大学入試センター試験 2019年(平成31年) 本試 数学ⅡB 第5問 解説
(1)
確率変数の期待値,分散,標準偏差の復習から。
復習
表のような確率分布に従う確率変数$X$があるとき、
$X$ | $x_{1}$ | $x_{2}$ | $\cdots$ | $x_{n}$ | 計 |
---|---|---|---|---|---|
$P(X)$ | $P(x_{1})$ | $P(x_{2})$ | $\cdots$ | $P(x_{n})$ | $1$ |
$X$の期待値(平均)$E(X)$は、
$E(X)=x_{1}\cdot P(x_{1})+x_{2}\cdot P(x_{2})+$
$\cdots+x_{n}\cdot P(x_{n})$
$X$の分散$V(X)$は、
$V(X)=\{x_{1}-E(X)\}^{2}\cdot P(x_{1})$
$+\{x_{2}-E(X)\}^{2}\cdot P(x_{2})$
$\cdots+\{x_{n}-E(X)\}^{2}\cdot P(x_{n})$
$V(X)$$=E(X^{2})-\{E(X)\}^{2}$式A
$X$の標準偏差$\sigma(X)$は、
$\sigma(X)=\sqrt{V(X)}$式B
である。
それから、確率変数の変換の復習もしておこう。
復習
確率変数$X$の
期待値(平均)を$E(X)$
分散を$V(X)$
標準偏差を$\sigma(X)$
とする。
$X$と定数$a$,$b$を用いて、確率変数$W$を
$W=aX+b$式C
と定める。
このとき、$W$の
期待値(平均)$E(W)=aE(X)+b$式D
分散$V(W)=a^{2}V(X)$式E
標準偏差$\sigma(W)=\sqrt{V(W)}$
$=|a|\sigma(X)$
である。
まず$E(X^{2})$を求める。
上の復習で、$X^{2}$の平均値が含まれるのは式Aだけ。
なので、式Aを使う。
問題文より、$E(X)=-7$
問題文より$\sigma(X)=5$なので、式Bより、
$\sqrt{V(X)}=5$
$V(X)=25$
以上を式Aに代入して、
$25=E(X^{2})-(-7)^{2}$
$E(X^{2})=25+49$
$E(X^{2})$$=74$
であることが分かる。
解答ア:7, イ:4
さらに、$W=1000X$は、式Cの
$a$を$1000$
$b$を$0$
にした場合と考えられる。
よって、$W$の
期待値(平均)は、式Dより
$E(W)=1000 \cdot(-7)+0$
$E(W)$$=-7\cdot 10^{3}$
分散は、式Eより
$V(W)=(1000)^{2}\cdot 25$
$V(W)$$=5^{2}\cdot(10^{3})^{2}$
$V(W)$$=5^{2}\cdot 10^{6}$
である。
解答ウ:3, エ:2, オ:6
(2)
$X$は平均値が$-7$,標準偏差が$5$の正規分布に従うので、分布は図Aのようになる。
この赤い部分の面積を求めれば、それが物質Aの量が減少しない確率($P(X\geqq 0)$)だ。
これを求める。
ということで、いつもの作業をしよう。
いつもの作業っていうのは、
標準化して
正規分布表を見る
だ。
まず、標準化の復習から。
復習
確率変数$X$の期待値(平均)を$E(X)$,標準偏差を$\sigma(X)$とする。
$X$を標準化した確率変数を$Z$とすると、
$Z=\displaystyle \frac{X-E(X)}{\sigma(X)}$
とかける。
$X\geqq 0$
の両辺を標準化すると、上の復習より、
$\displaystyle \frac{X-(-7)}{5}\geqq\frac{0-(-7)}{5}$
となる。これを計算すると
$\displaystyle \frac{X+7}{5}\geqq\frac{7}{5}$
$\displaystyle \frac{X+7}{5}\geqq 1.4$式F
となるから、
$P(X\geqq 0)=P\left(\frac{X+7}{5}\geqq 1.4\right)$式G
である。
解答カ:1, キ:4
式Fの左辺の$\displaystyle \frac{X+7}{5}$は、正規分布に従う確率変数$X$を標準化したものなので、標準正規分布に従う。
問題文より、$Z$は標準正規分布に従う確率変数なので、
$\displaystyle \frac{X+7}{5}=Z$
とかける。
よって、
$P(X\geqq 0)=P(Z\geqq 1.4)$
となる。
つまり、図Aの赤い部分の面積は、図Bの赤い部分の面積と等しい。
図Bは標準正規分布なので、正規分布表が使える。
正規分布表より、図Bの緑の部分の面積は
$0.4192$
緑の部分と赤い部分を合わせた面積は
$0.5$
なので、赤い部分の面積は
赤$=0.5-0.4192$
赤$$$=0.0808$
赤$$$\doteqdot 0.08$
となる。
よって、
$P(X\geqq 0)=P(Z\geqq 1.4)$
$P(X\geqq 0)$$\doteqdot 0.08$
である。
解答ク:0, ケ:8
この正規分布に従う母集団から無作為に$50$人の標本をつくり、物質Aの量が減少しない人数を$M$とする。
クケより、母集団中の物質Aの量が減少しない人の比率は$0.08$なので、$M$は
$50$回の試行を行ったとき、確率$0.08$で起こる事象が何回起こるか
という反復試行の問題と同じである。
反復試行なので、二項分布の復習をしよう。
復習
確率$p$で事象$\mathrm{A}$が起こる試行を$n$回繰り返し、$\mathrm{A}$が起こった回数を$M$とすると、$M$の確率分布は二項分布$B(n,p)$である。
確率変数$M$の
期待値(平均)$E(M)=np$
分散$V(M)=np(1-p)$
標準偏差$\sigma(M)=\sqrt{np(1-p)}$
になる。
復習より、問題の確率変数$M$は、二項分布
$B(50$,$0.08)$
に従う。
なので、$M$の
期待値$E(M)=np$
$=50\cdot 0.08$
$=4$
標準偏差$\sigma(M)=\sqrt{n(p(1-p)}$
途中式
$=\sqrt{50\cdot 0.08\cdot(1-0.08)}$
$=\sqrt{4\cdot 0.92}$
$=\sqrt{3.68}$
解答コ:4, サ:0, シ:3, ス:7
(3)
まず、標本平均の期待値と標準偏差の復習をしよう。
復習
母平均$m$,母標準偏差$\sigma$の母集団から大きさ$n$の標本を無作為に取り出すとき、標本平均$\overline{Y}$の
期待値(平均)$E(\overline{Y})=m$
分散$V(\displaystyle \overline{Y})=\frac{\sigma^{2}}{n}$
標準偏差$\displaystyle \sigma(\overline{Y})=\frac{\sigma}{\sqrt{n}}$
である。
いま、
母平均は$m$
母標準偏差は$6$
標本の大きさは$100$
なので、復習より、問題の標本平均$\overline{Y}$の
期待値(平均)$E(\overline{Y})=m$
標準偏差$\displaystyle \sigma(\overline{Y})=\frac{6}{\sqrt{100}}$
$=0.6$
となる。
解答セ:0, ソ:6
さらに、標本平均の分布について復習する。
復習
母平均$\mu$,母標準偏差$\sigma$の母集団から大きさ$n$の標本を取り出す。
このとき、標本平均は
母集団が正規分布に従うときには $n$の値にかかわらす完全に、
母集団がその他の分布のときには $n$が大きければ近似的に、
正規分布
$\displaystyle N\left(\mu,\frac{\sigma^{2}}{n}\right)$
に従う。
問題の確率変数$Y$はどんな確率分布をとるか分からないけれど、標本の大きさの$100$が大きい数だとすると、復習より、
$\overline{Y}$は近似的に正規分布$\displaystyle N\left(m,\frac{6^{2}}{100}\right)$に従う。
また、問題文中の式
$Z=\displaystyle \frac{\overline{Y}-m}{\fbox{ セ }.\fbox{ ソ }}$
の右辺は、(2)の標準化の復習を見てもらうと分かるように$\overline{Y}$を標準化する式だ。
先に考えたように$\overline{Y}$は近似的に正規分布に従うから、それを標準化した$Z$は近似的に標準正規分布に従う。
ここで、正規分布表から
$|Z|\leqq 1.64$
となる確率を求める。
この式の絶対値をはずすと
$-1.64\leqq Z\leqq 1.64$
なので、求める確率は図Cの緑の面積だ。
正規分布表には縦軸より左の面積しか載ってないので、斜線の部分の面積を求めて2倍する。
正規分布表で$1.64$を探すと、斜線の部分の面積は
$0.4495$
緑の部分の面積は、これを2倍して
$0.4495\times 2=0.899 \doteqdot 0.90$
となる。
解答タ:9, チ:0
これを使い、信頼度$ 90\%$の母平均の信頼区間を求める。
その前に、母平均の推定について復習だ。
復習
母平均$m$の信頼区間は、標本の大きさを$n$,標本平均を$\overline{Y}$,母標準偏差を$\sigma$とすると、
$\displaystyle \overline{Y}-z\cdot\frac{\sigma}{\sqrt{n}}\leqq m\leqq\overline{Y}+z\cdot\frac{\sigma}{\sqrt{n}}$式H
となる。ただし$z$は
信頼度$ 95\%$のとき、$z=1.96$
信頼度$ 99\%$のとき、$z=2.58$
よって、母平均$m$の信頼区間は、式Hから
$-10.2-z\displaystyle \cdot\frac{6}{\sqrt{100}}\leqq m\leqq-10.2+z\cdot\frac{6}{\sqrt{100}}$式I
とかける。
ところが、信頼度$ 90\%$のときの$z$の値が分からない。
このサイトも含めて普通の解説には上の復習のように書いていて、信頼度$ 90\%$のときの$z$は載っていない。
このようなときには次のような方法をとる。
アドバイス
図Dを標準正規分布の確率分布図とする。
信頼度$ c\%$のとき、式Hの$z$の値には図Dの$z_{0}$を使う。
長くなるので、なぜこうなるかの理由はここでは説明しない。
詳しくはこのページを見てもらいたい。
先ほど求めたように、図Cの緑の部分の面積の面積は
$ 0.90=90\%$
だった。
よって、アドバイスより、式Iの$z$は
$z=1.64$
だ。
これを式Iに代入して、
$-10.2-1.64\displaystyle \cdot\frac{6}{\sqrt{100}}\leqq m\leqq-10.2+1.64\cdot\frac{6}{\sqrt{100}}$
より
途中式
$-10.2-1.64\displaystyle \cdot\frac{6}{10}\leqq m\leqq-10.2+1.64\cdot\frac{6}{10}$
$\displaystyle \frac{-102-1.64\times 6}{10}\leqq m\leqq\frac{-102+1.64\times 6}{10}$
となるので、選択肢の②が正しい。
解答ツ:2