大学入学共通テスト 2021年(令和3年) 本試 数学ⅡB 第3問 解説

(1)

まず、二項分布の復習から。

復習

確率pで事象Aが起こる試行をn回繰り返し、Aが起こった回数をXとすると、Xの確率分布は二項分布B(n,p)である。
確率変数X
平均値は、np 分散は、np(1p) 標準偏差は、np(1p) になる。

読書をしなかった生徒の比率(母比率)が0.5である母集団から一人選んだとき、それが読書をしなかった生徒である は、
当たりが全体の0.550%)入っているくじの中から1本引いたとき、それが当たりである というのと同じことだ。

なので、母集団が十分に大きい場合、
100人を無作為に選ぶ は、
くじを100回ひく のと同じで、反復試行である。

よって、復習より、抽出した100人の生徒に含まれる読書をしなかった生徒数Xは、二項分布
B(100,0.5)
に従う。

解答ア:3

また、復習より、Xの平均値は、
np=100×0.5
np=50

解答イ:5, ウ:0

標準偏差は
np(1p)=100×0.5×0.5
np(1p)=102×0.52
np(1p)=10×0.5
np(1p)=5
である。

解答エ:5

(2)

二項分布と正規分布の関係について復習しておく。

復習

nが十分に大きい数であるとき、
二項分布B(n,p)
は、
正規分布N(np,np(1p))
で近似できる。

復習より、Xの確率分布は、近似的に
N(1000.5,1000.5(10.5))=N(50,25)
に従う。

一応確認しておくと、N(50,25)
平均値は、50 分散は25だから、標準偏差は25=5 である。

なので、確率分布図は図Aのようになる。

図A
大学入学共通テスト2021年本試 数学ⅡB第3問 解説図A

図中の赤い部分の面積が、求める確率p5だ。

というわけで、正規分布表を使って赤い部分の面積を求めるんだけど、
正規分布表に載っているのはN(0,1)(標準正規分布) 面積を求めたいのはN(50,25) だから、そのままでは正規分布表は使えない。

正規分布表が使えるように、
N(50,25)
を標準化して
N(0,1)
に変換しよう。


復習

確率変数を、
平均値0 標準偏差1 に変換することを、標準化という。

もとの確率変数をXとし、X
平均値をm 標準偏差をσ とするとき、標準化の式は
Xmσ式A
である。

復習より、図Aを標準化すると、
N(50,25)は、N(0,1) 式Aより、36
36505=2.8
になるので、図Aは図Bのようになる。

図B
大学入学共通テスト2021年本試 数学ⅡB第3問 解説図B

図Aの赤い部分の面積と図Bの赤い部分の面積は等しいので、図Bの方を使って求める。

ところが、正規分布表には0より右の部分の面積しか載っていない。
正規分布は左右対称なので、赤い面積とオレンジの面積は等しいから、代わりにオレンジの面積を求めよう。

正規分布表で
2.8
を探すと、面積は
0.4974
となっている。
これは、図Bの青い部分の面積だ。

0より右の面積は、すべての確率の半分なので、0.5である。
なので、図Bで
+オレンジ=0.5
とかける。

これに、正規分布表で調べた0.4974を代入すると
0.4974+オレンジ=0.5
なので、
オレンジ=0.50.4974
オレンジ$$=0.0026
オレンジ$$0.003
より、求める確率p5は、選択肢の

である、

解答オ:1


母比率が0.4の場合、Xが従う二項分布は
B(100,0.4)
になるから、近似する正規分布は
N(1000.4,1000.4(10.4))=N(40,24)
である。
この正規分布の
平均値は40 標準偏差は24 だ。

さっきと同じように、これを標準化すると、
N(40,24)は、N(0,1) 36は、
364024=424
変換される。

よって、p4は、図Cの赤い面積にあたる。

図C
大学入学共通テスト2021年本試 数学ⅡB第3問 解説図C

図Bと図Cを見比べると、
確率分布は同じN(0,1)

2.8<424

詳しく 424だけど、
16<24<25
なので
416>424>425
より
416<424<425
1<424<45
となるから、10.8の間の数だ。

なので、図Cの赤い部分の方が面積が大きい。

以上より、
p4>p5
であることが分かる。

解答カ:2

(3)

母平均の信頼区間については公式があった。

公式

母標準偏差をσ,標本平均をX,標本の大きさをnとすると、母平均mの信頼区間を求める式は、
XzσnmX+zσn式B

大学入学共通テスト2021年本試 数学ⅡB第3問 復習図

ただし、信頼度がc%のとき、zは、右図を標準正規分布の確率分布図として、図中のz0の値。
特に、
信頼度95%のとき、z=1.96 信頼度99%のとき、z=2.58 である。

式Bより、

C1=Xzσn
C2=X+zσn

とかける。

よって、
C1+C2=(Xzσn)+(X+zσn)
            =2X
C2C1=(X+zσn)(Xzσn)
            =2zσn
となる。

これに
n=100 X=204 σ=150 z=1.96 を代入すると、
C1+C2=2204
            =408

解答キ:4, ク:0, ケ:8

C2C1=21.96150100
            =58.8

解答コ:5, サ:8, シ:8

となる。

これじゃ原理がゼンゼン分からないけど、原理通り解くと時間がかかるから、共通テスト本番では機械的に公式を使おう。
原理に関してはこのページを参照してほしい。


ここで考えた信頼区間は、信頼度95%の場合だった。
言いかえれば、95%の確率で、母平均mは信頼区間に入っている。
式にすると、95%の確率で
C1mC2式C
が成り立つ。
数直線にすると、図Dの緑の範囲だ。

図D
大学入学共通テスト2021年本試 数学ⅡB第3問 解説図D

逆に言うと、5%の確率で式Cは成り立たない。
つまり、式Cの外側にmがある。

このとき、大きい方と小さい方、図Dでいうと赤い範囲とオレンジの範囲のどちらかにmが存在することになる。
なので、
C1mmC2も成り立つとは限らない。

解答ス:3

(4)

最初に考えたように、
読書をしなかった生徒の比率(母比率)がpである母集団から100人選び、それに含まれる読書をしなかった生徒数 は、
当たりが全体のp入っているくじの中から100本引いたときの当たりの数 と同じことだ。

なので、当たりが全体のp入っているくじの中から100本引くとして、
36は、校長が引いたときの当たりの数 nは、図書委員会が引いたときの当たりの数 だと考えられる。

このように考えると、当然ながら、
n36の大小は分からない ことになる。

解答セ:3

(5)

ちょっと話がややこしくなってきたので、いったん整理しておこう。

校長先生と図書委員会が別々に調査を行った。

ふたつの調査は、
母集団が同じなので、母標準偏差σは等しい。 とりだした生徒数も同じなので、標本の大きさnも等しい。

ここで(3)の公式をもう一度見ると、信頼区間は
標本平均を中心として ±zσnの範囲 になっている(図E)。

図E
大学入学共通テスト2021年本試 数学ⅡB第3問 解説図E

zσnはふたつの調査で同じ値なので、
ふたつの調査で信頼区間の幅は等しい ことになる。

また、ふたつの調査の標本は異なるので、
標本平均は等しいとは限らない。


なので、ふたつの調査による母平均の信頼区間は、
同じ幅 大小関係は不明 であることが分かる。

よって、校長先生と図書委員会の調査による母平均の信頼区間をそれぞれ赤,オレンジで表すと、ふたつの範囲は

大学入学共通テスト2021年本試 数学ⅡB第3問 解説図

のように完全に重なっているかも知れないし、

大学入学共通テスト2021年本試 数学ⅡB第3問 解説図

のように一部が重なっているかも知れないし、

大学入学共通テスト2021年本試 数学ⅡB第3問 解説図

のように離れているかも知れない。
また、図は赤を右に描いたけど、オレンジが右にあるかも知れない。
ただし、何度も言うけど、赤とオレンジの幅は等しい。

以上より、正しい選択肢は
②,④
である。

解答ソ:2, タ:4 (順不同)

別解

上の解のように、ふたつの信頼区間のイメージが思い描ければいいんだけど、そうじゃなければ仕方がないから計算だ。

校長先生の調査の標本平均をXC 図書委員会の調査の標本平均をXD とすると、式Bより、

C1=XCzσn式D
C2=XC+zσn
D1=XDzσn
D2=XD+zσn

とかける。

以上を頭に置いて、選択肢をひとつずつ確認しよう。


C1=D1C2=D2に式Dを代入すると、

C1=D1より、
XCzσn=XDzσn
XC=XD

C2=D2より、
XC+zσn=XD+zσn
XC=XD

となる。

なので、C1=D1かつC2=D2になるのは、ふたつの調査の標本平均が等しいとき。
ふたつの調査の標本平均は等しいとは限らないので、⓪は誤り。


C1<D2D1<C2に式Dを代入すると、

C1<D2より、
XCzσn<XD+zσn
XCXD<2zσn式E

D1<C2より、
XDzσn<XC+zσn
2zσn<XCXD式F
となる。

これを数直線で表すと、図Fのようになる。

図F
大学入学共通テスト2021年本試 数学ⅡB第3問 解説図F

C1<D2D1<C2のどちらか一方だけが成り立つのは、図Fの赤い範囲。
XCXDはふたつの調査の標本平均の差なので、赤い範囲は
ふたつの調査の標本平均の差が2zσnより大きいとき にあたる。

ふたつの調査の標本平均の差は分からないので、①は誤り。


D2<C1C2<D1に式Dを代入すると、

D2<C1より、
XD+zσn<XCzσn
2zσn<XCXD式G

C2<D1より、
XC+zσn<XDzσn
XCXD<2zσn式H

となる。

式G,式Hより、②は、
ふたつの調査の標本平均の差が2zσnより大きくなることもある という意味であることが分かる。
なので、②は正しい。


③,④,⑤

コサを求めるときに計算したように、
C2C1=2zσn
だった。

式DからD2D1を計算すると、
D2D1=2zσn
となる。

なので、常に
C2C1=D2D1
が成り立つ。

よって、
③,⑤は誤り。
④は正しい。


以上より、正しい選択肢は
②,④
である。

解答ソ:2, タ:4 (順不同)