大学入試センター試験 2020年(令和2年) 追試 数学ⅠA 第2問 [2] 解説

(1)

まず、本文中の図1を見る。
図1より、進学率が35以上40未満の階級には、1つの都道府県が含まれることが分かる。
よって、散布図のうち、進学率が35以上40未満に点が2つ存在する①,②は不適。


残る 散布図⓪と③を見比べると、⓪は③と比べて点の分布が上に寄っている。
上下方向の分布の違いなので、就職率を確認しよう。

問題文中の就職率の図は箱ひげ図なので、箱ひげ図の復習から。

復習

大学入試センター試験2020年追試 数学ⅠA第2問[2] 復習図

ついでに、四分位数の復習もしておこう。

復習

第1四分位数
データの下位半分の中央値。データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。データの大きさが偶数のときには、中央2数の平均値。
第3四分位数
データの上位半分の中央値。データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲
第3四分位数第1四分位数。
(箱ひげ図の箱の部分の幅にあたる)

問題文中の図2を見ると、就職率の第1四分位数は1718くらいの値だ。
いま、データの大きさは都道府県数の47だけど、復習より 第1四分位数は下から12番目の値にあたる。
なので、⓪と③のうち、下から12番目の点が1718の方が答えだ。

両方の散布図とも、点の数は47あるので、複数の点がちょうど重なってひとつに見えていることはない。
なので、単に点を数えると、
⓪では、下から12番目の点は2021付近 ③では、下から12番目の点は1718付近 に存在する。

以上より、正しい散布図は

である。

解答サ:3

(2)

選択肢をひとつずつ確認しよう。

1998年度,2003年度の進学率の箱ひげ図を見ると、左側のひげの方が右側よりも長い。
なので、誤り。

多分これが正しいけれど、念のために残りの選択肢も確認しておこう。

2003年度→2008年度は、就職率の四分位範囲(箱の幅)は増加している。
なので、誤り。

1978年度,2003年度,2008年度,2013年度は、明らかに進学率の四分位範囲の方が大きい。
なので、誤り。

1973年度の就職率の最小値は、34前後。最大値は66前後なので、最小値の2倍よりも小さい。
なので、誤り。

以上より、正しい選択肢は

である。

解答シ:1

(3)

問題文中の図4から、就職率についての最大最小値と各四分位数にあたる点を調べる。
データの大きさは47なので、復習より、
第1四分位数は、下から12番目 中央値(第2四分位数)は、下から(上からでもいいけど)24番目 第3四分位数は、上から12番目 の点にあたる。

それぞれの点を探すと、図Aのようになる。

図A
大学入試センター試験2020年追試 数学ⅠA第2問[2] 解説図A

図Aより、選択肢⑤の四分位範囲は
第3四分位数第1四分位数
=39前後29前後
=10前後
なので不適。

図Aより、残る選択肢のうちで34.8%にあたるのは中央値である。

解答ス:1


さらに、進学率の中央値は、点のうち左から(右からでもいいけど)24番目の値だ。
左から24番目の点は、図Aの赤い点。
進学率の目盛を見ると、この値は3435あたりであることが分かる。

選択肢のうち、これに当てはまるのは

34.5である。

解答セ:3

(4)

問題文中の図5を見ると、はっきりしないけれど、点は何となく図Bの青い線に沿って分布しているように見える。
青い部分は右下がりなので、負の相関が考えられる。
実際、問題文に「相関係数は0.41であった」と書かれている。

図B
大学入試センター試験2020年追試 数学ⅠA第2問[2] 解説図B

図Bの黒い点は、特に青い線によく沿っている。
よって、黒い点のおかげで負の相関が強くなっていると考えられる。

なので、この黒い点を除外すると、相関は弱くなる。
つまり、相関係数は0に近づく。

以上より、5つの点を除外したときの相関係数rは、
0.41<r<0
であると推測できる。

解答ソ:2

(5)

平均値の2乗というと、まず思い出すのは、問題文中にも載っている分散の公式だ。

復習

データ{x1x2xn}があり、平均値をx,それぞれの値の2乗の平均値をx2とするとき、分散s2
s2={(x1x)2+(x2x)2++(xnx)2}n=x2(x)2 である。

この式Aを使おう。

ここでは、データXについて考えているので
Xの平均値をX X2の平均値をX2 Xの分散をsX2 とすると、式Aは
sX2=X2(X)2
とかける。

これに、問題中の表1にあるX2の平均値を代入すると
sX2=1223(X)2式A'
となる。
式A'の赤い部分が、求めるだ。


ところが、sX2が分からないので、式A'は解けない。
仕方がないから、Xの分散sX2を求めよう。
分散の正の平方根が標準偏差なので、求めるのはXの標準偏差sXでも可だ。

改めて問題中の表1を見ると、まだ使ってない値は
Yの平均値Y Yの標準偏差sY XYの共分散sXY XYの相関係数rXY の4つだ。
これを使って、
Xの分散sX2または標準偏差sX を求めたい。

上のような値から思い出すのは、共分散から相関係数を求める式だ。

復習

相関係数rxyは、
rxy=sxysxsy式B
である。
ただし、sxyは共分散
sxsyはそれぞれのデータの標準偏差

式Bを、この問題に合わせて書きなおすと
rXY=sXYsXsY
とかける。

これに、表1にあるそれぞれの値を代入して、
0.41=20sX7.6
より
sX=200.417.6
    =6.418
なので、これを四捨五入して、Xの標準偏差sX
sX6.4式C
となる。

解答タ:6, チ:4


ここまで来ると勝ったも同然。
式Cを式A'に代入だ。

6.421223(X)2
より
(X)212236.42
なので、
(X)21182.04
であることが分かる。

これに最も近いのは、選択肢

1182である。

解答ツ:2