大学入学共通テスト 2021年(令和3年) 追試 数学ⅠA 第2問 [2] 解説

(1)

(I)~(III)をひとつずつ確認しよう。

(I)

まず、四分位範囲の復習から。

復習

四分位範囲はデータの散らばりを表す値のひとつ。大きいほど散らばりが大きいと考えられる。
四分位範囲=第3四分位数第1四分位数

問題文中の散布図(図1)では、
小学生数の散らばりは、
●の分布の縦方向の広がり
外国人数の散らばりは、
○の分布の縦方向の広がり
にあたる。
今は横軸の旅券取得者数は関係ないので、縦方向の広がりだけを見る。

散布図(図1)を見ると、●よりも○の方が広がって分布している。
なので、外国人数の四分位範囲の方が大きいと考えられる。
よって、(I)は誤り。

別解

四分位範囲を求めて比較すると、次のようになる。

というわけで、四分位数の復習から。

復習

値を左から小さい順に並べる。
中央値は、ちょうど真ん中にある数。値の数が偶数のときは、真ん中にある2個の値の平均値。 値の数が奇数のときは、中央値を除いて偶数にして、
左半分の中央値が、第1四分位数。 右半分の中央値が、第3四分位数。 都道府県の47個の値の場合、次の図のようになる。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

第1四分位数は、左(小さい方)から12番目の都道府県の値 第1四分位数は、右(大きい方)から12番目の都道府県の値 である。

なので、この問題の場合、
四分位範囲=大きい方から12番目の都道府県の値
小さい方から12番目の都道府県の値
だ。

図Aに、小学生数,外国人数それぞれの、大きい方から12番目を緑,小さい方から12番目を青で示した。

図A
大学入学共通テスト2021年追試 数学ⅠA第2問[2] 解説図A

図中の
赤い矢印の範囲が小学生数の四分位範囲 オレンジの矢印の範囲が外国人数の四分位範囲 にあたる。

赤い範囲はオレンジの範囲より小さい。
つまり、小学生数の四分位範囲は外国人数の四分位範囲より小さい。
よって、(I)は誤り。

(II)

復習

範囲はデータの散らばりを表す値のひとつ。大きいほど散らばりが大きいと考えられるけど、外れ値の影響が大きい。
範囲=最大値最小値

図B
大学入学共通テスト2021年追試 数学ⅠA第2問[2] 解説図B

復習より、
旅券取得者数の範囲は、赤い矢印の範囲 外国人数の範囲は、オレンジの矢印の範囲 だ。

見るからに赤の範囲が大きいけれど、横軸と縦軸で目盛の幅が違うので注意。
問題によっては見た目の幅と実際の値の幅の大小が異なる場合もある。
この問題の場合は大丈夫だけど、念のために確認しておくと、
赤い矢印の範囲は、
530140=390
オレンジの矢印の範囲は、
24030=210
なので、赤い矢印の範囲の方が大きい。

旅券取得者数の範囲の方が大きいから、(II)は正しい。

(III)

さらに、相関係数と散布図の復習だ。

復習

以下の散布図は、横軸・縦軸ともに矢印方向が大きい値とする。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

左端の図のように すべての点が右上がりの直線上にあれば、相関係数は+1

右端の図のように 右下がりの直線上にあれば、
相関係数は1

点の分布が直線的な配置から乱れるにつれて、
相関係数は0に近づく

ただし、点が直線的に分布していても、次の図のように縦軸や横軸に平行なときには、相関係数は0に近い値になる。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

(誤解しないでほしいのだけど、分布の傾きが0に近づけば相関係数も0に近づくという意味ではない。このへんについてはページをつくって詳しく解説したいけど、当分先の話になるかも。)

特に、下の図のように点が完全に軸に平行に分布しているとき、相関係数は計算できないため存在しない。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

問題文中の図1を見ると、小学生数の分布は直線的だけど、ほぼ横軸に平行だ。
一方、外国人数の分布は右上がりの直線に近い。

なので、復習より、外国人数の方の相関係数の方が大きいと考えられる。
よって、(III)は誤り。

以上より、解答群のうち正しい選択肢は

である。

解答ツ:5

(2)

まずは、単純に計算しよう。

問題文中の式
x=1n(x1f1+x2f2+x3f3++xkfk)

x2=x1+h
x3=x1+2h
xk=x1+(k1)h

を代入して、平均値x
x=1n[x1f1+(x1+h)f2+(x1+2h)f3
++{x1+(k1)h}fk]
と表せる。

この式の[]の中を展開した
x=1n{x1f1+x1f2+hf2+x1f3+2hf3
++x1fk+(k1)hfk}
の、x1の項とhの項に分けると
x=1n[x1(f1+f2+f3++fk)
+h{f2+2f3++(k1)fk}]
と変形できる。

この式の赤い部分は
f1+f2+f3+f4++fk=n
とかける。

詳しく

f1fkはそれぞれの階級の度数なので、この問題だと都道府県の数にあたる。
f1+f2+f3+f4++fk
はすべての度数の和だから、この問題だと全都道府県数だ。
なので、データの大きさnに等しい。

問題文中の度数分布表を見ると、度数の計がnになっている。
このことからも、
f1+f2+f3+f4++fk=n
であることが分かる。

なので、さらに
x=1n[nx1
+h{f2+2f3+3f4++(k1)fk}]
より
x=nx1n
+hn{f2+2f3+3f4++(k1)fk}
x=x1+hn{f2+2f3+3f4++(k1)fk}
式A
となる。

解答テ:3


式Aを使って、問題文中の図2のヒストグラムから平均値xを求める。

図2を見ると、階級幅h100で、

表C
階級値x1x2x3x4x5
100
度数f1f2f3f4f5n
25143147

であることが分かる。

これを式Aに当てはめて、
x=100+10047(25+214+33+41)
より
x=100+10047×113
x240
である。

解答ト:2, ナ:4, ニ:0

(3)

次に、分散s2について考える。

問題文中の式にもあるように、分散s2
s2=1n{(x1x)2f1+(x2x)2f2
++(xkx)2fk}
とかける。

この式の{}の中を展開して
s2=1n[{x122xx1+(x)2}f1
+{x222xx2+(x)2}f2
++{xk22xxk+(x)2}fk]

途中式 s2=1n{x12f12xx1f1+(x)2f1
+x22f22xx2f2+(x)2f2
++xk2fk2xxkfk+(x)2fk}
xがない項,xの項,(x)2の項に分けて、
s2=1n{x12f1+x22f2++xk2fk
2xx1f12xx2f22xxkfk
+(x)2f1+(x)2f2++(x)2fk}
s2=1n[(x12f1+x22f2++xk2fk)
(2xx1f1+2xx2f2++2xxkfk)
+{(x)2f1+(x)2f2++(x)2fk}]
s2=1n{(x12f1+x22f2++xk2fk)
2x(x1f1+x2f2++xkfk)
+(x)2(f1+f2++fk)}
式B
と変形できる。

(2)の問題文中の式にもあるように
1n(x1f1+x2f2++xkfk)=x
なので、式Bの緑の部分は
x1f1+x2f2++xkfk=nx
である。

また、(2)でも考えたように、式Bの赤い部分は
f1+f2+f3+f4++fk=n
だった。

よって、式Bは
s2=1n{(x12f1+x22f2++xk2fk)
2x×nx+(x)2×n}
とかける。

解答ヌ:3, ネ:0

これはさらに
s2=1n{(x12f1+x22f2++xk2fk)n(x)2}
より
s2=1n(x12f1+x22f2++xk2fk)(x)2
式B'
と表せる。

解答ノ:6


表Cに必要な値を書きたすと、表Dができる。

表D
階級値x1x2x3x4x5
100200300400500
度数f1f2f3f4f5n
425143147

これとトナニを式B'に当てはめて、
s2=147(10024+200225+300214
+40023+50021)2402

途中式 より
s2=1471002(14+2225+3214
+423+521)242102
s2=102{147102(4+100+126+48+25)242}
s2=102(147102303576)
s2102(6.45102576)
s269102
s26900
となる。

よって、正しい選択肢は

だ。

解答ハ:3