大学入学共通テスト 2022年(令和4年) 本試 数学ⅠA 第2問 [2] 解説
(1)
最初に四分位数などの復習だ。
復習
第1四分位数
データの下位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。
データの大きさが偶数のときには、中央2数の平均値。
第3四分位数
データの上位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲
第3四分位数$-$第1四分位数。
範囲
最大値$-$最小値。
復習より、29か国のデータを小さい順に並べると、図Aができる。
図Aのように、
第1四分位数は、小さい方から7番目と8番目の値の平均値
中央値は、小さい方から(大きい方からでもいいけど)15番目の値
第3四分位数は、大きい方から7番目と8番目の値の平均値
だ。
これをもとに 問題文中の図1,図2に四分位数の位置などを書き込むと、図Bのようになる。
図Bで、
緑は 第1四分位数が含まれる階級
黄色は 中央値が含まれる階級
青は 第3四分位数が含まれる階級
を表している。
また、
範囲は、オレンジの矢印の
$\hspace{40px}$太線部分 $\lt$ 範囲 $\lt$ 矢印全体
四分位範囲は、赤い矢印の
$\hspace{40px}$太線部分 $\lt$ 四分位範囲 $\lt$ 矢印全体
である。
図Bで2009年度と2018年度を比較すると、
中央値が含まれる階級(黄色い階級)は変わっていない
解答ケ:2
第1四分位数が含まれる階級(緑の階級)も変わっていない
解答コ:2
第3四分位数が含まれる階級(青い階級)は
2009年度では$60$以上$75$未満
2018年度では$45$以上$60$未満
なので、階級値は2018年度の方が小さい
解答サ:0
範囲(オレンジの矢印)は、
2009年では
9階級分の幅 $\lt$ 範囲
2018年では
範囲 $\lt$ 9階級分の幅
なので、2018年度の方が小さい
解答シ:0
四分位範囲(赤い矢印)は、
2009年では、
2階級分の幅 $\lt$ 四分位範囲 $\lt$ 4階級分の幅
2018年では、
1階級分の幅 $\lt$ 四分位範囲 $\lt$ 3階級分の幅
なので、どちらが大きいかは分からない。
解答ス:3
ことが分かる。
(2)
いつものように復習から始めよう。
今回は、箱ひげ図の復習だ。
復習
以下、「2009年度における教育機関1機関あたりの学習者数」を、単に「学習者数」と書く。
復習より、問題文中の図3から、学習者数の
最小値は$50$前後 | |
第1四分位数は$50$から$100$の間 | |
第3四分位数は$200$から$250$の間 | |
最大値は$450$から$500$の間 |
であることが分かる。
また、(1)の図Aで考えたように、
第1四分位数は 小さい方から7番目と8番目の値の平均値 | |
第3四分位数は 大さい方から7番目と8番目の値の平均値 |
だった。
以上より、選択肢の散布図のうち、学習者数(横軸)を見て
左端の点が$50$前後 | 条件A | |
左から$\hspace{10px}$7番目と8番目の点の $\hspace{50px}$平均値が$50$から$100$の間 | 条件B | |
右から$\hspace{10px}$7番目と8番目の点の $\hspace{50px}$平均値が$200$から$250$の間 | 条件C | |
右端の点が$450$から$500$の間 | 条件D |
を満たすものが正解だ。
これを頭に置いて、問題文中の選択肢の散布図をひとつずつ確認しよう。
以下の⓪~③に載せた値は、すべて学習者数(横軸)のものである。
右から7番目と8番目の点(図Cの赤い点)が、両方とも$250$より右にある。
なので、この2つの点の平均値も$250$より大きい。
条件Cに合わないので、不適。
①
右端の点(図Dの赤い点)が$400$から$450$の間にある。
条件Dに合わないので、不適。
② 条件A~Dの全部に合っているように見えるから、一旦保留だ。
③
左から7番目と8番目の点(図Eの赤い点)が、両方とも$100$より右にある。
なので、平均値も$100$より大きい。
条件Bに合わないので、不適。
以上より、学習者数(横軸)の分布を確認するだけで、答えが見つかった。
正しい散布図は、選択肢の
②
である。
解答セ:2
(3)
復習
データ$\{x_{1},x_{2},\cdots,x_{n}\}$と$\{y_{1},y_{2},\cdots,y_{n}\}$があり、
それぞれの標準偏差を$s_{x}$,$s_{y}$
$\{x\}$と$\{y\}$の共分散を$s_{xy}$
とするとき、$\{x\}$と$\{y\}$の相関係数$r_{xy}$は、
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
である。
復習より、$S$と$T$の相関係数は、
$\displaystyle \frac{735.3}{39.3\times 29.9}=\frac{\cancel{7353}^{2451}\times 10}{\cancel{393}^{131}\times 299}$
$\hspace{96px} =\displaystyle \frac{24510}{39169}$
$\hspace{96px} =0.625\ldots$
となる。
これを小数第3位で四捨五入して、正解は
$0.63$
である。
解答ソ:0, タ:6, チ:3
(4)
最後は、選択肢の散布図の中から
$S$の平均値が$81.8$ | 条件E | |
$T$の平均値が$72.9$ | ||
$S$と$T$の相関係数が$0.63$ | 条件F |
であるものを探す問題だ。
まず、選択肢の⓪,①だけど、$S$,$T$ともに平均値が$100$前後に見える。
条件Eに合わないので、⓪,①は不適。
残る②,③のどちらかが正解なんだけど、ここで相関係数と散布図の復習をしておこう。
復習
以下の散布図は、横軸・縦軸ともに矢印方向が大きい値とする。
左端の図のように すべての点が右上がりの直線上にあれば、相関係数は$+1$ 右端の図のように 右下がりの直線上にあれば、相関係数は$-1$ 点の分布が直線的な配置から乱れるにつれて、相関係数は$0$に近づく
ただし、点が直線的に分布していても、次の図のように縦軸や横軸に平行なときには、相関係数は$0$に近い値になる。
(誤解しないでほしいのだけど、分布の傾きが$0$に近づけば相関係数も$0$に近づくという意味ではない。ページをつくって詳しく解説したいけど、当分先の話になるかも。)
特に、下の図のように点が完全に軸に平行に分布しているとき、相関係数は計算できないため存在しない。
で、選択肢の散布図の②と③を見比べて、条件Fの相関係数が$0.63$である方を選ぶ。
②は点がかなりばらばらに分布している。相関係数は$0.5$より小さそうだ。(計算してみたら、約$0.43$だった。)
よって、正解は
③
である。
解答ツ:3
アドバイス
以上のような解説だと、納得できない人も多いと思う。
「⓪,①は不適」の部分は大丈夫だと思うけど、問題は「②の相関係数は$0.5$より小さくて」の部分だ。
散布図を見慣れていれば何となく想像がつくけど、「そんなの分からん」って人がほとんどじゃないだろうか。
なので、見慣れよう。
以下に、相関係数が$0.5$のときの散布図をいくつか載せておいた。
ながめてイメージをつかんでほしい。