大学入試センター試験 2014年(平成26年) 追試 数学ⅡB 第5問 解説
問題を解く準備
日付 | 走行距離(km) $x$ |
消費量(リットル) $y$ |
4月21日 | $x_{1}$ | $y_{1}$ |
4月22日 | $x_{2}$ | $y_{2}$ |
$\vdots$ | $\vdots$ | $\vdots$ |
4月30日 | $x_{10}$ | $y_{10}$ |
平均値 | $\overline{x}$ | $\overline{y}$ |
分散 | $s_{x}^{2}$ | $s_{y}^{2}$ |
標準偏差 | $s_{x}$ | $s_{y}$ |
共分散 | $s_{xy}$ | |
相関係数 | $r_{xy}$ |
説明のために、まず名前をつけよう。
表Aのように、
走行距離のデータをまとめて$x$とする。
4月21日の走行距離を$x_{1}$、22日の走行距離を$x_{2}$、… とする。
$x$の平均値を$\overline{x}$、$x$の分散を$s_{x}^{2}$、標準偏差を$s_{x}$とする。
ガソリン消費量のデータをまとめて$y$として、$x$の場合と同じように名前をつける。
また、$x$と$y$の共分散を$s_{xy}$、相関係数を$r_{xy}$とする。
(1)
データの代表値
$19.0$を仮平均とすると、
$\displaystyle \frac{1}{10}(-1-2-1.5+1+0.5+0-1+0.5+1.5+2)$
$=0$
よって、平均値は
$19.00$
である。
解答ア:1, イ:9, ウ:0, エ:0
次はガソリン消費量の分散$s_{y}^{2}$だ。
復習
分散$s^{2}$は、
データの大きさを$n$
それぞれのデータを$x_{1},\ x_{2},\ x_{3},\ \ldots\ x_{n}$
平均値を$\overline{x}$
としたとき、
$s^{2}=\displaystyle \frac{1}{n}\left\{(x_{1}-\overline{x})^{2}+(x_{2}-\overline{x})^{2}+(x_{3}-\overline{x})^{2}+\right.$
$\left.\cdots+(x_{n}-\overline{x})^{2}\right\}$式A
$s^{2}$$=\overline{x^{2}}-\left(\overline{x}\right)^{2}$式B
だった。
分散と標準偏差
今回は定義通り計算する方が楽そうなので、式Aを使おう。
問題文中の表の値を式Aに代入すると、
$s_{y}^{2}=\displaystyle \frac{1}{10}\{(-0.1)^{2}+(-0.2)^{2}+\cdots+0^{2}\}$
これは
$s_{y}^{2}\displaystyle $$\displaystyle =\frac{1}{10}\left\{\left(-\frac{1}{10}\right)^{2}+\left(-\frac{2}{10}\right)^{2}+\cdots+\left(\frac{0}{10}\right)^{2}\right\}$
とかけるから、$\left(\frac{1}{10}\right)^{2}$を共通因数として$\{\ \}$の前に出して、
$s_{y}^{2}$$=\left(\frac{1}{10}\right)^{3}\{(-1)^{2}+(-2)^{2}+\cdots+0^{2}\}$
$s_{y}^{2}$$=0.036$
である。
解答オ:0, カ:0, キ:3, ク:6
復習
中央値は、データを小さい順(大きい順でもいいけど)に並べたとき、
データが奇数個のときには、ちょうど真ん中にある数
データが偶数個のときには、中央2つの数の平均
だった。
ガソリン消費量のデータを小さい順に並べると、
$1.0,\ 1.1,\ 1.2,\ 1.2,\ 1.3,\ 1.3,\ 1.3,\ 1.4,\ 1.5,\ 1.7$
データが偶数個なので、ガソリン消費量の中央値は5番目と6番目の数の平均だけど、両方とも$1.30$なので、
$1.30$
解答ケ:1, コ:3, サ:0
(2)
まず、4つの相関図で、違っているところを見つよう。
相関関係
図Bで、4つの相関図で共通する点は黒で、異なる点は赤で示した。だから、赤い点だけ確認しよう。
まず、0・2にあって1・3にない$(x,y)=(18,1.0)$の点(青い矢印の点)だけど、問題文中の表を見ると4月27日のデータとして存在する。なので、1・3は除外。
次に、$x=19$の点(緑の矢印の点)は、0では$y=1.2$、2では$y=1.5$となっている。問題文中の表を見ると、$x=19$であるのは4月26日のデータで、$y=1.5$となっている。なので、0は除外。
以上より、当てはまるものは2である。
解答シ:2
次に、走行距離とガソリン消費量の相関係数を求める。
復習
相関係数
まず、共分散を$s_{xy}$とすると、
$s_{xy}=\displaystyle \frac{1}{n}\{(x_{1}-\overline{x})(y_{1}-\overline{y})+(x_{2}-\overline{x})(y_{2}-\overline{y})$+
$\cdots+(x_{n}-\overline{x})(y_{n}-\overline{y})\}$式C
$s_{xy}\displaystyle $$\displaystyle =\frac{1}{n}\sum_{k=1}^{n}x_{k}\cdot y_{k}-\overline{x}\cdot\overline{y}$式D
この共分散$s_{xy}$を、$x,\ y$それぞれの標準偏差の積で割った、
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
が相関係数だった。
相関係数
ということで、共分散を求める。
今回は式Dよりも式Cの方が計算が楽そうだ。
なので、まず走行距離の偏差($x_{n}-\overline{x}$)と消費量の偏差($y_{n}-\overline{y}$)の積を計算して、問題文中の表に書きたしたものが表Cである。
日付 | 走行距離 (km) |
消費量 (リットル) |
偏差の積 | ||
値 $x_{n}$ |
偏差 $x_{n}-\overline{x}$ |
値 $y_{n}$ |
偏差 $y_{n}-\overline{y}$ |
$(x_{n}-\overline{x})$ $\cdot(y_{n}-\overline{y})$ |
|
4月21日 | 18.0 | -1.0 | 1.2 | -0.1 | 0.10 |
4月22日 | 17.0 | -2.0 | 1.1 | -0.2 | 0.40 |
4月23日 | 17.5 | -1.5 | 1.4 | 0.1 | -0.15 |
4月24日 | 20.0 | 1.0 | 1.3 | 0.0 | 0 |
4月25日 | 19.5 | 0.5 | 1.2 | -0.1 | -0.05 |
4月26日 | 19.0 | 0.0 | 1.5 | 0.2 | 0 |
4月27日 | 18.0 | -1.0 | 1.0 | -0.3 | 0.30 |
4月28日 | 19.5 | 0.5 | 1.3 | 0.0 | 0 |
4月29日 | 20.5 | 1.5 | 1.7 | 0.4 | 0.60 |
4月30日 | 21.0 | 2.0 | 1.3 | 0.0 | 0 |
平均値 | 19.00 | 1.30 | 0.12 | ||
分散 | 1.60 | 0.036 |
式Cより、偏差の積の平均が相関係数$s_{xy}$なので、
$s_{xy}=0.12$
これを$x,y$の標準偏差で割れば、相関係数である。
復習
標準偏差$s$は、分散を$s^{2}$とすると、
$s=\sqrt{s^{2}}$
だった。
$x,y$の分散は、それぞれ$1.60,\ 0.036$であるから、相関係数$r_{xy}$は
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
$r_{xy}\displaystyle $$\displaystyle =\frac{0.12}{\sqrt{1.60}\cdot\sqrt{0.036}}$
$r_{xy}\displaystyle $$\displaystyle =\frac{12}{24}$
$r_{xy}$$=0.5$
解答ス:0, セ:5, ソ:0, タ:0
(3)
図Bに5月のデータを書き加えた。図D中、赤い点が5月のデータである。
図Dより、点は左下から右上に連なる傾向が見える。
よって、走行距離と消費量は正の相関が考えられるから、$0 \lt r \lt 1$
解答チ:4
16日間の走行距離の平均値$M$は、
(16日間の走行距離の合計)$\div 16$
ここで、
4月の10日間の合計$=$4月の平均$\times 10$
5月の6日間の合計$=$5月の平均$\times 6$
なので、
$M=\displaystyle \frac{19.00\times 10+23.00\times 6}{16}$
$M$$=20.50$
解答ツ:2, テ:0, ト:5, ナ:0
問題文中の
$T=(x_{1}-M)^{2}+(x_{2}-M)^{2}+\cdots+(x_{10}-M)^{2}$
に、
$(x_{k}-M)^{2}=(x_{k}-m)^{2}$
$+2(x_{k}-m)(m-M)$
$+(m-M)^{2}$
を代入すると、
$T=(x_{1}-m)^{2}+(x_{2}-m)^{2}+\cdots+(x_{10}-m)^{2}$
$+2(m-M)\{(x_{1}-m)+(x_{2}-m)+$
$\cdots+(x_{n}-m)\}$
$+10(m-M)^{2}$式E
ここで、分散の定義を思いだすと、式Cより、
$(x_{1}-m)^{2}+(x_{2}-m)^{2}+\cdots+(x_{10}-m)^{2}=10s^{2}$
また、偏差の和は$0$なので、
$(x_{1}-m)+(x_{2}-m)+\cdots+(x_{n}-m)=0$
よって、式Eは、
$T=10s^{2}+10(m-M)^{2}$
となる。
解答ニ:0
これに
$M=20.50$
$m=19.00$
$s^{2}=1.60$
を代入すると、
$T=10\cdot 1.6+10(19-20.5)^{2}$
$T$$=38.50$
となる。
解答ヌ:3, ネ:8, ノ:5, ハ:0
$T$の意味を考えると、
$(x_{k}-M)^{2}$は走行距離の偏差の2乗なので、
4月の10日間の走行距離の偏差の2乗の合計である。
分散とは偏差の2乗の平均なので、$T$に5月の6日間の偏差の2乗をたして、16で割れば、16日間の分散だ。
5月の6日間の偏差の2乗の和$T_{6}$は、$T$と同様計算しよう。
6日間の分散を$s_{6}^{2}$、平均値を$m_{6}$とすると、
$T_{6}=6s_{6}^{2}+6(m_{6}-M)^{2}$
これに
$M=20.50$
$m_{6}=23.00$
$s_{6}^{2}=6.00$
を代入すると、
$T_{6}=6\times 6+6(23-20.5)^{2}$
$T_{6}$$=73.5$
以上より、16日間の分散$s_{16}^{2}$は、
$s_{16}^{2}=\displaystyle \frac{38.5+73.5}{16}$
$s_{16}^{2}$$=7$
解答ヒ:7, フ:0, ヘ:0
アドバイス
16日間の分散の計算には、16日間の平均値を使う。
問題文中の2つの表に載っている分散は、それぞれ4月の10日間の平均値・5月の6日間の平均値を使って求めた分散なので、そのままでは使えない。だから、$T$のような式を作って変換した。