大学入試センター試験 2014年(平成26年) 追試 数学ⅡB 第5問 解説

問題を解く準備

表A
日付 走行距離(km)
$x$
消費量(リットル)
$y$
4月21日 $x_{1}$ $y_{1}$
4月22日 $x_{2}$ $y_{2}$
$\vdots$ $\vdots$ $\vdots$
4月30日 $x_{10}$ $y_{10}$
平均値 $\overline{x}$ $\overline{y}$
分散 $s_{x}^{2}$ $s_{y}^{2}$
標準偏差 $s_{x}$ $s_{y}$
共分散 $s_{xy}$
相関係数 $r_{xy}$

説明のために、まず名前をつけよう。
表Aのように、
走行距離のデータをまとめて$x$とする。
4月21日の走行距離を$x_{1}$、22日の走行距離を$x_{2}$、… とする。
$x$の平均値を$\overline{x}$、$x$の分散を$s_{x}^{2}$、標準偏差を$s_{x}$とする。
ガソリン消費量のデータをまとめて$y$として、$x$の場合と同じように名前をつける。
また、$x$と$y$の共分散を$s_{xy}$、相関係数を$r_{xy}$とする。

(1)

188
データの代表値

$19.0$を仮平均とすると、
$\displaystyle \frac{1}{10}(-1-2-1.5+1+0.5+0-1+0.5+1.5+2)$
$=0$
よって、平均値は
$19.00$
である。

解答ア:1, イ:9, ウ:0, エ:0

次はガソリン消費量の分散$s_{y}^{2}$だ。

復習

分散$s^{2}$は、
データの大きさを$n$
それぞれのデータを$x_{1},\ x_{2},\ x_{3},\ \ldots\ x_{n}$
平均値を$\overline{x}$
としたとき、
$s^{2}=\displaystyle \frac{1}{n}\left\{(x_{1}-\overline{x})^{2}+(x_{2}-\overline{x})^{2}+(x_{3}-\overline{x})^{2}+\right.$
                       $\left.\cdots+(x_{n}-\overline{x})^{2}\right\}$式A
$s^{2}$$=\overline{x^{2}}-\left(\overline{x}\right)^{2}$式B
だった。

193
分散と標準偏差

今回は定義通り計算する方が楽そうなので、式Aを使おう。
問題文中の表の値を式Aに代入すると、
$s_{y}^{2}=\displaystyle \frac{1}{10}\{(-0.1)^{2}+(-0.2)^{2}+\cdots+0^{2}\}$

これは
$s_{y}^{2}\displaystyle $$\displaystyle =\frac{1}{10}\left\{\left(-\frac{1}{10}\right)^{2}+\left(-\frac{2}{10}\right)^{2}+\cdots+\left(\frac{0}{10}\right)^{2}\right\}$
とかけるから、$\left(\frac{1}{10}\right)^{2}$を共通因数として$\{\ \}$の前に出して、
$s_{y}^{2}$$=\left(\frac{1}{10}\right)^{3}\{(-1)^{2}+(-2)^{2}+\cdots+0^{2}\}$
$s_{y}^{2}$$=0.036$
である。

解答オ:0, カ:0, キ:3, ク:6

復習

中央値は、データを小さい順(大きい順でもいいけど)に並べたとき、
データが奇数個のときには、ちょうど真ん中にある数 データが偶数個のときには、中央2つの数の平均 だった。

ガソリン消費量のデータを小さい順に並べると、
$1.0,\ 1.1,\ 1.2,\ 1.2,\ 1.3,\ 1.3,\ 1.3,\ 1.4,\ 1.5,\ 1.7$
データが偶数個なので、ガソリン消費量の中央値は5番目と6番目の数の平均だけど、両方とも$1.30$なので、
$1.30$

解答ケ:1, コ:3, サ:0

(2)

まず、4つの相関図で、違っているところを見つよう。

図B

大学入試センター試験2014年追試 数学ⅡB第5問 解説図B
大学入試センター試験2014年追試 数学ⅡB第5問 解説図B
大学入試センター試験2014年追試 数学ⅡB第5問 解説図B
大学入試センター試験2014年追試 数学ⅡB第5問 解説図B
199
相関関係

図Bで、4つの相関図で共通する点は黒で、異なる点は赤で示した。だから、赤い点だけ確認しよう。

まず、0・2にあって1・3にない$(x,y)=(18,1.0)$の点(青い矢印の点)だけど、問題文中の表を見ると4月27日のデータとして存在する。なので、1・3は除外。
次に、$x=19$の点(緑の矢印の点)は、0では$y=1.2$、2では$y=1.5$となっている。問題文中の表を見ると、$x=19$であるのは4月26日のデータで、$y=1.5$となっている。なので、0は除外。
以上より、当てはまるものは2である。

解答シ:2


次に、走行距離とガソリン消費量の相関係数を求める。

復習

相関係数
まず、共分散を$s_{xy}$とすると、
$s_{xy}=\displaystyle \frac{1}{n}\{(x_{1}-\overline{x})(y_{1}-\overline{y})+(x_{2}-\overline{x})(y_{2}-\overline{y})$+
                 $\cdots+(x_{n}-\overline{x})(y_{n}-\overline{y})\}$式C
$s_{xy}\displaystyle $$\displaystyle =\frac{1}{n}\sum_{k=1}^{n}x_{k}\cdot y_{k}-\overline{x}\cdot\overline{y}$式D
この共分散$s_{xy}$を、$x,\ y$それぞれの標準偏差の積で割った、
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
が相関係数だった。

199
相関係数

ということで、共分散を求める。
今回は式Dよりも式Cの方が計算が楽そうだ。
なので、まず走行距離の偏差($x_{n}-\overline{x}$)と消費量の偏差($y_{n}-\overline{y}$)の積を計算して、問題文中の表に書きたしたものが表Cである。

表C
日付 走行距離
(km)
消費量
(リットル)
偏差の積

$x_{n}$
偏差
$x_{n}-\overline{x}$

$y_{n}$
偏差
$y_{n}-\overline{y}$
$(x_{n}-\overline{x})$
$\cdot(y_{n}-\overline{y})$
4月21日 18.0 -1.0 1.2 -0.1 0.10
4月22日 17.0 -2.0 1.1 -0.2 0.40
4月23日 17.5 -1.5 1.4 0.1 -0.15
4月24日 20.0 1.0 1.3 0.0 0
4月25日 19.5 0.5 1.2 -0.1 -0.05
4月26日 19.0 0.0 1.5 0.2 0
4月27日 18.0 -1.0 1.0 -0.3 0.30
4月28日 19.5 0.5 1.3 0.0 0
4月29日 20.5 1.5 1.7 0.4 0.60
4月30日 21.0 2.0 1.3 0.0 0
平均値 19.00 1.30 0.12
分散 1.60 0.036

式Cより、偏差の積の平均が相関係数$s_{xy}$なので、
$s_{xy}=0.12$
これを$x,y$の標準偏差で割れば、相関係数である。

復習

標準偏差$s$は、分散を$s^{2}$とすると、
$s=\sqrt{s^{2}}$
だった。

$x,y$の分散は、それぞれ$1.60,\ 0.036$であるから、相関係数$r_{xy}$は
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
$r_{xy}\displaystyle $$\displaystyle =\frac{0.12}{\sqrt{1.60}\cdot\sqrt{0.036}}$
$r_{xy}\displaystyle $$\displaystyle =\frac{12}{24}$
$r_{xy}$$=0.5$

解答ス:0, セ:5, ソ:0, タ:0

(3)

図Bに5月のデータを書き加えた。図D中、赤い点が5月のデータである。

図D
大学入試センター試験2014年追試 数学ⅡB第5問 解説図D

図Dより、点は左下から右上に連なる傾向が見える。
よって、走行距離と消費量は正の相関が考えられるから、$0 \lt r \lt 1$

解答チ:4

16日間の走行距離の平均値$M$は、
(16日間の走行距離の合計)$\div 16$
ここで、
4月の10日間の合計$=$4月の平均$\times 10$
5月の6日間の合計$=$5月の平均$\times 6$
なので、
$M=\displaystyle \frac{19.00\times 10+23.00\times 6}{16}$
$M$$=20.50$

解答ツ:2, テ:0, ト:5, ナ:0


問題文中の
$T=(x_{1}-M)^{2}+(x_{2}-M)^{2}+\cdots+(x_{10}-M)^{2}$
に、
$(x_{k}-M)^{2}=(x_{k}-m)^{2}$
                 $+2(x_{k}-m)(m-M)$
                   $+(m-M)^{2}$
を代入すると、
$T=(x_{1}-m)^{2}+(x_{2}-m)^{2}+\cdots+(x_{10}-m)^{2}$
       $+2(m-M)\{(x_{1}-m)+(x_{2}-m)+$
                   $\cdots+(x_{n}-m)\}$
         $+10(m-M)^{2}$式E
ここで、分散の定義を思いだすと、式Cより、
$(x_{1}-m)^{2}+(x_{2}-m)^{2}+\cdots+(x_{10}-m)^{2}=10s^{2}$
また、偏差の和は$0$なので、
$(x_{1}-m)+(x_{2}-m)+\cdots+(x_{n}-m)=0$
よって、式Eは、
$T=10s^{2}+10(m-M)^{2}$
となる。

解答ニ:0

これに
$M=20.50$ $m=19.00$ $s^{2}=1.60$ を代入すると、
$T=10\cdot 1.6+10(19-20.5)^{2}$
$T$$=38.50$
となる。

解答ヌ:3, ネ:8, ノ:5, ハ:0


$T$の意味を考えると、
$(x_{k}-M)^{2}$は走行距離の偏差の2乗なので、
4月の10日間の走行距離の偏差の2乗の合計である。
分散とは偏差の2乗の平均なので、$T$に5月の6日間の偏差の2乗をたして、16で割れば、16日間の分散だ。

5月の6日間の偏差の2乗の和$T_{6}$は、$T$と同様計算しよう。

6日間の分散を$s_{6}^{2}$、平均値を$m_{6}$とすると、
$T_{6}=6s_{6}^{2}+6(m_{6}-M)^{2}$

これに
$M=20.50$ $m_{6}=23.00$ $s_{6}^{2}=6.00$ を代入すると、
$T_{6}=6\times 6+6(23-20.5)^{2}$
$T_{6}$$=73.5$

以上より、16日間の分散$s_{16}^{2}$は、
$s_{16}^{2}=\displaystyle \frac{38.5+73.5}{16}$
$s_{16}^{2}$$=7$

解答ヒ:7, フ:0, ヘ:0

アドバイス

16日間の分散の計算には、16日間の平均値を使う。
問題文中の2つの表に載っている分散は、それぞれ4月の10日間の平均値・5月の6日間の平均値を使って求めた分散なので、そのままでは使えない。だから、$T$のような式を作って変換した。