大学入試センター試験 2019年(平成31年) 本試 数学ⅠA 第2問 [2] 解説
(1)
まず、箱ひげ図の復習をしよう。
復習
範囲は、最大値$-$最小値
四分位範囲は、第3四分位数$-$第1四分位数
だった。
それから、今回のデータは通し日なので、整数の値だ。
だから、例えば問題文中の図1の2012年の最大値は130の目盛線の上だけど、これはぴったり$130$で、図2のヒストグラムだと$130$以上$135$未満の階級に入ると考えてよい。
「もしかしたら$129.9$で、$125$以上$130$未満の階級かも」とか考えなくても大丈夫だ。
2013年
2013年の箱ひげ図を見ると、
最小値は$70$以上$75$未満の階級
に入っていることが分かる。
図2の6つのヒストグラムのうち、$70$以上$75$未満の階級の度数が$0$でないのは③だけなので、これが正解だ。
解答ソ:3
別解
2013年の箱ひげ図を見ると、
最大値は$135$以上$140$未満の階級
に入っていることが分かる。
図2の6つのヒストグラムのうち、$135$以上$140$未満の階級の度数が$0$でないのは③だけなので、これが正解だ。
解答ソ:3
2017年
2017年の箱ひげ図を見ると、
最小値は$80$以上$85$未満の階級
最大値は$120$以上$125$未満の階級
に入っていることが分かる。
図2の6つのヒストグラムのうち、この条件に当てはまるのは④だけなので、これが正解である。
解答タ:4
(2)
選択肢の⓪~⑤の正誤は、箱ひげ図から判断できる。
ひとつずつ確認してゆこう。
選択肢の⑥,⑦の正誤は、散布図を見ないと分からない。問題文には、散布図中の線の傾きとか切片とか見慣れないことを書いてあるけど、たいしたことはしてないので動揺せずに確認しよう。
⑥ 問題文にあるとおり、散布図の中の実線は原点を通る傾き1の直線だ。なので、直線の式は
$y=x$
だけど、グラフの縦軸はツバメの初見日、横軸はモンシロチョウの初見日なので、上の式は
(ツバメの初見日)$=$(モンシロチョウの初見日)
とかける。
つまり、これはモンシロチョウの初見日とツバメの初見日が同じ日である線だ。
この直線上には点が少なくとも4個ある。
(「少なくとも」というのは、点が重なっている可能性があるため。)
なので、⑥は正しい。 ⑦ ⑥と同じように考えると、散布図の中の点線は
(ツバメの初見日)$=$(モンシロチョウの初見日)$-15$
(ツバメの初見日)$=$(モンシロチョウの初見日)$+15$
の線なので、この2つの点線の間はモンシロチョウの初見日とツバメの初見日の差が$15$日以内だ。
散布図を見ると、2つの点線にはさまれた部分の外側にも点がある。
なので、⑦は誤り。
以上より、誤っているのは④と⑦である。
解答チ:4, ツ:7 (順不同)
(3)テ
(3)は、知っていれば一瞬で解ける問題ばかりだ。
テの、偏差の平均値は必ず$0$になる。
解答テ:0
と、知っていればこれだけで終わってしまうんだけど、皆がこれを知ってるわけじゃない。てか、むしろ知らない人の方が多いかも知れない。
なので、ちょっと長くなるけど説明をしておく。
理解しなくても憶えればいいやっていう人は「偏差の平均値は必ず$0$になる」ってのを暗記してもらって、次の復習はとばしてもらっていいです。
復習
突然だけど、データの平均値とは何かを考えよう。
生徒 | A君 | B君 | C君 |
---|---|---|---|
得点 | $53$ | $40$ | $57$ |
例えば表Aのようなテストの得点のデータがあるとする。
得点の平均値は
$\displaystyle \frac{53+40+57}{3}=50$
より、$50$点である。
この計算を言いかえると、たくさん点を取った人が、あまり点を取れなかった人に点を分けてあげて、全員同じ得点にしたときの点数を求める作業といえる。
これを視覚的に表すと、図Bのようになる。
A君・C君の上の部分を切り取ってB君の上に載せ、3人が同じ得点になるようにすると$50$点になり、これが平均値だ。
次に、偏差とは何かを復習しよう。
偏差とはそれぞれのデータと平均値との差なので、図Cの赤い部分にあたる。
A君の偏差は $53-50=3$
B君の偏差は $40-50=-10$
C君の偏差は $57-50=7$
だ。
平均値より上の偏差は正の値で、平均値より下の偏差は負の値になる。
ここで、図Bと図Cを見比べると、平均点より上の偏差(図Dの紫の部分)の合計と、平均点より下の偏差(図Dの青い部分)の合計は、必ず等しくなる。$\pm$は逆だけど。
このことから、偏差の和は必ず$0$になると言える。
和が$0$なので、それを人数で割った偏差の平均値も、やっぱり$0$になる。
(3)トナ
次に、問題文中の
$x_{i}'=\displaystyle \frac{x_{i}-\overline{x}}{s}$式A
は標準化の式である。
標準化とは、データを
平均値が$0$
標準偏差が$1$
になるように変換すること。
なので、変換後のデータ$X'$の
平均値は$0$
標準偏差も$1$
である。
解答ト:0, ナ:1
と、トナも、標準化の式を知っていればこれだけで終わってしまう。
でも、せっかくだから、標準化について知らないときの解法も載せておいた。
憶えればいいやっていう人は、下の別解も読み飛ばしてください。
別解
問題文中の式
$x_{i}'=\displaystyle \frac{x_{i}-\overline{x}}{s}$
を考えるんだけど、まず思い出してもらいたいのは、次の性質だ。
重要事項
あるデータ$x_{1}$,$x_{2}$,$\ldots$,$x_{n}$の
平均値が$\overline{x}$
分散が$s_{x}^{2}$
標準偏差が$s_{x}$
であるとする。
データのすべてに$a$を加え、
$y_{1}=x_{1}+a$
$y_{2}=x_{2}+a$
$\vdots$
$y_{n}=x_{n}+a$
として$y_{1}$,$y_{2}$,$\ldots$,$y_{n}$をつくる。
このとき、$y_{1}$,$y_{2}$,$\ldots$,$y_{n}$の 平均値$\overline{y}=\overline{x}+a$ 分散は$s_{x}^{2}$のまま変わらない 標準偏差は$s_{x}$のまま変わらない である。
また、データのすべてを$b$倍して、
$z_{1}=bx_{1}$
$z_{2}=bx_{2}$
$\vdots$
$z_{n}=bx_{n}$
として$z_{1}$,$z_{2}$,$\ldots$,$z_{n}$をつくる。
このとき、$z_{1}$,$z_{2}$,$\ldots$,$z_{n}$の 平均値$\overline{z}=b\overline{x}$ 分散$s_{z}^{2}=b^{2}s_{x}^{2}$ 標準偏差$s_{z}=\sqrt{s_{z}^{2}}=|b|s_{x}$ となる。
まず、
$x_{i}'=\displaystyle \frac{x_{i}-\overline{x}}{s}$式A
の右辺の分子
$x_{i}-\overline{x}$
の部分を考えよう。
$y_{i} = x_{i}-\overline{x}$式B
とおくと、$y_{1}$,$y_{2}$,$\ldots$,$y_{n}$の平均値,標準偏差は、上の重要事項より、
平均値$\overline{y}=\overline{x}-\overline{x} =0$式C
標準偏差$s_{y} = s_{x} = s$式D
となる。
詳しく
重要事項より、
$y_{n}=x_{n}+a$
としたときの $y$の平均値$\overline{y}$と標準偏差$s_{y}$は
$\overline{y}=\overline{x}+a$
$s_{y} = s_{x}$
だった。
よって、
$y_{i}=x_{i}-\overline{x}$
としたときの $y$の平均値$\overline{y}$と標準偏差$s_{y}$は
$\overline{y}=\overline{x}-\overline{x}=0$
$s_{y} = s_{x} = s$
である。
式Bを式Aに代入すると、
$x_{i}'=\displaystyle \frac{y_{i}}{s}$
$x_{i}'$$=\displaystyle \frac{1}{s} \cdot y_{i}$
なので、データ$X'$の平均値,標準偏差は、上の重要事項より、
平均値$\overline{x'}=\displaystyle \frac{1}{s} \cdot \overline{y} =0$
標準偏差$s_{x'}=\displaystyle \left|\frac{1}{s}\right| \cdot s_{y} = 1$
となる。
詳しく
重要事項より、
$z_{n}=bx_{n}$
としたときの $z$の平均値$\overline{z}$と標準偏差$s_{z}$は
$\overline{z}=b\overline{x}$
$s_{z} = |b|s_{x}$
だった。
よって、
$x_{i}'=\displaystyle \frac{1}{s} \cdot y_{i}$
としたときの $x'$の平均値$\overline{x'}$は
$\overline{x'}=\displaystyle \frac{1}{s} \cdot \overline{y}$
だけど、式Cより$\overline{y}=0$なので、
$\overline{x'}=\displaystyle \frac{1}{s} \cdot 0 = 0$
である。
また、標準偏差$s_{x'}$は
$s_{x'}=\displaystyle \left|\frac{1}{s}\right| \cdot s_{y}$
だけど、式Dより$s_{y}=s$で、$s$は$x$の標準偏差だから$0 \leqq s$なので、
$s_{x'}=\displaystyle \frac{1}{s} \cdot s = 1$
である。
以上より、データ$X'$の平均値は$0$,標準偏差は$1$である。
解答ト:0, ナ:1
(3)ニ
以上より、$M'$と$T'$は、$M$と$T$の
①平均値を$0$に移動して
②標準偏差が$1$になるように拡大/縮小
したものである。
なので、問題文中の図4($M$と$T$の散布図)を、問題文中の図5($M'$と$T'$の散布図)に変換する作業は、図Eのようになる。
この作業を行ってできる散布図を、問題文中 図5の⓪~③から選ぶのが、最後の問題だ。
図Eを見て分かるとおり、$M'$と$T'$のグラフの形は、$M$と$T$のグラフを縮小したものになる。
なので、問題文中の図5の①や③のように、上下がひっくり返ったり左右がひっくり返ったりすることはない。
答えは⓪,②のどちらかだ。
⓪と②の違いは、目盛の違いだ。
⓪では すべての点が$-1$~$1$の間にあるけど、②では $\pm2$のあいだに広がっている。
どちらが正解かを見分けるのに、
$M'$も$T'$も標準偏差は$1$
を使う。
ただし、標準偏差では説明が面倒なので、分散を使うことにする。
復習
標準偏差は分散の正の平方根である。
復習より、標準偏差の2乗が分散なので、
$M'$も$T'$も分散は$1$
である。
さらに、分散とは何かを思い出すと、
復習
分散とは、偏差の2乗の平均値である。
だった。
問題文中の図5の場合、$M'$,$T'$ともに平均値は$0$なので、それぞれの点の偏差は、$M'$は図Fの紫の線の長さ、$T'$はオレンジの線の長さにあたる。(どうせ2乗するので$\pm$は無視する。)
紫の線それぞれの長さを2乗し、
その平均値を求めると、$M'$の分散
オレンジの線それぞれの長さを2乗し、
その平均値を求めると、$T'$の分散
なんだけど、$M'$の分散も$T'$の分散も$1$だから、⓪は不適であることが分かる。
⓪だと、紫の線もオレンジの線もすべて長さが$1$未満なので、2乗の平均値が$1$になることはあり得ない。
よって、正解は②である。
解答ニ:2