平成19年度問題9への解答・解説
この頁は、平成21年5月2日に新たに開設しました。
この頁は、令和2年5月5日に一部更新しました。
このページでは、平成19年度問題9への解答・解説・問題の評価を行う。
1) 正解 e
2) 解説
この問題は、問題中の解析方法の基礎を知っておれば、最初の A 及び B への
解答のみから(あとで「問題9の評価」のところで述べる専門的なことを言わなけ
れば)最終的な正解が e であることがわかる。
- A については、分散の等質性の検定のための F 統計量(これは、一般に2群の不偏
分散比として定義される)は、最初のパラグラフの中に F=1.95 と記載されて
おり、さらに分散の等質性の帰無仮説のもとでの危険率 5%の棄却点の値(別
名、臨界値)が、2.59 と記載されているので、分散の等質性は採択される。
そこで、通常の自由度 nx+ny-2 なる t-検定が可能となる。したがって、この言明
は、一応正しい。ここで、nx、ny は一般に各群のサンプル数である。問題の回答
には必要ないが、この例ではサンプル数はともに20なので、この場合の自由度は、
20+20-2=38 である。一方、やはり回答には必要ないが、F-統計量の2つの自由度は、
一般には nx-1, ny-1 であり、この例では、したがって 19, 19 である。
ここで「一応正しい」、と書いた理由については、あとの「問題9の評価」を見よ。
- B については、うえに書いたように、ここでのt-検定の自油度は nx+ny-2 すなわ
ち38であり、400 ではないので、間違いである。
- C については、5%の t-統計量の両側検定の臨界値をおよそ 2.02 と見るとすれ
ば、標本での統計量の値が問題に記載された 4.76 であるので、有意差がみられる
ので、正しいと言える。ただし、あとの「問題9の評価」を見ると、より専門的に
はすこし問題がある。
- D については、身長はもともと比率尺度であり、順序尺度ではないので、当該言明
の前半で既にまちがっており、正しくない。
3) 問題9の評価
正確にはこの問題での棄却点の値は、F-統計量の値が通常の両側5%点で行うとしても、
少しずれていて、正しくない。自由度 19, 19 の場合の通常の棄却点の値は、通常の両側
検定の場合の右側 2.5 %棄却点の値は 2.59 ではなく2.53 である。また、問題の中にこ
の場合両側検定を考えているのか片側検定を考えているのかが記載されていない。少なく
とも日本では、これまで一般に女子より男子の身長の方が高いはずで、そうであれば、身
長の男女さの検定は最初から片側検定を考えた方が適切のはずであるから。
もう一つの大きな問題は、よく知られたこの問題での、検定の一連の手順全体の危険
率の統制の問題である。実は、内外のほとんどのテキストは、この一連の手順全体の危険
率について述べておらず、その意味では問題9もよくある設定なのだが、一連の手順すな
わち、等分散性の F-検定を最初に行い、つぎに等分散性が採択された時、通常の t-検定
で平均値の差を検定する場合、両検定量は互いに独立なことがわかっており(Hogg, 1961)、
例えば多くのテキストにあるようにこの点を考慮せず2つの検定を行うと、全体の危険率
はほぼ2倍、例えばそれぞれを5%水準で検定すると、全体の危険率はほぼ10%に跳ね
上がってしまうのである。これを避けるには、このような場合、最初からそれぞれの検定
の危険率を 2.5 %に設定すれば、一連の検定での全体的危険率は5%に押さえることが
できる。詳細は、千野のWEB 頁の
「耳寄りな話」第1節
を参照されたい。
引用文献
- 千野直仁・佐部利真吾 (2009). 講義テキスト「心理統計学 I, II」 成文堂
- Hogg, R. V. (1961). On the resolution of statistical hypotheses.
Journal of the American Statistical Association, 56,
978-989.