[Previous page] [Next page]

http://tsigeto.info/2020/statu/u200710.html
田中重人 (東北大学文学部准教授) 2020-07-10

現代日本学演習II「統計分析の基礎」

第11講 統計的検定


[配布資料PDF版]
[テーマ] 平均値の区間推定と統計的検定の方法

前回課題について

課題1: 母比率の区間推定

課題2: 統計的検定の手続き


母平均の区間推定

間隔尺度以上の変数の場合には、「母集団においては正規分布している」という仮定を置けば、平均値の区間推定が可能。標本における平均 m と標準偏差 SD から、母集団における平均 M を推測する。

95%信頼区間は次のようになる:

m ± 臨界値 × 併合SD × SD / √n

臨界値は、t 分布を使って求める (数表で調べる)。「自由度」(df = n-1) と危険率 (=1−信頼率)によって変化する。標本規模200以上で信頼率95%なら、臨界値は1.96 と考えてよい。


平均値の差の区間推定

ふたつのグループの間の平均値を比較するときは、平均値のグループ間の差についての信頼区間を直接求める方法をとる。標本における2グループ間の平均値の差を d とすると、 95%信頼区間は

d ± 臨界値 × 併合SD × √( (1/n1)+(1/n2) )

ただし n1, n2 はそれぞれのグループの人数。 「臨界値」は自由度 (n1 + n2 − 2) の t 分布にしたがって求める。


PSPP コマンド

母平均の区間推定

「分析」→「記述統計量」→「探索的」

「因子」を指定すると、グループ別に分析できる。

平均値の差の区間推定

「平均の比較」→「独立したサンプルの t 検定」


統計的検定 (statistical test)

特定の値 x (0にすることが多い) を設定して、その値が信頼区間に含まれているかどうかを判定する。

統計的検定用語 (教科書 pp. 156--158, 165--166)

帰無仮説 (null hypothesis): 母集団における統計量が「特定の値」に等しい、という仮説
有意 (significant): 「特定の値」が信頼区間に 入っていない ことをあらわす

平均値の差の検定の場合

「5%水準で有意」とは……

「5%水準で非有意」とは……

有意確率とは

信頼区間の幅は、危険率 (= 1 − 信頼率) を下げると広くなる。危険率を下げて信頼区間をひろげていくと、どこかで x をふくむようになる。このときの危険率のことを「有意確率」または「p値」という。

分析の際は、前もって危険率を設定しておき (通常は5%)、有意確率がその値を 下回っているかどうか 判別する。


区間推定と統計的検定

区間推定と統計的検定の間に本質的なちがいはない。ただし、区間推定は、統計量によっては、すごくむずかしい場合がある。統計的検定のほうが計算が簡単なので、統計的検定を使うことが多い (分野によってちがう)。


課題

適当な変数の平均の男女間の差について統計的検定を行い、結果にコメントをつけて提出


参考資料

森際孝司「標準正規分布表」 <https://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm>


この授業のインデックス

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2020-07-10 13:53 +0900 with Plain2.

Copyright (c) 2020 TANAKA Sigeto