[Previous page] [Next page]

http://www.sal.tohoku.ac.jp/~tsigeto/2013/statg/g131002.html
田中重人 (東北大学文学部准教授) 2013-10-02

現代日本論演習/比較現代日本論研究演習III「実践的統計分析」(2013)

第1講 推測統計の基礎 (10/2)


[配布資料PDF版]
[テーマ] 推測統計の基礎

復習


統計的推測のふたつの方法

このような情報 (=標本統計量) から、母集団における統計量 (=母比率) を推測する

区間推定: 母比率はたぶん ○○ から ×× の範囲にある
統計的検定: 母比率が0.5だと考えてよいか?

統計的検定のほうが計算が簡単であるため、よくつかわれている。区間推定を論文等で目にする機会はあまりないが、きちんと理解するにはまず区間推定の考え方をおさえるのがよい。


母比率の区間推定

区間推定の原理

  1. 「信頼率」を決めておく (たとえば95%)
  2. データから統計量を計算する
  3. 母集団分布についていろいろなケースを想定する。その想定のもとでの標本統計量の確率分布を計算し、95%の確率で出現する範囲を確定する。
  4. この範囲のなかに、データから求めた統計量の値がふくまれるかを調べる
  5. (4) の条件を満たす想定ケースのすべてについて統計量を求める
  6. (5) で求めた値の集合が「95%信頼区間」である

標本比率 m はわかっているが母比率 M が不明の場合の区間推定

上記の例題では、 m=1 であることがわかっているが、 M が不明である (n=8)。このとき、95%信頼区間を求めるには、 M を適当に仮定し、その仮定の下で m=1 になる確率を計算することを繰り返す:

このようにして、m=1 になる確率が 2.5%以上 である M の範囲を求める。

課題1: 解答を火曜正午までに ISTU に提出。プロセスがわかるように書くこと。

累乗 (0.9 の8乗など) を求めることが必要になる。 Windowsの「電卓」ではメニューから[表示]→[関数電卓]に切り替えるとよい。 Excelでは ^ という演算子が使える (掛け算を8回繰り返してもよい)。

もっと複雑な例

全世界から400人を無作為抽出して麺類の好みを訊いたところ、「うどんが好き」と答えた人が240人であった。このとき、母集団 (全世界の人々) におけるうどん好きの比率の95%信頼区間を求めよ (欠損値はないものとする)。

原理的には上記とおなじやりかたで計算できるが、計算量が膨大になるので実際的でない。このような問いに答えるためには、「二項分布」(binomial distribution) の知識を利用する。

二項分布の簡単な例題: 硬貨を4回投げて、そのうち表が出る回数 x を数える。

表=1, 裏=0 であらわすと
0 0 0 0 (x=0)
0 0 0 1 (x=1)
0 0 1 0 (x=1)
0 0 1 1 (x=2)
...............
1 1 1 1 (x=4)

どれも等しい確率 (1/16) で起こるとすると、つぎのそれぞれの場合の確率が求められる:


表が1回も出ない (x=0) 確率:
表が1回出る (x=1) 確率:
表が2回出る (x=2) 確率:
表が3回出る (x=3) 確率:
表が4回出る (x=4) 確率:
課題2: 解答を火曜正午までに ISTU に提出。プロセスがわかるように書くこと。

参考資料


この授業のインデックス | 関連するブログ記事

次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2013-10-03 07:33 +0900 with Plain2.

Copyright (c) 2013 TANAKA Sigeto