[Previous page] [Next page]

http://tsigeto.info/2020/statu/u200703.html
田中重人 (東北大学文学部准教授) 2020-07-03

現代日本学演習II「統計分析の基礎」

第10講 推測統計の基礎と区間推定


[配布資料PDF版]
[テーマ] 推測統計の基礎

前回課題について

男性: 1, 2, 3, 3, 4 → 平均 2.6
女性: 2, 3, 4, 4, 5 → 平均 3.6
全体の平均 (SD): 3.1 (1.14)

グループ別平均値を当てはめた「仮想」データの平方和は、つぎのようになる。下線部に注意。

仮想の平方和 = 5 ( 2.6 - 3.1 )2 + 5 ( 3.6 - 3.1 )2 = 2.5

これを N (=10) で割って平方根をとると標準偏差が得られる。

仮想SD = √( 2.5/10 ) = 0.5

η = 仮想SD / 実際のSD = 0.5 / 1.14 = 0.44

ただし、SPSS では平方和を N-1 (=9) で割って「標準偏差」を求めているので、注意。度数がある程度大きくなれば (およそ N>200 の場合)、このことによる違いは気にしなくてよい。

分散分析の実際の計算では、平方和どうしで割り算してηを求める (N で割らずに済み、平方根を求めるのも一度で済むため)。結果を示す「分散分析表」は、伝統的にはそのようにして作成する。


基礎知識


統計的推測のふたつの方法

このような情報 (=標本統計量) から、母集団における統計量 (=母比率) を推測する

区間推定: ある統計量の母集団における値について、確率的な推測によって範囲を求める →母比率はたぶん ○○ から ×× の範囲にある
統計的検定: ある統計量の母集団における値について何らかの「帰無仮説」(null hypothesis) を設け、それが棄却できるかを判定する →母比率が0.5だと考えてよいか?

統計的検定のほうが計算が簡単であるため、よくつかわれている。区間推定を論文等で目にする機会はあまりないが、きちんと理解するにはまず区間推定の考え方をおさえるのがよい。


母比率の区間推定

区間推定の原理

  1. 「信頼率」を決めておく (たとえば95%)
  2. (1−信頼率) の確率を両極の事象に設定する (高いほう、低いほうからそれぞれ2.5%ずつを除く)
  3. 母集団における値がいくつであれば、この両極端を除いた区間に測定値が入るかを計算する。統計量の性質に応じて、これを計算するための式と数表があるので、それを利用する。

このようにして求めた、母集団においてありうる値の集合が「信頼区間」である。通常、最初に決めた「信頼率」を明示して、「95%信頼区間」などのようにいう。

母比率の区間推定

標本の規模 n がじゅうぶん大きく (n>30)、比率 m があまり偏っていない (0.1<m<0.9) とき、母比率の95%信頼区間は次の式で求められる:

m ± 1.96 √( m(1-m)/n )

課題

全世界から400人を無作為抽出してある意見に対する賛否を聞いたところ、「賛成」と答えた人が240人であった (欠損値はないものとする)。このとき、母集団 (全世界の人々) における賛成の比率の95%信頼区間を求めよ。


宿題

教科書 pp. 156--162 を読み、統計的検定の手続きをまとめよ


期末レポート

期限: 8/11 (火) 17:00
提出先: Google Classroom 「期末レポート」にファイルを提出
内容: クロス表と平均値の比較の両方について適当な分析をして結果を解釈する。それぞれ推測統計(区間推定または統計的検定)の結果もつけること。図・表は読みやすく整形し、論文としての体裁を整えること。授業で配布した以外のデータを使ってもよいが、その場合はデータについての解説をレポート中にふくめること。
備考: レポート提出後に、データのコピーをすべて消去すること。

この授業のインデックス

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2020-07-03 14:12 +0900 with Plain2.

Copyright (c) 2020 TANAKA Sigeto