[Previous page] [Next page]

http://www.sal.tohoku.ac.jp/~tsigeto/2016/statg/g160630.html
田中重人 (東北大学文学部准教授) 2016-06-30

現代日本論演習/比較現代日本論研究演習I「統計分析の基礎」

第10講 分散分析


[配布資料PDF版]
[テーマ] 分散分析 (ANOVA) の考えかたと計算方法を理解する

前回課題について


分散分析の考えかた

グループ別の平均値を当てはめて仮想の分散を求める分析法を「分散分析」(ANOVA:ANalysis Of VAriance) という。

相関比 (イータ) の性質:

大きさの評価基準は、Cramerの連関係数Vと同様。

なぜ相関比を求めると、平均値を比較していることになるのか?


課題

次のデータ (10人) について、分散分析を行なう

男性: 1, 2, 3, 3, 4
女性: 2, 3, 4, 4, 5

まず手計算 (またはExcel) で考えてみて、そのあと、SPSSにデータを入力して検算する。

  1. 全体の平均値とSDを求める
  2. 男女別の平均値を求める
  3. 男性の平均値×5人と女性の平均値×5人からなる仮想データを考えてSDを求める
  4. (3) のSDを (1) のSDで割ったものが相関比η

この相関比がなぜ「平均値の比較」の指標になるかを考えること。


相関比とエフェクトサイズの関係

相関比ηとエフェクトサイズESの間にはつぎの関係がある (n1, n2 は各グループの度数、N = n1 + n2 は全体の度数)。

ES2 = (η2 /(1−η2) ) × ( N2 / n1 n2 )

特に、2グループの度数が等しい (n1=n2) なら、この式は次のようになる。

ES2 = 4η2 /( 1−η2 )

(グループの度数が違えば、ESはこれより大きくなる)

さらに、ηがあまり大きくない (η<0.4 程度) 場合であれば、次のような単純な式で近似できる:


ES = 2η

モデルとデータの乖離

相関比ηは、モデルとデータの乖離を表した値と解釈できる


表の書きかた


グラフの書きかた

平均値をプロットし、上下にSDを表示する。誤差範囲 (error bar; 別名「ヒゲ」) にはSD以外を書く場合もあるので、必ず「±標準偏差」であることを明記する。

Excel では

より詳細に分布の違いを検討したいときは、グループ別に度数ポリゴン (または折れ線グラフ) を描いてもよい。


この授業のインデックス | 関連するブログ記事

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2016-07-01 17:50 +0900 with Plain2.

Copyright (c) 2016 TANAKA Sigeto