[Previous page] [Next page]

http://tsigeto.info/2022/statu/u220701.html
田中重人 (東北大学文学部教授) 2022-07-01

現代日本学演習II「統計分析の基礎」

第9講 分散分析 (つづき)


[配布資料PDF版]
[テーマ] 分散分析 (ANOVA) の考えかたと計算方法を理解する

前回課題について

男性: 1, 2, 3, 3, 4 → 平均 2.6
女性: 2, 3, 4, 4, 5 → 平均 3.6
全体の平均 (SD): 3.1 (1.14)

グループ別平均値を当てはめた「仮想」データの平方和は、つぎのようになる。下線部に注意。

仮想の平方和 = 5 ( 2.6 - 3.1 )2 + 5 ( 3.6 - 3.1 )2 = 2.5

これを N (=10) で割って平方根をとると標準偏差が得られる。

仮想SD = √( 2.5/10 ) = 0.5

η = 仮想SD / 実際のSD = 0.5 / 1.14 = 0.44

ただし、SPSS では平方和を N-1 (=9) で割って「標準偏差」を求めているので、注意 (前々回資料参照)。相関比ηを求める場合は、分子・分母の両方がおなじ方式で計算できていれば問題ない。

仮想SDのことを「群間」のSDと呼ぶことがある。一方、各グループ内での平均からの偏差を使って求めた標準偏差を「群内」のSDと呼ぶ。

実際のSD2 = 仮想SD2 + 群内のSD2

分散分析の実際の計算では、平方和どうしで割り算してηを求める (N で割らずに済み、平方根を求めるのも一度で済むため)。結果を示す「分散分析表」は、伝統的にはそのようにして作成する。

教科書 pp. 203-208 の説明では SSA が群間の平方和に、SSE が群内の平方和に、それぞれ相当する。


表の書きかた


グラフの書きかた

平均値をプロットし、上下にSDを表示する。誤差範囲 (error bar; 別名「ヒゲ」) にはSD以外を書く場合もあるので、必ず「±標準偏差」であることを明記する。

Excel では

Googleスプレッドシートでは同様のことはできない模様。

より詳細に分布の違いを検討したいときは、グループ別に折れ線グラフを描いてもよい。


文献


この授業のインデックス

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2022-07-01 14:27 +0900 with Plain2.

Copyright (c) 2022 TANAKA Sigeto