[Previous page] [Next page]

http://tsigeto.info/2020/statu/u200619.html
田中重人 (東北大学文学部准教授) 2020-06-19

現代日本学演習II「統計分析の基礎」

第8講 平均値の比較


[配布資料PDF版]
[テーマ] ふたつのグループ間での平均値の比較

度数分布表のオプション

度数分布表の「統計」オプションで「平均」と「標準偏差」をチェック。

練習問題:前回宿題について、PSPPにデータを打ち込み、平均値と標準偏差を出力してみよう。


順序尺度の変数の「平均値」

平均値は、本来は、間隔尺度以上の水準の変数にしか使えない。しかし、実際には、一定条件を満たせば、順序尺度についても平均値をとっていいとする基準が使われている。

具体的には、4点以上の尺度であって、正規分布に近似している場合 (教科書 p. 53--59)。これは、「偶然の積み重ねで形成されるものは正規分布にしたがう」という仮定による。

「正規分布に近似」しているかどうかは、通常、つぎの3点で判断する。

PSPP 度数分布表 (または棒グラフ) で検討するとよい。

「度数分布表」の「統計量」オプションで「歪度」「尖度」を指定すると、正規分布との乖離度を統計的に検討できる。これらの値は、正規分布のとき0をとり、絶対値が大きくなるほど、正規分布から外れる。およそ ±2 の範囲を超えていれば、正規分布からのずれが無視できない。

練習問題: 配布しているデータ中のさまざまな意識変数について、度数分布表 (棒グラフ、歪度、尖度) を出力し、正規分布に近似しているかどうかを判断してみよう。

これらの条件を満たさない場合は非線形変換 (教科書 p.142--144) をおこなったり、順位に変換したりすることがある。あるいは、平均値を使わずに中央値を使って分析することもある。

なお、2値の変数は、この条件にかかわらず間隔尺度とみなしてよいが、一定以上のデータ数があり、あまり偏っていないことが必要。


平均値の欠点

平均値は「はずれ値」(outlier) の影響を受けやすい。あまりにかけはなれたケースがあるときは

などの方法を使うことがある。

また、極端なはずれ値がなくとも、左右非対称の分布の変数 (所得、人口、めったに起こらない現象の経験回数など) では、平均値より中央値の方が適切な代表値であることが多い。


ふたつのグループ間での平均値の比較

データをグループに分けて、それぞれ平均値 (=層別平均) を求め、それらの間の差をもとめる。この差の大きさを、標準偏差を基準にして評価する。具体的には、effect size (ES) または 相関比 (η:イータ) という統計量を使う。

PSPPでのグループ別平均値の出力

メニューの「分析」から「平均の比較」→「グループの平均」を開く。

エフェクト・サイズ

Effect size (ES):一般には「Cohen の d」と呼ばれる。

ES = (グループ別平均の差) / (併合SD)

「併合SD」の計算については教科書 p. 137 [式5-8] の分母を参照。大雑把には、グループ別のSDの中間の値と考えてよい。

ESは、計算が簡単であり、直感的に把握しやすい。しかし、各グループの人数を考慮せず平均値だけ比較するため、グループの人数が大きくちがう場合でも、同じ人数に2等分されている場合でも、その間のちがいはESの値に反映しない。また、2グループ間の比較だけを行うものであるため、3つ以上のグループを比較するのにはつかえない。

ES はPSPPでは計算できない。

相関比 (correlation ratio)

イータ (η) は 0〜1の範囲の値をとり、独立変数の影響力をあらわす

PSPPでは、クロス表の「統計」オプションで「イータ」を選択する。出力には2種類の値が出てくるが、 平均値を計算したい変数が「従属」になっているほう を見る。


課題

  1. 適当な変数について、度数分布表・平均・標準偏差を出力(全体と男女別)
  2. 性別でわけて度数分布をグラフに表す (度数ポリゴンまたは折れ線グラフ)
  3. これらの分析結果から何が言えるか、解釈を書く。

この授業のインデックス

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2020-06-19 14:23 +0900 with Plain2.

Copyright (c) 2020 TANAKA Sigeto