[Previous page]
[Next page]
http://tsigeto.info/2020/statu/u200529.html
田中重人 (東北大学文学部准教授)
2020-05-29
現代日本学演習II「統計分析の基礎」
第6講 連関係数とクロス表の解釈
[配布資料PDF版]
- [テーマ]
連関係数と%の関係を理解する
前回課題について
「行」と「列」については、つぎのことを理解しておくこと:
- 「行」は横方向、「列」は縦方向
- 行% と列% の使い分けは、原因→結果の関係に対応
論文等に表を載せる場合は、行%か列%どちらか一方、適切なほうだけを書く (人数は、合計のところだけ書いておけばよい)。
PSPPの結果の表をExcel等でグラフにするには
- PSPPの出力ビューアの内容を、いったん「.html」の拡張子をつけたファイル名で書き出す
- それをブラウザで開いて、表の部分をコピー
- Excel のシートにペーストする
- 不要な部分を削除したり、ラベルをつけたりする
- 必要な部分を選択し、グラフを作成
という作業をする。
- クロス表をグラフにする場合は、帯グラフ (積み上げ棒グラフ) で合計100%になるようにするのが標準 (折れ線グラフまたは度数ポリゴンでもよい)
- Excel の「積み上げ棒グラフ」ではカテゴリー順序が逆転するので注意 (もとどおりにしたいときは、シート上の順序をいれかえる)
- 列%によるグラフになってしまう場合は、右クリック→「データの選択」で行/列を入れ替える
- 「レイアウト」→「線」で「区分線」を指定するとよい。
- 「合計」の数値は不要
たとえば次のようになる:
- 図1:
性別と性別不公平感との関連
今回の課題
「性別」と「性別による不公平」のクロス表を作成する。ただし、つぎの数値を指定すること。
- 「セル」オプションで「度数」「期待」「残差」「標準化された残差」
- 「統計量」オプションで「カイ2乗」「Phi」
出力と教科書 (pp. 108, 116--117) をもとに、つぎのことを考える:
- 連関係数「Cramer の V」と「Pearson のカイ2乗」の間の数学的な関係 [式 4-19]
- 式 [4-17] のなかに、「Pearson のカイ2乗」「観測度数」「期待度数」「残差」「標準残差」はどのように表れているか
- 連関係数 V の最小値・最大値はそれぞれいくつか。またどのような場合に最小値・最大値をとるか。
提出は、木曜日正午まで。
なお、余力があれば、次のことも考えてみる:
- 2×2クロス表におけるファイ係数 (φ:教科書 p.110 [式 4-10]) は Cramer の V とどのような関係にあるか
キーワード
- セル (cell):
クロス表のひとつひとつの升目のこと
- 行 (row):
横方向のセルの並び
- 列 (column):
縦方向のセルの並び
- 独立 (無関連 = independent):
すべての列について行%が等しい (またはすべての列について行%が等しい) 状態
- 周辺度数 (marginal frequency):
クロス表の右端・下端に書く「合計」の度数
- 期待度数 (期待値 = expected frequency):
周辺度数を固定しておいて、独立な (架空の) クロス表をつくった場合、各セルに入る (と期待される) 度数
- 観測度数 (frequency):
各セルに入っている実際の度数
- 残差 (residual):
観測度数 − 期待度数
- 標準残差 (standard residual):
残差を期待度数の平方根で割ったもの
- χ2 (chi-square):
標準残差の平方和
- クラメールの連関係数 V:
χ2 を全度数で割り、セル数を調整したものの平方根
行・列の数が多いクロス表では、各セルの%を比較するのが大変である。また、%の差が大きいように見えても、度数が少ない場合には、実質的には大差ないと考えるべきであるが、そのようなことを判断するのもむずかしい。そこで、まずクロス表全体について「連関係数」を見ることで、行変数と列変数の「連関の強さ」を判断し、そのうえで細かく%を比較していくのが定石になっている。
この授業のインデックス
前回の授業
|
次回の授業
TANAKA Sigeto
History of this page:
- 2020-05-29 : Created
- 2020-05-29 : Minor corrections
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2020-05-29 14:29 +0900 with
Plain2.
Copyright (c) 2020
TANAKA Sigeto