[Previous page] [Next page]

http://www.sal.tohoku.ac.jp/~tsigeto/2013/statg/g130605.html
田中重人 (東北大学文学部准教授)

現代日本論演習/比較現代日本論研究演習I「統計分析入門」(2013)

第7講 連関係数 (6/5)


[配布資料PDF版]
[テーマ] 期待度数、残差、連関係数の導出

前回課題について

「再」マークのついている人は、再提出 (ISTU で火曜正午まで)


今回の課題

「性別」と「性別による不公平」のクロス表を作成する。ただし、「セル」「統計量」オプションで「観測度数」「期待度数」「残差」「標準残差」「カイ2乗」「Phi」「Cramer V」の数値を指定すること。

出力と教科書 (pp. 108, 116--117) をもとに、つぎのことを考える:

提出は、ISTUで火曜日正午まで。


キーワード

独立 (無関連 = independent): すべての列について行%が等しい (またはすべての列について行%が等しい) 状態
周辺度数 (marginal frequency): クロス表の右端・下端に書く「合計」の度数
期待度数 (期待値 = expected frequency): 周辺度数を固定しておいて、独立な (架空の) クロス表をつくった場合、各セルに入る (と期待される) 度数
観測度数 (frequency): 各セルに入っている実際の度数
残差 (residual): 観測度数 − 期待度数
標準残差 (standard residual): 残差を期待度数の平方根で割ったもの
χ2 (chi-square): 標準残差の平方和
クラメールの連関係数 V: χ2 を全度数で割り、セル数を調整したものの平方根

行・列の数が多いクロス表では、各セルの%を比較するのが大変である。また、%の差が大きいように見えても、度数が少ない場合には、実質的には大差ないと考えるべきであるが、そのようなことを判断するのもむずかしい。そこで、まずクロス表全体について「連関係数」を見ることで、行変数と列変数の「連関の強さ」を判断し、そのうえで細かく%を比較していくのが定石になっている。


今後の予定

6/19 中間試験 (当初の予定より1週間おくれ)。出題範囲は、6/12 授業内容まで。持ち込み可 (ただし通信・相談禁止)。コンピュータで解答を作成して、ISTUで提出。

試験後は、通常通り授業。


この授業のインデックス | 関連するブログ記事

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2013-06-05 08:45 +0900 with Plain2.

Copyright (c) 2013 TANAKA Sigeto