[Previous page] [Next page]

http://tsigeto.info/2019/statu/u190521.html
田中重人 (東北大学文学部准教授) 2019-05-21

現代日本学演習II「統計分析の基礎」

第6講 連関係数とクロス表の解釈


[配布資料PDF版]
[テーマ] 連関係数と%の関係を理解する

前回課題について


今回の課題

「性別」と「性別による不公平」のクロス表を作成する。ただし、「セル」「統計量」オプションで「観測度数」「期待度数」「残差」「標準残差」「カイ2乗」「Phi」「Cramer V」の数値を指定すること。

出力と教科書 (pp. 108, 116--117) をもとに、つぎのことを考える:

提出は、ISTUで月曜日正午まで。

なお、余力があれば、次のことも考えてみる:


キーワード

独立 (無関連 = independent): すべての列について行%が等しい (またはすべての列について行%が等しい) 状態
周辺度数 (marginal frequency): クロス表の右端・下端に書く「合計」の度数
期待度数 (期待値 = expected frequency): 周辺度数を固定しておいて、独立な (架空の) クロス表をつくった場合、各セルに入る (と期待される) 度数
観測度数 (frequency): 各セルに入っている実際の度数
残差 (residual): 観測度数 − 期待度数
標準残差 (standard residual): 残差を期待度数の平方根で割ったもの
χ2 (chi-square): 標準残差の平方和
クラメールの連関係数 V: χ2 を全度数で割り、セル数を調整したものの平方根

行・列の数が多いクロス表では、各セルの%を比較するのが大変である。また、%の差が大きいように見えても、度数が少ない場合には、実質的には大差ないと考えるべきであるが、そのようなことを判断するのもむずかしい。そこで、まずクロス表全体について「連関係数」を見ることで、行変数と列変数の「連関の強さ」を判断し、そのうえで細かく%を比較していくのが定石になっている。


今後の予定

5/28 進度確認。出題範囲は、今週の授業内容まで。持ち込み可 (ただし通信・相談禁止)。コンピュータで解答を作成して、ISTUで提出。

試験後は、通常通り授業。


この授業のインデックス | 関連するブログ記事

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2019-05-21 12:12 +0900 with Plain2.

Copyright (c) 2019 TANAKA Sigeto