[Previous page] [Next page]

http://www.sal.tohoku.ac.jp/~tsigeto/2015/statg/g151112.html
田中重人 (東北大学文学部准教授) 2015-11-12

現代日本論演習/比較現代日本論研究演習III「実践的統計分析」

第5講 相関係数 (2)


[配布資料PDF版]
[テーマ] ピアソンの積率相関係数と相関係数行列

積率相関係数類

変数の標準化

平均=0, 標準偏差=1 になるよう変換する。これで単位を気にせずに、変数同士の値を比較できるようになる

具体的には: ( その個体の値 − 平均値 ) / SD (→ 教科書 pp. 129, 130)

Pearson の積率相関係数

標準化済みの変数 X, Y について、それらの積の平均をとったもの:

\begin{equation} r = \frac{\sum XY}{N} \end{equation}

通常、単に「相関係数」といえばこの r をさす

欠点:はずれ値や歪みに弱い

Spearmanの順位相関係数

先に各変数を順位に変換しておく。あとの計算は、Pearsonの積率相関係数とおなじ。

$ r_s $ または ρ (rho: ロー) であらわす。

SPSSコマンド

クロス表の「統計量」オプションで「相関係数」を選択。


相関係数類の使いわけ

相関係数が 0 または ±1 になるのはどのような場合か?


相関係数の検定

Pearson の r の信頼区間は、「Fisherの z 変換」と呼ばれる方法で求められる (森・吉田 1990)。この信頼区間に r=0 が含まれるかを判断すれば、統計的検定がおこなえる。

ただし、この方法で正確に信頼区間を求めるのは面倒なので、通常は t 分布を利用した検定だけをおこなう (教科書巻末の数表参照)。 Spearman の順位相関係数ρについても、おなじ方法が使える。

Kendall の順位相関係数タウbについての推定・検定は別の方法を使う (Bohrnstedt and Knoke, 1992) が、省略。 r に関する t 検定より検定力が低いことに注意。


相関係数行列

3つ以上の変数について、総当たりで相関係数を並べた表を「相関係数行列」 (correlation matrix) という。

SPSSコマンド

欠損値の処理

多変量解析の前段階の分析として相関係数行列を使うときは、必ず listwise 除去をおこなうこと。そうでない場合でも、係数どうしを比較するときには、listwise で欠損値をふくむケースを除去する (すべての係数について使っているケースを統一する) のが普通である。ただし、多くの変数を使った分析で listwise 除去をおこなうと、ケース数がかなり少なくなることがあるので注意。

この方法のどちらを取るかで結果が大きく違うとしたら、部分的に欠損値を持っているケースの挙動が特殊であることを意味する。その場合には、特定のケースで妙な回答パターンになっていないか、チェックすること。

相関係数行列の整形


課題

  1. SPSS の「クロス集計表」で、Kendall のタウb がプラスになる表とマイナスになる表を出力し、クロス表の%を見て解釈する
  2. 5つ以上の変数をつかって相関係数行列を出力し、解釈をつけて提出 (火曜正午までISTU)

予告

次々回の授業中に中間試験をおこないます。試験範囲は、今日の授業内容まで。なんでも持込可 (ただしオンラインで何かを調べるのは禁止)。授業で使っているデータと調査票を持ってくること。


文献


この授業のインデックス | 関連するブログ記事

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2015-11-12 10:13 +0900 with Plain2.

Copyright (c) 2015 TANAKA Sigeto