http://www.sal.tohoku.ac.jp/~tsigeto/2013/statg/g131113.html
田中重人 (東北大学文学部准教授)
2013-11-13
現代日本論演習/比較現代日本論研究演習III「実践的統計分析」(2013)
平均=0, 標準偏差=1 になるよう変換する。これで単位を気にせずに、変数同士の値を比較できるようになる
- 具体的には: ( その個体の値 − 平均値 ) / SD (→ 教科書 pp. 129, 130)
標準化済みの変数 X, Y について、それらの積の平均をとったもの:
\begin{equation} r = \frac{\sum XY}{N} \end{equation}通常、単に「相関係数」といえばこの r をさす
欠点:はずれ値や歪みに弱い
先に各変数を順位に変換しておく。あとの計算は、Pearsonの積率相関係数とおなじ。
$ r_s $ または ρ であらわす。
クロス表の「統計量」オプションで「相関係数」を選択。
相関係数が 0 または ±1 になるのはどのような場合か?
Pearson の r の信頼区間は、「Fisherの z 変換」と呼ばれる方法で求められる (森・吉田 1990)。この信頼区間に r=0 が含まれるかを判断すれば、統計的検定がおこなえる。
ただし、この方法で正確に信頼区間を求めるのは面倒なので、通常は t 分布を利用した検定だけをおこなう (教科書巻末の数表参照)。 Spearman の順位相関係数ρについても、おなじ方法が使える。
Kendall の順位相関係数タウbについての推定・検定は別の方法を使う (Bohrnstedt and Knoke, 1992) が、省略。 r に関する t 検定より検定力が低いことに注意。
3つ以上の変数について、総当たりで相関係数を並べた表を「相関係数行列」 (correlation matrix) という。
多変量解析の前段階の分析として相関係数行列を使うときは、必ず listwise 除去をおこなうこと。そうでない場合でも、係数どうしを比較するときには、listwise で欠損値をふくむケースを除去する (すべての係数について使っているケースを統一する) のが普通である。ただし、多くの変数を使った分析で listwise 除去をおこなうと、ケース数がかなり少なくなることがあるので注意。
この方法のどちらを取るかで結果が大きく違うとしたら、部分的に欠損値を持っているケースの挙動が特殊であることを意味する。その場合には、特定のケースで妙な回答パターンになっていないか、チェックすること。
次回の授業中に中間試験をおこないます。試験範囲は、今日の授業内容まで。なんでも持込可 (ただしオンラインで何かを調べるのは禁止)。授業で使っているデータと調査票を持ってくること。
History of this page:
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2014-09-24 22:56 +0900 with Plain2.
Copyright (c) 2013 TANAKA Sigeto