[Previous page] [Next page]

http://tsigeto.info/2020/statu/u201211.html
田中重人 (東北大学文学部准教授) 2020-12-11

現代日本学演習V「実践的統計分析」

第9講 多変量解析入門


[配布資料PDF版]
[テーマ] 多変量解析の種類と、重回帰分析の基本的な考えかた

前回課題について

「差」の変数をつくったときの「平均」「標準誤差」の意味。

対応のあるデータの場合、平均値の差の信頼区間を求める際の数式の標準誤差 (standard error) を、相関係数を用いて調整する。この点が、通常の (対応のない) 平均値の場合と異なる。

相関図を描いて考えてみよう

対応のある分析について: 結果の書きかた

個々の結果を表示する十分なスペースがある場合

クロス表 (または相関図) をいちいち示すのが基本 (別紙参照)。各セルには、度数と 全体での%を書く。統計量などは表の下に書く。必要な統計量は分析法によって違うので注意。

スペースがあまりない場合

対応のあるt検定であれば、各変数の平均とSDの表をのせる。表の下に、人数、相関係数、平均値の差、有意水準(対応のある検定であることを明記)を書く。

符号検定であれば、x>y, x=y, x<y 各ケースの比率の表をのせる。表の下に、有意水準 (符号検定であることを明記) を書く。

多数の変数間の関連を示す場合

ハッセ図 (Hasse diagram) が使える。平均値などの高い順に変数を並べ、有意な差がある変数どうしを線でむすぶ。具体例は太郎丸 (2000) 参照。


多変量解析とは

3つ以上の変数をつかう分析法を「多変量解析」(multivariate analysis) という。次の2種類に分けられる (大野, 1998, p.48-56)。

この授業では前者をあつかう。


用語

従属変数 (dependent variable): 結果になる変数のこと。通常、ひとつの分析についてひとつだけ。「目的変数」「被説明変数」ということもある。
独立変数 (independent variables): 原因になる変数のこと。ひとつの分析に複数あってよい。「説明変数」ということもある。

従属変数と独立変数は、しばしばYとXであらわされる


課題1

Q39g (……指導者や専門家……) と Q1_1a (満年齢), Q6_1(学歴) の関連を確認し、これらの間の因果関係についてどのようなことがいえそうかを考える。

ただし、学歴の変数は次のように3分割すること:初等 (1,2,12); 中等 (3-5,13); 高等 (その他)


第3変数の統制 (control)

複数の要因が影響を与えていると想像される場合、因果関係を確定するには、ある変数の効果を「一定に保った」状態をつくったうえで、別の変数の効果を推定する必要がある。

実験の場合: 被験者の割り当ての時点で統制する (無作為割り当てなど)
観察の場合: 分析の段階で、多変量解析をおこなう

たとえば、データセットを学歴で3分割して、年齢とQ39gとの相関分析を行ってみるだけでも、かなりのことがわかる。このような発想を洗練させたものが多変量解析である。


回帰分析

PSPPで、「分析」→「回帰」→「線形」を選択。

変数は次のように指定する

「統計」オプションで「係数」「信頼区間」「R」「分散分析」を指定

(学歴は変数変換が必要なので、次回以降)


結果の読みかた

Q39gの値は、つぎの式で近似できることになる

Q39g = 切片 + B × Q1_2a


文献


この授業のインデックス

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2020-12-11 14:33 +0900 with Plain2.

Copyright (c) 2020 TANAKA Sigeto