http://www.sal.tohoku.ac.jp/~tsigeto/2016/statg/g161215.html
田中重人 (東北大学文学部准教授)
2016-12-15
現代日本論演習/比較現代日本論研究演習III「実践的統計分析」
対応のあるデータの場合、平均値の差の信頼区間を求める際の数式の標準誤差 (standard error) を、相関係数を用いて調整する。この点が、通常の (対応のない) 平均値の場合と異なる。
クロス表 (または相関図) をいちいち示すのが基本 (別紙参照)。各セルには、度数と 全体での%を書く。統計量などは表の下に書く。必要な統計量は分析法によって違うので注意。
対応のあるt検定であれば、各変数の平均とSDの表をのせる。表の下に、人数、相関係数、平均値の差、有意水準(対応のある検定であることを明記)を書く。
符号検定であれば、x>y, x=y, x<y 各ケースの比率の表をのせる。表の下に、有意水準 (符号検定であることを明記) を書く。
ハッセ図 (Hasse diagram) が使える。平均値などの高い順に変数を並べ、有意な差がある変数どうしを線でむすぶ。具体例は別紙参照。
3つ以上の変数をつかう分析法を「多変量解析」(multivariate analysis) という。次の2種類に分けられる (大野, 1998, p.48-56)。
この授業では後者だけをあつかう。
従属変数と独立変数は、しばしばYとXであらわされる
Q39g (……指導者や専門家……) と Q1_1a (満年齢), Q6_1(学歴) の関連を確認し、これらの間の因果関係についてどのようなことがいえそうかを考える。
ただし、学歴の変数は次のように3分割すること:初等 (1,2,12); 中等 (3-5,13); 高等 (その他)
複数の要因が影響を与えていると想像される場合、因果関係を確定するには、ある変数の効果を「一定に保った」状態をつくったうえで、別の変数の効果を推定する必要がある。
たとえば、データセットを学歴で3分割して、年齢とQ39gとの相関分析を行ってみるだけでも、かなりのことがわかる。このような発想を洗練させたものが多変量解析である。
SPSSで、「分析」→「一般線型モデル」→「1変量」を選択。
変数は次のように指定する
「オプション」で「記述統計」「パラメータ推定値」を指定
Q39gの値は、つぎの式で近似できることになる
上記の一般線型モデルを変形して、年齢だけ、学歴だけを独立変数とする分析をそれぞれおこなう。結果出力のパラメータ推定値を比較して、なにがわかるかを考察。水曜正午までにISTUに提出。
History of this page:
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2016-12-15 12:58 +0900 with Plain2.
Copyright (c) 2016 TANAKA Sigeto