http://tsigeto.info/2021/statu/u211217.html
田中重人 (東北大学文学部准教授)
2021-12-17
「差」の変数をつくったときの「平均」「標準誤差」の意味。
対応のあるデータの場合、平均値の差の信頼区間を求める際の数式の標準誤差 (standard error) を、相関係数を用いて調整する。この点が、通常の (対応のない) 平均値の場合と異なる。
クロス表 (または相関図) をいちいち示すのが基本 (別紙参照)。各セルには、度数と 全体での%を書く。統計量などは表の下に書く。必要な統計量は分析法によって違うので注意。
対応のあるt検定であれば、各変数の平均とSDの表をのせる。表の下に、人数、相関係数、平均値の差、有意水準(対応のある検定であることを明記)を書く。
符号検定であれば、x>y, x=y, x<y 各ケースの比率の表をのせる。表の下に、有意水準 (符号検定であることを明記) を書く。
ハッセ図 (Hasse diagram) が使える。平均値などの高い順に変数を並べ、有意な差がある変数どうしを線でむすぶ。具体例は太郎丸 (2000) 参照。
3つ以上の変数をつかう分析法を「多変量解析」(multivariate analysis) という。次の2種類に分けられる (大野, 1998, p.48-56)。
この授業では前者をあつかう。
従属変数と独立変数は、しばしばYとXであらわされる
Q39g (……指導者や専門家……) と Q1_1a (満年齢), Q6_1(学歴) の関連を確認し、これらの間の因果関係についてどのようなことがいえそうかを考える。
ただし、学歴の変数は次のように3分割すること:初等 (1,2,12); 中等 (3-5,13); 高等 (その他)
複数の要因が影響を与えていると想像される場合、因果関係を確定するには、ある変数の効果を「一定に保った」状態をつくったうえで、別の変数の効果を推定する必要がある。
たとえば、データセットを学歴で3分割して、年齢とQ39gとの相関分析を行ってみるだけでも、かなりのことがわかる。このような発想を洗練させたものが多変量解析である。
PSPPで、「分析」→「回帰」→「線形」を選択。
変数は次のように指定する
「統計」オプションで「係数」「信頼区間」「R」「分散分析」を指定
(学歴は変数変換が必要なので、次回以降)
Q39gの値は、つぎの式で近似できることになる
Q39g = 切片 + B × Q1_2a
History of this page:
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2021-12-17 12:54 +0900 with Plain2.
Copyright (c) 2021 TANAKA Sigeto