[Previous page] [Next page]

http://www.sal.tohoku.ac.jp/~tsigeto/2013/statg/g131218.html
田中重人 (東北大学文学部准教授) 2013-12-18

現代日本論演習/比較現代日本論研究演習III「実践的統計分析」(2013)

第11講 一般線形モデル (12/18)


[配布資料PDF版]
[テーマ] 固定因子と共変量

モデルとパラメータ

前回の一般線形モデルの推定結果では、Q39g の値が次の式で近似されていることになる:

\begin{equation} = \mbox{切片} + B_1 X_1 + B_2 X_2 + B_3 X_3 \end{equation}

ただし、

推定された係数 (切片とB) それぞれについて、区間推定と統計的検定がおこなわれる


固定因子と共変量

固定因子: 名義尺度の変数

自動的にカテゴリーに分割され、そのうちひとつが「基準」になる。推定される係数は、カテゴリ数−1。

共変量: 間隔尺度の変数

そのままの値が投入される。推定される係数はひとつだけ。

固定因子ひとつのモデル

カテゴリ別平均から係数が計算される

初等: 3.591 − 0.700 = 2.891
中等: 3.591 + 0.011 = 3.602
高等: 3.591 + 0.000 = 3.591 ← 基準

「分散分析表」に表示されるものは、平均値の比較の際に使われるものと同等であるが、用語が少し違う:

平均値の比較と出力を比較してみよう。

共変量ひとつのモデル

最小2乗法 (least square method) で係数を求める。これは、適当な直線 A + BX によってYの値を近似する方法であり、Y と A+BX とのずれの大きさを評価するために差の2乗和をとる。この2乗和 $ \sum (Y−A−BX)^2 $ が最小になるように A と B の組み合わせを求める。

回帰係数Bの意味: Xが1単位増えたときYがどれだけ増えるか

独立変数が複数の場合


注意事項

交互作用

固定因子が複数あると、それらを組み合わせたカテゴリーごとに係数が推定される。このように、複数の固定因子の組み合わせごとに計算される係数のことを「交互作用効果」(interaction effect) という。

多量の係数が計算されて、結果を理解しにくくなる。また、ケース数の少ないカテゴリーがたくさんできて、意味のない結果になることも多い。

「モデル」オプションで「交互作用」をはずす

多重共線性

相関の極端に高い共変量を投入してはならない。およそ r > 0.7 になると、誤差が大きくなって、推定された係数の信頼性が落ちる。この現象を「多重共線性」(multicollinearity) という


課題

適当な変数について、一般線形モデル(独立変数を2つ以上含めること)による推定を行い、結果を解釈する。 ISTUで火曜正午までに提出。


この授業のインデックス | 関連するブログ記事

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2014-09-24 23:07 +0900 with Plain2.

Copyright (c) 2013 TANAKA Sigeto