http://www.sal.tohoku.ac.jp/~tsigeto/2013/statg/g131218.html
田中重人 (東北大学文学部准教授)
2013-12-18
現代日本論演習/比較現代日本論研究演習III「実践的統計分析」(2013)
前回の一般線形モデルの推定結果では、Q39g の値が次の式で近似されていることになる:
\begin{equation} = \mbox{切片} + B_1 X_1 + B_2 X_2 + B_3 X_3 \end{equation}ただし、
推定された係数 (切片とB) それぞれについて、区間推定と統計的検定がおこなわれる
自動的にカテゴリーに分割され、そのうちひとつが「基準」になる。推定される係数は、カテゴリ数−1。
そのままの値が投入される。推定される係数はひとつだけ。
カテゴリ別平均から係数が計算される
「分散分析表」に表示されるものは、平均値の比較の際に使われるものと同等であるが、用語が少し違う:
平均値の比較と出力を比較してみよう。
最小2乗法 (least square method) で係数を求める。これは、適当な直線 A + BX によってYの値を近似する方法であり、Y と A+BX とのずれの大きさを評価するために差の2乗和をとる。この2乗和 $ \sum (Y−A−BX)^2 $ が最小になるように A と B の組み合わせを求める。
固定因子が複数あると、それらを組み合わせたカテゴリーごとに係数が推定される。このように、複数の固定因子の組み合わせごとに計算される係数のことを「交互作用効果」(interaction effect) という。
多量の係数が計算されて、結果を理解しにくくなる。また、ケース数の少ないカテゴリーがたくさんできて、意味のない結果になることも多い。
相関の極端に高い共変量を投入してはならない。およそ r > 0.7 になると、誤差が大きくなって、推定された係数の信頼性が落ちる。この現象を「多重共線性」(multicollinearity) という
適当な変数について、一般線形モデル(独立変数を2つ以上含めること)による推定を行い、結果を解釈する。 ISTUで火曜正午までに提出。
History of this page:
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2014-09-24 23:07 +0900 with Plain2.
Copyright (c) 2013 TANAKA Sigeto