[Previous page]
[Next page]
http://www.sal.tohoku.ac.jp/~tsigeto/2014/statg/g141211.html
田中重人 (東北大学文学部准教授)
2014-12-11
現代日本論演習/比較現代日本論研究演習III「実践的統計分析」
第10講 一般線型モデル
[配布資料PDF版]
- [テーマ]
固定因子と共変量
前回課題について
年齢と Q39G は間隔尺度と考えてよいが、学歴(3段階)は順序尺度。
- 年齢 × Q39G → 相関係数 (Pearson / Spearman / Kendall)
- 学歴 × Q39G → クロス表、平均値の比較、または順位相関係数 (Pearson の積率相関係数は使えない)
- 学歴 × 年齢 → クロス表 (年齢を適当にカテゴリにわける)、平均値の比較、または順位相関係数 (Pearson の積率相関係数は使えない)
モデルとパラメータ
前回の一般線形モデルの推定結果では、Q39g の値が次の式で近似されていることになる:
\begin{equation}
= \mbox{切片} + B_1 X_1 + B_2 X_2 + B_3 X_3
\end{equation}
ただし、
- X1 は年齢
- X2 は初等教育のものについて1、それ以外は0とする
- X3 は中教育のものについて1、それ以外は0とする
推定された係数 (切片とB) それぞれについて、区間推定と統計的検定がおこなわれる
固定因子と共変量
- 固定因子:
名義尺度の変数。自動的にカテゴリーに分割され、そのうちひとつが「基準」になる。推定される係数は、カテゴリ数−1。
- 共変量:
間隔尺度の変数。そのままの値が投入される。推定される係数はひとつだけ。
固定因子ひとつだけのモデル
カテゴリ別平均から係数が計算される
- 初等:
3.591 − 0.700 = 2.891
- 中等:
3.591 + 0.011 = 3.602
- 高等:
3.591 + 0.000 = 3.591 ← 基準
「分散分析表」に表示されるものは、平均値の比較の際に使われるものと同等であるが、用語が少し違う:
- 決定係数
$R^2$
= 相関比 ηの2乗 = edu3 / 修正総和
- edu3 + 誤差 = 修正総和
平均値の比較と出力を比較してみよう。
共変量ひとつのモデル
最小2乗法 (least square method) で係数を求める。これは、適当な直線 A + BX によってYの値を近似する方法であり、Y と A+BX とのずれの大きさを評価するために差の2乗和をとる。この2乗和
$ \sum (Y−A−BX)^2 $
が最小になるように
A と B の組み合わせを求める。
- 回帰係数Bの意味:
Xが1単位増えたときYがどれだけ増えるか
独立変数が複数の場合
- 独立変数がひとつの場合と何が変わるか?
- 「コントロール」することの意味
- 分散分析表から独立変数の影響力の大きさを読む
この授業のインデックス
|
関連するブログ記事
前回の授業
|
次回の授業
TANAKA Sigeto
History of this page:
- 2014-12-11:Created
- 2014-12-11:Minor corrections
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2014-12-11 17:32 +0900 with
Plain2.
Copyright (c) 2014
TANAKA Sigeto