[Previous page]
[Next page]
http://tsigeto.info/2022/statu/u220506.html
田中重人 (東北大学文学部教授)
2022-05-06
現代日本学演習II「統計分析の基礎」
第3講 統計分析の基礎
[配布資料PDF版]
- [テーマ]
度数の利用と統計分析の基礎
前回課題について
操作については
前回資料
後半部分を参照
度数分布表の読みかた
- 度数
- 相対度数 (%)
- 累積度数・累積相対度数
- 欠損値のあつかい
(教科書 p. 27--31)
データセットを分割する方法
PSPPには、特定の変数の値によってデータセットを分割するコマンドがある
- メニューから「データ」→「ファイルの分割」を選ぶ
- 適当な変数を選び、「グループの比較」を選び、OK
いったんこの操作をすると、それ以降は、すべての分析が、その変数の値ごとに別々におこなわれる。
元に戻すときは、「データ」→「ファイルの分割」→「すべてのケースを分析」
データ収集から分析まで
- データの収集 (実験/観察)
- 分析可能な形に加工
- データ・セット作成
- クリーニング
- データの特徴を少数の数値に要約 = 記述統計
- 誤差の評価 (この手続きの一部が推測統計)
(教科書 p. 1--6)
標本抽出
標本抽出の4段階モデル
- 理論母集団 = 興味の対象となる人や事物の全体
- 調査母集団 = 調査の対象とする具体的な範囲
- 計画標本 = 母集団から抽出した対象者のこと
- 有効標本 = 調査の結果あつまった有効なデータ
「無作為抽出」(random sampling) とは:
- 母集団から計画標本を選ぶ際に、母集団にふくまれるすべての個体の抽出確率が等しくなるように抽出する
- この結果として、
「確率標本」
(probability sample) がえられる
統計的な推測のための理屈は、確率標本を前提として組み立てられている。母集団の人口がわかっていて、全個体を網羅した台帳がないと、無作為抽出はできない。実際にはそういうことはないので、いろいろ工夫して無作為抽出に近づける。
「層化2段無作為抽出」はその方法のひとつ:
- まず「地点」を抽出 (第1次抽出)
- その際、地域・都市規模等で地点抽出数を割り当てておく (層化)
- その地点の台帳から個人を抽出 (第2次抽出)
宿題
- 教科書 pp. 7--16 を元に、「データの種類」の分類 (名義尺度、順序尺度、間隔尺度、比率尺度) についてまとめよ
- SSM調査の質問項目のうち、比率尺度に当たるものはどれか
- 累積パーセントに意味があるのはどの種類のデータか
- 「収入」や「学歴」を比率尺度として分析するにはどのようにすればよいか
木曜正午までに Google Classroom に提出。
この授業のインデックス
前回の授業
|
次回の授業
TANAKA Sigeto
History of this page:
- 2022-05-06 : Created
- 2022-05-06 : Minor corrections
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2022-05-06 09:33 +0900 with
Plain2.
Copyright (c) 2022
TANAKA Sigeto