[Previous page] [Next page]

http://www.sal.tohoku.ac.jp/~tsigeto/2013/statg/g130424.html
田中重人 (東北大学文学部准教授)

現代日本論演習/比較現代日本論研究演習I「統計分析入門」(2013)

第3講 統計分析の基礎 (4/24)


[配布資料PDF版]
[テーマ] 累積度数の利用と統計分析の基礎

課題

前回課題について

カテゴリ統合の方針:

今回の課題

年齢(カテゴリ統合していない元の変数)の度数分布から、中央値と四分位を求めよ (提出は不要)。

参考資料:

また、任意のパーセンタイル (percentile) を求める方法を考えること。

発展問題 (余裕のある人のみ)

次の情報を参考にして、カテゴリ統合した後の年齢の度数分布表から中央値を求める方法を考える (森・吉田 (1990, p.15) も参照)


度数分布表の読みかた (復習)

(教科書 p. 27--31)


データ収集から分析まで

  1. データの収集 (実験/観察)
  2. 分析可能な形に加工
  3. データ・セット作成
  4. クリーニング
  5. データの特徴を少数の数値に要約 = 記述統計
  6. 誤差の評価 (この手続きの一部が推測統計)

(教科書 p. 1--6)


標本抽出

標本抽出の4段階モデル

無作為抽出とは:

母集団から計画標本を選ぶ際に、母集団にふくまれるすべての個体の抽出確率が等しくなるように抽出する (random sampling) → 等確率標本

統計的な推測のための理屈は、確率標本を前提として組み立てられている。

母集団の人口がわかっていて、全個体を網羅した台帳がないといけない。

実際にはそういうことはないので、いろいろ工夫して無作為抽出に近づける。

「層化2段無作為抽出」はその方法のひとつ:


宿題

調査データを使っている論文や新聞記事をひとつとりあげ、上記の「標本抽出の4段階」にそって紹介する。 ISTUのこの授業の掲示板に、下記の内容を投稿すること。期限は 5/14 (火) 12:00

  1. その論文などの書誌情報と、理論母集団・調査母集団・計画標本・有効標本について簡単にまとめたもの
  2. その論文などがオンラインで読める場合は、URLを上記の「書誌情報」に含めておくこと。そうでない場合は、コピーを田中のレターケースまで提出

文献


次回は 5/15 です (5/1, 5/8 は休講)

この授業のインデックス | 関連するブログ記事

前回の授業 | 次回の授業

TANAKA Sigeto


History of this page:


This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2013-04-24 07:45 +0900 with Plain2.

Copyright (c) 2013 TANAKA Sigeto