http://www.sal.tohoku.ac.jp/~tsigeto/2015/statg/g150423.html
田中重人 (東北大学文学部准教授) 2015-04-23

第3講　統計分析の基礎

前回課題について

ラベルの利用：「データビュー」の「変数ビュー」タブで、変数の値に「ラベル」をつける →分析結果出力に表示される
40代はなぜ多いのか →1995年の人口ピラミッド <http://www.stat.go.jp/data/kokusei/2010/kouhou/useful/u01_z16.htm>
70代はなぜ少ないのか

「再」マークがついている人は再提出 (来週水曜正午まで)

(教科書 p. 27--31)

年齢（カテゴリ統合していない元の変数）の度数分布から、中央値と四分位を求めよ (提出は不要)。

参考資料：

教科書 p. 43
総務省統計局「なるほど統計学園高等部：データの特性を見よう」 <http://www.stat.go.jp/koukou/howto/process/proc4_3_1.htm>
船津好明「統計計算の方法」 <http://www.wwq.jp/stacal.htm>

また、任意のパーセンタイル (percentile) を求める方法を考えること。

次の情報を参考にして、カテゴリ統合した後の年齢の度数分布表から中央値を求める方法を考える

(教科書 p. 1--6)

標本抽出の4段階モデル

「無作為抽出」(random sampling) とは：

統計的な推測のための理屈は、確率標本を前提として組み立てられている。母集団の人口がわかっていて、全個体を網羅した台帳がないと、無作為抽出はできない。実際にはそういうことはないので、いろいろ工夫して無作為抽出に近づける。

「層化2段無作為抽出」はその方法のひとつ：

ISTU で 5/6(水) 正午までに提出。

History of this page:

This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").

Generated 2015-04-23 10:34 +0900 with Plain2.