http://www.sal.tohoku.ac.jp/~tsigeto/2013/quesg/q131205.html
田中重人 (東北大学文学部准教授)
2013-12-05
現代日本論/比較現代日本論演習II「質問紙調査の基礎」2013年度(2学期)
調査票上部などに通し番号を振る。以降は、このID番号によって回答者を識別する。
記入漏れ、不完全な回答、誤りなどを探して訂正する。可能であれば、再調査をおこなうこともある。訂正する際には、回答とは区別できるように色ペンなどを使う。
論理的にありえない回答の組み合わせや、珍しい回答についても注意する。
記入漏れの非常に多いもの、内容の信頼性が低いものは無効とする。
この時点で有効回収率を計算する。
有効回収率 = 有効票数 / 配布票数
コンピュータでの分析のためには、データはすべて数値で表すのが便利である。回答を数値に変換するための対応表を「コード表」という。
コード表は、調査票作成と同時に作っておくとよい。ただし、調査後に自由回答のアフターコードなどを追加する場合や、データの内容をみて変数の配列を変えざるをえない場合もありえる。そのときには、コード表のほうも改訂する必要がある。
文章での回答を求めた場合や、選択肢に「その他」が入っていて具体的な内容を書いてもらった場合は、適切な数値 (code) を与える必要がある (アフターコード)。
既存のコードがある場合は、それを使えばよい。たとえば、都道府県・市町村コード、学校名コード、職業分類など。各省庁のサイトや日本工業規格 (JIS) などを探してみるとよい。
具体的な内容を見ないとコード自体が決められない場合は、つぎのようにする
通常の調査では、欠損値としては、無回答 (NA = No Answer) によるものと非該当 (対象外の質問) によるものがある。これ以外に、「わからない」(DK = Don't Know) やクリーニング段階で欠損値を与えたものなどについても別扱いにする場合がある。
いずれの場合も、「9999」「9998」などの通常は出てこない値を入れておいて、それをSPSSで処理する際に「ユーザー欠損値」として指定するとよい。
「いくつでも ○ をつけてください」のような質問の回答は、ひとつの回答についてひとつ変数をつくり、つぎのような数値をあたえるのが通例である。
0と1にしておくと、そのまま合計 (=その項目を選択した人数) や平均 (=その項目を選択した人の比率) を使えるという利点がある。
コード表にしたがって回答を数値化していく作業。つぎのどちらかの方式による。
このコード結果をみながらコンピュータに打ち込むことになる。
変数名を決めておく (コード表をつくるときに決めておくとよい)
下線 (_) 以外の記号のほとんどは変数名には使えないので、注意すること。
- ※ 最近のSPSSでは、変数名に日本語文字が使えて、長くてもOKではあるが、トラブルが起こりやすい
コンピュータに打ち込むには、最初から SPSS 等で作成してもよいが、Excel 等の表計算ソフトが使いやすい。その場合、つぎのように進める。
SPSSで分析するときは、ファイルの種類で「xls」などを指定すると、Excel のファイルをそのまま読み込める。オプションで、1行目が変数名であることを指定すること。この方式では変数のラベルを読み込めないので、ラベルが必要ならあらためて SPSS の「変数」ビュー画面で入力する。 SPSSで 9999 などを欠損値にするには、「変数ビュー」で、ひとつの変数について欠損値を指定しておいて、それをほかの変数のところにコピーすると、一気に処理できる。
データにみられるまちがいを摘発・修正する
あとで分析を進めていくうちにまちがいがみつかることもある。そのときは適宜データを修正して、データセットのバージョンを更新していく。一定の規則にしたがってファイル名をつけていくとよい。
配布した調査票について、つぎの手順で作業し、コード表にしたがってデータセットを作成する
History of this page:
This page is monolingual in Japanese (encoded in accordance with MS-Kanji: "Shift JIS").
Generated 2014-02-03 17:21 +0900 with Plain2.
Copyright (c) 2013 TANAKA Sigeto