標本はいくつ集めたらよいか
兵庫教育大学 成田 滋
Updated December 25, 2001
[心理・教育のための統計の初歩][論文の書き方]
[偏相関分析について][多変量解析は強力で難しくない]
[ノンパラメトリック法による分散分析の方法
--Friedman][直線的関連
Correlation][データの変換/変数の変更]
[データの性質と反復測定データ:
Repeated Mesurement][
共分散分析について][データの性質を知ろう][クラスター分析:
Cluster Analysis][判別分析:
Discriminant
Analysis][重回帰分析:
Multiple Regression
Analysis][因子分析: Factor
Analysis][データの標準化]
サンプルサイズ
いろいろな調査をする場合、どの位の標本数(サンプル数)を集めたらよいかが問題となる。標本とは、ある一定の集団から無作為に抽出したグループである。この標本が属する全体の集団を母集団という。こうした標本を対象とした調査を「標本調査」という。ちなみに、母集団全体の調査を「悉皆調査」、または「全数調査」という。母集団の数は通常「N」で表され、標本数は「n」で表される。標本として集出された数は、「サンプルサイズ」と呼ばれる。
標本を集め、それから得られたデータの平均値は、母集団の平均値μを推定する唯一の方法といえる。標本の平均値は、母集団のパラメータと同じということはないが、あまり差がないとされる。標本の平均値に基づいて、指定された誤差で、母集団の平均値が含まれる範囲を計算することができる。このような範囲は、「信頼区間」と呼ばれている。信頼区間を推定することを「区間推定」とも呼ぶ。区間推定では通常は、信頼係数を決めておくのが常套手段である。つまり信頼係数95%で母平均値μを推定するということになる。
信頼係数95%と設定したので、区間推定の誤差は5%である。誤差=標本平均値-母平均値となる。ここでの課題は、誤差を5%以内で押さえるために、どれくらいの大きさの標本が必要かということになる。このとき母平均値μの区間推定は、標準正規分布の数表Z(α/2)から求めることになる。
標本の大きさを決め方
標本調査において、母集団から標本の大きさを決めるための手順は次のようになる。
1) 許容できる誤差の範囲を決める。通常は0.05とする。
2) 信頼率を決める。通常は0.95とする。そして、信頼率に対応する正規分布の%点(k)を決める。0.95ならばZ=1.96となる。
3) 母集団の比率Pを予測する。予測が困難なときはP=0.5とすると最も安全な標本の大きさが決められる。
4) 計算する。
必要な標本数 n
母集団の大きさ N
最大誤差 e
信頼率に対応する正規分布点 Z
予想される母集団の比率 P
(1) 有限母集団の場合:
N
n>=------------------------------------
e e N-1
(----)*(----) -------- + 1
Z Z P(1-P)
(2) 無限母集団の場合:
1
n>= ---------------------------
e e 1
(----)*(----) --------
Z Z P(1-P)
例題br>
母集団が100人と1,000人の場合の標本数を、上記の式に入力して計算すると以下のようになる。すなわち、母集団が100人の場合は80人、母集団が1,000人の場合は278人となる。母集団の大きさが10倍になったからといって、標本数も比例するわけではないことがわかる。