標本はいくつ集めたらよいか

兵庫教育大学 成田 滋

 

Updated December 25, 2001

心理・教育のための統計の初歩][論文の書き方] [偏相関分析について][多変量解析は強力で難しくない] [ノンパラメトリック法による分散分析の方法 --Friedman][直線的関連 Correlation][データの変換/変数の変更] [データの性質と反復測定データ: Repeated Mesurement][ 共分散分析について][データの性質を知ろう][クラスター分析: Cluster Analysis][判別分析: Discriminant Analysis][重回帰分析: Multiple Regression Analysis][因子分析: Factor Analysis][データの標準化



サンプルサイズ
いろいろな調査をする場合、どの位の標本数(サンプル数)を集めたらよいかが問題となる。標本とは、ある一定の集団から無作為に抽出したグループである。この標本が属する全体の集団を母集団という。こうした標本を対象とした調査を「標本調査」という。ちなみに、母集団全体の調査を「悉皆調査」、または「全数調査」という。母集団の数は通常「N」で表され、標本数は「n」で表される。標本として集出された数は、「サンプルサイズ」と呼ばれる。

標本を集め、それから得られたデータの平均値は、母集団の平均値μを推定する唯一の方法といえる。標本の平均値は、母集団のパラメータと同じということはないが、あまり差がないとされる。標本の平均値に基づいて、指定された誤差で、母集団の平均値が含まれる範囲を計算することができる。このような範囲は、「信頼区間」と呼ばれている。信頼区間を推定することを「区間推定」とも呼ぶ。区間推定では通常は、信頼係数を決めておくのが常套手段である。つまり信頼係数95%で母平均値μを推定するということになる。

信頼係数95%と設定したので、区間推定の誤差は5%である。誤差=標本平均値-母平均値となる。ここでの課題は、誤差を5%以内で押さえるために、どれくらいの大きさの標本が必要かということになる。このとき母平均値μの区間推定は、標準正規分布の数表Z(α/2)から求めることになる。

標本の大きさを決め方
標本調査において、母集団から標本の大きさを決めるための手順は次のようになる。
 1) 許容できる誤差の範囲を決める。通常は0.05とする。
 2) 信頼率を決める。通常は0.95とする。そして、信頼率に対応する正規分布の%点(k)を決める。0.95ならばZ=1.96となる。
 3) 母集団の比率Pを予測する。予測が困難なときはP=0.5とすると最も安全な標本の大きさが決められる。
 4) 計算する。
   必要な標本数 n
   母集団の大きさ N
   最大誤差 e
   信頼率に対応する正規分布点 Z
   予想される母集団の比率 P

   
        (1) 有限母集団の場合:
N
n>=------------------------------------
e e N-1
(----)*(----) -------- + 1
Z Z P(1-P)
(2) 無限母集団の場合:
1
n>= ---------------------------
e e 1
(----)*(----) --------
Z Z P(1-P)

例題br>
母集団が100人と1,000人の場合の標本数を、上記の式に入力して計算すると以下のようになる。すなわち、母集団が100人の場合は80人、母集団が1,000人の場合は278人となる。母集団の大きさが10倍になったからといって、標本数も比例するわけではないことがわかる。