共分散分析について Covariate

兵庫教育大学 成田 滋

1998年1月4日更新


心理・教育のための統計の初歩
データの性質を知ろう
直線的関連: Correlation
論文の書き方
データの性質と反復測定データ: Repeated Mesurement
因子分析 Factor Analysis
クラスター分析: Cluster Analysis
重回帰分析: Multiple Regression Analysis


はじめに

別な箇所で偏相関について触れました。偏相関分析では、2つの変数間の関係を調べるときに、他の変数がなんらかの影響を与えているのではないか、と考えることから始まりました。例えば算数と国語の成績という2つの関係を調べたいとするときに、塾に通っているかとか、学校が好きか嫌いかということが成績に影響しているのではないかと考えるのです。この場合、塾通いなどの変数の影響を取り除くことによって、算数と国語の純粋な関係が得られるのではないかということです。このための方法が偏相関分析というものです。

共分散分析の考え方

共分散分析は、偏相関分析の考えに少々似たところがあります。肥満児の体重を減らすための運動方法が、運動量にどんな効果を及ぼすかということを想定するとします。このとき、肥満児の体重という変量も影響していると考えられます。この体重という変量を考慮にいれて分析しょうというのです。偏相関分析では、影響を与えそうな変量を取り除こうとするの対して、共分散分析ではこの変量を利用しようとします。このときの分析の補助として用いる変量を共変量といい、この場合の分散分析を共分散分析といいます。

共変量の与える影響を考えるときに、共変量x2を回帰分析の場合の説明変数ととらえることもできます。このとき式は次のようなモデルとなります。x1=a+x2 つまり、共分散分析=回帰分析+分散分析ということも成り立つのです。

例題

例題として各国の子どもの「数学の得点」が「性別」によって違いがあるかを調べるとします。このとき、数学の得点は「ethnic」(育った家庭環境)に関連しているのではないかとも考えることができます。つまり家庭という文化的な違いの共変量をあわせて用いたほうが、より正確な分散分析ができるのではないかというのです。

下図を説明しましょう。例題は、3か国の子どもの数学の得点からとっています。まず共変量-ethnicのF値=4.675とは、回帰の有意性の検定と呼ばれ回帰直線の傾きが0かどうかを調べるものです。よって仮説は「回帰直線の傾きは0である」とします。もし、これが傾きが0であれば、共変量を使う必要がないということです。ですが、結果のF=4.675は5%水準で有意ですから、共変量ethnicは成績に影響していると考えられます。

 

次に主効果である「性別」によって数学の得点に差があるかをみますとF=2.964となり、有意ではないという結果がでました。これにより、数学は、共変量-ethnicの影響によるところが大きく、「性別」の違いは重要ではないということになりそうです。

では共分散分析を使わないで、「性別」による二つの標本の比較を行いますとt=-2.714で5%水準で有意となります。共分散分析を使うか否かでこんなにも結論が違うのです。このように単なる一変数だけの比較では、十分でないということがおわかりと思います。

 

結論としては、数学の得点の比較は、生徒の性別よりもethnicによる分析のほうが意味がありそうです。なおこうした結論は、実験者の研究の内容や仮説の立て方によります。