2016年6月8日水曜日

正規性検定をノンパラメトリック検定の選択基準にするな


タイトルには,ノンパラメトリック検定の選択基準にするなと書いたが,もちろん,これをパラメトリック検定の選択基準にするなと書いても同じである。

t 検定を行なう前に,等分散かどうか検定し,等分散なら通常の t 検定,等分散でなければ Welch 検定と安易に使い分けてはいけないことは,既にブログで書いた。
この二段階検定問題は,既に相当広く知られていると思うのだが,それでもなお,駿河台大学・内田いづみ氏のように,大学教員ですら,事前の等分散検定のオンパレードみたいな論文を書いているのを見ると,ガッカリしてしまう。
ところで,この二段階検定問題は,等分散検定だけでなく,もっと広く注意されべき事柄である。

代表的な問題は,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,というものである。

この使い分けが正しくないのは,事前の等分散検定と同じロジックであり,私自身は多重検定の問題と考えている。しかし,等分散検定に比べ,正規性検定の問題については,意外と語られていない。

日本語で,この問題を指摘している数少ない例が,三重大・奥村氏のブログ2段階t検定の是非であり,そのページの追記2段階t検定その後を読むと良い。そこでは,正規性検定の結果で,パラメトリックとノンパラメトリック検定を使い分ける人が揶揄されている。

英語の解説ならば,二段階検定とは異なる観点から,正規性検定の問題点を指摘した統計ソフトGraphPad Prismの以下のページ。
冒頭で,わざわざ訂正線を引いて解説するという手の込んだページになっている。
First perform a normality test. If the P value is low, demonstrating that the data do not follow a Gaussian distribution, choose a nonparametric test. Otherwise choose a conventional test.

要するに,正規性検定では,t検定のようなパラメトリック検定が適用できないほどのズレがあるかどうかは判断できないというのである。

再度言うが,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,という安易な手順を踏んではならないのである。

その他の統計学上の話題は,私の研究室の解説リスト参照。