2016年6月30日木曜日

標準偏差に ± を付けるな!: 医療論文に多い?


統計量として,平均と標準偏差を示すのに,
平均 ± 標準偏差
あるいは
mean ± sd
と書く例が,時々見られる。

特に医療関係の論文に多いような気がするが,気のせいだろうか?

例えば,次の論文

庄司雅紀・恩田光子・岩出賢太郎・荒川行生 (2015)
降圧剤服用患者におけるお薬手帳の持参割合および手帳シールの貼付割合に影響を及ぼす要因
医療薬学, 41(3), 139-146.

その p. 143 の表 3 や 4 で,マンホイットニー U 検定やクラスカル・ウォリス検定を行なう統計量として
平均 ± 標準偏差
という記述がなされている。

しかし,よく考えてほしい。

通常,± は,範囲や区間を表すものである。例えば,体温計に,± 0.1 ℃ と書かれていたら,その範囲の誤差という意味だろう。

では,論文や報告書で,
平均 ± 標準偏差
と書かれていたら,それは平均の上下に,標準偏差のぶんだけ取った区間に注目せよ,という意味なのだろうか?

しかし,このような範囲を考えても,たいした意義があるとは思えない。実際には,「平均と標準偏差」の意味で,± 記号が用いられている気がする。

日本語論文では,あまり,この問題が指摘されていないが,海外の論文では,ズバリ指摘しているものがある。

例えば,以下のもの。
Jaykaran, P. Y., Chavda, N., & Kantharia, N. D. (2010)
Some issue related to the reporting of statistics in clinical trials published in Indian medical journals: A Survey
International Journal of Pharmacology, 6(4), 354-359.

その p. 357 右段

Instead of writing Mean ± SD the better way of representation is Mean (SD)

つまり,± を使わずに,平均(標準偏差)とするほうが良い,と書かれている。

同様なことは,以下の著名な医学統計の著書にも書かれている。
Altman DG (1991) Practical statistics for medical research. London, Chapman and Hall.

その p.42 の DATA PRESENTATION

It is common to put the SD in brackets after the mean.
mean ± SD, as in ‘their mean diastolic blood pressure was 102.3 ± 11.9 mmHg’, should be avoided

このような主張は,個人的な著書に留まらない。例えば,米国生理学会(American Physiological Society)の論文執筆ガイドライン

Curran-Everett, D., & Benos, D. J. (2004)
Guidelines for reporting statistics in journals published by the American Physiological Society
Journal of Applied Physiology. 97(2), 457-459

その p. 458 左段下
The symbol ± is superfluous: a standard deviation is a single positive number. Report a standard deviation with notation of this form: 115 mmHg (SD 10 ).
(SD) と書くべし,といった調子で書かれている。

日本の論文でも,平均と標準偏差の表記を改めて考え直したほうが良い。

その他の統計学上の話題は,私の研究室の解説リスト参照


2016年6月8日水曜日

正規性検定をノンパラメトリック検定の選択基準にするな


タイトルには,ノンパラメトリック検定の選択基準にするなと書いたが,もちろん,これをパラメトリック検定の選択基準にするなと書いても同じである。

t 検定を行なう前に,等分散かどうか検定し,等分散なら通常の t 検定,等分散でなければ Welch 検定と安易に使い分けてはいけないことは,別の統計解説ページに書いた。
この二段階検定問題は,既に相当広く知られていると思うのだが,それでもなお,駿河台大学・内田いづみ氏のように,大学教員ですら,事前の等分散検定のオンパレードみたいな論文を書いているのを見ると,ガッカリしてしまう。
ところで,この二段階検定問題は,等分散検定だけでなく,もっと広く注意されべき事柄である。

代表的な問題は,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,というものである。

この使い分けが正しくないのは,事前の等分散検定と同じロジックであり,私自身は多重検定の問題と考えている。しかし,等分散検定に比べ,正規性検定の問題については,意外と語られていない。

日本語で,この問題を指摘している数少ない例が,三重大・奥村氏のブログ2段階t検定の是非であり,そのページの追記2段階t検定その後を読むと良い。そこでは,正規性検定の結果で,パラメトリックとノンパラメトリック検定を使い分ける人が揶揄されている。

英語の解説ならば,二段階検定とは異なる観点から,正規性検定の問題点を指摘した統計ソフトGraphPad Prismの以下のページ。
冒頭で,わざわざ訂正線を引いて解説するという手の込んだページになっている。
First perform a normality test. If the P value is low, demonstrating that the data do not follow a Gaussian distribution, choose a nonparametric test. Otherwise choose a conventional test.

要するに,正規性検定では,t検定のようなパラメトリック検定が適用できないほどのズレがあるかどうかは判断できないというのである。

さらに,次のページには,小標本(サンプルサイズが小さい,n < 12 程度)では,正規性の検定が役立たず,パラメトリックでもノンパラメトリックでも,正しい検定結果が得られない,と書かれている。 結局,正規性検定を行なってから,それを満足すればパラメトリック検定,それを満足しなければノンパラメトリック検定と使い分ける,という安易な手順を踏んではならないのである。

その他の統計学上の話題は,生物科学研究所の解説リスト参照。