2014年11月30日日曜日

標準偏差の名付け親は,相関係数で有名なピアソン,不偏標準偏差の話題と共に


私が論じた様々な統計学的な話題のリストは,研究室トップページの「統計学関連の話題」で見られる。
***********

標準偏差の意味や計算法を知らなくても,その言葉自体は,耳にした人も多いと思う。

少しでも統計学をかじった人なら,標準偏差を英語で Standard Deviation と書くことも知っているはずである。

ところがどうも,このStandard Deviationの由来,つまり,誰が名付けたかを知る人は,ずっと少ないらしい。そういえば,大学等で使われる統計学の教科書でも,この語の由来を記したものを私は知らない。

この語を最初に使ったのは,Karl Pearson である。日本人にとっては,「相関係数」で馴染み深い,あのピアソンである。それが公式に登場したのは,次の論文である。

Pearson, K. (1894)
Contributions to the Mathematical Theory of Evolution
Philosophical Transactions of the Royal Society of London. A, 71-110.
https://archive.org/details/philtrans02543681

このURLで全文を見られる。

なお,右下の全画面記号
全画面記号(full screen)
それをクリックし,現れたページで右上のスピーカー記号
スピーカー記号(aloud)
それをクリックすると,論文を英語で読み上げてくれるので,それも面白い。

この論文5ページ目(本文p.75),下から4行目を見てほしい。

" standard-deviation" (Gauss's " Mean Error," Airy's " Error of Mean Square")

ガウスが Mean error (平均誤差)と呼び,エアリーが Error of Mean Square(平均平方誤差)と呼んだ計算式に対して,敢えて,ピアソンが standard-deviation と呼んだのである。

実は,これは公式な論文の話であって,非公式には,1893年1月31日の講義で,そう呼ばれていたようである。

このことは,数学用語の歴史的由来を解説した有名な次のサイトで知ることができる。ただし,日本人には案外知られていないサイトかもしれない。

Earliest Known Uses of Some of the Words of Mathematics

アルファベット順に用語が挙げられているので,Sのページで,STANDARD DEVIATIONを見ると

The term "standard deviation" was introduced in a lecture of 31 January 1893, as a convenient substitute for the cumbersome "root mean square error" and the older expressions "error of mean square" and "mean error."

ガウスの mean error などの用語は,専門的過ぎて分かりにくい(cumbersome),だからもっと簡単にして, standard deviation と呼ぶ,とピアソンは言ったのである。

もしかすると,自分の名付けた用語こそスタンダードだ,と言いたかったのかもしれない。実際,現在の状況を見れば,ピアソンの予想どおり(?),彼よりはるかに著名な科学者ガウスを差し置いて, standard deviation という呼称が,文字通り標準となっているのである。

なお,不偏標準偏差(Unbiased Standard Deviation),つまり,標準偏差の不偏推定量 D は,標本サイズが大きくなると,近似的に,平均からの偏差平方和を n−1.5 で割った値の平方根として求められる。
不偏標準偏差(Unbiased Standard Deviation)

このことは次の論文に書かれている。

Brugger, R. M. (1969)
A note on unbiased estimation of the standard deviation.
The American Statistician, 23(4), 32-32.

不偏分散(Unbiased Variance)が, n−1 で割った形であることは良く知られている。
不偏分散(Unbiased Variance)

しかし, n−1.5 で割った不偏標準偏差の形は,あまり知られていないようである。ウィキペディア(Wikipedia)の標準偏差の項目にも書かれていなかったので,私(Iguchi-Y)が書き加えておいた。

そこにも書いたことだが,困ったことに,不偏標準偏差の定義は二通りある。このブログで私が定義したように,標準偏差の不偏推定量 D を不偏推定量と呼ぶ人もいれば,不偏分散 U2 の平方根を不偏標準偏差と呼ぶ人もいるのである。どちらの定義が使われているか,十分注意が必要である。

2014年11月17日月曜日

アキアカネ,諏訪湖へ下る: 高ボッチの蝶,活断層,草競馬の話題も含めて



10月24日午後4時,私の研究所近くで,アキアカネ Sympetrum frequens のオス発見。見事な赤トンボである。



毎年,秋になると,岡谷市上空を飛ぶアキアカネの群が見られる。少なくともその一部は,夏に高ボッチ山(標高1665m,下の地図中のT地点)付近で過ごし,秋になると諏訪湖方面へ向けて下りてくる個体群のようである。ただし,これは私の研究所の予備調査段階での話であり,詳細かつ十分なデータは未だ得られていない。

高ボッチ山は,八ヶ岳中信高原国定公園に属し,県内有数の夜景の名所としても知られる。また,毎年8月に草競馬大会が開催される場所でもある。

地質学的には,国内第一級の活断層と称される牛伏寺断層を南に延長すると高ボッチ山の西麓付近に至り,塩尻市の地震情報ページでも紹介され,注意が促されている。

昆虫学的には,高ボッチ山は,アキアカネ生息地としてよりも,チョウの一種ヒメヒカゲ Coenonympha oedippus の生息地として有名な場所である。ただし,高ボッチを含む岡谷市・塩尻市のヒメヒカゲは,地域個体群として,長野県希少野生動植物保護条例により,希少野生動植物に指定されている。

より大きな地図で見る

2014年11月9日日曜日

大月ホタルの里(新潟県南魚沼市): 辰野町から外来種ホタルを移入

最近知って,仰天した「ほたるの里」の話題である。

新潟県南魚沼市の大月ホタルの里は,なんと,辰野町から移入されたホタルを養殖しているというのである。大月ホタルの里の説明を読めば,ご丁寧にも,長野県辰野町から譲り受けたホタルと書かれている。


より大きな地図で 大月ホタルの里(新潟県南魚沼市) を表示

正確に言えば,辰野のどこのホタルを持って行ったか分からない。しかし,いずれにしろ,大月ホタルの里には外来種ホタルが存在することになる。

もし松尾峡から移出したゲンジボタルならば,辰野町役場は,関西系統の外来種ゲンジボタルを南魚沼市まで意図的に拡散させたことになる。そもそも,この関西系のゲンジボタル移入によって,松尾峡に本来生息していたゲンジボタル在来種は滅びてしまったのである。そ知らぬ顔をして他県へホタルを移出する辰野町役場。その行為は犯罪的と言っても過言ではない

Yahoo!知恵袋で,「今後も移入することはない」と偉そうなことを言う辰野のホタルガイドyamada_de_net)がいるが,県外へ意図的にホタルを移出しているのだから,詐欺師まがいのホタルガイドと言えよう。

なお,南魚沼市女子力観光プロモーションチームから届いたメールに依れば,大月ホタルの里では,辰野町のように外来種ホタルであることを隠して入場料を徴収するような観光政策は行なっていない,とのことである。

参照サイト
長野県辰野のホタル再考: 観光用の移入蛍で絶滅した地元蛍 松尾峡ほたる祭りの背景にあるもの
辰野の移入(外来)ホタル 生物多様性の喪失へ

さらに,fukuokadonax氏によって,YouTubeに投稿された動画・辰野の蛍(養殖と天然)は,松尾峡の外来種ゲンジボタルと鴻ノ田の在来種(天然)ゲンジボタルの比較した秀逸な動画である。詐欺師まがいのホタルガイドからニセ情報を吹き込まれた人々には,このような動画を使って,改めて辰野町のホタル生態破壊の現状を知って頂きたい。