ここから本文です

この知恵ノートを「知恵コレクション」に追加しました。

追加した知恵ノートはMy知恵袋の「知恵コレクション」ページで確認できます。

知恵コレクション」に登録済みです。

再登録しました。

追加に失敗しました。

ノートに戻り、もう一度やり直してください。

すでに1,000件のノートが登録されています。

新しく追加したい場合は、My知恵袋の「知恵コレクション」ページで登録されているノートを削除してください。

追加できませんでした。

ノートは削除されました。

統計学の基準値の由来: 5%有意水準,カイ二乗検定(χ2検定),相関係数を巡って

ライターさん(最終更新日時:2017/2/23)投稿日:

  • ナイス!:

    5

  • 閲覧数:18151

印刷用のページを表示する

執筆責任:井口豊(長野県岡谷市・生物科学研究所

統計学において,しばしば目にする,そして,しばしば用いる基準値というものがある。しかしその割りに,その由来とか,出典元とかが不明のまま使われる基準値がある。それがあまりにも有名で広く使われているために,かえって原典が不明になってしまったケースと言って良い。

以下は,そのような基準値の原典は何か,という考察である。興味のある人は,実際にその原典までたどって読んでほしい。いくつかの文献には,PDFが読めるサイトをリンクした。

なお, 四分位数の定義とその用語の歴史については,以下の知恵ノートに別記した。

1. 5%有意水準

統計学において最も頻繁に使われる基準値と言えば,仮説検定における有意水準5%(α=0.05)という数値だろう。実に広く使われ,大学生や社会人のみならず,理系の高校生でも習う統計学上の基準値である。

仮説検定の結果,有意か否かを判定するのに,理論的には何%でも良いのだが,この5%(α=0.05)という数値が,世界中で慣習として用いられてきた。

慣習と単に言ってしまったが,その元となる歴史は,もちろんある。

有意水準5%を最初に言い出したのは,かのフィッシャー(R. A. Fisher)らしい。統計学者というより,統計学のスーパースターと言える人物である。

以下の論文を読むと,その起源が分かる。

On the origins of the .05 level of statistical significance.
American Psychologist 37: 553-558

これを読むと,Fisherが1925年に,彼の著書
Statistical methods for research workers. Oliver and Boyd, 1925.
において,P=0.05を最初に使ったことになる。

この部分を読むには,York大学のC. D. Greenが作成した


その中の
By Ronald A. Fisher (1925) 

をクリックして

正規分布を解説した章
12. The Normal Distribution
そこを読んでいくと
P =·.05, or 1 in 20, is 1.96 or nearly 2 ; it is convenient to take this point as a limit in judging 
と出てくる。

Cowles and Davis (1982)の最初の部分にも書かれているように,5%という基準自体は,特別な合理性があって決められたわけでなく,arbitrarilyに決められたと言って良い。

なお,Fisher (1925)の論文では,Pという文字で,0.05が示されているが,現在では,有意水準に対してはαが使われるのが普通である。このαは,仮説検定において,あらかじめ設定された棄却水準としての確率である。一方,帰無仮説が棄却される最小の有意水準を,有意確率といい,Pで表すのが普通である。これは一般にP値と呼ばれ,統計ソフトで検定したとき算出される確率でもある。

すなわち,
P≦αならば,帰無仮説は棄却される
P>αならば,帰無仮説は棄却されない
という結果になる。

2. カイ二乗検定(χ2検定)の適用基準

カテゴリカルデータの独立性の検定には,カイ二乗検定が,しばしば使われる。実際の計算例は,私の別の知恵ノート
を参照にしてほしい。

そこにも書いたが,カイ二乗検定(χ2検定)の適用基準として,期待値が5未満のセルが,全体の20%以上になってはいけない,とされる。

これに対しては,Cochran's ruleという名称が存在する。以下のCochran (1954)が示した基準値である。

Some methods for strengthening the common x2 tests.
Biometrics 10: 417-451.

ところが,日本の統計学の教科書には,このことが滅多に書かれていない。日本語でも,この原典を明記した上で「コクランの規則」のように書くべきだろう。

ただし,似たような基準値は,このCochran (1954)の論文以前から使われていたらしい。実際,この論文の中でも
many writers recommend that the mi be not less than 5 (p. 418)
という記述がある。このwritersの名前が挙げられていないので,誰なのかは不明だが,とにかく期待値が5以下では駄目,というような推奨があったらしい。

それにも関わらず,Cochranの規則という名称があるのは,この論文で,分割表のセル期待値がどのくらいあれば,どのような対応をとれば良いか,というアドバイスが書かれているからである。

具体的かつ詳細な内容は,本論文のp.420の
2.1 Recommendations about minimum expectations
を読んでほしい。

例えば,2×2分割表ならば,
全体の観察数(N)が20未満,または,20<N<40かつ最小期待値が5未満の時は,フィッシャーの正確確率検定を使うことを勧めている。

なお,Fisherの正確確率検定か,カイ二乗検定か,と考えることなく,最初から,Fisherの正確確率検定を採用するという考え方も当然ありうる。

たいていの教科書や統計ソフトでは,2×2分割表に対して,Fisherの正確確率検定が適用されると書いてある。しかしながら,群馬大・青木氏のオンライン計算サイトでは,任意の大きさの分割表に対して,Fisherの正確確率検定ができる。これに関連した解説統計ソフトRのプログラムも参照してほしい。

このオンライン版Fisherの正確確率検定は,海外からも参照される優れものである。

ところで,このFisherの正確確率検定(Fisher's exact test)の原典は,何なのだろうか?もちろん,ここで言うFisherは,冒頭述べたR. A. Fisherのことである。

これに関しては,しばしば,Fisher(1922)として引用される次の論文がある。 

On the interpretation of X2 from contingency tables, and the calculation of p.
Journal of the Royal Statistical Society 85: 87–94. 

しかしながら,実際にこの論文を読んでみると分かるが,Fisher自身がexact testと呼んでいるわけではない。この論文を,Fisherの正確確率検定の原典として引用する論文は,この論文でのFisherの功績をたたえて引用しているのである。

では,正確確率検定の本当の原典は何か?それに関しては,以下の論文が参考になる。

Yates and Contingency Tables: 75 Years Later
Electronic Journal for History of Probability and Statistics 5(2): 1-14.

この中で,p.4から始まる
3 Development of Fisher’s exact test
を読み進めていくと,以下の文献で,exact testという言葉が見られると分かる。

Statistical Methods for Research Workers, Fifth Edition. Oliver and Boyd.

実は,これ,最初の5%有意水準で挙げた本と同じもので,前述のが初版,こちらは第5版なのである。

この第5版の序文のp.11
PREFACE TO FIFTH EDITION vi
に,
giving the exact test
と書かれているのである。

余談だが,その少し前を読むと,カイ二乗検定に対する,イエーツの連続性補正(Yates' correction for continuity)についても,この第5版で論じていると分かる。序文で書くくらいなので,いかに,これが強調したい内容なのかがわかる。

この本
Statistical Methods for Research Workers
は,Fisherの最大の業績のひとつと言え,,Wikipediaにおいて,この本の項目
one of the 20th century's most influential books on statistical methods
と紹介されているのも当然であろう。

3. 相関係数の強弱の基準

相関係数の強弱も,何気なく使う統計上の基準値である。よく使われるのは,以下のような基準である。

相関係数の絶対値を考えると,
0 - 0.2 ほとんど相関なし
0.2 - 0.4 弱い相関あり
0.4 - 0.7 中程度の相関あり
0.7 - 1 強い相関あり
となる。

最後の部分は,特に,
0.9 - 1 非常に強い相関あり
とすることもある。

日本語の教科書やウェブサイトでは,これらの相関係数の基準を誰が言い出したのか,つまり,原典は何なのか,という解説は,まず見かけない。「目安として」とか,「分野によって異なる」とか,言い逃れみたいな説明だけになっている例も少なくない。

この相関係数の基準は,ギルフォード(J. P. Guilford)に端を発するらしい。

これも非常に有名な心理学者で,彼の略歴や業績を,日本語サイトで読めるので参考にして欲しい。

このウェブページにも出てくるのだが
Fundamental Statistics in Psychology and Education. McGraw-Hill, New York.. 
という単行本に,相関係数の基準が述べられている。

複数年の版があり,1942年,1950年,1956年,1965年,1973年,1978年に出版年があるのだが,私の個人的印象では,1956年版,つまり,第3版(3rd ed)が引用されることが多いようだ。

実際,上述の基準は,Guilford's Rule of Thumbと呼ばれることが多く,このキイワードでググルと,多くの論文がこの Guilford (1956) を引用しているとわかる。

なお,相関係数自体は,標本サイズ n に依存しない効果量(effect size)として使われることも多い。効果量に関しては,例えば,次の論文参照。

水本篤・竹内理(2008)
英語教育研究 31, 57–66.

*******
以上の統計学の基準値の原典は,あくまで,かつて私が学んだ範囲,あるいは,調べた限りでの情報である。もちろん,もっと古い時代に遡って出典があるかもしれない。その場合は,教えてほしい。ただし,上述の出典は,いずれも有名なものなので,それを各自の論文に引用すること自体は間違いではない。

日本語で書かれた統計学の教科書や授業は,こういう歴史的背景まで辿って解説されることが少ないような気がする。理論や統計ソフトの使い方を教える以前に,このような歴史的背景および原典となる文献にも触れて欲しいものだ。

このノートのライターが設定した関連知恵ノート

このノートに関するQ&A

このノートに関するQ&Aは、まだありません。

このノートについて質問する

このノートについてライターの方に質問できます。

※ライターの方から必ず回答をいただけるとは限りません

※別ウィンドウで開きます

この知恵ノートのライター

グレード

グレード知恵ノートのグレード:2-3

iguchi_yuさん男性

ピックアップ

【iPhone】修理交換の申込方法...
 ※追記※2015/1/30現在iPhone6及び6+が発売されたのを受け、情...
知っておきたい無線LANルーター...
知っておきたい無線LANルーターの知識と選び方iPod touchやPS...
iTunesカードの基礎知識
はじめにiTunesStoreやAppStoreの決済には通常クレジットカー...
本文はここまでです このページの先頭へ