ここから本文です

この知恵ノートを「知恵コレクション」に追加しました。

追加した知恵ノートはMy知恵袋の「知恵コレクション」ページで確認できます。

知恵コレクション」に登録済みです。

再登録しました。

追加に失敗しました。

ノートに戻り、もう一度やり直してください。

すでに1,000件のノートが登録されています。

新しく追加したい場合は、My知恵袋の「知恵コレクション」ページで登録されているノートを削除してください。

追加できませんでした。

ノートは削除されました。

多重比較 Steel-Dwass 正規近似と正確検定: U 検定が基準

ライターさん(最終更新日時:2016/2/29)投稿日:

  • ナイス!:

    1

  • 閲覧数:2040

印刷用のページを表示する

 Steel-dwass.gif
執筆責任:井口豊(長野県岡谷市・生物科学研究所

別の知恵ノートにも書いたが,通常使われる Kruskal-Wallis 検定は,2 群の場合,漸近 U 検定であり,漸近 Steel-Dwass 検定である。


多重比較検定の一種である Steel-Dwass 多重検定は, Tukey-Kramer検定のノンパラメトリック版である,という説明は,ウェブページでもしばしば見かける。しかし,この多重検定の基礎となるのが, Wilcoxon 順位和検定(Mann-Whitney U 検定)であることを説明したウェブサイトは意外と少ない。

日本語の論文で,そのことを説明しているのは,以下のようなものがある。

白石高章(2011)
計量生物学 32 (1): 33-47.

柳澤健太郎ほか(2007)
本金融・証券計量・工学学会 2007 年夏季大会予稿集: 249-263.

理論的な問題は別として,ここでは,統計解析ソフト R を用いて, Steel-Dwass 検定と U 検定の関係を探ってみよう。飯島勇人氏の “R と統計解析”のように,
「Steel-Dwass 検定の場合,決まった関数は用意されていない」
と説明する(古い?)サイトも見られるが,実際には R にも,それが用意されている。

R で Steel-Dwass 検定を実行する場合は,パッケージ NSM3 の中の pSDCFlig 関数を使うと良い。このパッケージをインストールした上で,2 群(2 標本,サンプル数 2)の検定を行なってみる。多群比較の検定の場合,その特徴を知るには,2 群の比較を行なうのが最適な方法であることは,以下の知恵ノートでも述べた。


pSDCFlig 関数の説明を読むと, method オプションとして,次の 3 種類, Exact,  Monte Carlo, Asymptotic,つまり,正確,モンテカルロ,漸近 の 3 種類が用意されていることが分かる。このうち,特に, Exact 法と Asymptotic 法を取り上げ,以下のような,共に大きさ 4 の 2 標本 a,b の検定をしてみる。なお,便宜上,タイ(結び,同点)が無いデータを考える。くどいようだが,サンプル数 2 で,サンプルサイズ 4 である。両者を混同しないでほしい。これらの用語の誤用については,私の研究室のウェブ解説も参照。


話を戻して,まず, Exact 法を実行。

# Steel-Dwass 検定
# データ
a<- c(1, 3, 5, 6)
b<- c(2, 4, 7, 9)

dat<- c(a, b)
grp<- rep(1:2, c(4, 4))

# 正確検定
library(NSM3)
pSDCFlig(dat, grp, method="Exact")

p 値が,0.4857 と算出される。

これが,正確 U 検定における p 値と同値であることは,以下のようにして確認できる。

# Mann-Whitney U (Wilcoxon 順位和) 正確検定
wilcox.test(a, b, exact=T)

Steel-Dwass 正確検定は,まさに,正確 U 検定をベースにして成り立っているのである。

次に,同じデータで 漸近検定を実行。

# 漸近検定
pSDCFlig(dat, grp, method="Asymptotic")

p 値が,0.3865 と算出される。

これが,漸近 U 検定における p 値と同値であることは,以下のようにして確認できる。

# Mann-Whitney U (Wilcoxon 順位和) 漸近検定,連続補正なし
wilcox.test(a, b, exact=F, correct=F)

Steel-Dwass 漸近検定は,まさに,漸近 U 検定をベースにして成り立っているのである。

なお,ここで言う漸近法とは,漸近的に正規近似させた方法である。2 群の標本サイズを n1,n2 とすると,それらが大きくなるにつれ,検定統計量 U は,次のような平均 E,分散 V の正規分布に近づく。いわゆる中心極限定理の例とも言える。

mean.gif
 variance.gif
したがって,検定統計量 U は ,平均 0,分散 1 の標準正規分布に従う統計量 Z に変換できる。
 z-statistics.gif
いわゆる Z 検定をすれば良い。 R で計算してみる。

# 正規近似
n1<- length(a)
n2<- length(b)

E<- n1*n2/2
V<- n1*n2*(n1+n2+1)/12 
U<- wilcox.test(a, b, exact=F, correct=F)$statistic

Z<- abs(U-E)/sqrt(V)

pnorm(Z, lower=F)*2

結果は
p = 0.3864762

すなわち, Steel-Dwass 検定の漸近法は, U 検定の正規近似をベースにして成り立っているのである。

標本サイズが大きければ漸近 Steel-Dwass 検定で良い。しかし,標本サイズが小さい場合, n1,n2 が 10 以下のような場合は,正確検定を使うべきである

ただし問題は,自分が使うソフトやプログラムが,どちらの方法を採っているか知らずに,あるいは,区別があることすら知らずに,それらを使う場合である。

例えば,ウェブ上で時々参照される群馬大・青木氏による

これは,漸近検定である。

その R スクリプトの下から5行目
p <- ptukey(t*sqrt(2), ng, Inf, lower.tail=FALSE)  # P 値を計算
を見て欲しい。

ptukey 関数で,スチューデント化された範囲分布を使って p 値を求めているのだが,引数として,自由度の無限大(Inf)に設定している。これが,正規近似の設定なのである。

R ベースの有名なフリーソフト EZR のSteel-Dwass 検定も漸近法である。

これらのことを知らずに使っている人も多いような気がする。例えば,以下の論文は,その点で気になった。

藤井貴允ほか (2013)
理学療法科学 28 (4): 463-468.

この論文では,16人,9人,7人の3群の代表値の比較に,前述の青木氏のプログラムを利用して,Steel-Dwass 検定を実行しているのだが,正確法で検定しても良かったケースである。

このノートに関するQ&A

このノートに関するQ&Aは、まだありません。

このノートについて質問する

このノートについてライターの方に質問できます。

※ライターの方から必ず回答をいただけるとは限りません

※別ウィンドウで開きます

この知恵ノートのライター

グレード

グレード知恵ノートのグレード:2-3

iguchi_yuさん男性

ピックアップ

耳鼻科の先生に聞いた、しゃっ...
  皆さん、しゃっくりってわずらわしいですよね  ある時急に...
知っておきたい無線LANルーター...
知っておきたい無線LANルーターの知識と選び方iPod touchやPS...
厄年について——意外と知られて...
厄年とは何か厄年とは文字どおり災厄に遭いやすいといわれる...
本文はここまでです このページの先頭へ