2020年9月8日火曜日

多重検定に関する問題

午前
・標本整理

午後
・学会業務
・勉強

多重検定に関する問題について勉強することになった。

学生の頃に指摘されて、「おぉ」と痛感したことを覚えている。

統計検定あるあるで、3群(以上)でANOVAをしたのち、どの群間で差があるかを調べるために、t検定をやりまくるヤツ。

しかし、最近、多重検定問題で検索すると、よく目にするのが「多項目の検定(足立, 1998)」と呼ばれる問題。

2群を複数の項目で比較することによって発生する。マイクロアレイの解析で陥りやすいそうで、それに関する記事がよく検索される。

足立(1998)によると、具体例として「多群の対比較の検定」、「多項目の検定」、「経時的データの輪切り検定」、「多種検定」、「サブグループ検定」、「中間解析」、「結果が出た後のsnooping」が挙げられている。

対処法としては「事前」と「事後」がある。

「事後」の対策として有名なのが、ボンフェロー二補正やTukey's HSD検定などがある。これは全体の有意水準を下がらないように制御するものである。

ただ、この方法だと、例えば、多項目の検定のとき、項目数が100個あったらまず違いがでない(マイクロアレイは数千〜万?)。そのために、第二種の過ちを制御する(?違うかも)Benjamini and Hochberg法やStorey法などがある。

後者は、勉強不足でまだ良く分かっていない。

文献

足立 (1998) らくらく生物統計学. 中山書店.