2017年12月1日金曜日

サンプリングバイアス

ほぼ丸一日、PCとにらめっっこ。どうにか決着。

先日、投稿して、即リジェクトになった点についての対策。

日本全国のデータを使って分布推定を行うのだが、計画立ててサンプリングがなされた訳ではないので、報告がない場所が、不在なのか、調査をしていないだけ、なのか分からないという大きな問題(サンプリングバイアス)がある。

Maxentは、在データだけでも中々良い予測ができるのだが、このサンプリングバイアスの影響は、かなり大きいことが知られており、色々な補正方法が考えられている。

もちろん一番良いのは、計画的に全域を調査することである。

例えば、ある種の在データ。


北海道でほとんど採集例がないのだが、生息していないのか、そもそも調査していないのか、についてはよく分からない。

そこで、この在データに基づき、カーネル密度推定という方法で、サンプリングバイアスを確率密度で評価する。


で、この確率密度に基づき点を発生させ、これをバックグラウンドデータとして利用することで、多少はサンプリングバイアスが補正される、、、?


解析には10000地点を利用した。

もちろん、自力で考えたはずもなく、下記論文にRコマンドがある。

MaxEnt versus MaxLike: empirical comparisons with ant species distributions
Fitzpatrick et al. (2013) Ecosphere, 4: 1–15

来週は雪が降るかも。