・標本整理(写真撮影)
午後
・資料作成
・データ解析
卒論の時期になると思い出すのだが、未発表の過去の卒論で得た貴重なデータの山、、、。
これはいかん、と今年の卒論を投稿用に、空間自己相関分析をやってみた。
複数の地点で連続データを取得した際、そのデータが地理的傾向を示す、つまり、データが大きい地点の近くのデータは大きい、または、小さい地点の近くは小さい(逆もある)、とき、空間的自己相関があるという。簡潔に言うと、地点間が独立ではない。
空間自己相関を評価する方法として良く用いられるのが、「Moran’s I」で、-1〜+1の値を取り、有意に正のときは、大きな値(or 低い値)が空間的に(ランダム分布よりも)集中し、有意に負のときは、大きな値(or 低い値)が(ランダム分布よりも)分散している、と解釈できる。
「alldata」はデータフレームで、「lon」列の東経、「lat」列に北緯、「sinyou_sum」列に針葉樹の数が入っている。他にも色々と列がある。
針葉樹数のMoran’s Iを求めるには、下記を実行する。
library(sf) library(spdep) #地点データをsf形式に変換 lonlat <- st_as_sf(alldata, coords = c("lon", "lat"), crs = "+proj=longlat +datum=WGS84 +no_defs") #座標データの指定 lonlat_c <- st_coordinates(lonlat) #空間隣接行列の計算 lonlat_d <- tri2nb(lonlat_c) #moran'Iの計算 moran.test(alldata$fsinyou_sum, nb2listw(lonlat_d,style="W")) Moran I test under randomisation data: alldata$sinyou_sum weights: nb2listw(lonlat_d, style = "W") Moran I statistic standard deviate = -0.50068, p-value = 0.6917 alternative hypothesis: greater sample estimates: Moran I statistic Expectation Variance -0.054011255 -0.016666667 0.005563221p-value > 0.05なので、帰無仮説(ランダム分布)は棄却されず。地理的傾向はないと解釈される。
地点間の距離を計測し行列を作成する、spdep::tri2nb( )、が優れもの。ドローネ三角網という方法で計算しているそうで、spdep::knn2nb( )を使えば、最近隣k地点で計算することもできる。
下記を実行すると、やっていることがイメージしやすい。
plot(lonlat_d, lonlat_c)