2020年9月30日水曜日

邦文だけど

午前
・標本整理

午後
・論文書き

久しぶりに論文を書き進めた、、、邦文だけど。

授業開始、卒論本格化でどうなることか。

2020年9月29日火曜日

予感

午前
・標本整理

午後
・個人ゼミ
・書類書き

卒論が少しずつ動き始めた。放置し過ぎたことを反省。

そして、予感が当たった!嬉しい。

2020年9月28日月曜日

フラス

土曜日から本日まで、実習の集中講義。

怪我なく無事に終了。

フラス。カシナガキクイムシのマスアタックによって樹木が削りだされた。

2020年9月25日金曜日

ヤマトマダニ

午前
・授業準備

午後
・授業準備 兼 データ解析 兼 標本整理

明日からの集中講義の準備で終わった。

それで見せるために標本整理を少し行った。ヤマトマダニ。

2020年9月24日木曜日

違う気

午前
・修論手伝い(野外調査)

午後
・会議
・授業準備
・会議

授業準備でカーネル密度図を作成。やりたいことと違う気が。

2020年9月23日水曜日

地図に任意の線を描く

午前
・データ解析
・個人ゼミ

午後
・個人ゼミ
・書類書き
・データ解析

絶対、簡単にやる方法がある、と思いながらも、良い方法が見つからなかった。地図に任意の線を描く方法。

結局、私には制御が難しい、grid.xspline()を使うことにしたが、カーブの重なり?と思われる濃部分が発生してしまった。

で、grid.offsetXspline()を使うと、カーブの重なり部分が解消されることが判明したので、これを使うことに、、、と思ったら、矢印が描けない。

ということで、矢印部分だけ、Arrowhead()を使った。
これだけの図(というかクネクネ矢印)を描くの数日かかってしまった。

2020年9月18日金曜日

ggtree

午前
・標本整理

午後
・書類作成
・メール書き
・データ解析

今後、頻繁に使うだろうと思い、系統樹の描画にggtreeを使っているが、、、挫折しそう。

痒いところに手を届かせられない。

どうにか、MLのブートストラップ値とベイズの事後確率の両方を出力することはできるようになったが(自動ではなく、ファイルに書き込んだ)、微妙な位置の設定ができない、、、。

上方向と下方向にアジャストにするには、別々に指定するのか、、、と気づき嫌になったので終了。


そして、たくさんの無駄メールを送信しまくった1日。

2020年9月17日木曜日

ミス連発

午前
・標本整理

午後
・データ解析

以前、作成した系統樹を詳細を忘れてしまったので再解析。

ミス連発の上、前回と樹形が異なる。

外群を入れたり、抜いたり。混乱してきたので終了。


カッコいい、宮本浩次:P.S. I love you

2020年9月15日火曜日

機会

午前
・標本整理

午後
・個人ゼミ
・データ解析

学生と話しをする機会が多い1日だった。

2020年9月14日月曜日

Rで最大エントロピーを用いた生息適地

午前
・標本整理

午後
・会議
・学会業務
・会議
・書類作成

Rで最大エントロピーを用いた生息適地の推定に関する土日の悪戦苦闘メモ。

色々とやり方があることが分かった。

まず、この本では、バッチモード(?)でmaxentを実行する方法が書かれている。

コマンドでmaxent.jarを実行するということだと思うけど、私にはできなかった。

ちなみに、この本で主に扱われているbiomod2パッケージでは、バッチモードを使わなくても
BIOMOD_Modeling(
	models = c("MAXENT.Phillips")
	)
で実行できる。しかし、解析オプションの設定や結果の出力がうまく制御できなかった。

ということで、biomod2は挫折した。ただ、他のモデルを比較したり、アンサブル予測をするには、biomod2上で実行する必要があるので(?)、今後の課題としておく。

Rからmaxent.jarを実行するにはもう一つ方法がある。dismoパッケージを経由する方法。こちらは出力されるデータが(私には)扱いやすかった。

マニュアル通りにやればこんな感じの地図が作れる。

また、そもそもJavaを使わずにmaxentをRで実行するためのmaxnetパッケージというのがある(スペルがややこしいので注意)。本家Maxentを作った本人によって作られており、Rで最大エントロピーを用いた生息適地の推定をするなら、これが本命かも。

kh-blogさんによる日本語での詳しい説明がある。

Rでやるならこれが良いのかも。他にも、MIAmaxent、rmaxent、maxlikeなんてもあるらしい。maxlikeは以前使ったことがあるか、前2者は詳細不明。

地図にプロットする際に、確率ではなく、ある閾値で区切って在 or 不在の二値化にしたいことも多いはず。

これについては、自動で計算してくれる関数をCecina Babich Morrowさんsが公開している。

上の地図をminimum training presence (MTP)で作図してみた。MTPでは、種の分布が発見された地点を全て、最適地に含むように閾値を指定する。

また、閾値が決まっているならば、plot()の機能を使う方が安心かも。
breakpoints <- c(0,0.1,0.2) #区切りを決める
colors <- c("red","blue") #区間の色を決める
plot(model_pred, breaks=breakpoints,col=colors, legend = FALSE)

2020年9月11日金曜日

意味のない結果

午前
・標本整理

午後
・データ解析

想像はしていたが、コマンドを参考にやっても色々とハマった。

半日かけて、実行することはできた。データが少ないせいか、設定の問題か、意味のない結果になった。色々とパラメーターの検討が必要だ。

2020年9月10日木曜日

白地図

午前
・標本整理

午後
・研究相談
・学会業務
・データ解析

論文作成(和文だけど)に向けた解析。最近は、OpenStreetMapを使うことが多いが、白地図は、Natural Earthでダウンロートしたshpも使っている。

Rから直接取得することもできる。1:110mスケール、日本が、、、。世界地図で使うスケール。
library(rnaturalearth)
library(sp)
sp::plot(ne_countries(country = 'japan', scale = 110))
日本だけを使う時は、1:10mスケールが良い。
library(rnaturalearth)
library(sp)
sp::plot(ne_countries(country = 'japan', scale = 10))
行政区画も使いたいときは、GADMのデータが使える。
library(raster)
JPN <- getData("GADM", country="JPN", level=1)
plot(JPN)
大陸も入れるときは、世界地図を取得して切りとれば良い。

plot() で出力しているので、色を塗ったりすることも簡単にできる。ナカナカ楽しい。

2020年9月9日水曜日

AR(拡張現実)

午前
・標本整理

午後
・学会業務
・勉強

とある助成金(科研ではない)に書いてしまったAR(拡張現実)。まだ、採択された訳ではないが、採択されそうな気がするので少し勉強しておく。

もちろんARがメインの研究ではない。

ARとは、スマホのカメラを通して風景をみると、実際にはないものが見える、というもの。

と言っても、AR.jsというARをするためのJavascriptが公開されているので、それを実行するだけ。

ちなみに、AR.js StudioというGUIだけでARを作成するサイトもある。

フリーにも関わらず。3つの方法でARを実行することができる。

Image Tracking Example
指定した画像にカメラを向けると、無いものが見える(多分)。

Marker Based Example
指定されたメークにカメラを向けると、無いものが見える(多分)。

で、やりたかったのが、Location Based Example。

上記の2つとは異なり、出現する場所を緯度経度で指定でき、何もなくてもキャラなどを出現させることができる。

見づらいけど、構内に「立ち入り禁止ではない」と表示されている。
道路にMongoloniscus koreanusが出現。
画像がダサいのは、アップした画像がダサいから。背景を透明にしてアップすれば、もう少しマシになると思う。

ただ、私のスマホ(ZenFone 2 Laser)のせいかも知れないが、この方法はスマホのGPSに依存するので、電波の状況によってかなり不安定になる。

また、ブラウザやOSにも色々と制限があるようで、メチャクチャ便利とまではいかないが、こんなことが無料で簡単にできるは凄いとしか言いようがない。

採択されたら真面目に準備する。

2020年9月8日火曜日

多重検定に関する問題

午前
・標本整理

午後
・学会業務
・勉強

多重検定に関する問題について勉強することになった。

学生の頃に指摘されて、「おぉ」と痛感したことを覚えている。

統計検定あるあるで、3群(以上)でANOVAをしたのち、どの群間で差があるかを調べるために、t検定をやりまくるヤツ。

しかし、最近、多重検定問題で検索すると、よく目にするのが「多項目の検定(足立, 1998)」と呼ばれる問題。

2群を複数の項目で比較することによって発生する。マイクロアレイの解析で陥りやすいそうで、それに関する記事がよく検索される。

足立(1998)によると、具体例として「多群の対比較の検定」、「多項目の検定」、「経時的データの輪切り検定」、「多種検定」、「サブグループ検定」、「中間解析」、「結果が出た後のsnooping」が挙げられている。

対処法としては「事前」と「事後」がある。

「事後」の対策として有名なのが、ボンフェロー二補正やTukey's HSD検定などがある。これは全体の有意水準を下がらないように制御するものである。

ただ、この方法だと、例えば、多項目の検定のとき、項目数が100個あったらまず違いがでない(マイクロアレイは数千〜万?)。そのために、第二種の過ちを制御する(?違うかも)Benjamini and Hochberg法やStorey法などがある。

後者は、勉強不足でまだ良く分かっていない。

文献

足立 (1998) らくらく生物統計学. 中山書店.

2020年9月7日月曜日

ハマダンゴムシの色彩変異

午前
・標本整理

午後
・授業準備

日本産ワラジムシ類の文献が500本に到達。見落としている文献が結構ある。

ハマダンゴムシの色彩変異の論文があった。並べると綺麗だな。

しばらくは、これを使いこなせるように練習の日々が続きそう。

2020年9月4日金曜日

ModestR

午前
・標本整理

午後
・授業準備

生物の分布推定がGUIでできるソフトとしてModestRというのがある。

使ったことはないが、HPを観た感じだと様々な解析ができるようだ。

名前にRと付いているが、あのRとは関係ない?みたい。

Windows版のソフトが無料でダウンロードできる。

2020年9月3日木曜日

野生生物の生息適地と分布モデリング

午前
・標本整理

午後
・論文書き
・授業準備


野生生物の生息適地と分布モデリング: Rプログラムによる実践

外来種の侵入予測や希少種の生息適地の推定、さらには分布制限要因の解析など、GISを用いた分布推定は様々な場面で利用されている。

そして、地図上に出力されたカッコいい推定地図を見ていると、作ってみたくなるのが性だろう、、、そんな貴方に、必携の一冊。

ずっと購入しなければと思っていたが、実際に手に入れると、その文量と内容の豊富さでナカナカ読み終わらなかった。

内容は多岐にわたり、分布推定の基礎知識となるニッチ概念の解説から、GISデータの取り扱い方法、空間統計やモデリングの解説、そして、様々な推定方法 (距離ベース、回帰ベース、分類ベース、最大エントロピーetc) による実践例が紹介されている。

また、モデリングの際にエンドユーザーを悩ませる、モデルやデータの評価方法についても解説がある。

そして、最も重要なこととして、タイトルにもある通り、これらの解析は全てRで行われており、そのコードが書かれている!

私は以前、Rを用いて日本における外来性ワラジムシ類の分布推定をしたことがあるが、勉強を始めると様々な解析方法が開発されていることが分かり、何がどう違くて、どれを使えば良いのか分からず非常に混乱した。

そのような悩みはこの1冊で解消される!

内容は非常に充実しており、、、充実し過ぎており、一度目を通しただけで完全に理解することは、私には不可能であった。実際に解析する際に辞書的に使うのが現実的か。

内容が豊富なだけに、Rも分布推定も全く手を出したことがない人が、どれくらい理解できるかやや心配だが(大学生向けらしいが)、Rコードを実行しながら読み進めることで、実体験を通して理解できるように思われる。

とりあえず、やってみたい人は、19章に解析事例があるので、これを試してみると良いかも。

また、第I部の第3章は、分布推定とは関係なく、生物の分布規定要因を勉強するのに非常に良い資料だと思う。

ちなみに、分布推定・生息適地推定のモデリングでは、生態的ニッチモデル(ENM)、種分布モデル(SDM)、生息地分布モデル(HDM)なども、様々な名称がある。これらは違いがあり、厳密には使い分けられるそうだが、この本では、生息適地モデル(HSM)に統一されている。

もくじ
1.本書の概要
[I 生息適地モデリングのが概要、理論、前提]
2.生息適地モデリングの手順
3.何が種分布を決めるのか?
4.ニッチをモデル化する—概念と実際のデータ
5.生息適地モデルの仮定
[II データの編集と収集、サンプリングデザイン、空間スケール]
6.生息適地を予測する環境データの選択と編集
7.モデリング対象種のデータ収集と設計
8.生態学的スケーリング:「空間」「時間」「主題」の解像度と規模
[III モデリングのアプローチとモデル校正]
9.エンベロープアプローチと距離ベースアプローチ
10.回帰ベースアプローチ
11.分類アプローチと機械学習システム
12.ブースティングとバギングによるアプローチ
13.最大エントロピー
14.アンサンブルモデリングとモデル平均化
[IV モデルの評価:過誤と不確実性]
15.モデル精度の測定—どの指標を用いるべきか?
16.モデル性能の評価—どのデータを用いるべきか?
[V 空間的な予測と時間的な予測]
17.時間・空間上へのモデルの投影
[VI 本書で用いたデータとツールおよび発展的な事例]
18.本書の分析で用いたデータとツール
19.Biomod2モデリングパッケージを用いた分析事例
[VII 将来展望] 20.生息適地モデルの将来

このデータでやってみるか。

2020年9月2日水曜日

思い出す

午前
・標本整理

午後
・論文書き
・授業準備

久しぶりにサソリモドキ 論文に手を出す。間を空けすぎたので、思い出すだけでも結構苦戦。あと少しなのだが、そのあと少しが終わらない。