2020年1月28日火曜日

()はダメ

午前
・卒論指導(原稿修正)
・個人ゼミ

午後
・卒論指導(原稿修正、データ解析)

卒論のデータ解析でハマった、、、。

data$speに種名が入っているデータがある。

生データでは成虫を「Branchiura sowerbyi」、幼虫を「Branchiura sowerbyi_m」としているので、このまま解析すると2種として計算されてしまう。


下記のようにすれば「Branchiura sowerbyi_m」を「Branchiura sowerbyi」に置換できる。
data["spe"] <- lapply(data["spe"], gsub,
 pattern = "Branchiura sowerbyi_m",
 replacement = "Branchiura sowerbyi")
data$spe <- factor(data$spe) #Factor型として使う場合は必要

しかし、今日は、これにハマった。

理由は、当初、幼虫が「Branchiura sowerbyi(m)」と書かれていたため。


この場合
data["spe"] <- lapply(data["spe"], gsub,
 pattern = "Branchiura sowerbyi(m)",
 replacement = "Branchiura sowerbyi")
としてもダメ。str_replace_all()を試したりとどハマりした。


どうやら「()」を文字情報として判断しないみたい。メタ文字?

ということで、()はダメ!