2023年2月16日木曜日

超入門! Rでできるビジュアル統計学の感想。

午前
・覚えていない、、、

午後
・会議
・卒論手伝い(原稿添削)

3年生向けの統計ゼミで使用した「超入門! Rでできるビジュアル統計学」の感想。

コンセプトは面白く、単に「グラフを描く」と言っても色々なことを考えなければならない、ことを学ぶには有用に感じた。

個人的なクセなんだろうが、コマンドの書き方で2点気になるところがあった。

一つ目は、オブジェクトへの代入を最後に右向きで書く点。以前、見せてもらったコマンドでも、そのように書かれていることがあったので、よく使われているのかも知れないが、多くの本では最初に左向きに書いていると思う。
data %>%
	select(ID, BMI, SBP, DBP) %>%
	pivot_longer(-ID, names_to="variable", values_to="value") -> data_long
私なら
data_long <- data %>%
	select(ID, BMI, SBP, DBP) %>%
	pivot_longer(-ID, names_to="variable", values_to="value")
の方がしっくりくる。

上記以上に違和感を感じたのが、ggplotのコマンドでaesを単独で書く方法。
ggplot(data) +
	aes(x=Sex) +
	geom_bar(width=0.8, fill="black") +
	theme_classic()
私なら、このように書く。
ggplot(data, aes(x=Sex)) +
	geom_bar(width=0.8, fill="black") +
	theme_classic()
複数のgeom_にaesを使う時はどうするのだろう。そもそも、そのような書き方はダメということなのか。

また、質的変数、量的変数、そして、一変量、二変量の順に並んでいるので、散布図や折れ線グラフよりも先に、サンキー図やベン図などを学ぶことになる。

科学的データに慣れていない学生には、サンキー図の意義を説明することだけも一苦労する。

この本でRを勉強するよりは、多少、慣れてから頭の中を整理するのに使う本と考えた方が良いかも。それとも医学分野では、これがスタンダードなのかも。