午前
・授業準備
午後
・授業(オンライン)
・資料作成
・卒論手伝い(形態観察)
Rを用いた解析の授業。
これまでは、統計解析とか地図作成を扱ったが、社会科学の学生なのでテキストマイニングを扱ってみた。
と言っても、普段は全くを手を出さない分野なので、下記の本を抜粋して説明するだけで一杯一杯だった。
Rによるテキストマイニング入門(第2版)
全てに目を通した訳ではないが、非常に分かりやすく関われており、書かれているようにコマンドを実行すれば、下記のような図も簡単に描ける。
これは、宮沢賢治著「注文の多い料理店」のワードクラウド。ワードクラウドとは、頻出頻度を文字サイズで表現したもので、「注文の多い料理店」は「扉」という文字が多く使われていることが分かる。
ただし、名詞(一般)と形容詞(自立)のみを対象としている。
twitterのテキストマイニングの事例があったりと、専門家でなくても楽しめる。また、3章のRの使い方(データ整形)、4章の文字処理(stringrパッケージ)は、テキストマイニングとは関係なく非常に参考になる。
今年はBSが観られるので、NFLのプレーオフを観てきたが、、、カンファレンス優勝決定戦は今朝だったのか。結果を見てしまった。
55回目にして、初めてスーパーボウルの開催地のチームがスーパーボウルに出場!しかも、トム・ブレイディは移籍した1年目。これは盛り上がる。2月8日は有給を取るべきか。