2021年1月26日火曜日

注文の多い料理店

午前
・授業準備

午後
・授業(オンライン)
・資料作成
・卒論手伝い(形態観察)

Rを用いた解析の授業。

これまでは、統計解析とか地図作成を扱ったが、社会科学の学生なのでテキストマイニングを扱ってみた。

と言っても、普段は全くを手を出さない分野なので、下記の本を抜粋して説明するだけで一杯一杯だった。


Rによるテキストマイニング入門(第2版)

全てに目を通した訳ではないが、非常に分かりやすく関われており、書かれているようにコマンドを実行すれば、下記のような図も簡単に描ける。


これは、宮沢賢治著「注文の多い料理店」のワードクラウド。ワードクラウドとは、頻出頻度を文字サイズで表現したもので、「注文の多い料理店」は「扉」という文字が多く使われていることが分かる。

ただし、名詞(一般)と形容詞(自立)のみを対象としている。

twitterのテキストマイニングの事例があったりと、専門家でなくても楽しめる。また、3章のRの使い方(データ整形)、4章の文字処理(stringrパッケージ)は、テキストマイニングとは関係なく非常に参考になる。

今年はBSが観られるので、NFLのプレーオフを観てきたが、、、カンファレンス優勝決定戦は今朝だったのか。結果を見てしまった。

55回目にして、初めてスーパーボウルの開催地のチームがスーパーボウルに出場!しかも、トム・ブレイディは移籍した1年目。これは盛り上がる。2月8日は有給を取るべきか。