■今回のテーマ
こんにちは
よもクローバーです。
前に「tacicaの歌詞は「雨」が多いか調査してみました」という記事を書きました。
その際に、tacicaの全歌詞を取得したので、それを使ってテキストマイニングしてみようと思いました。
テキストマイニングとは、文章を単語や文節で区切り、それらの出現頻度や共起回数、出現傾向などを解析する分析方法です。
学生の頃にテキストマイニングを授業で実際にやりまして、とても面白かったんですよね。
そのときは、アンケートの集計からテキストマイニングを行い、回答者が何に興味を持っているかというのを抽出しました。
Excelを使ってやっていたので、結構手間が掛かったのを覚えています。
何せ、アンケート結果を全て手入力していたので(^ ^;)
今回はネット上でテキストマイニングをしてくれるツールを発見したので、それを使ってテキストマイニングを行いました。
「UserLocalテキストマイニングツール」というこちらのサイトです。
フォームから入力するか、ファイルをアップロードするだけで、一瞬で結果が表示されました。
すっごい楽です!
しかも無料!
こんなツールがあるなら、何でも解析してみたくなりますね。
それでは、早速結果をご紹介します。
■tacicaの歌詞のテキストマイニング結果
こんな感じに一覧で結果が表示されます。
これは出現頻度順の結果になります。
「名詞」、「動詞」、「形容詞」ごとに表になっていて、しかもグラフと色も付いていて、すごく見やすいです。
スコアというのがありますが、これは後述します。
それぞれの結果をピックアップしていきましょう。
○名詞
名詞で一番多いのは「キミ」ですね。
改めて歌詞を見てみると、84曲中31曲に「キミ」が登場していました。
「キミ」は「君」と漢字ではなくカタカナなところが特徴ですね。
「キミ」と同じように「モノ」や「アナタ」もカタカナです。
カタカナ表記することに、tacicaなりの何らかの意味がありそうです。
私なりの感じ方ですが、漢字で表現すると対象がはっきりしているように見えるんですよね。
作詞家の中で明確に意識している「誰か」や「何か」があって、それを対象にしているように思えるんです。
tacicaのこのカタカナでの表現は、何となく対象は明確ではなくて、ぼんやりとはっきりしない何かを対象としているように見えます。
tacicaの作詞を書いているヴォーカルの猪狩さんの中で、「キミ」や「アナタ」や「モノ」という対象は明確に誰か、何かを意識している訳ではなく、猪狩さんの頭の中にある何か概念を言葉で表現するために、カタカナで表現しているのかなぁと感じたりしています。
あと、この結果には私が以前調査した「雨」という単語は出てきません。
よくよく見ると、一文字の単語は抽出できていないようです。
一文字の抽出は難しいのかな?
名詞じゃない単語も入っていたりもするので、完全ではないのかもしれません。
もっと精度が上がると、また結果が変わってきそうですね。
○動詞
動詞で一番多いのは「行く」ですね。
私が着目するのは二位の「生きる」です。
「生きる」という動詞が出てくる曲は以下です。
この「生きる」ですとか「命」、「生命」という単語はtacicaの曲名や歌詞にしばしば見られて、tacicaの中でもテーマにしている部分があるのかなと感じたりしています。
あとは「云う」なんかも、tacicaならではの表現です。
「言う」ではなく「云う」とよく表現しますね。
これにも何らかの意味があるのだと思います。
○形容詞
tacicaらしいネガティブな単語が結構出てくるなか、一位は「良い」というちょっとポジティブな形容詞です。
形容詞の結果を見ると、どんな感情を歌詞に込めているのか、垣間見えますね。
初期の曲はネガティブというか暗い世界観の曲が多かった感じがします。
しかし、それがtacicaの持ち味だったり。
最近は、強い意志を感じる、希望が見える曲が多くなってきたような気がします。
歌詞というものは、作詞家の心境に深く関わると思うんですよね。
tacicaの歌詞を書いている猪狩さんも、デビュー初期より心境が変わってきた部分があって、それを最近の歌詞に取り入れて曲を作っているのではないかなと思います。
○共起ネットワーク
UserLocalの結果には他に、共起ネットワークというのも一緒に出力されます。
こんな図です。
文章中に出現する単語の出現パターンが似たものを線で結んだ図。出現数が多い語ほど大きく、また共起の程度が強いほど太い線で描画されます。
とのこと。
それぞれ単語の丸はドラッグで動かすことができます。
実際に動かしてみると、それに紐づく単語も一緒に連動します。
単語と単語の結びつきが視覚的に分かりますね。
〇キーワードクラウド
もう一つ、キーワードクラウドというものも出力されます。
これです。
どういうものかというと、
スコアが高い単語を複数選び出し、その値に応じた大きさで図示しています。色が品詞に対応しています。
だそうです。
スコアとは以下のように説明されています。
単語ごとに表示されている「スコア」の大きさは、与えられた文書の中でその単語がどれだけ特徴的であるかを表しています。通常はその単語の出現回数が多いほどスコアが高くなりますが、「言う」や「思う」など、どのような種類の文書にも現れやすいような単語についてはスコアが低めになります。
これを見ていると、何となくtacicaの世界観が見えるようです。
■まとめ
興味本位でtacicaの歌詞をテキストマイニングしてみましたが、非常に面白いです。
こうやって分析してみると、どういう単語や感情を歌詞に込めているのかが分かってきます。
tacicaの歌詞の世界観は独特です。
簡単には理解できない歌詞ですが、それだけにとても興味深くて、何を伝えたいのかを探りたくなります。
tacicaを知らなかった方がもし興味を持って頂けましたら、嬉しいです。