パッショニスタは金色の夢を見る

TMだったり。あくせすだったり。そのときに心が動いたことを。

access/貴水博之ソロの歌詞を計量言語学+‪α‬的に分析してみた ②使用語彙のテキストマイニング編

②の今回は「『"らしさ"のある言葉』を抽出してみよう!」ということでテキストマイニングの手法を用いてやっていきます。

 

テキストマイニングって何なんだ

自分で説明するより、非常に分かりやすい説明があったので以下に引用します。

「大量の文章データ(テキストデータ)から、有益な情報を取り出すことを総称してテキストマイニングと呼びます。自然言語解析の手法を使って、文章を単語(名詞、動詞、形容詞等)に分割し、それらの出現頻度や相関関係を分析することで有益な情報を抽出します。」

www.traina.ai

 

もっと噛み砕くと、文章を刻んだ上で単語どうしの繋がりをみるみたいな感じです。たぶん。(あってるかな)

さすがに自力で7万字以上の膨大なデータを処理するのは不可能なので、フリーソフトウェアの「KH Coder」を使用しました。

khcoder.net

 

テキストデータさえあれば何でも出来てとても面白いので、興味があれば是非触ってみてほしいです!

(とても個人的な話ですが、まさにこれをやっていた最中にアルバム『Heart Mining』のリリースが発表されて、まさかのマイニング繋がりにめっちゃビックリした記憶があります)

 

▲マイニングを行うにあたって

頻出語抽出にあたり、

KH Coderの仕様上無視されてしまう人称代名詞26語

(私/僕(ボク)/僕達(たち)/僕等(ら)/俺(オレ)/俺達(たち)/俺等(ら)/君(キミ)/あなた(アナタ)/貴方/貴女/I/my/me/you/your/you’re/we)と

頻出が予想されるが抽出時に分解・無視されてしまう語句11語

(刹那い(さ)/彷徨う/access/AXS/heart/tonight/night/love/kiss/smile)

の強制抽出設定を行いました。

 

②ー1. 全体頻出語


では、それらを踏まえた上でまずは全体の歌詞における頻出150語とそれぞれの共起ネットワークを示していきます。

f:id:SYNCing_time:20190815214533j:plain

 

何だかキラキラしてる(気がする)……!!!


accessの歌詞における総抽出語数は35,197(分析使用数 :16,837)で

異なり語数は3,838(分析使用数:3,524)でした。
ヒロソロの歌詞における総抽出語数は18,494(分析使用数:8,460)で

異なり語数は2,620(分析使用数:2,334)でした。

 

共起ネットワークは「出現パターンの似通ったものを線で結んだ図、すなわち共起関係を線(edge)で表したネットワークを描く(KH Coder HPより)」ものであり出現回数が多い語には「大きな円」、共起関係が強く表れた語同士には「太い線」がそれぞれ描画されるというもの。

できるだけ同じ語数(50語程度)の共起をみることを目的としたため、品詞の種類などは統一で出現回数を絞って調整しています。(access:25回↑、ヒロソロ:13回↑)

f:id:SYNCing_time:20190815214722j:plain


150語を体言・用言で区分するとaccessでは体言が81語(54.00%)、用言が69語(46.00%)、ヒロソロでは体言が79語(52.67%)、用言が71語(47.33%)となりました。
このうち体言を分類すると「人称代名詞」「体の部位(より生じるもの、感情、行為)」「時間経過」「天気・自然」の4つのジャンルに分けられるものが多いことが判明しました。

 

人称代名詞
a:君(キミ)/me/you/your/my/I/僕(ボク)/we/僕ら(僕等)/あなた(アナタ)

ヒ:君/me/僕(ボク)/I/you/your/my/俺(オレ)/僕ら(僕等)/あなた(アナタ)

●頻出語は上位3語を人称代名詞が占め、最頻出は「君(キミ)」となった。なお、ヒロソロでは「キミ」は出現しておらず「」のみとなった。
●共起図では「君」と「僕」「you」と「me」の共起が強く表れておりaccess・ヒロソロともにその2つの関係性を歌った曲が多いという結果が出た。
●ヒロソロのみで「俺(オレ)」が出現、他の人称代名詞との共起がなく「心」「涙」との共起がみられた。


体の部位(より生じるもの、感情、行為)
a:heart/夢/love/愛/手/心/想い/胸/恋/瞳/kiss/言葉/目/涙/願い/smile/笑顔/鼓動/肌/指/声/腕/眼差し/背中

ヒ:愛/夢/心/love/目/胸/涙/言葉/手/気持ち/想い/瞳/笑顔/顔/鼓動/魂/悲しみ/kiss/声/頭/恋/願い

access・ヒロソロの共通点として「愛/love」や「夢」、「心/heart」「願い」などの感情・思考に関する語が非常に多く出現していることが挙げられる。
また、体の上半身の部位が集中して出現しており、とりわけ目に関する語(「瞳」「眼差し」「涙」)が多い。
●次の「時間経過」でも同じことがいえるのだが、ヒロソロでは強制抽出設定を行った英単語の出現が少なく和語・漢語の使用が多い。
●「」は両楽曲で82回と71回出現しているが「」がaccessでは35回、ヒロソロでは8回と出現数に差が表れている。

 

★キラキラは多分ここから感じるんじゃないかな…!と思える語彙の数々٩( 'ω' )و 

時間経過
a:今/night/夜/明日/未来/永遠/いつ/今夜/時/tonight/いつか/季節/瞬間/日々/夜空/時間/夜明け
ヒ:今/いつ/明日/未来/夜/時/永遠/いつか/夜空/過去/今夜/夜明け/瞬間/昨日/時間

access、ヒロソロともに夜に関連する語彙が多く使われていることが判明した。
accessでは「明日」「未来」「永遠」など「今」より後の時間軸に関する語が多く出現しているが、ヒロソロではそれらに加えて「過去」「昨日」といった「今」より前の時間軸に関する語も出現している。

 

★出ました、「夜」…!個人的にはaccessやヒロには日頃から夜の雰囲気を感じている(?)ので、この結果が出た時地味に嬉しかった(˙◁˙)


天気・自然
a:光/闇/空/星/風/影/宇宙/雪/雨
ヒ:闇/空/光/風/花/月/星/山

accessとヒロソロでは「光」と「闇」の出現順位が逆転している。
●人の目線よりもはるか上にある(上から生じる)ものがこの分類の大半を占めている。(まあお天気だから大体そうだよね)
●ヒロソロでは「月」「星」が合わせて16回出現しているのに対し、accessでは「星」「宇宙」が合わせて43回出現している。さらに共起図を参照すると「星」と「空」、「風」がグループ化されており、歌詞中でこれらが同じ括りとして使用されていることがわかる。

 

……と、ここまで4つの分類から頻出語の体言の内訳をみてきましたが、

accessは英単語の使用が多い・「今」より後の時間軸への言及が多いなどといった点が見えてきました。


また、前回のエントリーで「自然・宇宙」をテーマとした楽曲が少数であったことを述べていましたが、頻出語には「星」や「宇宙」を始めとした語が多く出現しており、

このことから前項で示したaccessはスペーシー(宇宙的)である」という本人たちの主張が歌詞の立場から成立しているといえると思います(˙◁˙)


 一方、ヒロソロは和語・漢語の使用が多く「今」より前の時間軸への言及が多いなど割と真逆の結果が表れました。

 


次に頻出の用言をみていきますが、accessの歌詞で最も使用されている動詞がマイナスイメージを持つ「終わる」であったことから、ここでは同じように「マイナスイメージを持つ動詞」に注目してみます。

 

a:終わる(26/44)/消える(13/29)/忘れる(8/21)/離す(19/21)/壊れる(1/16)/止まる(13/16)/迷う(5/17)/止める(3/15)/捨てる(1/14)/傷つく(2/14)/違う(0/13)/離れる(3/13)


ヒ:消える(7/23)/忘れる(6/19)/傷つく(2/14)/閉じる(0/12)/離れる(2/11)/隠す(4/10)/奪う(0/9)/壊す(1/9)/捨てる(0/8)/終わる(5/8)/すれ違う(0/7)

(※括弧内、左の数字が否定形で使用された回数/右の数字が総出現数)

 

access・ヒロソロともにテーマ分類では「恋愛5(現在進行型)」「はげまし」など前向きなテーマの割合が高かったため、マイナスイメージを持つ動詞が頻出しているというのは意外に思われました。
そこでKH CoderのKWICコンコーダンス(文脈検索)機能を用いてこれらの動詞の実際の用例を確認したところ、accessで「終わる」が44回出現しているうちの26回が終わらない」「終わりのないといった否定形で使用されていました。


accessでは「終わる」の他に「消える」「離す」「止まる」が総出現数の半分以上の回数否定形で使用されていることがわかっていただけるかと思います。

(「離さない」「止まらない」などの形でよく使われているということです、access曲主人公から確固たる意志を感じる…ッ!!!)

しかしそれに対して、ヒロソロでは「終わる」が半分以上否定形で使用されていますが、その他の動詞については半分以下、または全く否定形で使用されていないという結果が出ました。

大半をヒロが作詞する中で、発表名義の違いでこのように語彙が変わってくるのがかなり面白いな!??!?🤗

 

③ー2. 時期別特徴語

access


ここからはKH Coderの「関連語検索」機能でJaccard係数を算出した時期別の特徴語をみていきましょう。

 

Jaccard係数とは「2つの集合に含まれている要素のうち共通要素が占める割合(金子2018)*1」を示すもので、

この値が1に近くなるほど特徴的な語彙だといえるんです。

 

例えば「語A」が「1期」でどれほど特徴的かを求める場合は

『「1期」でなおかつ「語Aを含む」文書の数』で『「1期」か「語Aを含む」か一方でも当てはまる文書の数』を割ることでその係数を計算できるということ。(参考:khcoder HP)

 

では実際に算出した結果と語同士の共起ネットワークがこちら。

 

f:id:SYNCing_time:20190815225114j:plain

f:id:SYNCing_time:20190815225151j:plain

図6にて期数を示す四角から放射線状に結ばれた語はその期で特徴的な語、

中心に集まっている語は各期を通して特徴的な語であるという風にみてもらえたら。

 

表10とこの図6を照らし合わせると、以下の点が見えてきました。


●1,2期を通して特徴的な語→「君」「僕」「今」「明日」「夜」「感じる」「終わる」など

●1期で特徴的な語→「今夜」「星」「恋」「街」「追いかける」「見つめる」など。

●2期で特徴的な語→「未来」「永遠」「宇宙」「世界」「輝く」「煌めく」など。

 

「今」「今夜」を歌う1期から「未来」「永遠」を歌う2期へと、描く時間軸が「今」より後へとシフトしていることがわかります。

しかし前項ではaccessの楽曲にて出現する恋愛タイプの変化を受けて 「“主人公の現在・未来の恋愛に対する心情”から“主人公の過去・現在の恋愛に対する心情”へと描写が移り変わっていった」と結論付けました。

これらを総合して考えると、AXS1期での恋愛テーマ曲は「現在・未来の恋愛に対する主人公の“今”の心情」、AXS2期では「過去・現在の恋愛を通しての主人公の“未来”への心情」を描写しているといえるんじゃないかな……!

 

これに関連して「愛」は1,2期通して特徴的であるという結果が出ているが、1期で「恋」が共起図に出現しているのに対し、2期では出現しておらず特徴的であるとはいえない。
加えて2期のみで「世界」が表10にて高いJaccard係数を示していることを踏まえると前項にて取り上げたヒロの「大きな世界観を描けるようになった」「男女間の恋愛だけじゃなく、もっと大きな視点(=「世界」)や気持ちで“愛”を描けるようになった」という2期での発言を裏付ける形となっているのではないかと思います。

 

その他としては、1期では「星」、2期では「宇宙」「輝く」「煌めく」といった、やはり「スペイシー(宇宙的)」な語が挙がってきている点が興味深いです☆彡

ここで歌詞にまつわる2人の言葉を引用すると『PATi・PATi』(エムオン・エンタテイメント,2007)にてヒロが「大ちゃんの作る音に刺激されて言葉が出てくる」、とか『キーボード・マガジン No.400』(リットーミュージック,2017)では大ちゃんが「(ヒロに曲を渡す際説明するかと問われ)イメージは言うよね。」と言っているので、楽曲の音色や雰囲気、伝えられたイメージに歌詞が影響されている可能性もなくはないのかなって考えてみたりもします。しない?する???えっしない???してたらすごく素敵だなって(ヲタクの戯言コーナー)

 

最後に2期の共起に「ナイ」という語が出現している点に少し触れておきましょう。

皆大好きヒロ語の代表格ともいえる「ナイ」が特徴的な語として上がってきました。

正直やっぱそうだよね!!!!!ってなったw

 

このへんは「④特殊表現」で改めて詳しく取り上げたいのでこのあたりで。

 


▲ヒロソロ

f:id:SYNCing_time:20190815231222j:plain

f:id:SYNCing_time:20190815231257j:plain

f:id:SYNCing_time:20190815231334j:plain

図6と同様に四角から放射線状に結ばれた橙色の語はその期で特徴的な語、中心に近い語ほど各期を通して特徴的な語です。

 

表11-1,2と図7を照らし合わせると、以下の点が見えてきました。


全期を通して特徴的な語→「君」「今」「明日」「愛」「夢」など。
UO1期で特徴的な語→「目」「夜」「澄み切る」「気づく」「傷つける」など。
1期で特徴的な語→「俺」「自分」「心」「自由」「信じる」「感じる」など。
2期で特徴的な語→「街」「永遠」「抱きしめる」「引き寄せる」「見つめる」など。
3期で特徴的な語→「世界」「未来」「生きる」「探す」「知る」など。

UO1期はアルバム1枚(Satulation Flower)のみということもあり他とはかなり違った様相となっているが、1~3期ではかなり似通った語が出現してきました。

 

ですが、「自身」や「社会・人間関係」をテーマとする曲が「恋愛」の割合を上回っていた1期でのみ「俺」「自分」「自由」「涙」といった語が出現しています。

それらのテーマの中で「自分」がどのように使用されているかKWICコンコーダンスで確認したところ、

「つまらない自分が穴へ落ちてく(「IZAKOZA」(1996)、社会・人間関係)」
「せこい自分を振りきるまで(「Over The RULE」(1996)、社会・人間関係)」
「自分を愛せないならば 心の声を聴け(「愛すべきもの」(1997)、自身)」
「まったく自分に迷っている(「あかい月」(1997)、自身)」


というように「自分」を不完全な存在と捉え苦悩する様子が多く描写されています。


 ヒロがこの期に発売したアーティストブック『GET THE SUN-ADVENTURE』(音楽専科社,1996)の中で「言葉は大事にしたいですね。今、感じたこと、思ったことを素直に表現するっていうか。詞は自分自身に向けて書いているし、聴いてくれている人にも投げ掛けられるようなものにしたいですね。」と発言していることからも、1期はテーマだけでなく歌詞の詳細な内容も自己主張性が高く、ヒロ自身の思いが最もストレートに表れている期であるんじゃないかなといえると思います。

確かに落ち込んでいる時にこの時期の楽曲を聞くと引っ張られてしまうことがある…ない?

 

2期では「恋愛」テーマの楽曲が6割を超えたことに関連してか「愛」が高いJaccard係数を示しました。また、「me」「love」「you」「my」「kiss」といった強制抽出設定の外来語が1~3期の中で最も多く出現して、ある意味一番accessに近いかも、な感じ。
また、「街」がUO1期、「世界」が3期とともに共起に挙がっており、母数的にはっきり言えないけれどもソロ楽曲でもaccessでの傾向と同様に「大きな世界観」を描くように変化してきているのかなと。

 

3期では、「叫ぶ」「静寂」「鳴る」といった、音にまつわる語が出現しました。
また、この期でも「闘い」テーマの割合が「恋愛」テーマを上回っていたが、「闘う」「勝つ」「負ける」など勝負を連想させる語は使用されておらず「想い」や「願い」などの思想的な語が特徴として挙がっていることから、このテーマでは「闘い」の状況そのものではなく「闘うことを通しての主人公の心情」に表現の重きが置かれているといえます。

(でもこれはライダーソング全体にいえることなのかな……そういうの調べてみても面白いかもしれないです、興味がある方是非🤔✨)

 

▲まとめ的なもの

ここまで、Jaccard係数と共起ネットワークを用いて時期別の特徴語を分析してきましたが、accessとヒロソロ共通して「各テーマに対しての主人公の心情」を歌詞に盛り込んでいることが多いのかなあという結論に至りました。

 

また、ヒロソロでは「自身」への言及がみられたが、これはソロの1期が「“沈黙”直後の時期」なのに加えて、2人のイメージが付くaccessに対し、ソロでは1人だけのイメージが先行するため「自身」についての心情や思っていることを素直に吐き出しやすかったのではないかと考えたり。

 

私はその時期を知らないただのいちヲタクなのであくまでデータを見た上での想像でしかないのだけれど。。

語彙から歌詞を紐解いてみるととても興味深いものがありました。

 

さて、次回はヒロ語の大きな特徴のひとつでもある「当て字」について分析していきたいと思いますよ〜〜 (② 完)

 

 

*1:金子冴(2018)「【技術解説】集合の類似度(Jaccard係数,Dice係数,Simpson係数)―ミ
 エルカAIメディア(IT企業による人工知能機械学習自然言語処理周辺の技術情報
 のメディア)」(https://mieruca-ai.com/ai/jaccard_dice_simpson/)より