2. テキストマイニングの基本技術
予兆の発見→監視へ
更に上記の機能を拡張していくと、「予兆監視」が可能となります。どのような類似話題があるか全件マッチングで全て抽出し、時系列での上昇率を自動判定させると、急増する話題を発見する事ができます。
予兆発見→単語頻度では発見不可
例として、Twitterにおける「iPhone」に関するツイートを分析した結果を示します。件数は3件ですが、「OSのアップデートに失敗した」という意見が急増している事を発見できています。この結果を見た人から「“アップデート”という単語だけでも同様の結果を得られたのではないか?」との意見が出たため、“アップデート”だけの分析結果も掲載してあります。この結果から、単なる「アップデートの話題」の中に「OSのアップデートに失敗した」という急増話題が埋もれていた事が判明しています。つまり、急増話題を確実に抽出するためには「文単位の分析」「少数話題の自動抽出」「トレンド分析」が不可欠であり、これらが揃って初めて予兆発見が可能となるのです。