テキストマイニングの手法
分析スキルの向上
テキストマイニングの歴史は浅く、この技術に習熟する人材もまだ少ないのが現状であるが、データマイニングと比較すれば、その閾値はかなり低く、第3章、4章で紹介した様に、専門家でなくとも十分活用できるレベルのインターフェースを備えている。その最大の理由は、分析結果の解釈に高いスキルを要するか否かの違いである。データマイニングの場合、例えば決定木で解析された多くの結果(抽出されたルール)を比較検討して、現実的に意味のある結果に絞り込むには、当該業務に精通しているだけでなく、統計数学の知識を合わせ持つ事が必要となっているのに対し、テキストマイニングでは分類結果の良し悪しは、それを読めば誰にでも判断できるからである。つまり、テキストマイニングの場合では、内部で使われているアルゴリズムはほとんど意識することなく、インプットとアウトプットを自分の意図に合わせてコントロールすれば良いのであり、原則として高いスキルは必要としない。(勿論、ツールに対する習熟や、形態素解析に関する基本的な理解は必須である。)
従って、テキストマイニングにおける分析スキルとは、ツールに対する習熟だけでなく、むしろどのように実際の業務に適用して改善の手掛かりを得るのか、というレベルの適用ノウハウや分析する際の視点の高さが重要となる。この点で、第2章で述べた様に、担当者サイドに対しては、当該業務に対する問題意識の高さが重要で、もう一つはこれを指導・アドバイスするテキストマイニングのコンサルタントの資質・経験が課題となってくる。
つまり、テキストマイニングは実学的な面を強く持つ事から、まずは自らが高い改善意欲を持つと同時に、分析上の問題点や課題の解決方策に関しては個々の事例ごとに、その道のエキスパートに学ぶ事が最短コースである(前述のように、架空の事例では、問題意識が存在しないために、トレーディングにならない。要は自らの課題に対する実践があるのみである。この点、コンサルタントは様々な課題に直面できるため、その経験量の差は歴然としている)。 そして、その後に担当業務に対する、きめ細かい改善を組織として継続してゆく事で、最終的な目標に到達できるものであると考えられる。
日本では、コンサルタントやノウハウ提供に対する価値観が欠乏気味であるが、未開の地を旅する際には、誰もが現地の道案内を頼む様に、テキストマイニングと言う未開の荒野(今の所は)をスムーズに渡り歩くためには、必須である事を認識頂きたいと考えている。
以上をまとめれば、スキル向上のポイントとは、以下のとおりである。
①同一データに対して、多面的な分析を試み、必ず複数結果を比較した上で、結論を出す。
②同一データを複数人で分析し、その結果についてのディスカッションを実施する
(この際に、自由闊達な雰囲気作りが重要となる。分析結果の優劣を競うのではなく、新たな分析視点としてのレベルの高さや新鮮さがポイントである。従って、同一部署内だけでなく、異なる部門からの視点を含むため検討が効果的となる。)
③コンサルタントを活用する。
(2019.05.08 公開)
本書又は本コラムに関する一部あるいは全部について、ベクスト株式会社から文書による承諾を得ずに、
いかなる方法においても無断での引用・転載・複製等を行うことは禁じられています。
※記載されている商品名、会社名など固有名詞は各社の商標及び登録商標です。