テキストマイニングの手法

マーケティング情報の変遷

 高度成長期が終焉し、経済の安定期に入った今、マーケティングに要求されているのは、まず顧客の囲い込みである。特に2-8の法則(大部分の企業において、2割の優良顧客により、8割の利益が生まれている事を指す。)に代表される様に、優良顧客が企業収益の基幹を握っている事から、彼らとの関係をより緊密かつ長期的観点で推進して行く必要があり、きめ細かいサービスを継続的に実施する必要に迫られている。こうしたニーズを反映して、最近のマーケティングはMass MarketingからOne To One Marketingへと大きくシフトしており、その潮流の中でマーケティングで用いられる情報の内容とその種類(数値情報もしくは文書情報)も大きく変化している。

 図1-1では、Web Marketingの登場により、顧客情報が様々なチャネルを通じて、詳細かつ安価で、しかもリアルタイムに入手可能となっている事を示していると同時に、従来のマーケティング情報の大部分が売上情報と言う数値情報&文字列情報に依存していたのに対し、新たな観点として“顧客の生の声”を反映したマーケティングが実践されつつある事を意味している。実際、売上情報以外は、ほぼ全てが文書情報であり、これを如何に分析して活用するかがキーポイントとなっており、本書の主題であるテキストマイニングの存在理由もこの点にある訳であるが、これらの大きな質的変化は、次の2点に代表される。

① 数値情報から文書情報へ
② 売上情報から挙動情報へ

<数値情報から文書情報へ>

 まず、この変化は顧客ニーズを把握する段階で始まっている。これまでも商品開発やプロモーションの事前調査として様々なアンケート調査が実施されているが、従来の選択式アンケートの致命的な欠陥として、同じ内容であっても設問の順番を変更するだけで、その結果が大きく異なってしまう点が指摘されている。つまり、“設問と回答選択方式”では、結果を誘導している可能性が高く、その結果の精度は全く信頼できないと言い切る調査マンも数多いのが現実である。(逆に、周到に準備すれば望みの結果を得る事ができるかも知れない?)

そこで、最近は自由記述形式に切り替える事で、例えば“この商品を買った理由は何ですか?”あるいは“あなたにとって理想の○○とは何ですか?”と言ったフリー形式のアンケート調査が主流となってきており、消費者の本音を効率的に引き出す事に成功している。

 こうした現状を踏まえて、自由記述のアンケート結果(2000~5000件が多い)をテキストマイニングツールで迅速に解析し、分析者の意図を反映した多面的な分析を実施する事が、家電、情報機器等を始めとする製造業や金融、製薬等に至る多くの事業分野で始まっている。詳しくは後述するが、これまで調査会社に分析を依頼(2~4週間を要す)して時間と費用を費やしていたものが、テキストマイニングツールを用いる事により2~3時間で様々な分析結果を比較検討した上で、レポーティングする事が可能となっている。これは従来のやり方の場合で、調査会社の分析結果が依頼主の感性と程遠かった際には、やり直すか諦めるしかなかったものが、ごく簡単に再試行して比較検討できる事と同時に、同じデータを用いて品質向上やプロモーション企画と言った異なる観点から分析を試みる事が簡便にできる事を意味している。即ち、従来の手作業の壁を打ち破った事で、単なる情報共有だけでなく「分析の共有」とでも言うべき新たな知的交流の場が出現したものであり、知的生産性の観点からも新たな局面を切り開くものと言える。

 さらに、コールセンタでは1日当たり数千~数万件の問合せが寄せられており、これらの情報は対象商品の評価ばかりでなく、市場全体の反応や動向を反映していると考えられる事から、文書情報化された“顧客の生の声”を分析する事で、マーケティングや事業戦略の企画立案を支援する局面での活用が、製造業、金融業を始めとする多くの企業で実施されている。このように数値情報からは抽出できない、顧客の言動を捉える手段の1つとして文書情報が大きな貢献を果たすことから、大量データの蓄積とテキストマイニング技術の進歩とが相俟って、急速に脚光を浴びてきたものである。

<売上情報から挙動情報へ>

 誰が何を何時買ったかが売上情報であり、ビジネス上で最も基本となるデータであるが、最近ではPOSデータ(Point of Sales)に代表される様に、顧客の購買履歴情報としてデータウェアハウス化し、データマイニング(数値情報のマイニング)される例が増えている。この手法は、大規模データベースからニューロや統計手法を駆使して、隠された因果関係を抽出しようとするもので、購買履歴に基づく顧客行動のセグメント化に大きな威力を発揮するものである。有名な事例として「缶ビールと紙オムツの事例」(注1、参考文献2)があるが、当然ながらこうした情報は“買った”と言う情報に限定されており、その後に顧客がどんな不満を抱いているかや、どんな事に興味を持っているか等に関する情報はない。

注1:アソシエーション分析(マーケットバスケット分析とも呼ばれる)による「缶ビールと紙オムツの事例」
「週末のスーパーでは、缶ビールと紙オムツを併買する顧客が多い」と言う、全く異なるカテゴリーに属する商品間での併買ルールを見出した事例として有名であり、数百万件を超える販売履歴データからこうしたルール抽出する事を、データマイニング技術が初めて可能にした点を強く印象づける事例となったが、実際の所は事実であったのか伝説なのかは不明である。ただし、こうした併買ルールには多くの候補が抽出されるため、仮説検証による絞込み作業が重要となる。

 こうした点を補完するのが、顧客の声に代表されるテキスト情報であるが、これまではコールセンタでの回答業務に活用・蓄積されるだけで(つまり、個々の顧客毎に前回の問合せ内容を確認するため)、この情報全体を顧客の挙動情報として捉え、全社で活用するという視点に乏しかった。しかしながら、最近のテキストマイニング技術の進展により、大量の文書データを迅速かつ精度良く分析できる状況となったため、急速に活用が進みつつある。ここで、顧客の挙動情報に関して表1-1にまとめたが、大きくは企業が直接捉えることのできる情報とWeb上の情報に区分される。

 前者は、既存顧客を中心としてその企業にとっての最重要情報(他社では捉える事のできないオリジナル情報である)であり、まずこの情報を漏れなく有効に活用する事が、最初の一歩であると考えられる。特に、これまで苦情やクレーム情報は企業内において、あるべきものでないとの感覚が強く、タブー扱いされる状況が多く見られたが、逆にこれを正面から捉えて「苦情やクレームの中にこそ、宝となる重要な情報がある」との考え方が主流を占めつつあり、顧客の言動情報の分析とその結果に対する迅速な対応がキーポイントであると考えられる様になってきた。

 後者は、一般に公開されている情報であり、Yahooや2ちゃんねるの掲示板が有名であるが、余りにも膨大な情報量であるために、ターゲットを絞り込んだ情報収集と継続的な分析が必要となっている。この情報の最大のポイントは、非購入顧客や非コンタクト顧客に関するほぼ唯一の情報源である事であり、競合商品に関するユーザの不平不満をダイレクトに抽出できる情報として重要である。既に、こうしたWeb風評を分析するビジネスも始まっており、今後はより広くかつ深い情報分析と活用が進むものと考えられる。

表1-1、顧客挙動情報

区分 顧客挙動情報の内容 数値・文書の区分 備考
企業が直接取得できる情報 売上情報 購買履歴
数値・文字列情報
既存顧客の挙動情報として重要
営業情報 営業日報 文書情報
言動情報 問合せ、苦情 文書情報
アンケート 文書情報 非購入顧客、非コンタクト顧客の情報源として重要
Web上での情報 閲覧履歴 URLのアクセスフロー 数値・文字列情報
閲覧内容 文書情報
Web風評 掲示板等の自由発言 文書情報

顧客の声が経営を変える>>

(2019.05.07 公開)

本コラムは、2002年リックテレコム社出版 石井哲著作「テキストマイニング活用法 顧客志向経営を実現する」から引用しています。
本書又は本コラムに関する一部あるいは全部について、ベクスト株式会社から文書による承諾を得ずに、
いかなる方法においても無断での引用・転載・複製等を行うことは禁じられています。
※記載されている商品名、会社名など固有名詞は各社の商標及び登録商標です。