テキストの分析をしてみたく、テキストマイニングツールの導入はできたが、何から手をつけていいか分からない…といった方に向けて今回は
アンケートデータを使ったテキスト分析の初歩的なステップをご紹介します。
アンケートデータ
アンケートデータを収集することができたら早速分析に着手していきましょう。
テキストマイニングでは自由記述欄に書いてある情報を基に話題の分類を行います。
ベクスト株式会社のテキストマイニングツールVextMinerでは自由記述欄に情報に加え、属性情報(地域、性別、年代など)を登録しておけば、話題に対して属性をクロスして結果を見ることができます。これにより「この属性の人は、この設問に対してこのような話題を記述する」といった傾向を見出すことができます。
回答者個人を示す属性の他にも、サービスや商品に対する5段階評価などの設問もあれば、属性情報として登録しておいて損はないでしょう。
今回ご紹介するデモデータ概要
■アンケート内容:
・3大メディア(テレビ、屋外広告、インターネット)の良い点
■アンケート設問:
・良い点(自由記述)
・その良い点(自由記述)
・メディア
・年代
・性別
・受付月
■使用ツール:
・VextMiner
データのセット~主要話題把握
まずは属性情報とともにデータをセットします。
・分析対象列:その良い点
・属性情報:メディア、年代、性別、受付月
・参照属性:良い点
その後、主要話題を大まかにとらえるためにクラスタリング(話題の分類)を行います。
主要話題が抽出され、類似話題を近くに集めた結果が以下になります。
自由記述欄の中身を見てみると、アンケートの自由記述欄を対象にしているため、回答者により表現方法が様々です。ただVextMinerでは多少の表現の揺らぎに影響されず、類似する文章をまとめて抽出することができます。このクラスタリングでは詳細な話題をとらえるのではなく、あくまで全体像の把握程度を目的に行ってください。
話題を整理し、ラベル付けと統合が終わったら次はカテゴライズを行っていきます。
話題と属性情報をクロスしてグラフ表示する
クラスタリングでは全体像をある程度把握できたら、次は分類ルールを基にしたカテゴライズ結果を属性情報と掛け合わせて見ていきます。
▼カテゴライズ結果:図①
図①は横軸に「属性情報:メディア」を表示し、カテゴリ情報とクロスして表示しています。
図②は同じ条件のもと、表示形式を割合表示したものになります。
図①より、アンケート回答数は屋外広告≒テレビ>インターネットとなりました。
各メディア別に主要話題を見てみると、テレビ、インターネットは「目立つ」であるのに対し、インターネットは「詳しい」となりました。
また、このグラフからテレビは内容が判り易いが、詳しく内容を見るのであればインターネットが良いと考えられている傾向があると言えるでしょう。
分類を行い、主要話題を見える化することから始める
このようにまずは分類をしていくことで、主要話題・傾向などを把握することができるようになります。
ただ、分析と分類は等しいものではなく、分類をすることで初めて分析が可能になります。
今回は分類までとしますが、その後のステップの分析について触れている記事(「分類」で終わらないためのテキスト分析手法)もございますので、気になる方はぜひご覧いただければと思います。
より詳細な情報や事例について知りたい方は、お問合せフォームよりぜひお気軽にお問合せください。テキストマイニングに興味をお持ちの方は、無料のセミナーもございますので、お気軽にご参加ください。また、ベクスト各種製品のお役立ち資料もご用意しております。
関連製品:VextMiner
関連ワード:自然言語処理、アンケート分析、分析ステップ