SNSデータは、VOC(=Voice of Customer)分析においても有用なデータソースですが、そのデータの性質上、他のデータの分析とは大きく異なる点があり、分析を実施する上でも特有の注意点が存在します。
今回は、SNS分析のポイントについて、まずは最も基礎的な内容を解説いたします。
1.分析要件に合わせて対象サイトと期間を決める
まずは分析要件に合わせてSNSの対象サイトと対象期間を決定する必要があります。
例えば、ある特定のプロモーションの反響について分析したい場合、プロモーションの実施直後のある特定期間のデータを取得するなどです。
また、特定の商材に関しての口コミが集まるSNSなど、対象サイトにも様々な種類がありますので、分析対象の商材・サービスに合わせてサイトを選定する必要があります。
2.分析要件に合わせてクローリングのキーワードを決める
SNS分析においては、データ収集の際のクローリングのキーワードの設定の良し悪しが、後工程の分析の効率を大きく左右します。
キーワードの設定方法は、使用するクローリングツールによっても異なりますが、AND条件やNOT条件などで設定することが一般的です。
この際、広すぎず狭すぎない設定でデータ収集をすることがポイントです。
あまりにも一般的なワードで設定すると、データ規模が大きくなりすぎてしまい前処理が煩雑になりますし、逆に設定を厳しくしすぎて限定的な件数しか取得できないと、そもそも分析の目的を達成できないからです。
3.前処理はデータの種別ごとに分けて実施する
クローリングのキーワードをどんなに工夫をしても、分析の対象外となるデータを完全に除外することは難しいです。そこで、SNS分析の場合、前処理の工程が必須となります。
この際、前処理を実施したいデータの種別ごとに分けて処理を実施していくことがポイントです。
例えば、分析対象のキーワードと包含関係にある言葉が存在してヒットしている場合は、そのキーワードを頻度集計で洗い出し件数の多い順に削除することや、分析の対象とはならない企業の宣伝コメント等が多く出現する場合は、マイニングツールの機能を使って類似の文書を一括して抽出して削除するなどです。
4.まとめ
今回はSNS分析のポイントについて、まずは最も基礎的な内容について解説いたしました。
より詳細な情報や事例について知りたい方は、お問合せフォームよりぜひお気軽にお問合せください。テキストマイニングに興味をお持ちの方は、無料のセミナーもございますので、お気軽にご参加ください。
関連製品:VextMiner
関連ワード:自然言語処理