辞書・分類設定のメンテナンスについて(基礎編)

テキストマイニングツールを定常的に業務活用するうえで、辞書や分類設定のメンテナンスをいかに効率的に実施するか?は最も重要な課題の1つです。

今回は、辞書・分類設定のメンテナンスを実施する際のポイントについて、まずは必ず抑えておくべき最も基礎的な内容について解説いたします。

1.個々の条件設定は極力シンプルな設定にする。

ツール導入時は分析担当者が条件設定にこだわり、時間をかけて複雑な設定を作成することも多いですが、その後、「導入時の担当者が異動になり、誰もメンテナンスができなくなった。」というような状況はよく発生します。

このような課題を防ぐため、個々の条件設定は極力シンプルな設定としておき、担当者変更があった場合も、後任者が見て分かりやすい設定にしておく事が必要です。

2.話題が細かい場合は2段階の分類体系にする。

分析要件にも依りますが、サービス区分や話題が多岐に渡る場合、作成すべき分類の項目数が膨大になることがあります。

このような場合、1つの分類体系に全てを取り入れようとすると、分類設定のメンテナンスが非常に複雑になってしまうため、例えば、「大きなサービス区分で分ける分類」と、「個々のサービス区分の中で更に細かく分ける分類」の2つを用意して、2段階の分類体系にすると、分かりやすくなりメンテナンスもしやすくなります。

3.分類体系は状況に合わせて常に見直しをする。

「導入時に苦労して分類体系を作成したが、自社のサービス内容や市場が大きく変化し、今や使えないものになってしまった。」というような状況はよく発生します。

そのため、分類体系は状況変化に合わせて柔軟に変更することが必要ですし、それが容易に行えるようなツールを使用することが必要となります。

また、分類体系を変更した際は、新しい分類設定を用いて過去データを含めて再度分類を行い、新しい切り口で傾向分析をすることも有効です。

<分類体系のイメージ>
分類体系のイメージ

4.まとめ

今回はテキストマイニングツールの辞書・分類設定のメンテナンス方法について、最も基礎的な内容について解説いたしました。

より詳細な情報や事例について知りたい方は、お問合せフォームよりぜひお気軽にお問合せください。テキストマイニングに興味をお持ちの方は、無料のセミナーもございますので、お気軽にご参加ください。

関連製品:VextMiner
関連ワード:自然言語処理