テキストマイニングに必要な音声認識の要件について

テキストマイニングに必要な音声認識の要件について
近年、コンタクトセンターにおける音声認識・音声テキスト化の利用の普及により、音声マイニング(=音声認識+テキストマイニング)の導入を検討するお客様が急速に増加しております。
音声マイニングを導入するためには、音声認識・テキストマイニングのそれぞれのツールの検討が必要ですが、それらは個々に独立して行われるべきではなく、音声認識を検討する際にもテキストマイニングに必要な要件を満たしているかどうか?を確認しておく事が必要となります。

そこで今回は、テキストマイニングに必要な音声認識の要件について解説いたします。

1.句読点やスペースなどにより、文意の区切りが明確になっている

テキストマイニングに必要な音声認識の要件として「認識精度が高いこと」は当然ですが、必要な要件はそれだけではありません。

1文字1文字の認識精度が高いのはもちろんのこと、句読点やスペースなどによって文意の区切りが明確になっていることが非常に重要です。

人間がテキストデータを読む際に句読点が入っていた方が読みやすいのと同様に、後工程のテキストマイニングツールやAIツールにおいても、句読点やスペースなどの文意の区切りの位置の情報があった方が処理しやすくなることが多いからです。

2.発言者・通話日時・通話時間などの属性情報とセットでデータが出力される

音声認識ツールから出力される情報は、音声をテキスト化したテキストデータだけではありません。

通常、発言者・通話日時・通話時間といった属性情報とセットで出力されます。後工程のテキストマイニングツールでの分析処理において、これらの属性情報は極めて重要な情報となります。

例えば、オペレーターの発話に絞り込んで分析する、通話時間が長くなっている通話に絞って分析するなど、属性情報があれば様々な分析要件に対応することが可能となるからです。

3.分析要件に合わせて、ユーザー側で音声認識辞書をチューニングできる

音声認識の認識精度は高いに越したことはありませんが、通常、認識精度は100%ではなく、若干の誤認識が発生することが一般的です。

誤認識が多少あってもテキストマイニングの処理自体は可能ですが、分析要件によっては、必ず正しく認識されていて欲しいというキーワードは存在します。

例えば、オペレーターの口癖を分析するという要件では、口癖に関するキーワードは必ず正しく認識されている必要がある、などです。

従って、ユーザー側で音声認識辞書をチューニングできる機能があり、分析要件に合わせて重要キーワードの設定ができれば、後工程のテキストマイニングツールでの分析も容易になります。

音声マイニングの分析結果例

音声マイニングで失敗しやすい5つのポイントとその対策

4.まとめ

今回はテキストマイニングに必要な音声認識の要件について解説いたしました。

より詳細な情報や事例について知りたい方は、お問合せフォームよりぜひお気軽にお問合せください。テキストマイニングに興味をお持ちの方は、無料のセミナーもございますので、お気軽にご参加ください。

関連製品:VextMinerVextVoiceMiner
関連ワード:自然言語処理
関連Blog記事:【検討者必見】音声マイニング特集(VextBlogをまとめて紹介!)