RAG(Retrieval-Augmented Generation)について解説します!

今回は、ChatGPTなどの大規模言語モデル(LLM)の機能を拡張することで社内のナレッジ活用や業務効率化を推進することが出来るRAG(Retrieval-Augmented Generation)についてご紹介します。

RAG(Retrieval-Augmented Generation)とは?

RAG(Retrieval-Augmented Generation)は、「検索拡張生成」などとも訳されますが、ChatGPTなどの大規模言語モデル(LLM)に回答を生成させる際に、外部の知識ソースを参照させることで、出力される回答を最適化するものです。これにより、特定の分野や組織の内部ナレッジベースの情報などについての回答を出力する際に、正確性、信頼性などを高めることができます。

RAGの仕組みについて

RAGは、「検索」(Retrieval)と「生成」(Generation)の2つの主要なステップを組み合わせて動作します。「検索」のステップでは、社内ナレッジや資料などのデータベースから「検索」を行い、ユーザが入力した質問と関連度の高い情報を抽出します。このステップの後、「生成」ステップに移ります。「検索」ステップで抽出した情報を基にChatGPTなどの大規模言語モデル(LLM)が回答を生成します。

アーキテクチャは以下のようなイメージです。

RAGの活用場面は?

RAGは、例えば以下のような場面で活用することが出来ます。

  • 社内FAQ検索システム:会社内のFAQを外部の知識ソースとして参照させることで、効率的に社内FAQを検索できるようになります。
  • 社内のドキュメント検索システム:会社内の資料(就業規則など)を外部の知識ソースとして参照させることで、業務や手続きに必要な書類・ナレッジをまとめて管理することができ、大量のデータの中からすぐに必要な抽出することが可能となります。

Vext(ベクスト)とRAGの関係性は?

RAGにおいて、社内ナレッジや資料を検索する際、自然文での検索が非常に重要です。自然文での検索を実現するためには、文章のベクトル表現を使うことが求められます。
ベクトル表現とは、文章を数値の列に変換する技術です。これにより、文章同士の類似度を計測し、検索に活用することができるのです。この技術は「概念検索(ベクトル検索)」と呼ばれています。

弊社「Vext(ベクスト)」の社名およびシリーズ製品名は「VEctor indeXed Text」に由来しています。1996年に、株式会社コマツの研究本部とコマツソフト(現クオリカ)で、テキストマイニング技術の研究・開発を始めました。ベクトル検索技術を我々の知る限り国内で初めてテキストマイニング製品に組み込み、発展させてきました。

現在提供中の分析アシスタント機能「VextInsight powered by ChatGPT」では、RAGプロセスをさらに拡張しています。社内ナレッジや資料の検索にとどまらず、分析結果そのものをシステムが最適な形へ加工し大規模言語モデルに入力することで、分析結果の解釈を可能にしています。

そして、今年7月24日(水)に開催予定の大型イベント「Vext Tech Conference2024」では、LLM/RAGと弊社独自の自然言語処理技術を組み合わせた新製品や新機能を提供予定です。ぜひお早めにお申し込みください。

まとめ

今回はRAG(Retrieval-Augmented Generation)について紹介させていただきました。
今後、さらに大規模言語モデル(LLM)が発展していくことでRAGの活用場面も増えていくと予想されます。RAGをうまく活用し、社内ナレッジの活用や業務改善を目指していきましょう。

 


関連イベントのご案内:Vext Tech Conference2024

Vext Tech Conference 2024
Vext Tech Conference」は、テキストマイニングを含めた、めまぐるしい速さで更新されていく様々な新情報や新技術と共に、企業の知的生産活動の未来の姿を皆様にお伝えする事を目指した、毎年夏季に開催のイベントセミナーとなります。

・開催日程:2024年7月24日(水)14:00~16:15
・参加費 :無料
・主催者 :ベクスト株式会社
・お申込み:こちらから

【本件に関するお問い合わせ】
ベクスト株式会社(VTC事務局)
TEL : 03-4590-6755 / e-mail : vext_sales@vext.co.jp