COLUMN

1. RAG(Retrieval-Augmented Generation:検索拡張生成)とは?

RAGとは、LLM(大規模言語モデル)※のテキスト生成に、信頼性の高い外部情報の検索を組み合わせることで、プロンプトだけではコントロールしづらい出力精度を向上させるフレームワークです。

検索(Retrieval)機能を拡張(Augmented)し、質の高い回答を生成(Generation)できるようになることから、それぞれの頭文字を取って「RAG」と呼ばれています。

RAGではLLMが回答を生成する前段階に、最新の情報や専門分野のデータベースなどの外部情報(外付けの情報)を付与し、それらを検索できる工程を追加することで、LLMのウィークポイントを克服しつつ、エビデンスが明確で精度の高い出力が可能になります。

※LLM(Large Language Models|大規模言語モデル):膨大なデータとディープラーニング技術によってトレーニングされた自然言語処理モデルのこと。人間が話す言葉や書く文章などを学習して単語の出現率を統計的に分析し、学習したデータをもとにテキスト生成や文章要約などを行う技術。

NTT東日本のRAGを活用した生成AIソリューションのサービス資料です。無料でダウンロードできますので、ぜひご活用ください!

2. RAGが注目されている理由

RAGは、LLMに起こりがちな、事実に基づかない回答を生成する「ハルシネーション(幻覚)」という現象を回避できることから注目されています。

LLMは、チャットAIに入力された質問の意図を完璧に理解し、正しい回答を生成しているわけではありません。インターネットなどから収集した学習済みのデータの中から、提示されたプロンプトに応じ、ある言葉の次に続く可能性の高い言葉を予測・分析して並べ、文章を作成しています。

しかしながら、LLMは特定の期間や狭い分野の情報しか保有しておらず、その知識には学習するデータの量や質によって偏りがあります。またLLMは情報の正誤の判断ができないため、まったく関係のない情報が紛れ込んでいても、もっともらしい回答を生成してしまいます。その結果、まるで幻覚を見ているような、エビデンスが不明確な内容を出力してしまうことがあります。これがLLMのウィークポイントであり、課題です。

ハルシネーションを回避するには、信頼できるデータベースやソースを検索させて回答を生成することが求められます。RAGの仕組みは「オープンブック試験(教科書持ち込みOKの試験)」に例えられ、「教科書を見ながら問題を解く」ようなフレームワークを構築できるため、外部情報を検索して正確な出力が可能になります。

NTT東日本のRAGを活用した生成AIソリューションのサービス資料です。無料でダウンロードできますので、ぜひご活用ください!

3. RAGの仕組み

複雑に思えるRAGですが、仕組みは至ってシンプル。ユーザーからの質問に対して、「検索」と「生成」の2つのフェーズを経て回答を生成します。下記の概念図を参考に、プロセスを見てみましょう。

3-1. 検索フェーズ(Retrieval Phase)

検索フェーズでは、ユーザーの質問に対して最適な回答ができるよう、外部情報を検索してデータを収集します。

(1)ユーザーがチャットAIなどに質問を入力

(2)チャットAIが外部情報を検索し、適したデータを収集

(3)検索結果データを取得

3-2. 生成フェーズ(Generation Phase)

生成フェーズでは、検索フェーズで得たデータをもとに、LLMが回答を生成します。

(4)ユーザーの質問と(3)で取得した検索結果データを組み合わせ、チャットAIがプロンプトを入力

(5)(4)で入力されたデータをもとに、LLMが回答を生成し、チャットAIに返答

(6)チャットAIが、LLMから取得した回答をユーザーに出力

回答の精度を向上させるには、「外部情報をチャットAIが検索しやすいフォーマットに整える」「用途に応じた検索方式を実装・チューニングする」など、検索フェーズを工夫することが重要です。

3-3. RAGの検索方式

RAGで用いられる検索方式には次のようなものがあります。

  • ベクトル検索:単語の意味を捉え、関連する情報を見つけ出す方式
  • キーワード検索:単語や文字列のパターンを照合し、類似度に応じて情報を見つけ出す方式

しかし、「ベクトル検索は開発コストが高い」「キーワード検索はデータ量が増えると生成速度が低下する」などの短所があるため、多くの場合は、それぞれの欠点を補う「ハイブリッド検索」の実装が推奨されています。

NTT東日本のRAGを活用した生成AIソリューションのサービス資料です。無料でダウンロードできますので、ぜひご活用ください!

4. RAGのメリット

RAGの強みは、LLMに外部情報を検索させて回答が生成できることです。これにより、LLM単体で運用したときと比べ、さまざまなメリットがあります。

4-1.① 生成結果の信頼性・確実性が高まる

LLMのみで回答を生成すると、情報が古かったり、ハルシネーションを起こしたりする可能性があり、ファクトチェックに時間を要します。RAGでは、LLM自身のデータベースではなく、正確な外部情報を検索するため、信頼性の高い回答を生成することが可能になります。

4-2.② 外部情報の更新が容易に行える

LLMの知識をアップデートする場合は、最新の情報などを再トレーニング(再学習)させる「ファインチューニング」を行う必要があり、非常に手間がかかります。

RAGは、LLMが持つ情報ではなく、ユーザーが準備した正確な外部情報を検索させるためファインチューニングの必要がなく、常に最新の情報を反映した回答が生成できます。また、分野に応じた専門性が高いデータを組み込むことも可能です。

4-3.③ 費用対効果が向上する

LLMのファインチューニングは、データセットの準備や環境構築、実装後の改善などを行う必要があり、コストがかかります。RAGであれば、LLMの生成プロセスに外部情報を検索させる手順を加えるだけで完結するため、コストを大幅に抑えることができます。かつ、ファインチューニングよりもハルシネーションが起こる可能性が低く、コストパフォーマンスでも優位性があると言えるでしょう。

4-4.④ よりパーソナライズされた回答の生成が可能になる

LLMは、インターネットなどに公開されている既出の情報を根拠としているため、限られた分野・範囲の回答しか生成できません。一方RAGでは、外部情報として専門分野の詳細な情報のほか、社内文書や作業マニュアルといった非公開情報を扱うことも可能です。これにより、LLMの生成速度や要約力という強みを生かしながら、パーソナライズされた回答を速やかに生成することができます。

NTT東日本のRAGを活用した生成AIソリューションのサービス資料です。無料でダウンロードできますので、ぜひご活用ください!

5. RAGのユースケース

RAGのユースケースとして挙げられるのは、「チャットボット」への活用です。FAQ(よくある質問)やオペレーションマニュアルなどを外部情報として検索させることで、これまで人の手による確認が必要だった細かな作業のほとんどを自動化でき、オペレーターが応対する時間を短縮できます。

大阪府守口市の自治体では、市に寄せられるゴミ分別への問い合わせに対して、AIを活用した電話自動応対サービスとゴミ分別ガイドのチャットボットを並行で稼働したところ、人が応対する電話相談の件数が約15%減少したとの結果が出ています。時間外や土日も対応できることで、市民サービスの向上にもつながっています。

参考:「自治体におけるAI活用・導入ガイドブック<導入手順編>」(総務省)

このようにRAGを導入することで、業務効率化はもちろん、人的リソースを再分配してコア業務へ注力する人員を増やすことも可能です。

NTT東日本のRAGを活用した生成AIソリューションのサービス資料です。無料でダウンロードできますので、ぜひご活用ください!

6. RAG導入の注意点

LLM単体の運用と比較して、メリットが多いRAG。とはいえ、決して万能ではありません。導入時の注意点とその対策を押さえておきましょう。

6-1.① 出力結果は外部情報に依存する

RAGは外部情報を検索して回答を生成するため、組み込んだ文書やデータベースそのものが間違っていた場合、出力結果は誤情報になります。外部情報のファクトチェックや定期的なメンテナンスを行い、正確な出力結果が得られるようにしましょう。

6-2.② 機密情報の取り扱いによるトラブルの懸念

RAGは外部情報のすべてが検索範囲です。仮に機密情報や秘匿性の高い情報が含まれている場合でも、是非の判断を行わずに回答のソースとして利用してしまうため、意図しない情報流出の危険性があります。RAG環境を構築する際には、外部情報に重要な情報を含めない、アクセス制限をかけるなどの対策を行い、セキュリティを確保しましょう。

6-3.③ 独自性のあるコンテンツの生成は難しい

RAGの最大のメリットは、正確なソースを参照することで、事実に基づいたコンテンツを生成できること。裏を返せば、外部情報にはないコンテンツの生成は難しいということになります。RAGは便利な技術ですが、コントロールできるノウハウがないと、その力を最大限に発揮することはできません。独自性の高いコンテンツを作成する際には、人がやるべきところとRAGに任せるところを明確に区別し、共創する意識で進めていくことが望ましいでしょう。社内のリソースが足りないときは、パートナー企業に依頼することも一つの手段です。

NTT東日本のRAGを活用した生成AIソリューションのサービス資料です。無料でダウンロードできますので、ぜひご活用ください!

7. RAGの導入ならNTT東日本の生成AIソリューション

NTT東日本の「自治体様向け 生成AIソリューション」では、RAGの活用支援はもちろん、生成AIをセキュアに利用するための管理機能や、導入後すぐに使える100以上のプロンプトテンプレートなどご提供しています。

https://business.ntt-east.co.jp/content/cloudsolution/municipality/generative-ai.html

8. まとめ

生成AIの活用でよく聞くお悩みが「ファクトチェックに手間がかかること」です。RAGは、LLM自身のデータベースではなく、信頼できる外部情報を検索するため、事実に基づいた回答が生成できます。業務効率化に役立つRAGを導入してみてはいかがでしょうか?

NTT東日本では、RAG環境の構築からユースケースの創出まで伴走支援いたします。

サービスや事例をご紹介していますので、生成AIの活用を検討している方は、ぜひお問い合わせください!

生成AIの活用に向けて、地域DXアドバイザーや生成AIエンジニアが徹底サポートいたします。