2025.05.14 ｜ Writer：NTT東日本　アベ

生成AIカスタマイズで業務効率化！具体的な手法と実践のコツを解説

業務効率化やビジネスチャンスの創出などを目的に、多くの自治体や企業で生成AIの導入が進んでいます。一方で「情報セキュリティの課題がある」「自社業務とフィットしない」などの理由から、十分に生成AIを活かしきれていないケースも少なくありません。そうした場合に有効なアプローチが、生成AIのカスタマイズです。

本記事では、生成AIをカスタマイズする具体的な手法や進め方、メリット・注意点などを紹介します。

NTT東日本の生成AIサービスの詳細はこちら！

1. 生成AIをカスタマイズするメリット
2. 生成AIのカスタマイズ手法: 2-1. ファインチューニングとは; 2-2. RAGとは; 2-3. ファインチューニングとRAGの違い
3. カスタマイズの進め方: 3-1. ファインチューニングを実施する; 3-2. RAG環境を構築する
4. 生成AIをカスタマイズする際のコツ: 4-1. オーバーフィッティング（過学習）を防ぐ; 4-2. データのクオリティを担保する; 4-3. アップデート情報を確認し、更新計画を立てる; 4-4. ガバナンスやログ管理を適切に行う; 4-5. 個人情報・機密情報の取り扱いに注意する
5. 生成AIのカスタマイズならNTT東日本の「生成AIサービス」
6. まとめ

1. 生成AIをカスタマイズするメリット

生成AIを、特定の用途や業務、ユーザーに最適化された形で動作するよう「カスタマイズ」することで、汎用モデルでは対応しきれない専門性の高い業務や業界特有のニーズに対応できるようになります。主なメリットは以下の通りです。

特定のタスクや業務に特化した出力が可能になる
特定の分野の専門知識やデータに基づいた高精度な出力が可能になる
ハルシネーションを軽減し、修正にかかる時間やコストを削減できる
独自のデータやノウハウを反映した生成AIを開発することで、競争優位性を獲得できる

NTT東日本の生成AIサービスの詳細はこちら！

2. 生成AIのカスタマイズ手法

生成AIのカスタマイズにはさまざまな手法がありますが、標準的なものは「ファインチューニング」と「RAG（Retrieval-Augmented Generation：検索拡張生成）」の2つです。

2-1. ファインチューニングとは

既存の学習済みモデルに対して、特定のタスクや業務に関連するデータを用いて追加学習（再学習）を行う手法です。モデルのパラメータを調整することにより、専門的で高精度な出力が可能になります。

（例）法務部門に特化した生成AIを作りたい場合、法律文書などを含むデータセットでファインチューニングを行うことで、より精度と専門性の高い文書生成が可能になる。

2-2. RAGとは

生成AIに信頼性の高い外部情報のデータベースを組み合わせることで、出力精度を向上させる手法です。ユーザーが入力したプロンプトに対して、データベースから関連情報を取得し、それをもとに生成AIがテキストを生成します。これにより、生成AI単体では難しかった、特定の事実に基づく正確な回答や、最新の情報を反映した出力が可能になります。

（例）社内文書をもとにFAQチャットボットを構築したい場合、社内文書をデータベース化し、RAGを活用することで、最新の社内情報に基づいた適切な回答が生成できる。

RAGとは？仕組みと導入メリット、使用の注意点をわかりやすく解説

2-3. ファインチューニングとRAGの違い

ファインチューニングとRAGはどちらも生成AIの出力をカスタマイズする手法ですが、以下のような違いがあります。

横にスクロールします

	ファインチューニング	RAG
カスタマイズ方法	追加学習（再学習）によるモデルパラメータの調整。生成AIそのものに手を加える　etc.	信頼性の高い外部情報のデータベースを付与。生成AIそのものには手を加えない　etc.
メリット	特定のタスクやドメインに特化した高精度な出力が可能一貫性と再現性のある出力が可能　etc.	データベースの更新が容易に行えるため、最新の情報に基づいた出力が可能参照元を提示できるため、透明性・保守性に優れている　etc.
デメリット	追加学習用の大量のデータが必要オーバーフィッティング（過学習）のリスクがある　etc.	出力結果はデータの品質に依存する複雑で創造的な質問への回答が難しい　etc.

どちらの手法が適切かは、カスタマイズの目的や活用シーン、運用体制などによって異なります。例えば、大量のデータがあり、特定のタスクや業務に特化させたい場合はファインチューニング、最新の情報や出典元を重視する場合はRAGが適しています。

NTT東日本の生成AIサービスの詳細はこちら！

3. カスタマイズの進め方

ファインチューニングとRAGについて、それぞれの進め方を詳しく解説します。

3-1. ファインチューニングを実施する

ファインチューニングの実施方法は次の通りです。

3-1-1. ファインチューニング用の学習データを準備する

学習データの内容や質が、ファインチューニングの成果に大きく影響します。ノイズや偏りのあるデータは、誤った出力やオーバーフィッティングの原因となるため、事前にデータの調整をすることが重要です。

3-1-2. 学習データをアップロードし、ファインチューニングを実行する

学習データを使用する生成AIプラットフォームにアップロードし、ファインチューニングを実行します。プラットフォームによって具体的な手順は異なり、学習データの形式やパラメータなどを設定する必要がありますが、多くのプラットフォームでは、自動的に最適なパラメータを調整する機能が提供されています。

3-1-3. ファインチューニングの結果を確認し、必要に応じて調整・再学習させる

ファインチューニングが完了したら、出力品質の評価を実施します。評価指標としては、出力精度やF値（適合率と再現率の2つの指標をまとめたもの）などが用いられます。これらの指標をもとに、モデルの性能が目標値に達しているかを確認します。目標値に達していない場合は、学習データの追加やパラメータの調整などを行い、再学習を行いましょう。このプロセスを繰り返すことで、モデルの性能を向上させることが可能です。

3-2. RAG環境を構築する

RAG環境の構築方法は次の通りです。

3-2-1. RAG環境用の参照データを準備する

参照するデータの内容と質が出力精度に直結します。最新の情報であることや、正確性が担保されていることなどを十分に確認しましょう。

3-2-2. ドキュメントの前処理を行い、ベクトルデータベースを構築する

準備したデータは、ベクトルに変換するなどの前処理を行います。前処理の手法はさまざまですが、一般的には自然言語処理技術を用います。前処理が完了したら、ベクトルデータを格納するためのベクトルデータベースを構築します。

3-2-3. 検索機能と生成機能を連携させる

生成AIとベクトルデータベースを連携させます。「API経由で接続する」「ライブラリを利用する」などの方法が一般的ですが、自社の環境に応じて選定しましょう。

3-2-4. 出力精度向上のためにハイブリッド検索を実装する

ハイブリッド検索とは、キーワード検索とベクトル検索を組み合わせることで、高精度な情報検索が実現できる手法です。実装には、各検索エンジンの特性を理解し、統合方法や結果の重み付けを適切に設定・調整する必要があります。

3-2-5. ユーザーインターフェースを整備する

構築したRAGシステムを利用しやすいよう、ユーザーインターフェース（UI）を整備します。チャットボットとして利用する場合は、チャット形式のUIが、検索システムとして利用する場合は、検索ボックスや検索結果を表示するUIが必要になります。ユーザーのニーズや業務フローを考慮し、最適なUIになるよう検討・設計しましょう。

NTT東日本の生成AIサービスの詳細はこちら！

4. 生成AIをカスタマイズする際のコツ

生成AIのカスタマイズは、業務効率化に大きく貢献する一方、いくつかの注意点があります。以下に、カスタマイズを成功させるためのコツを解説します。

4-1. オーバーフィッティング（過学習）を防ぐ

オーバーフィッティングとは、モデルがデータに対して過剰に学習してしまい、未知のデータに対する予測精度が低下する現象です。

【具体的な対策】

学習データ、検証データ、テストデータの明確な分割を行う
検証データでの精度低下をトリガーにして、学習を早期終了（停止）させる

4-2. データのクオリティを担保する

生成AIの出力精度は、学習データのクオリティに大きく依存します。学習データにノイズや誤りが含まれていると、生成AIの出力精度が低下する可能性があります。

【具体的な対策】

誤字、脱字、えん字や表記ゆれを除去する
ノイズの多いデータや重複データを排除する
内容に偏りや差別的表現がないかを確認する

4-3. アップデート情報を確認し、更新計画を立てる

生成AI技術は常に進化しており、頻繁にアップデートが行われます。特にクラウドベースのAIサービスでは、負荷分散や自動スケーリングの対応が求められます。対策としては以下の通りです。

【具体的な対策】

新機能や情報セキュリティの修正に対応するため、定期的なアップデートチェックを行う
データ量やアクセス数の増加など、長期運用を見据えたスケーラビリティ（拡張性）を意識した設計を行う

4-4. ガバナンスやログ管理を適切に行う

生成AIの利用においては、適切なガバナンス体制を構築することが重要です。

【具体的な対策】

操作ログや出力結果ログを保存し、問題発生時の検証や改善に活用する
これらをコンプライアンス遵守や社内統制の証跡としても活用する

4-5. 個人情報・機密情報の取り扱いに注意する

生成AIの学習データや出力結果には、個人情報や機密情報が含まれる可能性があるため、情報の取り扱いには細心の注意が必要です。

【具体的な対策】

暗号化処理、IP制限、ログイン認証などでアクセスを管理する
データ匿名化やマスキング処理を施す
個人情報保護法などの関連法令を遵守する

NTT東日本の生成AIサービスの詳細はこちら！

5. 生成AIのカスタマイズならNTT東日本の「生成AIサービス」

SaaS型で提供するNTT東日本の「生成AIサービス」では、社内のデータを活用できるチャットツールとして、文章要約やアイデア出しといった日々の業務を強力に支援。特定の情報のみを検索して回答を出力する「RAG」としての活用も可能です。また、プロンプトのテンプレート化や、利用状況を可視化できるレポート機能なども提供しています。その他にもオプションにはなりますが、生成AIを効率的に利用するためのサポートや知識・技術習得のための研修なども実施できます。最適な生成AI環境のカスタマイズをトータルでサポートいたしますので、生成AIサービス選びにお悩みの方は、生成AIエンジニアが多数在籍するNTT東日本にご相談ください。

NTT東日本の生成AIサービスの詳細はこちら！