2024.09.24 (Tue)

テクノロジーでビジネスの現場が変わる!(第62回)

Googleの生成AI「Gemini」は、ChatGPTと何が違うのか?

 Googleは2024年2月に「Gemini」という対話型生成AIの提供をスタートしました。先行してリリースされたOpenAI社の「ChatGPT」とは、何がどう異なるのでしょうか?

ChatGPTの後塵を拝したGoogleの逆襲

 2024年3月、Googleは「Gemini(ジェミニ)」という対話型の生成AIの提供をスタートしました。5月にはアプリ版もリリースされており、すでに使用しているという人もいることでしょう。

 対話型の生成AIといえば、2022年11月にリリースされた、OpenAI社の「ChatGPT」が広く知られています。世界規模の巨大IT企業であるGoogleにしてみれば、生成AIの分野において、ChatGPTの後塵を拝する形となりました。

 その後Googleは2023年2月に、Geminiの前身である「Bard(バード)」という生成AIを発表しました。しかし発表時のデモにおいて、太陽系外の惑星の写真を初めて撮影した宇宙望遠鏡の名前を間違って回答したことで、親会社であるAlphabet社の株価が急落する事態に追い込まれてしまいました。

 Geminiは、Bardの性能をアップグレードし、名称を変更したものです。Geminiは、どのような特徴を備えているのでしょうか?そして、ChatGPTとは何が違うのでしょうか?

※本稿は2024年8月末時点の情報を元に作成いたしました

Geminiの特徴「マルチモーダル」とは

 Geminiの特徴としては、テキストや画像、音声など、異なるモダリティ(様式)からの情報を処理できる「マルチモーダル」性能を備えている点が挙げられます。そのため、無料版であっても、画像/動画/音声/文章/プログラムのコードなど、複数の入力メディアを処理することに対応しています。

 たとえば、グラフの画像をGeminiに読み込み、「この画像を要約して」とプロンプト(命令)を入力すれば、グラフの説明文が出力されます。このほかにも、「この画像のキャプションを考えて」といった作業もできます。

Geminiでグラフの要約を命令した様子。画像の内容を元に、指定した文字にしたがって要約を出力する

 画像の出力にも対応しています。ただし、日本語プロンプトでの画像出力はできず、英語でのプロンプトであれば作成は可能です。人物画像の生成についても、2024年8月末時点では対応しておらず、有料版の「Gemini Advanced」において実装が予定されています。

 ChatGPTでも画像の生成に対応しており(日本語版 画像生成GPT)、人物画像の生成も可能ですが、無料版では1日2枚のみに限られます。ユーザーが持っている画像をアップロードし、その要約を依頼することはGEMINI同様に可能ですが、有料版のみの対応となります。

GeminiはGoogleの検索結果に基づいて回答する

 Geminiの特徴としては、Googleの検索結果に基づいたソースを元に回答しているという点もあります。そのため、Web上に掲載されている、質の高いコンテンツの情報を元に回答を出力することが可能です。

 質問に対する回答の真偽が疑わしい場合は、「回答を再確認」というアイコンをクリックすることで、ソース元となった記事のリンクを表示する機能も備わっています。

 ソースとなるコンテンツが存在する場合には、当該箇所に緑のマーカーと元記事へのリンクが表示され、逆に関連したコンテンツが見つからない場合は、オレンジのマーカーと「この記述が信頼できるものかどうか、さらに調査することを検討してください」という、内容の確認を推奨するメッセージが表示されます。

「回答を再確認」のアイコンをクリックすると、引用元となった記事のページが表示される

 一方のChatGPTは、インターネット上で公開されているあらゆる情報を元に出力を行います。出力される文章は、人間との対話に特化しているため、まるで会話をするように回答が得られる点が特徴です。

グループウェアとの連携で、Geminiが下書きや要約を作成することも可能

 Geminiのさらなる特徴としては、Googleのグループウェアツールである「Google Workspace」と連携した「Gemini for Google Workspace」というサービスが用意されている点もあります。同サービスを利用すれば、たとえばメールアプリ「Gmail」と連動することで、下書きを作成したり、長大なメールスレッドの内容を要約することも可能です。

 Web会議ツールの「Meet」でGeminiを使えば、議事録の作成や自動文字起こしもできます。相手が日本語話者でない場合は、相手の言語を日本語に、日本語で喋った内容を相手の言語に翻訳することも可能です。

 2024年8月末現在、Gemini for Google WorkspaceにおけるGeminiに対する指示は英語のみとなりますが、Googleでは9月より日本語対応していくことを明らかにしています。

 ChatGPTも、アドインを利用することで、WordやExcelといったオフィスソフトとの連携は可能ですが、ChatGPT自体がグループウェアに組み込まれたサービスは、現時点では特に展開されていません。ただし、Microsoftの生成AIである「Copilot」には、エンジンとしてOpenAI社の「GPT-4」が採用されており、CopilotとMicrosoftのグループウェアである「Microsoft 365」を組み合わせた「Copilot for Microsoft 365」というサービスは存在します。

 ここまで見てきたように、基本的にはGeminiもChatGPTも、そこまで機能に大きな差はありません。しかしGeminiでは、一部機能で日本語に対応していない点は、ChatGPTよりも明らかに使いづらい面もあります。

 一方でGeminiには、出力時のソース元を明示する機能があったり、無料版でも画像の生成数に制限が無いなど、ChatGPTよりも優れている点が存在します。生成AIをビジネスに導入する際は、まずは無料版を使用し、自社が求める機能が備わっているかよく検証してから決めるべきでしょう。

連載記事一覧

メルマガ登録


NTT EAST DX SOLUTION


ミライeまち.com


「ビジネスの最適解」をお届けします 無料ダウンロード資料


イベント・セミナー情報

ページトップへ

ページ上部へ戻る