機械学習の力で音声データから文字起こしができるAmazon Transcribeを解説

音声データを文字にしたいシーンは多いものです。例えば、インタビューの音声を記事化したい、会議の音声を議事録にしたい、電話の記録をテキストで残したい、など、ニーズは企業内外に多数あることでしょう。
「Amazon Transcribe」ならそのニーズを満たしていけます。また、他AWSサービスとも連携することで様々な効果を生み出せます。このコラムでは、そのような文字起こしのニーズに対応できる「Amazon Transcribe」を解説していきます。

Amazon Transcribeとは

Amazon Transcribeは自動で文字起こしができるAWSのサービスです。自動音声認識の技術で、音声ファイル・動画ファイルなどの文字起こしや、会議などでのリアルタイム文字起こしに活用できるのが魅力です。更に、他のAWSサービスと連携することで、AWSの他サービスと連携した顧客の傾向分析、動画字幕のローカライズなどを行うことができます。

Amazon Transcribeの利用メリット

まずはAmazon Transcribeのメリットについて、みていきましょう。

精度の高い文字起こしができる

Amazon Transcribeでは、語彙をカスタマイズし、独自の言語モデルをトレーニングできるので、ジャンルに沿った高精度の文字起こしも可能です。言語は、2020年12月現在、日本語、英語、中国語、ドイツ語、フランス語などの31言語に対応し、事例の項で後述する「動画への自動字幕付加で大幅コストカット」他、様々なシーンで活用されています。

特定の単語をフィルタリング

語彙フィルタを別途作成すれば、不適切な単語や不要な単語を文字起こしから削除でき、文章を最適化できます。既に不要な単語が複数判明している場合は、文字起こしの効率化に力を発揮するでしょう。事例の項で後述する「説明字幕の自動付加で学生の満足度が向上」など、高精度の文字起こし機能と併用して使用されています。

Amazon Transcribeの課題

どの文字起こしソフトやサービスにも当てはまることかもしれませんが、Amazon Transcribeでも録音したマイクとの距離やBGM、雑音、人数などで正確性が変わってきます。使用してみた感覚としては60%程度の正確性という声もあるのが事実です。語彙カスタマイズの機能を使えば、ある程度は対応していけるかもしれませんが、まだ完璧だとはいえない部分もあります。

Amazon Transcribeのユースケース

AWSの公式サイトでは、下記のようなAmazon Transcribeのユースケースが列挙されています。一つずつみていきましょう。

顧客との会話を分析

音声通話をテキストに変換することにより、Amazon Comprehend などの他のAWSサービスと組み合わせて、通話後分析アプリケーションを構築できます。このことにより、問い合わせ窓口の担当者は、顧客の傾向と音声を分析して業務改善に役立てられるでしょう。

動画などの字幕を効率的に作成

動画や映像などのクリエイターは、自分の動画から文字起こしをする際に、不必要な情報を削除したうえで字幕を作成できるため効率的です。またテキストをAmazon Translateと組み合わせることで、動画を簡単に他の言語へ翻訳できるでしょう。特定の情報をフィルタリングできるので、例えば個人情報に該当する単語のマスキングなど、プライバシーの配慮にも一定の効果を発揮します。

音声データのカタログ化

音声データや動画データの文字起こしを行い、Amazon Elasticsearchと連携することで、音声・動画ライブラリに対してインデックスを作成し、カタログ化を実施できます。従来のように、ただデータを配置しておくよりも効率よくデータ検索を実施できるようになるでしょう。

Amazon Transcribeの導入事例

Amazon Transcribeを導入することで、多くの企業で字幕作成や文字起こしのコストカットに成功しています。ここからは、実際にAmazon Transcribeが企業に導入された事例をみていきます。

動画への自動字幕付加で大幅コストカット

ある自動車レースの運営会社では、自社で配信している動画を195か国29言語で配信しています。従来は、字幕を手動で動画へ追加する作業がコスト負担となっていました。しかし、Amazon Transcribeを使用して字幕作成の自動化を推し進めたところ、大幅なコストカットに成功しています。

説明字幕の自動付加で学生の満足度が向上

教育系動画プラットフォームを提供している企業では、ビジネスパートナーの大学でAmazon Transcribeを活用し、不要な単語もフィルタすることで、ビデオに高精度の説明字幕を付けられるようになりました。検索の強化、字幕作成コストのカット、ノートの取りやすさなど、大学や学生にとって様々なメリットを打ち出すことに成功しています。

Amazon Connectの通話記録をAmazon Transcribeで文字起こし

大手金融企業では、財務担当者が各クライアントに対応したログ記録にかかる時間を削減したいと考えていました。当初、電話機のオプション機能を使用した音声文字起こしアプリケーションを構築しましたが、書き起こしの品質が悪く、修正に時間を要していたことが課題でした。その点Amazon Transcribeは、文字起こし後の修正が非常に少なく、正確な文字起こしプラットフォームとして従業員の間で広く使われています。使用感としては、概ね95%程度の精度という結果が出ています。

Amazon Transcribeと他AWSサービスとの連携事例

前述した通り、Amazon TranscribeはAWSの他サービスとの連携でさらにその真価を発揮します。その具体例を順番にみていきましょう。

Amazon TranscribeとIoTデバイスの連携

Amazon TranscribeとIoTデバイス(Raspberry Piなど)を連携させることで、留守中の自宅への訪問者がメッセージを残せるようになります。また、Amazon Translateと連携させることにより、訪問者が使う言語を自分の得意とする言語へ変換できるでしょう。IoTとの連携事例の中でも比較的内容が平易のため、ある程度の知識があれば自分自身でシステムを構築できます。

Amazon Connectの通話記録をAmazon Transcribeで文字起こし

Amazon ConnectはAWSのクラウド型顧客問合せ窓口システムで、各社の問い合わせ窓口で利用されているサービスです。問い合わせ窓口には、日々多数の問い合わせ電話があり、その対応の改善は、各社が問い合わせ窓口で抱える課題の一つです。そこでAmazon Transcribeを利用することにより、担当者が顧客とやり取りした通話の記録を効率的に残していけます。

Amazon Connectについては、「Amazon Connectで自動音声案内を作る」をご覧ください。Amazon Connectでの自動音声案内の構築事例も記載しております

Amazon Transcribeで文字起こしした文章をAmazon Comprehendで分析

Amazon Comprehendは機械学習を使用して、テキスト内の隠れた心理や関係性を検出する自然言語処理サービスです。ユースケースで少しふれていますが、Amazon Transcribeで文字起こしした文章をAmazon Comprehendで分析すれば、顧客や関係者の潜在的なニーズや関係性を抽出できる可能性があります。

大手の動画作成プラットフォームで、この連携を導入した事例が既に存在します。動画コンテンツを文字に変換してAmazon Comprehendで分析し、動画が与える潜在的な影響についてクリエイターとクライアントに提示することで、市場での優位性確保に役立っています。

複数のAWSサービスとの連携で毎月数百万件の問い合わせを処理

ある世界的な電化製品の製造会社は、顧客からの毎月数百万件の問い合わせを処理しています。従来は問い合わせを手動で処理していて、その膨大な件数への対応が従業員の負荷となっていましたが、今ではAWSのサービスを駆使して対応の自動化に成功しています。

採用したのは、Amazon Transcribe、Amazon Connect、Amazon Lex、Amazon Pollyの4つのサービスです。この4つのサービスを連携させて導入することで、製品情報の検索、顧客情報の記録、担当者につなぐ前の一般的な質問への回答といった単純な作業を自動化できました。これにより従業員の負荷は大幅に下がり、人件費の削減にもつながっています。Amazon Transcribeは自動分析用の通話文字起こしで活用され、継続的なプロセス改善に寄与しています。

Amazon Transcribeの料金

Amazon Transcribeは従量課金制で、文字起こしを行った音声の秒数で課金されます。最初の文字起こしをリクエストした日から12ヵ月間、毎月60分の音声分析は無料です。詳細は下記公式サイトをご覧ください。

Amazon Transcribe の料金(AWS)別ウィンドウで開きます

Amazon Transcribeで効率的な文字の記録を

Amazon Transcribeは、自動音声認識機能を持ち、音声ファイルや動画ファイルのテキストデータ自動生成や、会議などでのリアルタイム文字起こしが可能です。更に他のAWSサービスとの連携で、文章の分析などでも効果を発揮していけます。単純な音声のテキスト記録としてのみならず、顧客の潜在ニーズ分析などにもAmazon Transcribe活用することで自社の経営やビジネスオペレーション改善を行っていきましょう。

Amazon Web Services(AWS)、Microsoft Azureの
導入支援サービスのご相談、お問い合わせをお待ちしております。

ページ上部へ戻る