「自動翻訳」は日本と世界の架け橋となる新たなコミュニケーションツールになり得るか。国立研究開発法人情報通信研究機構(NICT)フェローの隅田英一郎氏に話を聞きました。
<目次>
「人の脳を模した自動翻訳」で高い翻訳精度に
自動翻訳で世界に向けて「真の開国」が実現
翻訳データの寄付でみんなが得する「翻訳バンク」
「逆翻訳」で簡単チェック
日本から英語教育がなくなる日が来る?
「人の脳を模した自動翻訳」で高い翻訳精度に
日本と世界をつなぐコミュニケーションツールに、コンピュータによってさまざまな言語を翻訳する「自動翻訳」があります。
自動翻訳はあまり翻訳精度の高くない1980年代から販売されてきたので、自動翻訳の有用性を疑問視する人も多いかもしれません。
しかし、国立研究開発法人情報通信研究機構(NICT)フェローであり一般社団法人アジア太平洋機械翻訳協会(AAMT)会長の隅田英一郎氏によると、2016年ごろにニューラル翻訳(NMT)と呼ばれる手法が採用されて以降、自動翻訳の精度が急速に上がっているとのことです。
「NMTとは、人の脳を模したニューラルネットを使って大量の翻訳データを学習し、翻訳精度を高めていく技術で、それ以前の手法に比べて非常に高精度になっています。日英の自動翻訳はTOEICで900点台の英作文能力を示しており、もはや多数の日本人の英語力を凌駕する水準です」(隅田氏)
1文1文の翻訳ではなく、その1文の前の文を踏まえて訳文を決定する「文脈処理」の性能も向上しているといいます。
「文脈処理とは、複数の文章から関係性やつながりを推察し、指示語や省略された単語を補完する技術です。NMTの登場によって精度・有用性が向上しています」(隅田氏)
自動翻訳で世界に向けて「真の開国」が実現
翻訳精度が向上したこともあり、自動翻訳はビジネスでの活用が活発化しています。特に、コロナ禍をきっかけとしたオンライン会議の普及は、自動翻訳にとって好機であると隅田氏は言います。
「コロナ禍により、企業の内外でオンライン会議が一般的になりました。国際会議もリアルからオンラインへと変わってきています。従来の国際会議では海外出張が必須でしたが、今ではインターネット環境さえあれば自国から会議に参加できます。オンライン会議が浸透してきた今、まさに自動翻訳普及の好機だと捉えています。なぜなら、オンライン会議では音声が無意識のうちにデータ化され、そこに自動翻訳が抵抗なく導入できるからです」(隅田氏)
従来のface-to-faceの会議では、外国人とコミュニケーションを取るには、高いコストを払って通訳を雇うか、ぎこちないながらも自分で英語をしゃべるかしか選択肢がありませんでした。しかし、オンライン会議では音声がデータ化されているので、自動翻訳を活用するのが自然になり、通訳を雇う必要がなくなります。
自動翻訳の活用はオンライン会議にとどまりません。自動翻訳は「海外との情報のやり取りに制限がある状況」を打破できます。
「例えば、証券取引所での企業情報開示は10%ほどしか英語に翻訳されておらず情報の発信は限定的です。逆に、外電ニュースについても5%ほどしか日本語に翻訳されておらず情報の受信も限定的です。情報の流通が自由にスムーズにできているとは言えない状況であり、言い換えると、日本はいまだ情報について実質的に“鎖国中”なのです」(隅田氏)
なぜこのような事態に陥っているかというと、従来の自動翻訳は翻訳精度が低く導入が進まなかった結果、人手の翻訳に頼ることになり、そうすると費用が高額になるため絞り込みが必要になっているのです。現在では、高精度に翻訳できる自動翻訳システムが安く簡単に使えるようになっているため、これらを活用すれば状況が一変します。
「翻訳されていない文章を自動翻訳すれば世界と情報のやり取りが活発になり、経済・社会活動のグローバル化が促進されます」(隅田氏)
自動翻訳は、在留外国人への言語サポートという課題に対しても有効な解決策になります。現在、多くの外国人が日本で暮らしていますが、彼らの日常を支える言語サポートは十分でないのが実情です。
「先進国における在留外国人は人口比の平均10%ほどですが、日本ではまだ3%ほどです。言い換えると、日本でも今後3倍ぐらいまで外国人数が伸びる余地があります。在留外国人の増加も念頭におき、言語対応の問題を早急に解決すべきなのです」(隅田氏)
翻訳データの寄付でみんなが得する「翻訳バンク」
今後さまざまなシーンへの導入が期待される自動翻訳の多分野化・高精度化を支える取り組みとしてNICTでは「翻訳バンク」という活動を実施しています。
「自動翻訳システムを作る際には、翻訳元となるデータと翻訳されたデータの対からなら翻訳データを用意し、ディープラーニング(深層学習)を使って学習させます。これらの翻訳データについて、質が高ければ高いほど、量が多ければ多いほど、高精度な自動翻訳システムが作成できるのです」(隅田氏)
一般的には、Web上にある翻訳データを利用しますが、これらには質の低いデータも混じっているため、誤訳が増えてしまいます。翻訳バンクでは、いろいろな企業と提携し、各社が過去に翻訳した原文と翻訳文からなる質の高い翻訳データを寄付してもらうことによって、精度向上を図っています。
「翻訳データを寄付していただくと、まず汎用的な自動翻訳の守備範囲を広げ、かつ翻訳精度を上げるのに使います。さらに、別に専用の高精度の自動翻訳システムを構築できます。つまり、質の高い翻訳データを提供する企業が増えれば増えるほど、おのずと翻訳精度が向上し、提供企業はその精度が上がったシステムを使えるようになります。このように、提供企業と翻訳バンクとの間でWin-Winの関係を築いているのです。翻訳バンクは日英だけでなくさまざまな言語に対応しています」(隅田氏)
翻訳バンクは、医薬品の分野でも良い実績を残していると隅田氏は語ります。
「日本で医薬品を販売するには、治験を実施しなくてはなりません。そのための文書を日本語で提出するので自動翻訳は必須です。イギリスの製薬会社・アストラゼネカでは、翻訳バンクに同社の翻訳データを寄付し、医薬品専用の高精度自動翻訳システムを構築。通常1カ月かかる治験関連文書の翻訳期間を2週間に短縮することに成功しました」(隅田氏)
続けて隅田氏は「翻訳バンクに翻訳データを寄付する製薬会社が増えますと、おのずと翻訳精度も向上するため、業界全体で、翻訳がより効率的になります」と述べています。
「逆翻訳」で簡単チェック
自動翻訳の利用について禁止事項があります。それは自動翻訳が常に正しいと信じることです。
「自動翻訳は誤訳します。現在の精度は9割程度なので、翻訳結果を鵜呑みにせず、誤訳があるかもしれないと考え、チェックを行うのが必須です。中学・高校レベルの英語スキルがある人が翻訳結果を一度チェックし、修正することで良い翻訳が得られます」(隅田氏)
「翻訳結果をいちいちチェックするのは面倒だ」と考える方も中にはいるでしょう。そんな悩みに応えるソリューションとして「逆翻訳」があります。「逆翻訳」はNICTの多言語音声翻訳スマートフォンアプリ「ボイストラ」などいろいろな自動翻訳ソフトウェアで提供されています。
「音声で入力した原文Aを即時に翻訳し、同時に翻訳文Bを再度日本語に翻訳し直した文Cを表示します。するとスマートフォン上にはAとCという2つの日本語文が並びます。この2つを比較して、ほぼ同じ意味なら翻訳文は問題ないと考えられます。もし内容が違っていたら、日本語を言い換えればよいのです。日本語なら難しいことではないでしょうし、翻訳も瞬時に行われるので、やり直しのストレスもほぼありません」(隅田氏)
日本から英語教育がなくなる日が来る?
自動翻訳の技術革新が加速度的に進んでいます。同時通訳システムの実現を目的とした国家プロジェクトも動き出していると隅田氏は語ります。
「2020年3月に総務大臣より、同時通訳システムを作る国家プロジェクト『グローバルコミュニケーション計画2025』が発表されました。2025年までに端末やアプリによる同時通訳システムを社会実装する計画です(第1弾)。その後2030年を目途にシビアなネゴーシェーションにも使えるところまでレベルアップする計画です(第2弾)」(隅田氏)
このように国を挙げて同時通訳システムの社会実装を目指しているとのことですが、その背後で3Dプリンタの普及や電池の長寿命化、さらには5Gをはじめとした移動通信システムなど周辺技術の進化がサポートしていると隅田氏は言います。
「周辺技術に急激な進化により、近未来的な翻訳デバイスも作れるようになりました。例えば、メガネ型やブレスレット型といったウェアラブルデバイス、シースルーパネル型など、その形状は多岐にわたります。近い将来、当たり前の技術として自動翻訳エンジンが、さまざまなデバイスに搭載されるでしょう。世界進出を検討しているならば、自動翻訳に早めに慣れておくにこしたことありません」(隅田氏)
同時通訳システムの開発が進むことで、まるでマンガやアニメの世界で登場するような翻訳デバイスが、日常で使われる未来もそう遠くはないでしょう。これは極論ですが、上述のような近未来的な翻訳デバイスが一般化することで、もしかすると、日本から英語教育がなくなる日が訪れるかもしれません。なぜなら、日本人が英語を使いこなせるようになるまでには、膨大な時間とコストがかかるためです。
「アメリカの国務省が発表したデータによると、アメリカ人が日本語を使いこなせるまでに2200時間以上の勉強時間が必要だと言われております。逆に日本人が英語を覚えるときにも同様の勉強時間が必要になります。しかし、中学・高校の勉強時間を合わせても約1000時間です。半分にも満たないので、日本人の大半が英語を使いこなせないのは当然です。残りの1200時間を補うために、語学学校に通うとすると相当なコストと時間がかかります。自動翻訳を使うと決めれば、1200時間の投資は不要になります」(隅田氏)
<インタビュイープロフィール>
隅田英一郎(すみた えいいちろう)
日本アイ・ビー・エム、ATRを経て国立研究開発法人情報通信研究機構(https://astrec.nict.go.jp/)へ。2016年から同フェロー。2017年から総務省と連携し自動翻訳の高精度化のために「翻訳バンク(https://h-bank.nict.go.jp/)」を運営。音声翻訳の国家プロジェクト(https://www.soumu.go.jp/menu_news/s-news/01tsushin03_02000298.html)を推進。2018年から一般社団法人アジア太平洋機械翻訳協会(https://aamt.info/)会長を兼務。
連載記事一覧
- 第2回 ばらまき型メールによるウイルス感染に注意 2016.02.01 (Mon)
- 第4回 どこが変わったの? いまどきの無線LAN事情(前編) 2016.02.19 (Fri)
- 第5回 どこが変わったの? いまどきの無線LAN事情(後編) 2016.02.29 (Mon)
- 第8回 FAX複合機に注意!内部データが丸見えに!? 2016.04.08 (Fri)
- 第10回 デジタルサイネージで“おもてなし”(前編) 2016.05.23 (Mon)
- 第11回 デジタルサイネージで“おもてなし”(後編) 2016.05.30 (Mon)
- 第12回 東大職員も騙された!心理の隙を突いたサイバー攻撃 2016.06.03 (Fri)
- 第13回 起きる前に芽を摘む!内部不正とヒューマンエラー 2016.06.17 (Fri)
- 第14回 せっかく育成したセキュリティ担当が、転職!? 2016.07.15 (Fri)
- 第15回 すぐにしないと命取り!?事例で見るセキュリティ対策 2016.07.15 (Fri)
- 第20回 社内に溜まった紙資料の問題を「電子化」で解決! 2016.10.21 (Fri)
- 第22回 面倒なマニュアル作成もクラウドで解決!? 2016.10.28 (Fri)
- 第23回 クラウド化のメリットはコスト削減だけではない! 2016.11.29 (Tue)
- 第24回 夜間の回線トラブルがもたらし得る大きな損害 2016.12.02 (Fri)
- 第25回 データとIT資産の管理はアウトソーシングすべし 2017.03.06 (Mon)
- 第26回 会話するロボットを自社スタッフとして活用する方法 2017.03.28 (Tue)
- 第27回 システム管理者も“クラウドに置く”時代!? 2017.04.28 (Fri)
- 第28回 社内から「繋がらない」の声をなくす、VPNを検討してみる 2017.05.12 (Fri)
- 第29回 ランサムウェアの脅威に備える最適な方法とは? 2017.05.25 (Thu)
- 第30回 社内にネットワーク管理者は不要の時代!? 2017.05.26 (Fri)
- 第31回 VPNってなに?今さら聞けないVPNはじめの一歩 2018.02.22 (Thu)
- 第32回 拠点間同士を結ぶネットワーク、今はVPNがトレンド 2018.02.23 (Fri)
- 第33回 ネットワーク監視も24時間サービスが最適な理由 2018.02.28 (Wed)
- 第34回 セキュリティ人材の争奪戦勃発!企業は何をすべき? 2018.03.22 (Thu)
- 第35回 今からでもまだ間に合う! ICT管理者探しはお早めに! 2018.03.28 (Wed)
- 第36回 押し寄せるデータの波は、NASでは乗りこなせない! 2018.03.30 (Fri)
- 第37回 専門知識は必要なし!今どきのホームページ制作事情 2019.01.10 (Thu)
- 第39回 初診の「オンライン診療」解禁、対応病院は1万件に 2020.06.12 (Fri)
- 第40回 コロナでも急成長、「サブスク」で継続利益を確保する 2020.08.05 (Wed)
- 第41回 知らないと損!新たな顧客体験「OMO」で売上UP 2020.12.23 (Wed)
- 第42回 こんなAI/IoTの導入は失敗する!重要なのは顧客視点 2020.12.23 (Wed)
- 第43回 売れないスルメにも意味がある!チャンス発見学とは 2020.12.23 (Wed)
- 第44回 離島や薬局で導入・実証進む、オンライン診療のいま 2021.02.19 (Fri)
- 第45回 ビジネスチャット。安全・手軽なコミュニケーション 2021.04.30 (Fri)
- 第46回 並ばず買い物OK、コロナ禍で需要伸びる無人店舗 2021.06.03 (Thu)
- 第47回 地方創生のカギ、どこでも受講できる「ネット大学」 2021.06.03 (Thu)
- 第48回 薬局DXのいま、ロボット活用やドローン配送なども 2021.06.15 (Tue)
- 第49回 建設業の人件費を約4割削減も、進むi-Construction 2021.06.15 (Tue)
- 第50回 「言葉の壁はなくなる?」NICT隅田氏に聞く 2021.07.01 (Thu)
- 第51回 全労働人口の8割を占める、デスクレスワーカーのDX改革 2022.11.15 (Tue)
- 第52回 高齢者のデジタルデバイド問題に立ち向かう自治体・企業のいま 2022.11.15 (Tue)
- 第53回 AIやビッグデータ活用も、進化し続けるデジタルサイネージ2022.12.21 (Wed)
- 第54回 コスト削減やデータ活用に期待、電子レシートの可能性2022.12.21 (Wed)
- 第55回 「お絵描きAI」のビジネス活用の可能性と課題とは2022.12.21 (Wed)
- 第56回 AI採点や新スポーツも、スポーツテックとは何か 2022.12.21 (Wed)
- 第59回 「ベビーテック」は少子化対策の切り札になるか?2023.03.06 (Mon)
- 第60回 研究現場もDX!ラボラトリーオートメーションとは2023.04.28 (Fri)
- 第61回 人生100年時代のファイナンシャル・インクルージョン2023.05.16 (Tue)
- 第62回 その通信機器、実は違法かも!?「技適マーク」の重要性2024.01.17 (Wed)
- 第57回 Z世代の心をつかむ「メタバース採用」とは2023.01.30 (Mon)
- 第58回 医療・健康ビッグデータ「PHR」はビジネスチャンスとなり得るか2023.01.30 (Mon)