自動車の自動運転技術や、自律的に動作するロボット、さらには人間の名人を打ち負かした囲碁ソフトAlpha Goの出現など、現在は第三次AIブームといわれる状況にあります。
これらブームを牽引している中心技術がディープラーニング、日本語で深層学習(しんそうがくしゅう)と呼ばれているものです。この深層学習とは一体どのようなものでしょうか。
脳の仕組みを機械上でシミュレーション
深層学習の仕組みについて説明する前に、その基盤技術であるニューラルネットワークという技術について説明しておく必要があります。
人間の脳には、脳全体では千数百億個以上もあるニューロンという電気刺激を伝える神経細胞で構成されています。
これらは、何層にも重なった複雑なネットワークを形成し、電気信号で情報を伝えることにより、経験から規則性を見つけ出すという学びや、未知のものに経験則を当てはめる判断などを行っています。
ニュートラルネットワークは、このネットワークの構造を人工的に再現することで、人工知能が学びや判断を行えるようにしたものです。
この考え方の起源は古く、1940年代にはその原型となるものは提唱されていましたが、盛んに研究されるようになったのは1950年代に入ってからでした。
しかし、できることは簡単な統計データの分類程度で、広く注目を集めることはなく、研究は続けられていましたが、2000年代まで人工知能技術の中心となることはありませんでした。
画像認識で圧倒的な実力を示す「深層学習」とは
そのニュートラルネットワークがにわかに注目を浴びることになったのは、2012年のILSVRCでのことでした。ILSVRCとは世界的な画像認識アルゴリズムに関するコンペで、人工知能が画像を分類する早さを競っています。その2012年大会において、トロント大学のSuperVisionチームが2位以下を10%以上引き離して圧倒的な成果を上げました。同チームが用いていたのが、深層学習によるアルゴリズムだったのです。
深層学習は、ニューラルネットワークの応用技術です。初歩的なニューラルネットワークでは、多数の問題とその答えを組み合わせたサンプルを人間が提示することによって法則性を学習させる「教師あり学習」と呼ばれる方法でした。対して、深層学習は人間が答えを教えず、コンピューターが自動的に答えを導き出す「教師なし学習」と呼ばれる手法の1つです。
「教師なし学習」を実現するためには、CNN(Convolution Neural Network)やRNN(Recurrent Neural Network)と呼ばれるさまざまなアルゴリズムがありますが、共通しているのは多層のニューラルネットワークを作ることにより自律的に学習できるようなアルゴリズムを構築している点です。コンピューターは、このアルゴリズムによって蓄積された情報を基にして、外部から与えられた膨大な情報を自ら分類していきます。
このアルゴリズムは大変強力で、前述のILSVRCのような画像の中にある特定の特徴を拾い出す特徴表現学習といった分野では大きく成果を上げています。また、このアルゴリズムは画像のみならず、音声合成やゲームのアルゴリズム、さらにはロボットの自律的な動作などといった分野にも応用されているのです。
深層学習が人工知能の常識を変えた
この深層学習の考え方は、従来の人工知能の常識を180度転換させてしまいました。1950年代、1980年代と過去に二度の人工知能ブームがありましたが、それらの中心技術はいずれも「エキスパートシステム」と呼ばれる、人間がある特定の分野に関する知識や情報処理の仕方をコンピューターに教え込むというものでした。
それに対して機械学習、特に深層学習では簡単な枠組みは人間が用意するものの、学習そのものはコンピューターに任せるという方法です。その深層学習が応用されている例を紹介します。
有名なものとしては、IBMのワトソンという人工知能があります。ワトソンは、自然言語処理ができるAIシステムです。2011年に「Jeopardy!」というアメリカのクイズ番組に出演し、人間の回答者を破って見事優勝し、賞金100万ドルを手にしています。
冒頭に紹介したAlpha Goは、深層学習において2017年に発表された第4世代のアルゴリズムに属します。この世代は、すでに人間が勝てないレベルに到達したといわれています。このほかにも医療やマーケティング、科学技術などさまざまな分野で深層学習は大きな成果を上げています。
深層学習は誰にでも利用できるようになった
深層学習の優れた点はそれだけではありません。かつての人工知能ブームとの大きな違いは、われわれがその成果を簡単に利用できる点にあります。
たとえば、IBM社のワトソンはAPI(アプリケーション・プログラム・インターフェースの略。プログラムからソフトウェアを操作するためのインターフェイスのこと)が一般に公開されており、料金を払えばだれでも利用が可能で、多くの企業で採用されています。
私たちが最もよく目にする事例がチャットボットです。チャットボットとは、人間が入力するテキストや音声に対し、自動的に回答を行うことで、これまでコールセンターなどで人間が対応していた「お問い合わせ」や「注文対応」などの作業を代行するためのプログラムです。今後はさらにこういった機能が高度化し、コールセンターそのものや、医療での自動診察機能などさまざまな分野で利用可能であるといわれています。
また、深層学習に利用できるライブラリ(補助的なプログラムを集めたもの)として、TensorflowやChainerといったものがあり、誰でも無料でダウンロードして利用できるようになっています。しかもそれは普通のPCで十分利用可能なものであり、高性能や大規模な機材がなくとも深層学習を利用したシステムを開発できるのです。
このようにあっという間に世の中に登場して圧倒的に成果を上げた深層学習ですが、前述のようなAPIやライブラリなどを利用できることから、誰でも簡単に深層学習を用いたアプリケーションやサービスを作ることができます。そして、それを応用したサービスや製品が次々と生み出されています。
現在は主にSNSやインターネット通販、あるいはコールセンター業務などといった従来型の企業や産業向けのサービスの効率化に利用されていますが、遠くない将来、これらの技術を応用して現在の私たちには想像もつかないような新しいサービスやビジネスが生み出されるかもしれません。
※掲載している情報は、記事執筆時点(2018年3月29日)のものです。
連載記事一覧
- 第1回 第三次人工知能ブームを起こした3つの波 2018.02.28 (Wed)
- 第2回 間もなくビッグデータが生活・社会を変える時代へ 2018.03.30 (Fri)
- 第3回 人工知能の常識を変えたディープラーニングとは何か 2018.04.16 (Mon)