- 目次 -
現役の数学者が起こした人工知能ベンチャー。いよいよ実用段階に入った人工知能によるサービス開発の最前線を取材
人工知能の現状
スマビ総研でも「人工知能」を用いたアプリやサービスを展開しているベンチャーをいろいろと取り上げてきたが、果たしたどこまで実用化が進んでいるのだろうか。そもそも人工知能型のシステム開発はどのくらいのコストがかかるのか。今回のスマビ総研は特別篇として、日本の人工知能系システム開発の最前線にいるShannonLabの田中社長にお話を伺ってきた。
まずはShannonLabの取り組みを簡単に紹介したい。2011年12月に設立されたShannonLab株式会社は、カリフォルニア大学リバーサイド校で数学科前期博士号を取得し、ファジー測度や経路積分の研究を行っていた、アメリカ数学会に所属する現役の数学者である田中 潤氏によって設立されたベンチャーだ。
同社は人工知能関連のシステム開発の受託を行いつつ、頭に特定の映画を思いながら質問と回答を何度か繰り返して映画名を当てる「脳クラゲ」や、ブラウザ上で人工知能の女の子と会話できる「ブラウザ彼女」、タブレットに組み込んだ人工知能アプリが自動で受付をしてくれる「受付AgentSystem」など、ユニークなものから実用的なものまで、多くの人工知能サービスを開発・展開している。
同社がこれから主力として展開しようとしているサービス「受付AgentSystem」は、タブレット端末で動く、人工音声と人工知能による自動受付システムだ。使い方は簡単で、病院や介護施設などの受付にタブレットを置いて、来訪者がタブレットをのぞき込むと顔を画像認識してスリープモードから自動的に起動。さらに来訪者が話しかけると人工知能が受け答えをしてくれて、内容に応じて担当者の内線番号に電話を繋いでくれるといった事が可能だ。表側のUIにはかわいらしい女性のキャラクターを起用しているが、裏には顔認識、音声認識、日本語構文解析による対話処理など、最先端の人工知能技術が詰まっている。
「ケアAgentSystem」は2015年6月時点では実証実験の段階で、3か所の介護施設でテストを続けている。高齢者にとって人工音声のスピードが少し早すぎて聞き取りづらい、受付終了後の暗闇のなかでも誰かが近づくと自動起動してビックリしてしまうなど、現場ならではの改善要望などを吸収しつつ、2015年10月には正式リリースの予定で開発が進められている。
介護施設などでは人手不足が深刻といわれており、同サービスに使えば受付人員の削減が可能となるだろう。他にも企業の受付などにも転用が考えられるほか、一人暮らしの高齢者向けの対話サービス「ケアAgent System」なども企画・開発を進めている。「ケアAgent System」はいわゆる高齢者見守りサービスだが、普段と違う会話があれば異変を感知して、遠隔で離れて暮らす家族やケアマネージャなどに通知を送ったり、スマートフォンから様子を確認できるといった使い方を想定しているそうだ。
オープンソースを活用することで、300万円~から人工知能システムの開発は可能
人工知能システムの開発
ShannonLabの田中氏によれば、人工知能システムといっても、ゼロからすべてを開発することはなく、意外とリーズナブルなコストで開発が可能だそうだ。その理由は、人工知能の分野でもすでに高性能なオープンソース・ソフトウエアが多数存在し、それらを応用することで、システム自体の開発費を押さえられるという。田中氏によれば、要件しだいだが、だいたい300万円ぐらいから開発は可能とのこと。
ここで、人工知能システムに良く使われるオープンソース・ソフトウェアについて田中氏に伺ったところ、まず中核となるディープラーニングなどの解析処理では、Caffe (カフェ)やPylearn2(パイラーン・ツー)というソフトが良く使われるそうだ。CaffeはC++でGPUの性能を生かしたソフトとして知られており、またPylearn2は欧米のWebシステム構築では人気のPython言語で作られている。
また、日本語の文章解析にはCaboCha(かぼちゃ)という構文解析のソフト、あるいはMeCab(めかぶ)という形態素解析のソフトも良く利用されるという。この2つは日本人が開発したもので、日本語の解析処理では定番なものだ。ShannonLab社では構文解析とDQNとファジーロジックを組み合わせた対話エンジンの開発に取り組んでいる。ただ、日本語の構文解析の精度にはまだまだ課題が多いそうだ。
学習させた確率モデルを保存する部分にはRedis(レディス)というソフトをよく利用するそうで、これはデータを値(value)と標識(Key)のみを保持する、KVSとよばれる簡単なデータベースで、メモリ内で稼働することで大量のデータを超高速に処理することができる。人工知能システムでは大量のデータを扱うため、伝統的なRDB型データベースだけで処理していると遅くなるため、オンメモリでデータ処理を行うことが多い。
あとは一般的なWebシステムでよく使われる構成、いわゆるLAMP(Linux、Apache、MySQL、PHP | Perl| Python)で十分実用的なシステムが組み上げられるそうだ。
このようにオープンソース・ソフトウェアを組み合わせることで、リーズナブルに高性能な人工知能システムが構築できる。例えば同社が最近リリースした「脳クラゲ」というアプリは、頭で思い浮かべた映画名をあてるという心理ゲームだが、脳クラゲ自体が自律的に学習しながらどんどん賢くなる仕掛けだという。そのため、実はリリースしたばかりではそれほど回答率が良くなかったそうだが、そこはご愛嬌で、失敗を学習して、どんどん精度が高くなっていく。まさに人工知能だ。同アプリは2015年5月にリリースされたばかりだが、取材をした2015年6月時点では約1000本の映画を学習しているという。
ちなみに、こうした仕組みを作ろうとすれば、一昔前であればデータベースに大量の映画情報を「人間がインプット」して、またあらかじめ質問文を設計・生成して、ディレクトリー的に候補を絞り込んでいくというアプローチだった。しかし、こうした設計はもはや前時代的なのかもしれない。
人工知能の実用化は始まったばかり。これから30年間は毎年のように画期的な発見・発表が起こるだろう
人工知能のこれから
人工知能システムで有名なものといえば、GoogleのDeepMindやIBMのWatsonなどがある。Watsonはメガバンクなどが導入したというニュースもあるが、そのような巨大プロジェクトではなくても、上記のようにオープンソースなどを活用すれば、中小企業やベンチャーでもコスト的に十分活用・挑戦できるはずだ。
人工知能システムにおいて重要なのは、データと学習機会である。つまりいかに多くのデータを集めて、それをいかにコンピューターで学習させるかが勝負となる。エンジンそのものはオープンソースを使っても、その組み合わせやデータによっては今までにない高性能なエンジンが格安で開発できる。そこで、測度やロジックなどの知識が肝になるわけだ。
もっとも、人工知能に関する各種エンジンにも、まだまだ改善すべき課題は多い。ShannonLabの田中氏によれば、例えば音声認識であれば環境雑音の除去が大きな課題だそうで、音声とノイズの区分については、まだまだ高い精度が求められるという。
また、日本語の構文解析も大きな課題として残っているそうだ。英語などは文法の単純さから構文解析は非常に高い精度で行えるようになっているが、日本語の文法は複雑すぎるため、実用性を考えると、まだまだ精度を高める必要があるという。画期的な日本語構文解析のソフトが開発できれば、Googleなどは真っ先に買いにくるかもしれない。
最後にShannonLabの田中氏より、人工知能の未来についてコメントを頂いたので、それを紹介して終わりとしたい。
「人工知能やAIという分野は古くから研究されてきたテーマですが、ここ数年で一気に火が付きました。先日、Googleが人工知能に絵を描かせたことがニュースになりました。おそらく、この手の話題はこれから毎年のように出てくると思います。それは、この先30年間は続くでしょう。それだけ大きな可能性があり、かつ30年間は進化が尽きない分野であると言えます。人工知能の開発には数学者、物理学者、統計学者、計算機科学者、心理学者、脳科学者、言語学者、メンタリスト、手品師、さらに使ってくれるユーザーとそれこそ多くの人が関わっていくと思います。雇用を奪うなどのネガティブな報道も目立ちますが、より多くの雇用創出に繋がっていくことでしょう。
当社は創業してまだ4年目のベンチャーですが、ようやく実用的な人工知能システムを製品化するところまでこぎ着けました。当社の今後10年での目標としては、人工知能でチューリングテストをクリアすること。そこまでいくと、人間と人工知能が自然と対話できる世界になります」
Shannon Lab株式会社 | |
---|---|
代表者:田中 潤氏 | 設立:2011年12月 |
URL: http://shannon-lab.org/ |
スタッフ数:16名 |
事業内容: ・タブレット端末で稼働する人工知能と自動音声による自動受付システム「受付AgentSystem」の開発・運営 ・人工知能システムの開発受託 |
当記事の内容は 2015/6/30時点のもので、該当のサービス内容が変わっていたり、サービス自体が停止している場合もございますので、あらかじめご了承ください。