NTTグループのAI技術「corevo」

日本電信電話株式会社代表取締役副社長 研究企画部門長篠原 弘道は、基調講演において社会にはイノベーションが不可欠であり、NTTは異業種とのコラボレーションに力を入れていることについて語った。

NTTはAIやIoT、ビッグデータ、ネットワーク、セキュリティなど、この先さまざまな社会課題を解決していくために必要になるであろう技術を開発し、「B2B2X」モデルなど新たなビジネスモデルと共に、社会の変革をサポートすることに挑戦している。

篠原が基調講演の中で紹介したのは、NTTグループ全体としてのAIに関する取組みだ。

「AIには2つの種類があります。人の知性・思考そのものを模倣するAIと、人の能力を補強して引き出すためのAIです。私たちが開発を進めているのは、後者の人と共創するAI。ただ、これまでAIは専門用語が分かれており、わかりにくい状態となっていました。そこでNTTグループのAI技術を「corevo」と呼ぶことに決定しました。corevoの名前の由来は、Co-revolutionです。AIの技術を使うことでさまざまなプレイヤーと、新しいことを生み出していくことに挑戦していきます」

_P0A9876_fin

NTTグループが研究開発しているAIは、4つの領域に分かれている。人の発する情報を読み解き、意図・感情を理解する「Agent-AI」。意識されない人の心と身体を読み解き、深層心理・知性・本能を理解する「Heart-Touching-AI」。物、人、環境を読み解き、瞬時に予測・制御する「AmbientAI」。複数のAIが有機的につながり成長し、社会システム全体を最適化するAIおよびネットワークにAI技術を適用する「Network-AI」の4つだ。

人の発する情報を読み解く「Agent-AI」

篠原の基調講演の中では「Agent-AI」と「AmbientAI」を中心に語られた。

「Agent-AI」が取組んでいるのは、聞いて理解する、見て理解する、理解して話すの3つだ。たとえば、100dBを超える環境でも人間の声を聞き取るという雑音の中での聞き取り技術や、大勢の人間が同時にしゃべる中で一人ひとりの声を識別する「インテリジェントマイク技術」がある。

インテリジェントマイク技術はブースも出展しており、複数人での会話を話者ごとに分離し、独立して集音する技術を体験できるようになっていた。想定しているよりもAIが複数人での会話の聞き取りが可能なことに驚いている来場者も多かったようだ。

_P0A10359_fin

聞き取ることができたら、次は認識する技術が必要になる。NTTが開発している技術では、多言語を認識することや日本の方言を認識することも可能だ。認識の次は、理解する技術が必要だ。発話理解技術では、さまざまなことを話す人間に対応していくために大規模なデータを活用して機械学習し、発話を理解していかなければならない。

発話を認識する際には、感情を識別し理解することもAIには求められる。人が何をしゃべっているかではなく、どんな気持ちでしゃべっているのかを理解すること。話している人の発音が同じでもイントネーションによって意味は異なってくるため、AIはこうした情報も認識、理解しなければならない。

_P0A10961_fin

SXSWでの石黒教授のイシグロイドに対話技術を載せて行ったデモンストレーションのように、AIに雑談をしてもらうための技術も開発が進んでいる。人同士のコミュニケーションは何か目的があって行われることばかりではない。雑談のようなコミュニケーションも、AIは対応していく必要がある。

「Agent-AI」に関する開発技術を活用し、NTTコミュニケーションズが実際に商用サービスを開始した自然な日本語の対話ができるAI「Communication Engine “COTOHA”®」がある。「COTOHA」はNTTが40年以上に亘り蓄積・精錬した100万語を超える日本語データベースや高精度の処理技術を活用している。

「COTOHA」は自然な日本語を高い精度で理解し、相手との対話を積み重ねる。人からの質問が漠然としているときは具体的な質問をすることで意図を確認したり、どうしてもわからなくなったときは人間のオペレーターにエスカレーションするなど柔軟な対応をする。

「COTOHA」を利用することでコンタクトセンターにおける顧客からの問い合わせ対応や企業内のヘルプデスク業務の効率化が期待され、将来的には販売活動を担うことなどもできると考えられている。

こうしたコンタクトセンターや窓口を支援する内容に関しては、情報の検索や応対内容の記録といったオペレーターや店員の活動を支援する「corevo for smart service desks」の展示も行われ、将来、顧客との接点がどのように変化していきそうなのかを来場者に伝えていた。

聞いて理解する、話す技術の他に、見る技術もAIには必要だ。人間は目で見ている情報と記憶している情報のマッチングが起きることで物事を認識する。これをAIで実現するために、NTTでは物体検索技術である「アングルフリー物体検索技術」の開発を行っている。あらかじめ登録されている画像の中から合うものを見つける同技術では、3次元物体を登録画像数が少なくても高精度に認識・検索し、関連情報を提示する。

環境を読み解き、予測・制御する「AmbientAI」

「Agent-AI」に加えて、「AmbientAI」についての紹介も行われた。篠原は、AI開発において1番大切なことは何かについて基調講演内でこう語った。

「AIにおいて機械学習や深層学習、統計処理などはツールです。AI開発においては、分析モデルの最適化が最も重要です。分析モデルによって判定・予測性能などは変わってきます。分析モデルの取組みについては、観測画像の圧縮と同時に変化領域を高速に検出する技術の開発や、すばる望遠鏡で撮影された大量の数十兆ピクセル級の宇宙撮像データから超新星を絞り込む技術のように少ないデータから高性能な学習をする技術の開発も行っています」

この他、NTTデータが日立造船株式会社と取組んでいる事例では,機械稼働音の分析に雑音に強いインテリジェントマイク技術と正常稼働音異常音を検知する技術を用いて、機械の不調や故障予兆を検知する技術の開発を実施。ドライブレコーダーから得られるデータを活用して危険運転を予測することで交通事故を減らしていく技術の開発も行われているなど、さまざまな開発が進んでいる。

ドコモの研究開発事例では、運行データや人口データなどさまざまな情報を分析してタクシーの需要をリアルタイムに分析する「リアルタイム移動需要予測」の実証実験も基調講演内では発表された。

AIがもたらす未来社会

AI同士の連携が必要になる「Network-AI」や、運動における脳のメカニズムを解析しスポーツ現場における効果的なトレーニングを生み出そうとする「Heart-Touching-AI」に関する取組みは本講演内では具体的には共有されなかったものの、その可能性の一端が共有された。

_P0A10284

これらの個別技術を単体として展示するだけではなく、NTT R&Dフォーラム2017ではAI技術を用いて音声対話やナビゲーションが行われる「corevo for Drivers」やロボットデバイス anone R-env を置いたリビングをイメージした「corevo for living rooms」など、AIの利用シーンをイメージした展示やコンセプトデモも行われていた。

「corevo」のようにコンセプトを統一することに加えて、利用シーンとセットで技術を紹介することはAIへの理解を促す上で重要だ。

AIがもたらす未来社会をより豊かなものにしていくべく、NTTドコモをはじめとしたNTTグループは「corevo」の開発および商用導入に注力していく。

写真=植村忠透 Photos : Tadayuki Uemura
文=モリジュンヤ Text : Junya Mori