2016年9月28日 更新

Microsoftとカーネギーメロン大学が質問回答式の人工知能システムを開発

マイクロソフトの研究チームは、カーネギーメロン大学との共同研究で、人工知能のシステムを新しく開発した。機械に画像の抽象的な特徴を解析させ、その画像に関する質問に対して回答する訓練ができるようになった。

60 view お気に入り 0
マイクロソフトの研究チームは、カーネギーメロン大学との共同研究で、人工知能のシステムを新しく開発した。機械に画像の抽象的な特徴を解析させ、その画像に関する質問に対して回答する訓練ができるようになった。

今回開発されたシステムでは、コンピュータビジョン(ロボットの目)とディープラーニング、画像分析と適切な回答を解析するための自然言語処理技術を使う。質問に対する回答の推論は、複数のレイヤー(SANs:stacked attention networks)を通して行われる。
arXiv.org

arXiv.org

まず、画像情報をニューラルネットワークで処理することで、与えられた質問の意味や前提となる状況を理解する(第1レイヤー)。
次に画像の中で回答に必要なものをふくむ領域に視点をフォーカスする。
これは写真に写り込んだ無関係な情報を排除するプロセスでもあり、抽出された情報から「最も適切と思われる」回答を導き出すことができる(第2レイヤー)。
 (1212)

たとえばトップ画像の写真について「自転車のカゴの中にいるのは何ですか?」という質問があったとする。
第1レイヤーでは、自転車やカゴといった"物体"と「カゴの中」という"概念"を認識。そして第2レイヤーでカゴの中身に焦点を当てて、「その中にあるのは何か」を分析する。この場合、質問への回答は「イヌ」となる。

今回紹介した研究は画風アルゴリズムで紹介したConvolution Neural Network(CNN)が用いられている。今後、Neural Networkを用いたディープラーニングの研究は更に進んでいくだろう。
 (1214)

<参考資料>
System trains machines to look at images the way people do – and answer questions about them(Microsoft Blog)
Stacked Attention Networks for Image Question Answering(Arxiv.org)
7 件

関連する記事 こんな記事も人気です♪

Deep learningで画像認識④〜畳み込みニューラルネットワークの構成〜

Deep learningで画像認識④〜畳み込みニューラルネットワークの構成〜

畳み込みニューラルネットワークは、画像データに特化した特徴量の抽出と分類が可能です。今回は、畳み込みニューラルネットワークの構成についての内容です。
木田智士 | 426 view
Deep learningで画像認識③〜ネオコグニトロンとは?〜

Deep learningで画像認識③〜ネオコグニトロンとは?〜

Deep learningは、画像認識において大きな成功を収めています。そこで用いられる多層ネットワークは、畳み込みニューラルネットワーク(convolutional neural network:CNN)と呼ばれており、画像認識に適した独特の構造を持っています。
木田智士 | 933 view
Neural Network with Julia 〜Kaggleの文字認識(DeepLearning)の前処理〜

Neural Network with Julia 〜Kaggleの文字認識(DeepLearning)の前処理〜

今回もNeural NetworkをJuliaで実装する方法についてご紹介します。
Deep learningで画像認識②〜視覚野と畳み込みニューラルネットワーク 〜

Deep learningで画像認識②〜視覚野と畳み込みニューラルネットワーク 〜

前回に引き続き、Deep learningで画像解析についてご紹介します。今回は、畳み込みネットが画像認識に適している理由を解説しようと思います。
木田智士 | 683 view
人工知能エンジニアMeetUp!#3〜医療ビッグデータの活用〜のまとめ

人工知能エンジニアMeetUp!#3〜医療ビッグデータの活用〜のまとめ

先日、「人工知能エンジニアMeetUp」と題して、医療ビッグデータの活用に関する講演がありましたのでその模様をご紹介します。

この記事のキーワード

この記事のキュレーター

エルピクセル編集部 エルピクセル編集部