2022/09/27

AI(人工知能)の世界最高峰の国際会議「NeurIPS 2022」で論文採択—Vision Transformerに代わる画像認識モデルー

AnyTech株式会社(所在地:東京都文京区、代表取締役:津久浦 亮)の立浪 祐貴(立教大学大学院人工知能科学研究科博士後期課程在籍)と立教大学大学院人工知能科学研究科(所在地:東京都豊島区、研究科委員長:内山 泰伸)の瀧 雅人 准教授の研究成果が、機械学習分野の国際会議の一つである「NeurIPS 2022」(Neural Infomation Proccessing Systems)に採択されたことをお知らせいたします。

 「NeurIPS」は毎年開催される機械学習分野の国際会議で、機械学習・深層学習・強化学習・学習理論等の分野において、世界最高峰と目される会議です。今年は10,411件の投稿の中から25.6%の論文が採択されています。採択された論文は、2022年11月28日から12月9日まで米国ルイジアナ州ニューオリンズで開催される「NeurIPS 2022」にて発表を行います。

 本研究では、先端的なコンピュータビジョンにおいて用いられるTransformerのアテンション機構が、古典的なリカレントニューラルネットで代用可能であることが明らかにされました。さらにこの発見に基づき、畳み込みもアテンション機構も用いない新たな画像認識モデル、Sequencerを提案しました。Sequencerは、純国産の画像認識モデルとしては初めてPytorch Image Modelsに採用されました。

画像認識のための二つのアプローチの模式図。上図:アテンション機構を使って、画像のパッチを大域的に相互作用させる。下図:リカレントニューラルネットを使って、逐次的に画像のパッチの情報を集約する。

詳しい内容はこちらの立教大学からのリリースを参照ください。

【関連リンク】