Kato D, Baba M, Sasaki KS, Ohzawa I.
Effects of generalized pooling on binocular disparity selectivity of neurons in the early visual cortex.
Phil. Trans. R. Soc. B 371: 20150266. (2016)
DOI: 10.1098/rstb.2015.0266
概要:
近年Deep Neural Netが脚光を浴びていますが、その階層構造の基本要素であるプーリングの効果を、ステレオ立体視の観点から、理論と大脳の視覚野細胞における実験の両面から調べました。
この研究では、ステレオ立体視のための脳内情報処理において「両眼の間で比較される情報は何か?」という根源的な問題を再提起しています。
従来は、両眼の画像特徴の「位置ずれ」である両眼視差を正確に検出することが、ステレオ立体視の基本的原理であると考えられてきましたが、この研究では左右の画像を「波」(wavelet)として分解した時の成分が、両眼間で比較されるという考えを提唱しています。つまり、「ステレオ立体視はV1パラメータ空間での眼間マッチングである」という仮説です。
実際に拡張した4次元空間でプーリングを行うと、V1パラメータのすべてについて両眼マッチングのチューニング特性がよりシャープになり、ステレオ立体視の精度を向上させる効果があることを発見しました。
このようなメカニズムにより、ヒトや動物の奥行き知覚(3次元空間での面の傾きを含む)の高い精度や分解能が実現されていることが示唆されます。また、ステレオ立体視システムの精度向上につながる可能性があります。
・論文へのリンク:
http://rstb.royalsocietypublishing.org/content/371/1697/20150266.abstract
・Supplement 数学的導出と追加の図:
http://rstb.royalsocietypublishing.org/content/371/1697/20150266.figures-only
・日本語解説(生命機能研究科サイト):
http://www.fbs.osaka-u.ac.jp/jpn/events/achievement/kato-ohzawa-20160607/
*1. この論文は、”Vision in our three-dimensional world” (3次元世界における視覚) と題された立体視の特集号
http://rstb.royalsocietypublishing.org/content/371/1697
に掲載されています。同じ号には、CiNetの藤田一郎教授の論文も掲載されています。