眼视光学杂志 1999年第4期第1卷 文献综述
作者:黄欣 胡聪 金贵昌
单位:上海医科大学附属眼耳鼻喉医院眼(黄欣);青岛医学院附属医院眼科(胡聪);中国科学院北京生物物理研究所(金贵昌)
1838年Wheatstone发明了立体镜使人看到了深度景观并发现了双眼视差,从而揭开了双眼的奥秘,自此开拓了一个崭新的空间视觉研究领域。一个半多世纪以来,立体视觉研究一直是一个十分活跃的领域,60年代双眼驱动细胞的发现及计算机产生的随机点立体图对为立体视觉研究带来了一场革命[1],近40年来,立体视觉研究在心理物理和神经生理学方面均取得了令人瞩目的进展,本文将就近年来立体视觉机制的研究进展作一综述。
1 立体视觉的神经生理学研究
1959年以前在立体视觉产生机制中占主导地位的一直是心理作用[1]。1959年,两篇几乎同时发表的文章掀起了一场有关双眼视觉机制的革命。首先是Hubel和Wiesel有关猫纹状皮层存在双眼驱动细胞(Binocularly-activated cortical cell)的报道[2],第一次明确了来自双眼的视觉信息在很早的阶段就发生汇合[1]。第二个报道是Julesz提出的随机点立体图(Random-dot stereograms,RDS)[3],这种图排除了立体视觉的单眼线索,认为视差是产生立体视的充分条件,因此深度感知的神经机制一定发生在对形状感知之前[1]。
1965年,Bishop和Barlow及他们的学生Pettigrew和Blake-more分别用单细胞记录的方法发现了视差敏感性双眼神经元(Disparity-selective binocular neuron)。他们之后所进行的一系列工作建立了双眼深度分辨的神经基础[1]。1970年,Hubel和Weisel报道了猴子18区的视差敏感细胞[4],认为18区至少有两个独立的功能即连接中线两侧的视野与立体视觉机制有关。1973年他们在猫17区只找到很少的视差敏感细胞并由此认为猫、猴17区并不存在双眼深度感知的主要机制[4]。1979年,Clarke等在新出生的羊的次级视皮层记录到双眼驱动细胞。Pettigrew在猫头鹰顶脑Visual Wulst核最上面的表层上找到对双眼视差敏感的细胞。可见对双眼视信息于初级视皮层(17区)还是于次级视皮层(18区)处理仍有争议,在不同的动物也不相同。由于双眼水平视差和垂直视差的存在,视差敏感细胞也就分别对水平视差或垂直视差敏感。有些细胞对两者都敏感。1971年Redieck提出只有对水平视差敏感的细胞才在立体感知中真正有效。1982年Mayhew和Longuet-Htggins证明了垂直视差与水平视差结合可估计出物体与注视点的相对深度,单独由垂直视差可判断出物体的距离和方向,垂直视差保证了水平视差和凝视点的相对关系。由此从神经生理上揭示了皮层细胞可以识别水平视差和垂直视差以及它们在识别深度上的作用,但神经系统对这些信息进一步加工的机制尚不清楚。
1977~1984年G.Poggio等人在清醒猴子的皮层上记录到体视细胞[5~7]。他们证明了立体视觉的加工开始于纹状皮层,并辨别出深度选择性神经元上存在两大类细胞,每一类又包括具有相反反应行为的两个功能型。一类是调制(调谐)神经元,对注视点附近很窄区域的视差有反应,包括调制兴奋性神经元和调制抑制性神经元;另一类为交互神经元,对于交叉视差和非交叉视差有交互兴奋和抑制反应,包括“近”细胞和“远”细胞,前者对交叉视差敏感而后者对非交叉视差敏感,在零视差时有很陡峭的反应,从最大的兴奋突然变为最大的抑制。他们认为调制神经元对应于精细立体视而交互神经元对应于粗略立体视[4]。另有一种神经元被称为扁平调制神经元,它们对所有的视差都具有兴奋性[8]。1985年Poggio等又在皮层17区和18区又发现了对只包含视差线索的动态随机点立体图起反应的神经元。以上发现说明了17区细胞是整体立体视的神经基础[6]。
1987年Pettigrew等人研究了猫视网膜神经节细胞(X-、Y-、W-)经外侧膝状体至皮层的投射通路在处理双眼视差时的不同作用[9]。X、Y、W均投射至17区,Y型至18区,W型至19区。认为Y系统(至17、18区)处理注视平面以内的会聚视差(Convergent disparities)即交叉视差,而X系统(至17区)处理注视平面的双眼信息即零视差,W系统(至19区)处理注视平面以远的发散视差(Divergent disparities)即非交叉视差。他的研究支持了1977年Levick的假说。
1988年Livingstone和Hubel指出,猴子的初级视觉系统包括几个分离且相互独立的亚系统,以此来分析同一视网膜像的不同方面。根据视皮层1区、2区和更高级的区域的细胞对颜色、立体觉和方向的选择性,将它们分为三种亚型。小细胞系统(Parvocellular stream)对形状和颜色有选择性敏感,而大细胞系统(Magnocellar stream)对深度和运动成分敏感。在低一级水平,视网膜和外侧膝状体的细胞也以它们的颜色选择性、对比敏感性、时间特性和空间分辨性而被分为二个亚系统。这些细胞的选择性决定了不同的视觉功能(如色觉、深度觉、运动、形状感知等)应存在不同的对应关系[10]。1990年Schiller等研究发现初级视觉系统中的颜色成分通道(Colour-opponent channel)是颜色、轮廓、精细模式和精细立体觉的关键,而宽带通道(Broad-band channel)是快速闪光和运动感知的基础,其它通道可能与亮度、粗略形状感知、低空间频率立体觉和对比敏感性有关,并指出小细胞系统与精细立体视觉的加工有关,而大细胞系统与粗略立体视觉的加工有关[11]。
有关静态立体视(即位置立体视PS)和动态立体视(即运动立体视MS)的研究也较多。神经生理学研究证明PS和MS的中枢部位不同,并且出现在初级视皮层双眼相互作用的早期阶段[6]。有正常PS的猫和猴的纹状区(17区)神经元对PS的视觉线索极为敏感[6,12],前纹状区(18区和正常猫的Clare-Bishop皮层、正常猴的颞上皮层)对MS的视觉线索敏感[13,14]。Hishi Kitaoji研究了斜视病人的残存MS和PS,也认为PS和MS的中央型和周边型具有不同的神经机制[12]。
神经科学研究视觉的主要目的是确定与视觉刺激传入相应的中枢区域。1997年Cumming应用动态随机点立体图研究皮层Ⅲ区的神经元是否直接接受双眼立体视深度的感知信息,结果表明Ⅲ区视差选择性神经元接受反相关(Anticorrelated)随机点立体图的视差信息,说明它们并不明确地产生立体视觉,因为视觉系统被反相关随机点立体图刺激后并不产生深度感知[15]。Masson的研究表明来自Ⅲ区的视差信号可能对于快速非自主控制眼球运动起非常重要的作用,这种眼球运动在极短时间被诱发,从而导致了双眼成像特征的匹配,并且使它们的视觉输入信息来自于皮层通路的早期阶段,即在深度感知之前[16]。
2 立体视觉的心理物理学研究
主要有以下三个假说[8]:
2.1 The Keplerian Hypothesis
天文学家Johannes Kepler提出,双眼视差是深度感知的有效刺激,该观点在立体视的早期研究中较有影响。Richard评论该观点为“只是对于具有双眼视差(Binocular parallax)的外部信息的一个内部反应”,引伸开来就是由于每一个或一级特殊的细胞代表一个方向,故每一个或一组细胞也就代表每一视差,但是这种观点无法解释对应问题(Correspondence problem)。神经生理研究发现了视差敏感细胞之后这个假说则不再成立。
2.2 Richards'Pool Hypothesis
1970年由Richards提出人的视觉系统包含三个“Pool”:分别对应于交叉、非交叉及近零视差,近零视差的“Pool”与注视平面附近较高的立体视锐度相关。由其观点来看,交叉和不交叉视差的“Pool”的相对激活将引起一个特殊的深度感知,而不是一个假定的神经成分突然由一个带有独特信号的深度转至另一特殊深度的感知。其依据是一些立体视异常的人虽然不能感知交叉视差却能区分非交叉视差,反之亦有;另有部分病人仅在注视平面附近几弧分的范围内有正常立体视锐度;正常人则能够区分交叉视差、非交叉视差和近零视差。此假说在神经生理学上得到了Poggio及其同事的支持,他们发现纹状皮层约50%的神经元及V2区更高比例的神经元对视差敏感[6,7],V1区和V2区只存在两类神经元即前述的调制神经元(调制兴奋性神经元和抑制性神经元)和交互神经元(“近”细胞和“远”细胞)。
[1] [2] 下一页 |