当前位置

: 首页 名家文章查看内容

对视觉的三种不同看法(心理学的故事)

2020-03-09 22:19 4043

  对视觉的三种不同看法(心理学的故事)周国平选入教材的文章名家写物件的文章“视知觉,”贝拉·朱莱茨最近说,“所处的状态与物理学在伽俐略之前,或者生物化学在沃森和克里克发现双螺旋之前一样。”他可能对自己有些苛刻,不过,两种主要的方法——如果我们把吉布森的理论与其它的理论并列在一起的话,那就有三种——都只能解释这些现象的某些方面,还没有一种综合性的视知觉理论。这可能意味着,某种大型的组织性概念尚没有发现出来,或者说,视知觉是如此复杂,没有一种理论可以解释它所有的方面,名家散文精选大全不同的方法解释各个不同的复杂问题。

  我们已经看到过一些不同的方法。在这里,我们做一个收尾的工作,把他们对视知觉的解释在总体上做一个全面的勾勒。

  神经元理论:这种方法回答的问题,是19世纪的生理学家们一直很着迷的:感觉神经虽然在结构上都是一样的,它是怎样把不同的感觉传递到大脑里面去的呢?

  这个以详尽的细节作出的答案是,神经脉冲本身并没有什么差别;反过来,对某些刺激有反应的接受器把它们的信号分开发送到纹状体,即视皮层的主要区域。胡贝尔和他目前的同事玛格丽特·利文斯通(威塞尔与胡贝尔合作20年后另分一支了,他现在是洛克菲勒大学的校长)最近显示,由外形、移动、深度和色彩生成的脉冲经由不同的平行通道到达皮层,并稍后在那里形成一个整体。(色彩是一个研究得很多的课题,它只是本书焦点外围的部分,因此加以忽略。)

  主视觉皮层只覆盖约15平方厘米的面积,但其内部的建筑却是极为复杂的。好几十年来的神经生理学家们一直在探索这个结构及其内部的线路原理。他们得知,进入里面来的信息首先进入“简单”细胞,在这里被谐调起来,以对具体的刺激作出反应。这些细胞把他们的脉冲通过极复杂的线路原理送入“复杂”细胞,这些复杂的线路原理在很大程度上是基因决定的。复杂细胞开始整合单个的脉冲,李煜诗词并把来自两眼的信息混合起来。结果是,视网膜图象被以“地图”形式作为复杂神经元的集体激发而送入视皮层,可是,这些激发的模式并不像视网膜上的图象,也不像眼睛之外的场景。按胡贝尔和威塞尔的话说:

  视觉场景在投射到视皮层里面去的时候,实际上什么样子呢?假设一个动物盯着某个点,而视野中惟一的物体就是在这条直线稍上和偏左的地方,动物的目光就盯着这个点。如果每一活跃的细胞都会被点燃,再如果一个人可以站在皮层之上然后朝下看,这个图案会是什么样的呢?为了使这个问题更有趣,假设这个图案只由一只眼看着……这个图案却原来不是一条直线,而只是一组有规则地分布开的串。

  换句话说,它不是一个图象,而是一个编了码的图象表达,这有点像录音带上磁场的图案并不是声音,而是一种编了码的声音表达。然而,这种表达的确还不是知觉;如胡贝尔和威塞尔所言:“主视觉皮层绝对不是神经传导的终结。它只是一个阶段,比较起它所处理的信息的抽象程度来说,它兴许只是一个早期的阶段。”

  部分集合和整合起来的信息从纹状区域发送到视皮层的另一个区域,再到达超出它之外的更高的大脑皮层区域。在这里,信息最终被思维看见,并被认出来属于某种熟悉或者以前没有看见过的东西。这是如何发生的,到目前为止还没有弄清楚,大部分神经生理学家都这么看。可是,有少数人却大胆地猜想,在大脑较高级的水平上,有一些包含以前看见过的、以突触连接或者分子沉积形式表现出来的物体的“痕迹”,而这些细胞只有在一个输入的信息符合痕迹时才会有所反应。这种对能配合的一方作出的反应是一种意识(“我见过这张脸”);非配合不会引起反应,它也是一种意识(“我没有见过这张脸”。)研究者们半开玩笑,半是严肃地把这些假设性的视觉系统神经元称作“祖母”细胞,因为其中的一些只在看见自己祖母编了码的本身时才会有所反应,而对其它的任何信号皆置之不理。

  除开这些想象的东西不说,神经理论告诉了我们很多有关视知觉在微观水平上的工作机制,但没有宏观的理论;说了很多有关视觉机制的话,但没有谈到其拥有者和操作者,谈了很多有关神经元反应的东西,但没有说到知觉经验。如一位认知理论家所说的:“只研究神经元来理解知觉,这就像只靠研究羽毛来理解鸟的飞行一样。”

  认知理论:这种方法主要处理在像外形一致、特征辨认、外形辨认、从提示中得来的深度知觉和当许多信息丢失后辨认人物等的知觉现象中运作着的心理过程。毛泽东诗词六盘山

  得出这些结果的心理过程,是由几十亿的神经现象构成的,可是,认知理论家们认为,需要宏观理论,而不是微观理论来解释这些过程。一位研究一个波浪如何改变形状并在接近海滩时粉碎的物理学家,不会从数不胜数的水分子的相互作用中得出波动机械学的法则,就算利用巨型计算机也得不出一个结果来。这些法则表达的是集体效应,它们存在于一个完全不同的组织里。一个人与我们谈话时发出的声音是由大气中的分子的震动构成的,可是,这些话的意义绝不可能以这些分子形式表达出来。

  视知觉的心理过程亦是如此。它们是神经现象集体的组织效应,是由心理法则,而不是神经生理学的法则表达出来的。我们已经看到过这方面的证据,但是,有一个特别有趣的例子是很值得讨论的。当我们从记忆中调出一个图象并在思维的眼中看它时,会发生什么样的事情,并在什么样的水平上发生呢?由认知理论家们进行的一些实验显示,这只能在高级认知理论上进行解释。最为流畅和表现力最强的的实验,是由斯坦福大学的罗杰·谢泼德进行的“心理旋转”实验。谢泼德请受试者说出下列三组中的物体是否是一样的:

  大多数人在研究过这些图案后会认出,A里面的物体与B里面的物体是一样的。C里面的物体不是。当问及他们如何得出结论时,他们说,这些东西在他们的头脑里面转动,就好像在现实世界里转动真实的东西一样。谢泼德通过另一项实验显示出这个过程是如何反应了真实的转动的。在这项实验中,看东西的人从一个有角差的角度看见一个既定的形状。比如,下面这套实验显示出一系列位置上的单个形状:

  给受试者看这些图案时,他们辨认出这些东西彼此一样所需的时间与这些图案位置的角差成正比。也就是说,一个图案与另一个进行比较时需要转动的角度越大,辨认所需要的时间就越长。

  这只是许多知觉现象中的一个例子,它们涉及更高的心理过程,必须以外部世界的内化符号进行操作。最近几年,一系列知觉研究者在尝试形成一个综合性的认知理论,以说明这些过程是什么样的,它们是怎样产生这些知觉的。

  他们的理论有两种方法。一种是利用从计算机科学的分支——人工智能中得来的概念及过程。人工智能基本的假定是,人类心理活动可以通过一步一步的计算机程序加以摹仿,也按这同一种步骤一步一步地发生。人工智能专家们一方面是想让计算机辨认出他们正在寻找的东西,一方面是想获取对人类知觉更好的理解,它们编写了好多外形辨认的程序。为了获取基本的外形辨认元素——比如辨认三角形、方形和其它规则的多边形——一种程序也许会按一系列的假如——那么步骤来进行。如果有一条直线,那么,它会跟着直线下去,并测量它,直到末端;如果另有一条线从这里继续下去,那么它会把这个点叫做一个角,并测量这个角,经由这个角而改变方向;如果这另一条线是一条直线,那它就会跟踪它,直到……等等,直到边和角的数字已经被数过,并与一个多边形和其特征的对比而配对。

  赞同人工智能方法对视知觉有用的主要说法是,大脑里面没有投射器或者屏幕,也没有想象的小侏儒在里面看事物;因此,思维一定不是在处理图象,而是在处理编了码的数据,它一步一步地处理,而计算机程序正是这样工作的。

  反对人工智能方法的主要观点是,与人类的程序比较起来,还没有任何机器视觉程序可以与之相匹敌的,还没有辨认平面形状,还不说三维图象的能力,也没有哪一种程序可以感知周围世界里的三维分布,也不能理解它是不是在环境里面,也不能辨认出岩石、椅子、沙发、水、面包或者任何它所看见的东西可能的物理特性。如乌尔里克·赖塞尔所总结的:

  在机器视觉设计里面碰到的许多困难,都可以归结到一个简单的来源中:设计者们进行的工作缺乏有效的理论。他们大都以为视知觉是辨认特别刺激模式的问题。如果果真全都如此,我们应该早就能够生产出有视力的计算机了。没有形成以这些理论为基础的模型,失败的原因都可以作为一个证据,证明这些理论本身不行,因此也可以证明需要另一种方法。

  关于认知知觉过程如何工作的另一个思想流派,依赖于对人类思想而不是对机器进行的思想摹仿进行的实验室研究。这个观点的起源可以远到亥姆霍兹时代,当时的传统看法是,知觉是从不完整的信息,包括另一类有意识的思想过程进行无意识推理的结果。其最显著的倡导者是我们前面提到过的、加利福尼亚大学的欧文·罗克。他1983年的《知觉逻辑》一书在1991年的“心理学年报”中被描述为“是对在观察者一方好像需要智力活动才能得到的知觉效果最为全面和实验上最可行的解释”。

  尽管罗克是一位杰出的感觉心理学家,可是,他在其早年的学生生涯中远非如此。事实上,在一个知识分子家庭里,他是一头黑羊。可是,在二战期间,他那支部队受到敌机轰炸,他感觉到自己会被炸死,“我对自己发誓说,如果能够活下来,我会在有生之年做比以前更多的事情”。战后,他成了顶尖大学生。他在物理学方面开始其研究生学院的生活,可当他意识到,在心理学这门年轻的研究领域里对知识作出更大贡献的机会要大得多以后,他就转向了心理学。

  在社会研究新学院里,罗克受到了格式塔学派很大的影响,他自己也成了其中一个热情的研究者。格式塔心理学中的一些基本的组织和关系思维法则仍然是他的理论中的一个部分。可是,这些法则描述基本的自动过程,而罗克慢慢相信,许多知觉现象只有通过像一种思想一样的心理过程才能得到解释。

  他在1957年进行的一项实验中开始产生这个想法,如上所述,他把一个方框倾斜一下,让它看上去像钻石形,然后再证观察者倾斜过来。由于观察者仍然认为这个方框是钻石形的,罗克推出,观察者一定是在利用视觉和内脏提示来解释看到的东西。罗克花了许多年的时间设计和进行其它的实验以检测一个假设,即,知觉经常需要比视皮层更高水平的一些过程。这些研究最终引导他得出目前的论题,即“知觉是智力的活动,因为它基于类似构成思想的那些操作”。

  而罗克说,的确,知觉也许就是思想之所以诞生的原因;也许就是原初有机体低水平的感觉过程与更复杂的生命形式高水平的认知过程之间的进化连接。他认为,如果眼睛看到的东西是一种意义模糊和对现实易于变形的表达,有些机制就得发生进化,以得出对现实可靠和忠实的了解。按他的话说,“智力操作也许就是为了服务于知觉而进化出来的”。

  这并不是说,所有的知觉都是类似于思想的。罗克特别引用了瀑布错觉,作为在低水平的神经形式上可以解释的例子。可是,有关运动知觉和其它形式的知觉的大部分事实对他都好像需要高水平的过程。无意识的推论,比如我们利用纹理阶度提示来感觉距离,只是其中的一种。对这种解释的结果的描述是另外一种。在由波林绘制的含义模糊的老巫婆与少妇图案中,人们看到的不仅仅是简单辨认一个图像的结果,而是对自己解释一个特别的曲线是什么样子的结果:像一只鼻子,或像脸。许多物体被知觉出来的形式并非立即可以辨认出来的;辨认事物究竟是什么东西是通过这样一个过程得来的。

  知觉还经常需要这种或那种问题求解。人们很少认为知觉是问题求解,可罗克已经掌握了大量的证据——很多是从别人早期的研究中得来的,有些是从他自己的原创实验中得来的——可以显示,在很多情况下,我们寻找一个假说来解释我们看到的东西,把这种假设与别的可能性进行比较,然后选择好像能够解决使我们看到的东西产生意义这个问题的那一个。所有这些通常都发生在几分之一秒的时间内。

  一个例子:在一个自亥姆霍兹时代以来就知道的一项实验室现象中,如果一条像波浪的曲线横向通过一个细孔,如下图所示;

  大多数观察者首先看到小的元素在上下移动,可是,过一会儿后,其中一些人会突然看到这条曲线以直角在孔的前后移动。是什么东西产生了这些发生了变化的正确的知觉的呢?罗克发现,他们使用的一条提示是线条在通过小孔时不断变化的曲率;另一个是曲线的末尾,如果它能够为人们所看到的话。这些提示给思维提示了另一种假设——一条曲线平行通过小孔,而不是一个小元素在上下移动。这个假设好得多,思维很快就接受了,并认为这条线真的就是这个样子的。

  在理论水平上,至少按照提供在这里的一套理论来说,知觉和思想包含着推理。在有些情况下,毛泽东诗词六盘山总括或者规则是通过归纳在知觉中形成的。这些规则接着就被演绎加以利用,作为推出结论的前提。某些情形下的知觉可以概括为创造性的问题求解的结果,因为它也是在寻找一个基础(或者内部的解)从而得出一个具体的解释。知觉包含着决定,正如思想一样。最后形成知觉经验的操作与概括思维的东西是同一类型。

  直接或生态知觉理论:吉布森及其追随者的直接或生态知觉理论不仅仅试图解释深度知觉,如我们前面已经说过的一样,而且要解决总体的视知觉问题。吉布森的理论,即观察者通过环境的移动会产生一个连续变化的视觉排列,不仅仅是他的深度知觉解释的中心,而且也是他对形式、大小、距离和运动知觉的中心。

  吉布森于1979年在《视知觉的生态学方法》一书中阐述了他的理论,他的阐述深奥难解、穷根究底,很难读下去,部分原因是因为他创制了许多新词。可是,这本书在知觉心理学家中极其有限的接受程度,也许更多的是由于它否定了由其他人到目前为止在知觉研究中取得的几乎一切成果。吉布森典型的话如下所示(摘自他去世后发表的一篇文章):

  一个世纪以来从对知觉的研究中得出的结论是微不足道的。从一个世纪以来对感觉的研究中获取的知识是不连贯的。我们没有足够的知觉理论,我们在寻找感觉当中所发现的东西是一串混杂的错觉、生理怪事和身体的感觉。这些含义是令人沮丧的。在解决知觉的问题上,必须有一个全新的开始。

  吉布森之所以决定要另起炉灶的理由听上去是足够充分的:他用这个问题(跟科夫卡一样)开始“为什么事物就是它们看上去的样子”,然后说:

  我们如何看出自己处于环境之中的什么地方?我们如何知道自己是不是在移动?如果是在移动,我们是在向哪里移动?我们如何知道事物的长处在哪里?我们如何知道怎样处理事情?

  为了正儿八经地重起炉灶,吉布森排除掉了大多数基本的假设,这都是哲学家和心理学家们在视知觉方面一向采用的假想。其中有:感觉是知觉的基础;来自外界的刺激会引起有机体的反应;有机体能产生反应;大脑可以处理、整合并解释信息;对视觉的合适研究从视网膜和大脑开始;光学的运动是视觉系统必须加以补偿的东西;环境只是由视网膜上的信息部分再现出来;知觉在很大程度上取决于推论等等。吉布森可谓是一把新扫帚。

  对前述假设加以全盘扫荡之后,吉布森提出了自己的新理论,这种理论多一些哲学意味,少一些实证基础,更多的是概念上的,而不是以资料以基础的,而且很难掌握。尽管如此,他还是通过实验达到他自己的结论的,首先是运动知觉,然后是形式和其它现实世界特点的形式。名家写物件的文章如我们在前面已经说过的,第一线曙光是从他参加航空人员研究中得出的,如他所言:

  我们了解了更多有关物体知觉的东西,我认为这比通过外形知觉进行的实验室标准实验多得多。一方面,我有一个挥之不去的感觉,即从来没有人真正在生活中看到过一个二维的东西,中华好诗词第五季也就是说,一个事物的图片。人们看到的是一连串视点的转换,无穷多的外形,它们可以确定物体变化了的外形。

  从这里开始,他后来不仅排斥所有以图片和错觉为基础的研究,而且排斥就知觉作为思维对视网膜上的二维图片不完全的信息进行的解释的所有理论:

  最终,我慢慢理解了,图片形式的知觉与自然的知觉方式是何等的不同。名家欣赏前者是二手的知觉;后者是一手的知觉。从图片中来到眼睛里的有框架的视觉排列,与来自世界而到达眼睛里的自然的视觉排列完全不同……眼睛之所以进化;是因为它们要看这个世界,而不是看一个图片。自从我意识到这些以后,不管是什么意义上的用途,我一概回避使用“视网膜图象”这个词了。

  吉布森的结论我们已经在前面看到,就是说,光学排列包含了我们需要的所有有关现实世界的信息。他承认,我们的对这个世界的知识由于神经系统的特性而有限,可是,他坚持认为,这些特性取决于对这个世界的进化适应,我们知道必须了解的所有环境特点。进化会在每种动物中产生一个知觉系统,会使它直接辨认对其有用的环境的特点——按吉布森的说法是“可利用性”,即任何东西的特征的利用都会使这个物种受益。因此,事物相对于观察者的大小和生理装备来说,看上去是可食用的、可饮用的、可以在上面行走的、可以在里面游泳的等等。

  简短地说,知觉不是对一种降格视网膜图象的解释过程,而是通过光学排列和光学流动直接和真实的现实体验。这对吉布森而言,就是知觉的核心机制——而不是由胡贝尔和威塞尔(他们进行的工作他认为是无关的)记录下来的神经现象,也不是认知过程,他认为认知过程是以错误和人工的假设为基础的。

  直接知觉也是吉布森对贝克莱的回答。我们知道,世界就在那里,在我们之外独立地存在着,因为当我们在环境中移动时,我们以连续变化的形式看见事物,而我们会体验到事物的连续性、真实感,且不依赖我们作为观察者而存在。其它的所有动物亦是如此。只有哲学家们才会去怀疑世界不是我们看上去的样子。吉布森的视知觉理论因而就大胆突破了对视觉的研究,从而进入认识论的领域。

  这还不算完。到他生命快要终结的时候,吉布森慢慢相信,知觉是全部心理学的支柱,而他的知觉理论可以给这门科学的许多领域带来巨大的变化。像思维、意识、学习和驱动力这样一些概念,都可以被生态心理学所代替,而生态心理学是以动物对地点、事件和物体有用的、危险的特征的意识为基础的,也是以他们对自己的动作进行组织和控制,以达到他们在现实世界里所欲求的结果为基础的。

  吉布森经由何种过程以期达到这种至高无尚的目标的,我们不得而知。《生态心理学》出版两年后他就去世了,尽管他有关视知觉,特别是光学流动的一些思想已成为被接受的知识的一部分,可是,这些知识和他更为雄心勃勃的一些概念却并没有给知觉带来一场革命,更不用说总体意义上的心理学。

  很可惜,吉布森会变得这样不能宽容,这样自负,他的光学流动概念当然是很有价值的,尽管它并不会使他认为的许多东西毫无必要,可是,他爱走极端的性格使他对心理学作出的贡献不能像它应该的那样广为接受。

  《心理学年报》1991年对知觉问题的回顾提出了全部三种方法——神经生理学的、认知学的以及吉布森式的方法——并认为这三种共同存在的理论和知识体系彼此并非互相排斥。以刺激为基础的神经学方法、以人类思维进行的认知方法和光学流动直接法都描述了全部现实的不同部分。他们并非彼此冲突和矛盾的,而是互补的。

  从这个立场出发,知觉好像就是心理学知识当中相对发达的一个领域,尽管有许多谜尚未解开。对这些有趣的问题,还有太多而不是太少的答案,但是,现代心理学其它的研究领域也是这般情景。未来是否会产生一个包罗万象的综合理论,这还需要时日来证明。同时,我们知道,我们已经了解了比以前多得多的知觉方面的情况,而且知道,还有更多的知觉知识尚需了解。

返回顶部