您现在的位置是:网站首页>励志励志
《我们如何看见,又如何思考》告诉我们眼睛看到的信息是如何传递去大脑的 _ 如何透
铛铛铃2025-08-07【励志】928人已围观
简介
大家好,欢迎来到听书享富,祝大家享受愉快的听书时光。今天我要介绍的这本书名为《我们如何看见又如何思考》,这本科普书探讨了视觉研究的话题。一开始提出了一个引人入胜的问题:你是如何在几百毫秒内,从人群中辨认出熟悉的面孔的呢?这个问题听起来可能有些困惑,因为辨认熟人似乎是一件很自然的事情。但真正的挑战在于,你是如何在一瞬间辨认出他的。这个过程被称为对象识别,它需要眼睛和大脑进行复杂的计算。
首先,你需要敏锐的视力,以在短时间内将更多的注意力集中在人群中,找到那个熟悉的面孔。其次,你需要优秀的记忆力,能够立即调用关于他的记忆,即使没有他的照片也能进行对比。但更复杂的是,每次看到这个人时,他的样子在你的视网膜上都不尽相同。面对这种情况,你需要考虑到脸部表情、朝向、距离以及光线等因素,这使得一张脸的变化几乎是无限的。那么,我们再回到之前的问题,你是如何在几百毫秒内认出那个人的呢?这个问题确实有些奇怪,因为眼睛和大脑之间的对话机制,仍然是科学界最重要的谜团之一。这本书的核心议题正是对象识别,尽管在我们看来,这似乎是一种基本操作,但在人工智能领域,却花了50多年才有所突破。
作者理查德·马斯兰,曾是哈佛大学医学院的神经生物学和眼科教授,他在40多年的职业生涯中,一直致力于研究人眼和大脑的工作机制。在这本书中,马斯兰教授向我们介绍了许多关于人类视觉研究的有趣发现,这些发现将有助于我们更深入地理解机器学习和人工智能的发展。长期以来,使计算机更接近人类大脑,一直是计算机科学领域的重要目标之一。而本书将分为两个部分来探讨这个问题。首先,我们将关注于了解自己的眼睛,弄清楚视网膜如何工作,以及如何将所见信息传递给大脑。其次,我们将深入研究大脑内部的响应机制,了解科学界关于这方面的最新发现。好了,废话不多说,让我们开始这趟探索自我认知的科学之旅吧。
首先,让我们来讨论一下视网膜。一提到视网膜,我们大多数人对它的了解,可能仍停留在高中生物课本上。视网膜作为一层透光的薄膜,使我们的眼睛能够感知外界物体的反射光。这一过程涉及光线经晶状体折射后,落在视网膜上,形成物像。随后,这些图像信息通过视神经传送至大脑,进而产生视觉感知。因此,通俗地说,视网膜的作用近似于一层幕布,这构成了我们对其初级认知。不过,科学家们通过研究发现,视网膜的实际作用远远超出了我们的想象。它更像是一个早期的图像处理器,对于外界信息进行一系列加工处理后,最终在大脑中识别主要矛盾,并传递最显著的视觉信号,而将其他无关紧要的背景噪声滤除。这种简化的加工措施,并非仅是生物演化的结果,而是感知系统的基本原则之一。视觉作为主要信息接收来源,其信息量和复杂性要求视网膜工作更高效。为了简化这一复杂任务,视网膜需要高效的压缩、分解和强化信息。
首先,压缩是其中关键的一步。光线的强度和变化范围相差甚远,视网膜必须将这些差异进行进一步的压缩,以确保其在合适范围内进行处理。为了更好理解这一概念,让我们来考虑一种情景。当我们从黑暗的环境走入明亮的房间时,光线的突然变化可能会让我们感到刺眼。可是,这种不适感,正是视网膜进行压缩处理后的结果。由于黑暗和亮光之间的差异巨大,单个神经元或大脑无法直接处理这种巨大的数值差距。因此视网膜必须通过压缩来调整光线的范围,使得输出的光亮强度在一个适当的范围内,从而让我们能够在各种环境下正常感知。这种情况出现的原因很简单,即对黑暗和亮光敏感的细胞,所输出的信息大小相差1000倍。这种数值上的巨大差距,即便是单个神经元、大脑或计算机都难以处理。因此,视网膜必须调整光线变化的范围,以使输出的最大光亮强度,大约只有最小强度的十倍,而非1000倍,以适应各种照明环境。虽然压缩任务非常具有挑战性,但视网膜必须智能的设定合适的亮度范围,以确保我们能够在各种光线环境下进行有效切换。但是与此后的任务相比,这只是小菜一碟。因为除了压缩光线强度外,分解才是视网膜的主要任务。分解任务的精妙设计,真正展现了视网膜的巨大智慧。
以前面提到的人脸图像为例,迅速识别熟人实际上是相当困难的,因为人脸图像每次都在变化。因此视网膜必须学会分解,将复杂的问题分解为最简单的部分,然后分别处理每个单独的部分。视网膜的智慧在于,它不仅仅是简单的拆解图像,而是对图像进行模型化的分解。这意味着,视网膜的工作远不止于简单的拼图,它会根据不同的特征点对图像进行分类,并形成多条并行的信息流,将整理过的内容传输到下一步。这样一来,人脸图像就不再是一团杂乱无章的信息碎片,而是一条条已经整理好的、分门别类并行的信息流。因此,即使发生微小的变化,视网膜也能进行识别。说到视网膜,我们还需深入了解,完成如此复杂工作的主要参与者——神经节细胞。视网膜中的神经节细胞离大脑最近,任务也最重。这些神经节细胞多达100万个,科学家已经鉴定出30多种不同类型。这些不同类型的神经节细胞,分别负责响应不同的特征,从而确保能够捕捉到图像的微小变化,并在信息传输过程中,最大限度地保留多样性。如何在保留多样性的同时确保高效呢?这就涉及到视网膜的第三个关键工作——强化。强化的概念相当易于理解,就像重要的事情需要多次强调给大脑听,以确保大脑了解其重要性。完成此步骤后,从大脑的角度来看,图像已经得到改进,因为视网膜已经对真实世界进行了选择性的处理,使视觉开始与实际产生关联。
视网膜在进行强化时选择了哪些信息呢?长期以来,大自然已经认识到,有关边缘和运动的信息非常重要。观察发现,这些信息在视网膜的工作过程中,得到了充分的强化。首先是边缘,大自然的视觉元素通常具有结构、线条和角度,边缘意味着能够在模糊的图像中了解信息发生了变化。因此边缘是信息量最密集的地方,视网膜的工作是抓住边缘处的结构变化,并对其进行强化,增强其明暗边界。视网膜所进行的强化过程被称为侧向抑制,当我们的视觉系统观察到从明亮到黑暗的转变时,侧向抑制效应就会加强,使得我们更加清晰地感知到这种对比度。因此,视网膜在强调边缘信息时发挥着关键作用。这种选择性的强化,使得视网膜能够从大量信息中,选择出最显著的特征,传输给大脑。因此,在这一过程中,视网膜必须高度重视边缘信息的作用。除了强化边缘信息外,视网膜对运动信息的强化也是很好理解的,因为突然出现的物体,需要大脑迅速做出反应,而这需要视网膜对运动信息进行检测和强化。视网膜在压缩、分解和强化这些工作内容时展现了智慧,它不仅仅是一层简单的光透膜,而是一个充满智慧的图像处理器。视网膜的主要任务是,整理并传输一条条并行的信息流给大脑,以减轻后续处理的压力。这种策略在计算机信息处理中也是类似的。
视网膜在其结构上设计了更多高级功能。比如,我们的中央视力非常敏锐,而外周视力较差,这是因为中央区域的神经节细胞更多,且更密集,而边缘区域的神经节细胞较为稀疏。外周视力的不足也具有其用途,它对变化敏感,可用于导航和避开障碍物,从而减轻大脑信息处理的负担。智能武器也采用类似的策略,先用粗略的视觉定位重点区域,然后在该区域发现运动时放大像素密度,以处理更多细节,以节省计算资源。视网膜结构的精心设计,造就了中央势力和外周势力之间的巨大差距,这种安排是有道理的。此外,即使视网膜脱落,它仍能保持完整并继续存活,这表明它是一个强大且独立的存在,与脊髓和大脑一样,属于中枢神经系统的一部分。因此,视网膜比我们想象的更加强大。现在,我们对视网膜已经有了相对清晰的认识,接下来,我们将准备深入大脑内部,看看科学界目前的研究进展,以及大脑如何通过视觉信号来构建感知。
首先,让我们谈谈视网膜的输出通往大脑的视觉皮质。科学家们通过观察视网膜神经节细胞的活动,已经基本搞清楚了这一过程。不过,对于大脑视觉皮质的研究工作,就像是航行在迷雾中的航海者,我们只能凭借着少数标记,向着更多的位置前进。在大脑中,还有许多未解之谜需要探索。因此,在今天的讨论中,我们将结合计算机领域的发展,探讨一些关于大脑处理视觉信息的研究成果,特别聚焦在前文提及的对象识别问题上。科学家们首次的发现是,我们的大脑对某些具体的视觉对象,表现出更为活跃的响应。其中,人脸是一个相当引人注目的对象。通过核磁共振成像,他们发现,当人类和猴子观察到一张脸时,大脑粘液中会出现六个特定的小斑块,这些斑块就像是专为识别脸部而设计的细胞。有些斑块功能相对简单,只对特定朝向的脸有反应,而另一些则更为复杂,无论脸部朝向如何,都能准确识别。这六个斑块,能否作为一个系统来协同工作呢?为了解答这个问题,科学家们根据视觉信息的分解机制,将一张脸拆分成不同的元素,并通过实验观察不同细胞的工作方式。他们想要了解的是,当增加或减少某些面部特征时,不同细胞的工作会如何变化。虽然实验过程有些复杂,但我们直接说结果。首先,这些细胞对于不同的脸部组合特征,都有一定的响应,他们确实对脸更感兴趣一些。通过增加或减少一些面部特征,细胞的反应强度也会有所不同。但是最有趣的发现是,这些细胞并不像之前人们推测的那样,各自独立,有些专门识别眼睛,有些专门识别鼻子,而是以一种高级的方式工作,他们会测量一系列面部参数,并联合分析这些参数,来确定某个对象是否是一张脸。
举个例子,有些细胞会对脸的长宽比比较敏感,另外一些则会对眼睛之间的距离比较敏感,还有些会对眼睛的位置参数更感兴趣。换句话说,单独看每一个参数,并不能直接告诉这些细胞脸的存在,但通过某种方式将这些参数组合起来,细胞就能够判断眼前的对象是否是一张脸。这是第一个有趣的研究成果,显示了这些细胞的工作机制与我们想象的不同。科学家们发现的第二个重要研究成果是,感觉系统的神经连具有很强的可塑性。通过观察这些细胞识别面部的方式,科学家们想了解,为什么特定的细胞会选择性地对面部敏感。他们进行了一项实验,饲养了一些从未见过鱼脸有关的参数的猴子,它们甚至在与猴子接触时戴上面罩,以完全阻挡自己的脸。这些猴子在正常的视觉环境中长大,但它们唯一被剥夺的是对面部的视觉体验。科学家们通过扫描猴子的大脑发现,当他们看到人脸或同伴的脸时,并没有在大脑中观察到面部斑块的活跃。相反,当他们看到手的图像时,面部斑块区域显示出了活跃的响应。这暗示着,如果猴子从小就没有接触到鱼脸有关的图像,那么这些对面部敏感的细胞,会对其他图像更为敏感。这是因为,在正常的社交环境中,对于灵长类动物来说,最重要的视觉对象是脸,因为脸传达着各种情感和生存信息。但如果没有机会看到脸又会怎样呢?很明显,环境中的第二重要特征是手,包括猴子自己的手,以及培育和喂养它们的实验人员的手。因此,原本被认为是面部斑块的脑区域,就变成了手部斑块。但更有趣的是,在猴子被允许看到实验人员或其他猴子的脸后,大约过了六个月,科学家们再次观察到,手部斑块的细胞逐渐恢复,对脸更为敏感。这明显表明,面部传达的信息如此重要,以至于他们重新夺回了手的图像所占据的那部分大脑区域。这个过程可以被视为是一种感知学习的过程。
可以说,我们的感官系统一直在通过调整自身,来适应自然界的统计规律,这个规律指的是对于我们来说最重要的视觉特征。这也说明了感官系统的神经连接具有很强的可塑性。现在对于可塑性的概念,相信你已经有了答案。可塑性指的是,大脑重新组织神经连接的能力。这种可塑性不仅意味着,我们的大脑能够从一次次的损伤中重新修复,还能够让大脑将资源分配给我们当前最重要的任务。刚才我们提到了,大脑对识别人脸有一套特殊的方式,我们的感官系统的神经连接也具有很强的可塑性。但是作者在书中进一步指出,一旦信息进入大脑的高级中枢,几乎所有的脑区都在相互交流,而我们所能看到的就像是一团乱麻。脑区之间的相互连接及其功能,大多数我们还不太了解。换句话说,从科学的角度来看,人类大脑的学习能力有多强,这是科学界一直在不断深入研究的问题。可是幸运的是,依据已经掌握的脑科学研究成果,大大促进了人工智能领域的发展。例如,神经网络这个词,最早是由加拿大的神经科学唐纳德·赫布提出的,随后被计算机科学家借用。在20世纪后期,当计算机科学家们刚开始研究人工智能时,分成了两个阵营,一边支持固定规则的算法,另一边支持机器学习算法。固定规则的算法是指,通过编写程序来识别物体,而机器学习算法,通过提供大量的样本、数据和反面案例,让计算机自己通过学习找到规律。实际上,机器学习更像是我们大脑学习的过程,其核心理念是,通过模仿人类大脑的工作原理,建立复杂的神经网络,逐渐拥有人类的智能。因此,它更广为人知的名字是人工智能。
在过去的十几年里,随着数据资源的增加和大型专用计算机运算能力的提升,人工智能已经在各个领域得到广泛应用,包括语音识别、智能翻译、智能家居和智能医疗等。这一快速发展,也引起了神经科学家对大脑神经网络的浓厚兴趣。神经生物学和计算机科学之间的合作也日益频繁,这为我们更深入地理解机器学习和人工智能的发展提供了契机。今天,我们先来概括一下《我们如何看,又如何思考》这本书的要点。总的来说,我们探讨了如何在几百毫秒内,从人群中识别熟人的问题。我们了解到,视觉图像信息经过视网膜的压缩、分解和强化,传输至大脑。视网膜的功能和结构,比我们想象的更为复杂。接着,这些信号到达大脑的视觉皮层,我们发现,颞叶区域有一些专门响应面部的斑块。科学家们通过观察猴子的实验,转化手部斑成为面部斑块,从中了解到神经连接的可塑性。最后,作为脑科学研究专家,作者提到了一个颇具启发性的发现,我们的大脑运行速度相当缓慢,大脑中神经元和它们之间的突出运行速度,仅为现代计算机的百万分之一。不过,大脑在许多感知任务上都能超越计算机。大脑中存在许多谜团,但最重要的是,它并非一台固定连接的通信机器,而是由神经元交连而成的可塑性神经网络。这些神经网络之间的对话充满神秘而强大,甚至完成最简单的任务,都需要人工智能大量的硬件和能源支持。相比之下,我们的大脑只需消耗一盏小夜灯的电量,就能完成更多的任务。从这个角度来看,人工智能向人脑学习的旅程,对我们人类而言还有很长的路要走。
以上即是这本书的核心内容,恭喜你又听完了一本书。感谢大家对我的支持和关注,请订阅听书想富的频道,点赞并与身边的朋友分享这个宝贵的知识,让我们共同将智慧与实践相结合,实现自己的财务目标,创造更美好的未来。谢谢大家,我们下期见。
"感谢喜欢,赞赏支持是对我的鼓励。"
很赞哦! (0)