在第一篇文章中(链接:(一)视觉系统的全貌),我们已经了解了视觉信息被大脑处理的全过程。现在,我们把目光投向一切的起点——眼睛。
实际上,人们提起“视觉”,首先想到的几乎都是“眼睛”。但其实眼睛只负责“视”的最初步骤,“觉”的部分主要由大脑来完成。“视”与“觉”不可分离,要讲“视觉”,眼睛和大脑也不能割裂开来讲解。
(更进一步:许多神经科学家们把眼睛视作大脑的一部分——“外围脑”。支持这一观点的证据有很多,也许会在将来专门撰文讲述)
我们首先复习第一篇文章里,关于眼睛部分的文字:
1、光(本质是电磁波)携带着外部世界的结构信息,经过一系列折光系统(如晶状体、玻璃体等),投射在眼球底部的视网膜上。
2、视网膜上的光感受器细胞,将光信号转换为电信号(光电转换),传递给视网膜的其他细胞(比如双极细胞、水平细胞、无长突细胞等),进行初步的信息整合加工。
3、视网膜的各种细胞最终将整合好的信号,传递给视网膜神经节细胞,由它将视觉信息通过视神经,传递进入大脑。
我国的近视率一直在上升,人们从小就接触各种视力健康方面的知识,所以我相信许多人都已经对眼球的结构有所了解。这一部分我将简要带过,着重讲视觉信息处理的部分。
· 眼球
眼球可以简单分为三个部分:
1、支持系统(负责固定眼球的形状,为其他部件提供稳定结实的依靠,同时提供眼球所需的营养。例如巩膜——也就是“眼白”)
2、折光系统(负责将外界射入的光偏折到需要的角度,从而在视网膜上成像。例如晶状体、玻璃体)
3、感光系统(负责将光携带的外部世界信号,转换为大脑可以识别的电信号,并进行初步的整合处理。例如视网膜)
我们平时戴眼镜,主要是为了辅助眼球折光系统的工作,确保在视网膜上清晰成像。而如果我们关注“视觉”,那就要着重讲第三点:眼球的感光系统——视网膜。
· 视网膜
视网膜是分层的(大脑皮层也是分层的),每一层都有不同的细胞,负责不同的功能。
严格来讲,视网膜可以分为10层,分别是:
1、 色素上皮层(为视网膜提供营养)
2、 感受器细胞层(分布着密集的光感受器细胞的外段和内段,是光电转换的地点)
3、 外界膜
4、 外核层(由光感受器细胞核构成)
5、 外丛层(由感受器细胞、双极细胞、水平细胞形成突触网)
6、 内核层(由双极细胞、水平细胞和无长突细胞核构成)
7、 内丛层(由双极细胞、无长突细胞和神经节细胞形成突触网)
8、 神经节细胞层(由神经节细胞构成)
9、 视神经纤维层(由神经节细胞的轴突构成,是视觉信号向大脑传递的出发点)
10、内界膜
但上述分层过于细致,为了便于理解,我们简单将视网膜的结构分为四个部分:
1、 提供营养的基底膜2、 光感受器,将光信号转换为电信号,传给中间神经细胞3、 中间神经细胞,初步整合视觉信号,传给神经节细胞4、 神经节细胞,负责把视觉信号传入大脑
这样一来,我们就对视网膜的构造和功能有了基本的概念。
当然,其中的细节也是极其丰富的,限于篇幅,我们了解几个最为关键的方面即可:
· 色觉的来源
视网膜的光感受器细胞可以大致分为两类:视杆细胞、视锥细胞。它们的形状有明显区别(见下图),同时功能上也很不一样。
视杆细胞对光极为敏感,非常微弱的光就可以激活它。因此,它是我们能在黑暗环境中看清东西的原因。但人眼中的视杆细胞只有一种类型,所以单靠它无法获得颜色信息,我们在黑暗中很难分辨物体的颜色,原因就在于此。
而视锥细胞不同,它虽然对光不太敏感,但是种类比视杆细胞多——在人眼中,有三种视锥细胞,它们分别喜爱红光、绿光和蓝光。三种视锥细胞对同一束光的反应强度有所区别,就可以共同编码“颜色”的信息了。
我们日常使用的RGB三原色系统,可以通过红绿蓝三种颜色的不同组合,获得无数种颜色。这就和视锥细胞编码色彩的原理相同。
· 视网膜是严重贫富不均的
视网膜就像一张膜,但并不是均匀的膜。它的中央区域细胞最为密集,但周边区域细胞比较稀疏——有点像大型城市的人口密度分布。因此人类对视野中央的东西看得最清楚(分辨率最高),而视野边缘的东西就看不清楚(分辨率比较低),需要转动眼球才能看清。
放一张我用windows自带“画图”软件制作的灵魂手绘图,方便大家理解“中央密集,周边稀疏”的含义:
· 视网膜能提取图像的轮廓信息
视网膜对视觉信息做了初步的整合处理,可以从中提取出“轮廓信息”。这是中间神经细胞们的功劳,它们构成的兴奋-抑制神经网络,赋予神经节细胞识别轮廓的能力。专业点说,就是让神经节细胞对感受野(这个细胞负责的视野区域)内部视觉信号的处理方式上,产生了中心-周边拮抗的同心圆结构。
其实,目前非常非常热门的“深度学习”、“卷积神经网络”中,就广泛借鉴了神经节细胞的这种能力。神经节细胞的同心圆拮抗感受野,对应了卷积神经网络里边的“双高斯差卷积核”(也有人用“拉普拉斯算子”来对应它,比如David Marr),它可以对原始输入图像做卷积运算,从而提取出原始图像中“亮度变化最快”的区域——通常是图像的轮廓。
下图:一个“中心-周边拮抗同心圆”结构的卷积核案例
下图:上图中的“中心-周边拮抗同心圆”结构的卷积核提取图像轮廓信息前后对比
来源:Computer Vision I - Introduction to Computer Vision课程资料,Robert Collins (Penn State University)
关于“中心-周边拮抗的感受野”这一话题,我以后会专门撰文讲解——它对于我们“提取外部世界的结构信息”至关重要。只有提取了外部世界的结构信息,我们才能把物体和背景区分开,否则,世界在我们眼中就是一片“未分化的混沌”。
· 视网膜是倒置的
如果你仔细看了视网膜的分层结构图,就会发现——光线进入眼球,先通过密密麻麻的细胞群,再照射在光感受器细胞上面。换句话说,光感受器细胞上方,悬了一层厚厚的毛玻璃。这会影响到信号质量吗?当然会!
但是,人类(以及其他高等哺乳动物)为何偏偏选择了这样一种看起来极不合理的构造呢?要知道,低等动物章鱼的视网膜,看起来都要更合理一些——章鱼的视网膜和人的视网膜正好相反,光最先照在感受器细胞上(见下图)。
上图中,1 = 视网膜;2 = 神经纤维;3 = 视神经;4 = 人类的盲点,由视神经穿过视网膜造成
原因至少有两点:
1、 高等哺乳动物的视觉系统比较发达,光感受器细胞数量极其巨大,而光电转换的耗能是非常高的。为了能够提供充足的能量,光感受器细胞层必须紧贴着供能的基底层(色素上皮层)——否则将无法支持如此多的光感受器细胞存活。
2、 “进化是一个修补匠”,它只能在原有的基础上修修补补,具有很高的路径依赖性。因此,高等哺乳动物的共同祖先的微小变化,就会决定未来后代们的进化走向。也许正是“倒置视网膜”的小小差错,让视网膜成功滋养了大量的细胞,从而使得视觉系统的地位愈发重要,最终让人类成为了“视觉动物”(而非“听觉动物”、“触觉动物”、“嗅觉动物”)呢?
我们已经知道视觉信息如何在视网膜内部进行处理了,下一篇文章,我们聊一聊:视觉信号如何传入大脑?信号在大脑中处理的方式,才真正决定了我们如何“看到”世界。
敬请关注!
【专栏目录】(持续更新)
1 / 视觉系统的全貌
2 / 光线如何被眼睛检测到?
3 / 视觉信号如何传入大脑?
4 / 视觉信号在大脑中被重组、扭曲全过程!
5 / 视觉信号在大脑中的第一站:外侧膝状体
6 / “虚拟视觉”第一步:理解初级视觉皮层
7 / 8张图彻底剖析初级视觉皮层
8 / 视觉信号在大脑中的第三站:高级视觉皮层们
【专题目录】(酝酿中...)
剧透:“脸盲”、“汉字顺序不影响阅读”、“虚拟视觉”、“大脑的欺骗”、“视觉错觉”、“潜意识与意识”……
2020.4.5
于复旦大学