来源:混沌巡洋舰
人类作为模式发现者,处于一触即发的状态,我们可以倾向于在一个系统找到模式,而这个系统可能并不真实存在。由此,问题出现了,宇宙究竟是按照模式运行的,还是人类只是在我们看到的任何地方,都会找到模式,不论该模式的真假了?
对这个古老问题的研究,可能会对研究复杂适应系统(如大脑)的科学家,提供一个有价值的启发。在大脑中,神经成像数据被解释为所呈现的模式,可能与更高层次的认知过程相对应,也可能不相对应。
一个明显的例子: 搞笑诺贝尔奖得主研究人员用核磁共振成像仪扫描了一条死去的鲑鱼的大脑,发现了一个与社会观点相关的信号。鲑鱼实验的目的是提醒神经科学家不要过度解读数据ーー看到并不存在的模式。但是,大量的神经成像研究表明,大脑某些区域的神经活动模式确实与更高层次的行为相对应,比如在风景中航行。如何区分真实和虚假的模式,因此具有重要的意义。
在《澳大利亚哲学杂志》的一篇新论文中,圣塔菲博士后研究员泰勒 · 米尔豪斯提出了一个标准,来评估一个模式可能的真实程度。
这篇新论文基于丹尼尔 · 丹尼特(Daniel Dennett)在1991年的一份报告,该报告使用“压缩性”来判断一个模式可能的真实程度。。正如信息理论家所表明的那样,当且仅当这些数据表现出某种模式时,数据是可压缩的。就像高度详细的照片可以压缩成 JPEG 文件,同时捕捉原始图像的基本特征一样,丹尼特定义了真实的模式,即复杂的科学数据是否可以由简单的科学模型忠实地表示出来。越难以准确地被解释的模式,就越有可能是真实的模式。
该文指出,仅仅可压缩性不足以评估复杂数据集中的模式,因为它不能解释这些数据集通常需要的是那种解释。例如,当科学家研究神经成像数据时,他们使用这些数据来绘制大脑活动的地图。这个绘图过程涉及到对测量数据的解释,有时可以是对不存在的数据中的模式进行解释,就像解释死去鲑鱼的大脑信号一样。所需的解释越复杂,这种模式可能就越不真实。
该让我们反思我们做了多少解释性工作,”“同时也提醒我们去思考科学的理论化是如何在总体上起作用的。尽管有证据证明你的理论是正确的,但你也很容易想出一些理由,来论证你的理论是正确的,即使事实你的理论并没有对应真实世界。这项研究表明,我们必须进行的“阅读”量,与真实存在的模式意味着什么密切相关。
用一句话总结:模式只要你来找,就会有,但只有那些能够化繁为简,同时具有预测效能的模式,才是有意义的,这是丹内特的洞见。在此之上,还需要给找到的模式一个解释,从而确保这个模式是针对真实的而非虚假的现象,由此一个模式的解释越简单,该模式越有可能是描述真实现象的。
上述两个洞见,不止能帮助我们应对阴谋论,还能在数据分析中,在模型的泛化能力,可解释性的评估上,获得别样的视角,避免找到虚假的,或基于无稽之谈的模式。
参考
https://santafe.edu/news-center/news/research-brief-really-real-patterns
https://www.tandfonline.com/doi/full/10.1080/00048402.2021.1941153
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”