来源:混沌巡洋舰
因果推断让大数据更有温度在六种看待因果关系的视角(机制,反事实,干预,过程,信息传递及概率因果)中,信息传递是潜在应用最广泛的一种。当我们想弄清楚是什么导致某件事情发生时,如果由于伦理原因,无法做干预实验;机制又过于复杂,使得反事实推理中出现蝴蝶效应,或者过程中包含反馈和自循环;那可以看看什么因素能够预测该事件是否发生。
例如关于怎样的婚姻更加美满这一问题,古往今来有太多的讨论,然而却大多没有定论。而大数据下,对这个问题的回答,可以考虑那些因素能够最准确的预测出婚姻质量。例如2020的PNAS论文[1],指出对浪漫关系满意度影响最大的因素是“响应性”。
这让我想到了2015的另一篇PNAS论文[2],在即使考虑了其它因素下,网恋的情侣比线下认识的婚姻更幸福,也许是因为网恋带来的快速响应成为习惯,从而使得浪漫关系更令人满足。2020年研究的另一项发现,是决定忠诚度的是亲密感。考虑到社交网络兴起后,虽然物理上在一起,心理上却不亲密的情况越来越多,这一发现并不令人意外。
很多人传统上会觉得,物质条件,学历性格等,会决定亲密关系。然而之前的积极心理学研究指出,幸福的基线不会由于哪怕是意外的加薪而发生持久改变,而只会由于你改变了行为模式而提升。从信息传递的角度来看,因果关系的存在,意味着从原因到结果之间有信息被传递。加薪是一个一次性事件,你很快会为新的收入找到去处;而行为模式的改变,会持久地带来新信息。一次性的事件,无法成为持久结果的因,对于婚姻亦是如此。
对于长期的持续性的果,种下这个果的因,也不可能是一次性的。这个道理是普遍适用的。职场中的发展,也是这样一个宏观的集合特征。要预测该结果,也需要持续的信息传递。例如职场中,领导是否将特定的任务交给你这样的微观结果,取决于能力是否匹配,但职场长期成就,则只会取决于你的态度及习惯。信息传递决定了不应该使用微观特征来解释集体性的结果。
行为模式常常和性格相关,那有那些因素决定性格了?对于该问题的回答,同样可以通过判定那些因素能够预测性格来回答。这里介绍两篇论文,第一篇说的是能够根据静态脸部图像,预测性格[3],另一篇则是通过居住地信息,发现山区的居民在五大性格特征和平原地区有些区别[4].
两者之间都是相关性,但从信息传递的角度来看,从脸部特征到性格间并没有什么可能的渠道,能够传递信息(虽然相貌的不同,对陌生人会附带偏见,但经常交往的人,不会以貌取人,而性格的成因,来自持续的互动模式)。因此两者之间的联系,可能是由于基因的共同影响,或者是性格的不同,塑造了不同的气质。该例子说明,通过判定是否存在可能的信息传递机制,可以判定因果关系方向。
而地形和性格间的关系,则更有可能是前者为因,后者为果。山区的自然环境,影响了该地区居民的生产方式和交流模式,进而塑造了性格。例如该文中指出,在五大性格特征(外倾性,责任心,情绪稳定性,宜人性,开放性)中,前四项山地居民都偏低,而唯有最后一项,山地居民明显偏高。这也和我们的日常经验是相符的。
总结来看,因果关系的出现,意味着存在信息传递,不仅意味着可以用类似转移熵这样的指标,来进行因果发现。还以为可以通过找出那些具有预测效力的指标,再寻找可能的信息传递机制,来找到潜在的因果联系,或者依据信息传递的管道不存在,来暗示两者间的相关性仅仅是相关性。
参考:
[1] Machine learning uncovers the most robust self-report predictors of relationship quality across 43 longitudinal couples studies,
[2] Marital satisfaction and break-ups differ across on-line and off-line meeting venues.
[3] Assessing the Big Five personality traits using real-life static facial images
[4] Physical topography is associated with human personality
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”