您现在的位置是:网站首页>科普科普
《为什么》
铛铛铃2025-09-13【科普】2人已围观
简介
今天为您解读的书是《为什么》
副标题是《关于因果关系的新科学》。
本书作者朱迪亚·珀尔,是美国国家科学院院士,人工智能领域的权威专家。
现如今,随着大数据和人工智能等技术的发展,很多人会以为,只要数据足够多,就能解决一切难题。本书的作者却指出,现在的人工智能技术并不是真正的智能,他认为“你比你的数据更聪明”,因为数据不了解因果,而人类了解。
然而,作者所关心的不仅仅是人工智能,他的野心更大。珀尔真正想做的是,建立并推广一门名为因果推断的新学科。作者认为,这门新学科会影响到人类生活的方方面面,覆盖从新药开发到经济政策制定,从创新教育模式,到缓解全球变暖等重大问题。
在开始正式的解读前,需要说明的是,本书比较硬核,难度有些大,涉及到了很多数学推论和实验模型,本书的中文版甚至单独配了一个习题册,来帮助读者理解、巩固书中的概念。本次解读也将只介绍书中的核心思想,如果你对因果推断感兴趣,或者想更了解更多作者理论模型的细节内容,强烈建议阅读原书。
我们本次解读,将围绕作者所提出的一个核心概念,叫做因果关系之梯,梯就是梯子的梯。这个梯子中包含了作者认为因果推断的三个层次,分别叫关联、干预和反事实。这些概念你现在听起来可能感到迷惑,不过没关系,我们的讲解将对应这三个部分,分别介绍每一层级因果关系肢体的具体内涵,并将向你展示这些层次的因果推断思考方式会如何影响我们的决策和生活。
因果关系之梯的第一层名叫关联,简单来说就是找出不同变量之间的关系。这一层其典型的思考问题是,如果我观察到某一现象,那么会怎么样呢?比如感冒时我发热了,那我同时头痛的可能性有多大呢?
对于关联这个概念,我们可以用另一个咱们更熟悉的词来描述,那就是相关性。而在相关性的研究发展中,有两个人是绕不过去的,他们就是高尔顿和皮尔逊,这两人是师徒关系。英国学者高尔顿是进化论提出者达尔文的表弟,可能是受到了表哥的影响,高尔顿对人类学和统计分析的研究特别感兴趣。他曾经设计过一种装置,叫做高尔顿板,这种高尔顿板,你可能在一些抽奖游戏当中见过类似的。它是一块板子,上面按照三角形阵列插满了钉子,高尔顿板其实也可以说是一种钉板,在板子的顶部上有一个口,可以往里面放入小球。一旦小球进入到高尔顿板中,它就会从上往下逐层弹跳下来,最后落进底部的一排卡槽中。对单个小球来说,每一次碰到钉子,它向左或向右弹落的概率是随机的,如果你往高尔顿板里倒入很多小球,就会出现一个有趣的规律,在底部堆积的小球,越靠近中间的位置,小球堆积的就越多,两边逐渐减少,所有小球加起来,它们堆积的样子就像一个小山包。小球们的这种分布状态就叫做正态分布。
现如今我们都知道了,这种正态分布现象比比皆是,比如高尔顿收集的关于军队里新兵身高的数据,就符合正态分布,多数人是中等身材,特别高或特别矮的人很少。因为都符合同样的分布规律,一开始,高尔顿认为,这个钉板可以用来模拟人类的遗传规律,但问题也随之而来,如果把高尔顿板加长,也就是增加了钉子的数量,那么最后整个分布变得越来越扁,落在两边的小球数量也会逐渐增加。如果这个现象和现实世界的人类遗传规律相同,那么随着子孙代数的增加,会出现越来越多身高特别高或身高特别矮的人。事实上,我们也都知道,人类身高分布状况是相对稳定的,一个世纪前没有身高3米的人,现在依然没有。甚至高尔顿还发现一个规律,那些高个父亲的儿子,往往会比普通人高一点,但是却没有父亲高,同样的,矮个子男人的儿子,身高会比普通人矮一点,但是却没有他父亲矮。也就是说相对于父辈来说,儿子的身高会更普通一些,高尔顿管这种现象叫做向均值回归,均就是平均的均。不止在身高方面,现实生活中也有很多这种向均值回归的现象,比如在一些比赛中,会有评选出年度新秀,也就是第一个赛季表现最佳的新人球员,然而这些年度新秀在第二赛季可能表现就没那么好了。再比如我们常说的富不过三代,其实也是一种回归均值。
高尔顿一直试图找到回归均值的因果解释,而且很多人也在试图对类似的现象提出分析,比如新秀球员后续表现变得平庸,专家们就会解释,新秀过度自信了,或者这位新秀的打法被别人识破了之类的。再有富不过三代,有人就会说是家族的子孙们奢侈无度,或者不学无术,造成了财富的流失。然而本书作者指出,回归均值的过程并不需要一个因果推论,这种现象单凭概率规则就足以解释了。诺贝尔经济学奖得主丹尼尔·卡尼曼,在他的著作《思考,快与慢》中,曾提出一个著名的公式,成功等于天赋加运气,巨大的成功等于更多的天赋加更多的运气。天赋是个小概率事件,运气也是个小概率事件,一个人的身高很高,一方面是遗传因素,另一方面是因为他就是运气比较好,或者是成长环境比较好,而他的下一代遗传因素确实不错,但是环境变化了,或者运气变差了,于是身高就回落了。同样的,一个赢得年度最佳新秀的球员,的确比一般球员能力更强,但他能在同样有才华的一小撮新人中脱颖而出,一定也有很多的运气,而在第二个赛季,虽然他同样有实力,他可能就没有那么幸运了,于是他的表现就会下滑。
到1889年,高尔顿终于想通了这一点,他此时形成的观点是,并不是所有现象都有一个因果解释。在否定了因果性的绝对地位后,高尔顿开始收集更多的人体测量数据,包括身高、臂长、头部尺寸等等,他注意到,高个的人通常也有长度大于均值的前臂,显然不能说身高导致了臂长,只能说二者存在一定的相关关系,而这个所谓的相关性,也就是本书作者所提到的关联。套用咱们刚开始提到的表达形式,也就是说,观察到一个人是高个子后,他手臂比较长的概率也很大。
如果说高尔顿开启了相关性的研究,那么他的学生卡尔·皮尔逊更加极端,他甚至想将因果关系从统计学中彻底抹去。皮尔逊甚至认为,世间的关系都是相关关系,根本没有因果关系。经过几十年的发展,皮尔逊积累起巨大的影响力,1901年,他创办了一本名为《生物统计学》的期刊,这本期刊目前在统计学领域仍然极具权威性。1903年,皮尔逊在伦敦大学学院创办了计量生物学实验室,一度成为了统计学世界的中心。此时的皮尔逊对相关性的研究也越发狂热,甚至开始打压与他意见不同的学派,按照他当时同事的回忆,皮尔逊要求同事表示百分之百的忠诚,并且曾迫使异议人士离开。
然而,这个皮尔逊渴望建立的相关性科学帝国,还是出现了裂痕。首先,发现显然不合理的相关关系比较容易,比如有人发现,一个国家的人均巧克力消费量,和该国诺贝尔奖得主的人数之间存在强相关,这种相关性显然没什么道理,因为吃巧克力越多,并不能让我们得到更多的诺贝尔奖。按照皮尔逊的说法,这类相关性是一种伪相关,没什么科学意义。但是只要我们稍微思考一下,会发现巧克力与诺贝尔奖之间似乎也可以建立起联系,那就是国家越是富裕,巧克力的消耗相对更多,而富裕国家的科研水平自然会更高,因此获得诺贝尔奖的学者也就越多。显然,这是一个因果解释。对皮尔逊来说,他坚决抵制这样的推论,因为他认为因果关系只是一种迷信。正是因为如此的固执,皮尔逊在很多类似的伪相关问题上,并不能给出很好的解释,以至于他原本的一些追随者,开始与他分道扬镳。
而为了解决这种伪相关问题,我们要爬到因果关系之梯的第二层。因果关系之梯的第二层叫做干预,这个概念的意思就是说,如果采取行动,将会产生怎样的影响,比如如果我吃了阿司匹林,头痛能治愈吗?而在采取行动之前,也就是做出干预之前,我们首先要做的就是排除混杂因子的影响。混杂因子是指,那些可以同时对因和果产生影响的因素。在一些伪相关例子的分析中,皮尔逊犯主要的错误,就是忽视了混杂因子的存在。比如在巧克力与诺贝尔奖的故事中,国家经济状况就是一个混杂因子,它同时影响了巧克力消耗和获得诺贝尔奖这两个方面。类似的例子还有,有人发现,在某些年份里,英国的死亡率与由教堂主持婚礼的婚姻数量存在极高的相关性,也就是说,信徒们的婚礼数量越多,整个国家的死亡率就越高,难道上帝要惩罚婚姻幸福的信徒吗?显然不是,在这个例子中的混杂因子是时间因素,或者说是历史趋势,在这个时间段中,英国的死亡率和信教的人数同时在上升,因此这两方面看上去有很强的相关性。
从这些例子可以看出,混杂因子对于因果关系的推断至关重要,特别是学者们在设计一些药物实验时,要尽可能控制混杂因子,才能保证所得到的结论具有说服力。比如,作者提到了一个很有名的悖论,叫做辛普森医生悖论。有一名叫做辛普森的医生,想测试一种防治心脏病的新药,他惊讶地发现,评测结果显示,这种药对男性有害,对女性也有害,但对全人类却有益,这可能吗?让我们来简化一下辛普森医生发现的问题,这个新药测试把患者分成了两组,一个是吃药组,一个是没吃药组,也就是对照组。在制药组中,有40名女性和20名男性,而对照组反过来,有40名男性和20名女性。在总人数上,两组是相同的,都是60人。在没吃药的对照组中,40名男性有12人发病,发病率30%,20名女性中一人发病,发病率是5%。在吃药组中,20名男性有八人发病,发病率40%,40名女性有三人发病,发病率是7.5%。此处涉及的数字有点多,所以我们再来总结一下,男性不吃药发病率是30%,吃了药发病率是40%,显然,药物对男性有害,而对于女性不吃药,发病率是5%,吃了药发病率是7.5%,所以它对女性也有害。就目前的数据看,显然这个药是失败的,对男女都没有好处。但是诡异的一幕出现了,当我们把全部数据加在一起时,会发现在没吃药的60人里,得病的总数是13人,发病率是22%,而吃药的60人中,发病的有11人,发病率是18%,也就是说吃药后发病率降低了,从全体人类的角度看,这个药是有效果的。
你也许会感到惊讶,我们在文稿中把这些数字列了出来,你可以自己计算一下,发现确实如此,这个药对男人不利,对女人不利,但却对全人类有益。如果你掌握了混杂因子的概念,也许就能发现问题的所在,那就是性别因素是一种混杂因子,同时影响了分组和疗效,应该排除掉混杂因子的存在,造成了很多类似的辛普森医生悖论。也正因为混杂因子对实验结果的影响太大,很多研究者走向了另一个极端,他们会误认为所控制的变量数量越多越好,以至于在各种研究报告中,我们经常能看到,研究者会做一个很长的表格,列出了所控制的变量,包括性别、年龄、民族、身高、体重、地区分布、饮食习惯等等。但是本书作者认为,这种做法既浪费资源,又容易出现纰漏,因为很可能一不小心,就把真正想测量的因素也限制了。
那有没有更好的方法,能避开混杂因子的影响呢?当然有,那就是随机控制变量法。让我们用一个农业方面的例子,来讲解一下这种方法。假如农民们想知道,A肥料是不是比B肥料效果更好,那该怎么办呢?也许你会觉得这还不容易,找两块地,这块用A肥料,那块用B肥料,收获时看哪边产量高不就可以了?但事情没这么简单,肥料的效应与很多其他的因素混合在了一起,比如土壤、水源、种子、气候等等,可能左边的地块比右边原本肥力就好,或者右边的更靠近水源,甚至播种的先后顺序等等,这些因素都会影响庄稼的产量。1923年,一名名叫费舍尔的英国学者,设计了一套方法,来试图解决验证肥料作用的问题,这种方法就是随机控制变量实验。正如名字所示,费舍尔的核心思路就是设计随机的实验,他的做法大体是,将一块土地分成很多小区域,然后在所有的小区域中随机分配肥料,测试它们对植物生长的影响,这个过程作为一次实验,然后他将这种实验反复做很多次,每一次都重新随机分配肥料的对应区域,所以有时你会比较倒霉,把A肥料全部用在了贫瘠区域,有时你也可能比较走运,把它们都用在了最肥沃的土地上,但是随着实验做的次数越多,比如做100次,每一次实验都会产生一个新的随机分配,这就保证了在大部分的时间里,你既不是特别幸运,也不是特别倒霉,这样你就可以排除土地、水源等其他因素的影响,而聚焦到A肥料与B肥料的效果分析上。
从我们现在的角度来看,随机实验似乎是顺理成章的,但在当时,费舍尔的这一想法确实具有突破性。这种设计的巧妙之处在于,所有可能对肥料效果产生影响的因素,都在多次的随机过程中相互抵消掉了。虽然随机化可以消除混杂因子带来的偏差,但很多时候我们却无法做出这种随机实验。比如在研究肥胖对心脏病的影响时,我们不可能随机安排患者吃胖或者减肥,再比如在研究吸烟与肺癌的关系时,我们也不可能随机找出一组人,让他们抽上10年香烟。总之,现实世界中,遇到这种无法进行人为干预的问题时,我们就要动用来自因果关系之梯第三层的能力了。
因果关系之梯的第三层名叫反事实,凡是相反的,就是说如果某事没发生,那会产生怎样的结果呢?这个层级中典型的思考问题,例如,如果我三天前没吃阿司匹林,我的头疼还会好吗?在进行反事实思考时,我们没法进行直接的观察或者干预,我们不可能穿越回三天前,阻止那个吃药的自己,在穿越回三天后看头疼是否消失,所以对反事实的思考只能发生在大脑中,去推断事件背后的运行机制。因此,反事实的提问可以换一种说法,就是问出“为什么”,如果我没吃阿司匹林,头疼还会好吗?这个问题其实就是在问,为什么阿司匹林能治好头痛。作者认为这种反事实的思考方式,是人类社会能够不断发展的关键所在。
反事实思考的关键之一就是找到中介因素,所谓的中介因素,简单理解的话就是A导致B,B导致C,那么B就是中介因素。为了强调中介因素的重要性,作者在书中提到了一个真实的历史案例。随着哥伦布发现新大陆,人类开始了大航海时代,然而,长期漂泊在海上的水手们,却被一种可怕的疾病所困扰,那就是坏血病。1500年至1800年间,大约有200万名水手因此丧命,直到1747年,一名名叫詹姆斯·林德的英国海军医生发现,食用柑橘类水果可以治疗坏血病。到了19世纪,英国海军就规定,所有的船只都必须携带充足的柑橘才能出海,所以坏血病似乎已经告一段落。然而一个世纪后,当英国人开始在南北极地区探险时,这个本已经进入历史的疾病,却忽然卷土重来了,至少有四支极地探险队中出现了坏血病。1903年,在著名的斯科特南极探险队中,有五名到达了南极的队员死在了那里,其中两人的死因极有可能是坏血病。为什么会发生这样的悲剧?因为医生们并没有真正理解,柑橘是如何预防坏血病的,换言之,他们不了解那个中介因素是什么。从大航海时代开始,人们以为柑橘类水果能预防坏血病的,很可能是因为里面有酸性物质,基于这个因果推断,医生会认为任何酸的东西都能预防坏血病。起初,水手吃的是西班牙柠檬,之后人们开始用价格更便宜的西印度酸橙,作为替代品,这种酸橙跟西班牙柠檬一样酸,但维生素C的含量却只有1/4。更糟糕的是,有些人开始烹煮来提纯果汁,以方便存储和运输,然而,高温会破坏原本就已经含量不高的维生素C。总之,这种种做法加快了中介因素的失效啊。1875年,在北极的探险队员发现喝了酸果汁,却还是得了坏血病时,医生们十分困惑,他们甚至将责任推到了罐头肉的头上,认为腌肉中的细菌是坏血病的病因。经过长时间的迷茫,直到1912年,波兰化学家卡西米尔·冯克提出了维生素的存在,1930年,匈牙利生理学家圣吉尔吉分离出了维生素C,人们才找到了预防坏血病的关键,圣吉尔吉还因为这一发现而获得了诺贝尔奖。此时人们才算理清了这条因果关系,那就是柑橘类水果提供维生素C,维生素C防治坏血病。而确定了中介因素后,我们就能采取更多的行动来影响结果,比如,如果船员的柑橘吃没了,就可以找其他含有维生素C的食物,对抗坏血病。
当然,中介因素不仅仅指作用机理,它还有更复杂的内涵,比如,当A导致B,A和B共同作用导致C时,此时这个中介因素B的存在,会让我们对问题的分析出现偏差。这里有一个具体的例子,在一家公司中,员工的学历和工作经历,共同决定了他的薪水,如果小张是本科学历,5年工作经验,年薪是10万,那么如果小张是硕士学历,他工资该有多少?我们不可能让小张时空穿越,重新考研,再来应聘这家公司,所以,这就成了一个典型的反事实问题。如果这个问题交给你,你会怎么分析呢?也许你会想到先建立一个公式,员工薪水等于系数A乘以学历,加系数B乘以工作经验,其中学历的信息可以进行数字化,比如本科学历就是一,研究生是二,博士是三。为了得到两个系数A和B,你再去查找小张同事们的信息,比如把小王、小李、小赵,他们的学历和工作年限,都收集汇总起来,经过简单的计算,就能找到系数A和B的值,然后把公式中小张的学历换为研究生,就能得到这种假设情况下他的薪水了。这种方法叫做回归分析,是一种常见的数学分析方法。乍一看没毛病,但作者指出,这样的分析却有着本质的缺陷,那就是这种分析是数据驱动的,因此往往忽视了因果推断。如果更加仔细的分析薪水的问题,我们会发现一个关键因素,那就是工作经验。在这个案例中,工作经验与学历影响薪水,但工作经验同样取决于学历,因为拥有更高学历的员工,往往花了更长时间去接受教育,如此一来,在年龄相同的情况下,他们的工作年数就会相应缩短,所以工作经验是一个中介因素。在这个例子中的具体表现就是,假如小张是研究生学历,那他的工作经验将减少两到3年,在建立公式时,需要把这一项修正考虑进去。因为这个例子中的因果模型和回归计算都很简单,所以这种中介因素的分析看似有些脑筋急转弯的意思,但在本质上,这是两种完全不同的分析体系。按照作者的话说,回归分析法是停留在了因果关系之梯的第一层,只是观察了数据的特点,而考虑到中介因素,并理清了其中的关系后,才算做到了真正的因果推断,也就是达到了因果关系之梯的第三层。
经过攀爬三层因果关系之梯,现在我们终于学会了,如何建立起正确的因果模型,并做出因果推断。最后,让我们再来谈谈因果推断这一学科的发展,能给全人类带来怎样的好处。作者认为,只有有了因果模型做基础,我们才能解决人类发展中的一些重大问题,比如实现真正的人工智能,或者叫强人工智能。所谓的强人工智能,是指与人类具有同等智慧,甚至超越人类的智能。作为人工智能领域的泰斗级人物,作者也一直在思考,如何构建这种强人工智能。近些年,以深度学习等技术为代表的人工智能技术,在很多领域取得了出色表现,比如阿尔法狗在围棋项目上击败了人类选手,但作者指出,目前的这些技术,都只是依靠海量数据的训练,所以他们只停留在因果关系之梯的第一层级。要想实现强人工智能,必须要让机器理解因果模型,从而他们才能像人类一样思考,他们甚至可以反思自己的错误,并进行自我完善。
当然,不仅是人工智能领域,作者认为,当今的很多科学研究,被束缚在了统计学的框架里,他们的研究很多都只是涉及到了相关性,也就是因果关系之梯的第一层。通过构建因果模型,可以让科学家们更好地理解数据之间的如何作用,从而让他们真正的回答一个又一个“为什么”。作者坚信,因果革命将带来整个科学界的转变,从而让科学更加繁荣发展。
好,《为什么》这本书就为你解读到这儿,听书笔记在音频下方,我们明天见。
"感谢喜欢,赞赏支持是对我的鼓励。"
很赞哦! (0)
上一篇: 《太空居民》
下一篇: 《我们如何走到今天》