您现在的位置是:网站首页>励志励志

《人人都在说谎》 以数据棱镜刺破虚伪表象,在群体谎言的褶皱里窥见真实人性的暗涌与

铛铛铃2025-08-30励志16人已围观

简介

今天我们继续来解读《人人都在说谎》。

在解读这本书之前,我们先来看一下这本书当中的一个有趣的实验。一名女子在谷歌上打出了一个问题:“我老公是不是……”,他最有可能搜的问题是什么呢?大多数人很容易凭直觉猜测,他搜索的很可能是“我老公是不是出轨了”。但是这本书告诉我们,实际上他最有可能问的问题是“我老公是不是同性恋”。这个问题的搜索量,比“我老公是不是出轨了”的搜索量高出了10%。这个结果是不是让你有些惊讶呢?

在《人人都在说谎》这本书当中,类似挑战我们直觉的例子比比皆是。因为大多数人都会放大自我的感受,以个体的经验来推测群体的想法,而恰恰在这种推导的过程当中容易产生谬误。这个时候,大数据的作用就体现出来了,它能帮我们更多地了解我们的真实想法,而不是受到自我感受或是情绪的影响。

这本书的作者名字有些长,叫塞斯·斯蒂芬·斯达维多维茨。他曾经担任谷歌大数据科学家,因此在书中引用了不少谷歌内部利用大数据进行社会学研究的例子。作者通过这本书,为我们挖掘出了大数据的真正价值,告诉我们大数据分析是如何增进我们对这个世界的理解。离开谷歌之后,他为《纽约时报》撰写大数据专栏,是这一领域的资深研究者。

大数据、人工智能和自动化,是当下最受关注的三大科技热点。利用大数据分析来了解普通人的喜好,了解真实的世界到底是怎样运行,是科技推动认知发展的全新研究领域。大数据研究也正在颠覆许多人类常识的认知。随着未来可以搜集的大数据越来越多,颗粒度越来越细,大数据可以揭示的真实世界会更多。

接下来,就让我们一起走进这本《人人都在说谎》,共同寻找大数据的奥秘吧。所谓的大数据,简单来说就是能够涵盖海量信息的数据集,它能够帮助我们更好地了解所在的世界。

第一部分的内容,我们就来了解一下,在作者看来,大数据的价值体现在哪里。在以前,人们要研究一个什么东西,都必须专门去调查,收集数据过程费时费力。可是网络数据就不一样了,不仅数量巨大,随便你用,更重要的是可以开发出新的数据类型,让我们从新的角度去理解事物和解决问题,这就是网络数据的第一个价值。

就拿数据巨头谷歌公司来说吧,谷歌的工程师开发了一款叫做谷歌相关的搜索工具,通过挖掘和分析大量的搜索数据,分析出某个关键字的搜索趋势,揭示以往发现不了的深层规律。比如说,我们可以利用搜索关键字预测失业率的变化。大家可能觉得,失业率越高,人们肯定越着急找工作,对不对?但事实并非如此。本书作者研究了2004年到2011年谷歌搜索数据,他发现失业率高的时候,美国人搜索最多的不是招聘信息,而是休闲游戏和成人影片。这想想也对,毕竟失业的人除了找工作,大多数时间都待在家里无所事事,总得找点什么打发时间吧。利用这个规律,我们就能迅速判断当前就业率和经济的大致情况。

除了搜索关键字以外,网络数据还可以来源于数字,很多企业就会根据销售数字来制定业务发展策略。比如美国零售业巨头沃尔玛,通过分析过往的产品销量和天气记录,发现了一个神秘的联系:每次刮台风,超市里最好卖的商品不是瓶装水和方便面,而是草莓味的果冻蛋挞。也许是因为果冻蛋挞不用加热就能直接吃,可是为什么是草莓味,而不是其他味道呢?这恐怕没人清楚了。不过原因都不重要,沃尔玛只要在天气预报台风到来之前,确保货架上囤满草莓味的果冻蛋挞就行了。而事实证明,这些蛋挞果然十分畅销。

还有日常生活当中随处可见的东西,一旦拍成照片传到网上,也能作为大数据来使用。美国一家大数据公司,就通过一些生活现象来分析经济景气度和通货膨胀率。例如,在美国,每当在经济不景气时,口红的销量反而会直线上升。这是因为人们认为,口红是一种比较廉价的奢侈品,在经济不景气的情况下,人们仍然会有强烈的消费欲望,所以会转而购买比较廉价的奢侈品。口红作为一种廉价的非必要之物,可以对消费者起到一种安慰的作用。通过分析口红效应,公司就能实时分析宏观经济动态,他们甚至正确预测了中国2011年通货紧缩和2012年的通货膨胀。

总之,大数据给我们提供了看待问题的新角度,让我们更了解周围的世界,这就是大数据的价值所在。

上面的内容我们了解了大数据的价值是什么。其实用《人人都在说谎》作为标题,作者的目的是在陈述一个事实:无论是有意还是无心,每个人都可能说谎。无论是调研的结果,还是人们的直觉,甚至是许多人相信的常识,都不一定能反映真实的世界。而大数据研究恰恰可以戳穿各式各样的谎言。

第二部分的内容,我们就来了解一下,大数据是如何戳穿那些人人都在说的谎言的。在过去,人们的认知里,总以为市场调研的数据可信,但如果你用调研的方式去了解每个人的想法,每个人都可能说谎,因为人们没有动力在调研中提供真实的想法。一个明显的例子就是,为什么美国2016年总统大选的民意调查那么不靠谱。在大选前一天,希拉里还领先特朗普好几个百分点,可大选的结果却是特朗普获胜。作者对此解释说,美国人不真实的回答,可能导致川普的支持率少报了至少两个百分点。因为不少特朗普的支持者并不愿意在接受民调的时候说出自己的真实想法。社会学中将这种行为称作社会期望偏差,也就是人们会把自己非主流的想法藏起来,担心自己的想法跟别人不一样而遭到歧视。美国选民对待特朗普的态度,就凸显了这种偏差。这些地下的特朗普支持者觉得,主流民意把特朗普包装成一个大嘴巴的笨蛋,自己如果公开对他支持,就可能会被别人嘲笑,因此选择在人前隐藏自己的想法。

类似的偏差很多,比如说一些人明明心里存在性别歧视,但是如果别人问起来,他会说自己支持男女平等。像谷歌工程师公然在内部邮件里鼓吹男性比女性更适合当软件工程师的案例凤毛麟角,非常少。无论是出于社会压力,还是希望表现得政治上正确,调研其实无法发现很多隐藏着的性别歧视者,这就是社会期望偏差在起作用。

那么,大数据如何发现人们在说谎呢?答案就是观察人们在互联网上的行为,就能更好地反映他们的倾向。说回2016年美国总统大选,其实仅仅对搜索信息做一个梳理,也能发现特朗普获胜的苗头。比如说在特朗普逆袭的美国中西部几个州,这几个州的选前民调数据显示,都是希拉里的支持率要更高,希拉里因此也没有在这里投入多少精力。但是谷歌的搜索就显示,在这些区域搜“特朗普 希拉里”的人数多于搜“希拉里 特朗普”的人。显然,如果你倾向于投票给谁,就可能把谁的名字放在前面。

除了在大选中预测民意,大数据分析还能挑战一些常识,推翻我们固有的认知。看到一个问题时,我们经常用直觉去判断,但是大数据告诉我们,很多直觉不靠谱。先举一个美国吃瓜群众的常识,很多美国人认为穷人更容易入选NBA,也就是美国男子职业篮球联赛,特别是黑人的孩子。因为在NBA球员里,黑人的比例非常大。这种传统的想法认为,NBA给了穷人家的孩子一条出人头地的出路,因此穷人家的孩子会特别努力,肯吃苦,而中产家庭的孩子缺乏这样的努力与吃苦精神。现在是这样吗?对过去几十年所有NBA选手的家世背景的大数据分析显示,恰恰是中产家庭的孩子更有可能参加NBA选秀。因为首先NBA需要个子高的球员,而家境比较好的孩子更容易长高,那些吃救济单亲家庭的孩子很可能成长阶段营养不够,不容易长高。其次,NBA不仅需要高个子和体能,也需要团队配合能力,需要比较高的情商,而美国的穷人很可能生长在单亲家庭,缺乏情商教育,不合群。现实很残酷,吃瓜群众对苦孩子能吃苦、更努力的一厢情愿,在大数据面前不堪一击。

所以个人的直觉、传统的调研、大众的常识,在大数据时代都可能被证明并不是真实世界的反应。大数据分析可以给我们带来的洞察,让我们能了解这个世界到底在怎样运作,比传统的方法要有效很多。

了解了大数据是如何戳穿人们的谎言的,我们明白了,大数据分析可以让我们更好地了解每一个个体。但是作者又说了,利用大数据来做各种各样的私人定制,并不完全有利于社会发展。最后一部分的内容,我们就来了解一下,作者为什么会认为用大数据分析来了解每一个个体不一定是一件好事呢?

其实自从大数据产生第一天起,对大数据被滥用的风险,以及在数字时代如何保护个人的隐私,就不断地被各方提醒。作者告诉我们,利用大数据研究来预测未来,一旦涉及到特定的个人的时候,一定要慎之又慎。在书中就举了这样一个可能造福所有人的例子,在未来医学的发展当中,有一个重要发展领域,就是通过大数据找到一个病史记录上跟你的身体信息类似的人,比如说血脂和血糖水平、家族心血管疾病病史,当然也包括特定的基因等等。这么做的好处很多,医生可以根据你的数据分身的病史记录,预测你未来接受治疗的反应,并可能提出更稳妥的诊疗方案,真正做到医疗的私人定制,这在大数据时代很快就能成为可能。作者把这定义为每个人的数据分身,或者说数据影子。因为现代医药测试仍然是统计学上的数字,也就是某种药物对某种病情的治疗效果在统计学意义上有效,对于一个比较大的群体是管用的,但是这些对不同的人并不一定有效,甚至有时候会有负面的作用,因为每个人的其他体征千差万别,对药物的反应也会不同。这样从病史记录上找到你的数字分身,就可以知道他的身体对特定药物和特定医疗方法的反应,医生也就可以根据这一点来推荐更适合你的诊疗方案。同样,你的数字分身在治疗过程当中的各种表现,以及病情发展的记录,也可以帮助医生判断你的病情发展,尝试使用更新的药物和科技手段来治疗。

从大数据分析发展的角度来看,找到每个人的数据分身会越来越容易,但是是否应该允许在各个行业都能轻易使用你的数据分身,却需要特别慎重。比如如果允许在保险业里找到你的数据分身,也就是找到跟你的风险喜好相同的人,保险公司就能更好地判断你能够承受多高的保费,因此定价也就更精准,宰你也就更没有商量。同样,赌场也非常想找一个人的痛点在哪里,赌场的所谓痛点就是到底多大损失会让一个赌徒元气大伤,从而立志戒赌。每个人的痛点都不同,赌场非常想在每个赌徒越过痛点之前打住,比如免费邀请吃大餐,或者免费升级住豪华套餐,保证每个赌徒还能成为回头客。大数据分析就非常容易帮助赌场去分析你的数据分身,推断出你的痛点,让你对赌博欲罢不能。

所以私人定制的大数据分析,优点和问题都非常明显。但是大数据被滥用的最大风险恰恰是依赖大数据模型去判断具体个人的行为,并侵犯个人权益。所以大数据让私人定制成为可能,这会带来巨大的福利,但是也暴露出极大的风险。未来无论消费还是医疗,大数据分析都能提供根据个人特点的定制化服务,不过这种大数据分析需要有严格的监控,不然非常容易被用于牟取暴利。

到这里,这本《人人都在说谎》的重点部分内容就讲完了。我们最后再来总结一下:

第一,带着问题去利用大数据解答,常常会得出一些反常识的答案,大数据分析可以更好地帮助你洞察这个世界到底怎样运作。

第二,大数据研究能告诉你一个更真实的世界,这是我们做出正确决策的第一步。

第三,大数据的私人定制能够带来开创性的研究,但也可能严重侵犯隐私,并成为无良企业的摇钱树。

斯蒂芬·斯达维多维茨并不属于那些个不假思索就为大数据革命摇旗呐喊的人。我们在感叹科技的进步同时,也需要了解科技的两面性。大数据研究本身是中性的,但是怎么去使用,尤其涉及到预测个人行为的时候,一定要慎重,不然我们很容易会陷入到一个透明人的危险境地。想象一下,如果每个人的一举一动都可以被预测,那会是怎样的世界呢?

作者说自己在大学毕业时读了《魔鬼经济学》,发现运用好奇心、创造力和数据,就能极大地提升我们对这个世界的认知,于是立志要从数据的海洋当中找出现实世界到底如何运作的真相。希望听众朋友们听完今天的解读,也能够开始用好奇心去打量我们所处的世界,依靠大数据来挖掘更多真相。

好了,今天就分享到这里,感谢聆听,我是泥巴,下期读书会我们再来继续一起解读精品好书,记得收听哦。



"感谢喜欢,赞赏支持是对我的鼓励。"

微信收款码   微信收款码

很赞哦! (0)

发表评论

本栏推荐