您现在的位置是:网站首页>科普科普

《信息简史》

铛铛铃2025-09-14科普1人已围观

简介

今天为你解读的书是《信息简史》。

本书的作者是美国《纽约时报》的记者兼编辑詹姆斯·格雷克,他也是著名的科普作家,其科普读物拥有百万数量级的销量。《信息简史》的英文书名直接翻译是“信息:它的历史,它的理论和它掀起的洪波”。根据书名,今天的解读也分三个部分,先说信息的历史,然后介绍香农创立的信息论,最后讲信息带来的冲击。

我们先从信息的历史说起。信息有个特点,只有通过传播才能为大众所感知。因此,格雷克讲信息的历史,实质是信息传播工具发展的历史。

传播信息的工具,要从会说话的非洲鼓讲起。欧洲人很晚才进入撒哈拉沙漠以南的非洲,那时这些非洲部落还过着原始人的生活,以狩猎为生,没有文字,但是部落里总会有一个鼓。它用整段木头雕成,大约有一米多长。早期这些鼓用来传递一些简单的信息,例如有敌人来袭、请求邻村的支援、通知部落聚集,在作战时传达进攻或撤退的命令等。后来鼓声表示的内容慢慢丰富起来。有一个叫罗杰·克拉克的传教士,记下了一段号召村民参加葬礼的鼓声,并译出了鼓声的含义:“在黎明时分,我们不要集结去劳作,我们要在河边举行聚会。”他还注意到,虽然只有一部分人知道怎样用鼓声来沟通,但几乎所有的人都能够理解鼓声的含义。虽然鼓手的节奏快慢会有不同,但是不妨碍他们表达同一个意思。只需要一个钟头,信息就可以传到一二百公里外。

传播信息的第二个工具是文字。今天流传的古希腊文化,很大程度上得益于荷马史诗。荷马史诗是荷马根据民间的口头传说整理而成的。那么,为什么不将语言作为信息传播的工具呢?书中解释道,语言不是一种技术,无论多么成熟、多么发达的语言,都不能被视作心外之物,因为语言是心智本身的功能。但是文字是一种外在的符号,它似乎要将知识从人那里抽离出来,将他们的记忆存储在别处。这里传达了信息传播工具的一个特点,它是独立于心智的,也就是说,传播工具本身不带情感、立场和认识。文字使得信息的传播突破了时间与空间的局限,然而也带来了新的问题。柏拉图担心地说,文字会带来僵化。这种僵化可以从两个方面来理解,首先文字让口语所带的情感消失了,其次是文字的复制会产生差错,造成信息得不到正确的传播。为了避免后一种情形的发生,逻辑与词典应运而生。逻辑诞生的本意是让思维变得严谨,并保证正确性,这同时使得传播思想的文字表述具有严谨性,为文字传播信息的正确性提供保障。例如,亚里士多德提出了逻辑学三段论,如果你发现亚里士多德的一段话不符合三段论,那一定存在印刷差错。为文字保驾护航的还有词典,书中提到,乡村教师罗伯特·考德里在1604年编的英语词典《字母排表》,考德里将书名起为《字母排表》,就是为了强调它的词典是按照字母顺序排列的,而当时流行的是按照单词的释义,如天、地、人、动物、植物等编排的。考德里的这种排列法,后来被称为词典排列法,它给不知道词义的读者提供了查询的方便。

从鼓声与文字,你是否感悟到信息传输的一些特征?它们可以传递同一个信息,但显然它们的表现是不同的,也就是说,信息在传递的过程一定是被调制过的,然后在接受信息的另一端得到复原。这种调制与复原现在叫做编码和解码。其次,信息在传输过程中难免会有差错,我们需要设计有效的手段来检测和纠正这些差错。非洲鼓声用冗余来消除差错,比如通知村民早上聚会,根据克拉克传教士的记载:“竟然用来在黎明时分,我们不要集结去劳作,我们要在河边举行聚会。”那么多的音符;而文字则用逻辑与词书来规范表述。

承载信息的第三个载体是机器计算,它与现在的计算机不是一回事。这里要提到19世纪的两个英国人,查尔斯·巴贝奇和艾达·拜伦。前者是数学家和发明家,曾担任剑桥大学三一学院的卢卡斯数学教授,那曾经是牛顿的教席,后者是洛夫莱斯伯爵的夫人、诗人拜伦的女儿、数学的狂热分子、世界上首位程序员。巴贝奇被聘为卢卡斯数学教授,并非他在数学上有什么出色的建树,而是因为他拯救了英国的数学。1810年,19岁的巴贝奇进入剑桥大学三一学院读书,但他很快失望了,他发现自己懂得比教授们还多。于是巴贝奇西渡英吉利海峡,到法国求学,并学到了欧洲大陆最前沿的数学,还立下了复兴英国数学的决心。后来他也确实做到了,与同学一起创立了解析社,引入莱布尼茨理论,推动英国数学研究的改革。18世纪,对数表在欧洲盛行,因为对数可以极大地降低计算的复杂度。巴贝奇设想造一台机器来制作对数表,并将这台机器称为差分机。在英国财政部的支持下,巴贝奇历经10年才造出了可以演示的样机,这台样机至今仍陈列在伦敦科学博物馆里。但就在这时,他与同伴发生了争执,而英国财政部也对巴贝奇的差分机失去了耐心,因此真正的差分机一直没有造出来。巴贝奇在家里定期举行沙龙,出席的有英国政要、艺术家和科学家,达尔文、法拉第、狄更斯等都是座上客,艾达·拜伦就是在这种场合下认识了巴贝奇。其他来宾在看到这件精美仪器时的表情,我敢说就像一个野蛮人第一次看到大镜子或者听到枪声时的表情差不多,而拜伦小姐尽管年纪轻轻,却能懂得它的运行原理,并能看出它的美妙之处。一位与会者这样描述艾达见到演示机的反应。她与巴贝奇的交往让后者觉得遇到了知音。巴贝奇告诉艾达,他已经对差分机失去了兴趣,正在构思一种新的计算机,并称之为分析机,顾名思义,这种机器会思考。此后,艾达不但是巴贝奇智力上的同伴,还成了巴贝奇很多灵感的来源。即使艾达结婚生子后,还常常与巴贝奇通信,讨论机器计算机的问题。艾达说:“分析机与单纯的计算机器毫无共同基础,它意味一种新的、涵盖广泛的、强大的语言的发展。”她尝试用这种想法编了一个计算伯努利数的程序,其中用到了今天称为循环语句的思想。富有远见的艾达程序的原件一直到1953年才公开,人们首次读到艾达编写的程序,尊她为人类历史上第一个程序员。1980年,美国国防部提出了一种新的计算机语言,就称为艾达语言。虽说巴贝奇的差分机与分析机最后都没制造出来,但巴贝奇关于计算机的构思,特别是分析机,成为以后计算机的雏形,为此我们称它为零代计算机。零代计算机的贡献是让信息的存储和产生与计算机器挂上了钩。

传播信息的第四代载体是电报。18世纪,人们认识了电,也知晓电可以远距离传送。从那时开始,人们就想用电来传输信息。科学家知道,电从正极流向负极,并造出了安培计来检测电流方向。大数学家高斯是第一批利用安培计让电来传递信息的实验者,他用三根电线将传出端和接收端连接起来,这三根电线分别连接着电源的正极、负极和零极,用电键选择传出的是正电还是负电,接收端则是一个安培计,接收者观测安培计并将指针偏转的情况记录下来。高斯他们将指针偏转情况与字母做了一个对应规定,指针朝右动一次为A,联动两次表示I,而向左动一次为E,联动两次表示B,先右后左动两次表示O,先左后右动两次表示U等等。这种方式确实将安培计上指针的偏转与字母挂上了钩,实现了单词的远程传送,但是操作很不方便,每分钟大约可以传递三个字母。后来的电报采用的摩尔斯电码,它是由美国人摩尔斯和维尔发明的,根据电线接通的时间分别画出点和线,相当于现在的零和一。维尔发明了发报用的电键和接收端的自动记录设备,这样可以自动记录电报内容。摩尔斯将26个英文字母和0~9的十个数字根据在传输中出现的频率编制了摩尔斯电码,一个普通的操作员一分钟至少可以发送30个字母或数字。你是否注意到,在摩尔斯电码采用零和一两个数字,等价于现在的二进制数,这样的点和线表示在信号传递中完全取代了文字。电报促使了密码的诞生,例如AB发了一份电报,这两个人早就约定了一个数字三,二进制为一一,单词ask正确的摩尔斯代码是000100010110001011,但是发报人对这个二进制数加一一,发送的成了000111011001001110,接受方按照正常摩尔斯代码查到的是DVN,只有接受者事先知道三这个数,在摩尔斯代码表上朝后倒数三个字母,就得到了正确的报文,这个过程就称为加密,三这个数字称为密钥。出现加密是信息传递的一个重要的里程碑,它说明信息在传播过程的调制和恢复是可以定制的。

好,了解了信息传播的四代工具——鼓、文字、机器和电报,现在要说信息理论了。我们将介绍三位大师和他们对于信息理论的贡献。

第一个要讲的是美国人克劳德·艾尔伍德·香农,1916年出生,2001年逝世,一般认为他是信息论的创立者。1948年,香农出版了《通讯的数学原理》,这是第一本专门研究通信的书,书中描述了信息传输的过程,重要的是定义了信息的度量。1936年,香农从密歇根大学毕业,然后到麻省理工学院做研究生,具体工作是为工程学院院长布什操作微分分析机,这是一台百吨重的庞大机器,本质是机械装置,这台机器可以用来解微分方程,当你输入了参数后,机器可以描绘出微分方程解的曲线。这台机器的关键部件叫继电器,就是用电控制的开关。1937年,香农到贝尔实验室实习,对继电器做了深入的研究,他尝试将继电器的两种状态——断开和导通,与数字一和零相对应,然后尝试应用布尔代数对多个继电器连接结果进行分析。布尔代数出现在19世纪中叶,一直少有人问津,这些研究成了香农硕士论文的主要成果。鉴于香农的研究,他的导师建议香农到数学系攻读博士学位。尽管香农在数学系读博士,但是仍然与布什保持学术关系,他在给布什的一封信上描述了他对信息传输过程的研究,他说,几乎所有的通信系统都存在两个函数和两次变换,发送方要发送一个信息给接收方,即为函数小F,但是在发送的过程中,这个小F函数被转换成另一个大F函数,因此接受者收到的是大F,它通过一定的设置,相当于密钥,将这个大F转换成小F,从而完成精确的复制。香农指出,精确的复制很难实现,总会有失真,怎样估计和排除噪音是通信的重要任务。香农指出,加密通信实质就是人为的加入噪音,造成一般人无法复制。由于香农对密码工作的独特见解,在二次大战期间,香农被安排在位于纽约的贝尔实验室旧大楼工作,他的具体任务是分析美国总统罗斯福与英国首相丘吉尔之间通讯采用的加密系统的安全性。理论上任何密码都是可以破解的,但是必须掌握一定量的历史信息,从中分析出密钥。他发现,破解目前两位首脑之间的通信密码,至少要采样50次,而目前使用的随机密码在敌方还没有完成足够的采样前就更改了密钥,因此在当前的技术下是无法破解的。1945年,香农将关于密码的研究写成论文《密码学的数学理论》,这篇论文长期被美国列为机密文件,不予公开。

我们说是香农创立了信息论,关键在于他将熵引进到信息论,这两者是怎么联系上的呢?首先,信息论里的信息虽然与日常意义的信息有关,但是又不同,不应该将它们混淆。香农说,信息与不确定性相关,它是不确定性带来的。香农想到用熵来描述信息,熵原本是热力学中的一个概念,用来描述热做功的本领。那么如何用熵来描述信息呢?如果一个事件HN种可能的结果,出现这些结果的概率是已知的,分别是P1P2P3等,我们可以用公式计算出这个事件的熵。如果这个事件只有一个结果,那么N等于一,P1等于一,熵H等于零。如果事件有两个结果,它们出现的概率是一样的,也就是N等于二,P1等于P2等于0.5,计算出来熵等于一。进一步,事件还是只有两个结果,但它们出现的概率是不一样的,一个是1/4,另一个是3/4,这时可以算出熵大约等于0.811。香农将算出的结果用比特做单位,那么当N等于一时,这是确定事件熵为零比特;当存在两种结果,而出现两种结果的可能性是一样的时候,熵是一比特;当存在两种结果,而出现两种结果的可能性是不一样的时候,这时熵就小于一比特了。熵越大的事件,不确定性也越大,而信息是用来减少不确定性的,就是用来减少一个事件的熵。香农将熵引进到信息论,给出了具体的计算式子,制定的单位象征着信息论的建立。20世纪50年代,信息论曾经风靡一时,很多领域都在效仿信息论的做法,不过香农提醒大家,信息论本质是数学,尽管它可能对一些学科的发展有帮助,但绝不是可以简单照搬的。

我们要说的第二个人物是大名鼎鼎的阿兰·图灵,被称为计算机之父。图灵是英国人,1912年生,死于1954年。图灵于1938年在美国普林斯顿高级研究院获得博士学位,随后他回到英国剑桥大学。二次大战之际,他被英国政府招募,从事破译德军机要通信密码——恩尼格玛的工作。恩尼格玛是一台密码机,发报人按照正常拼写发报,机器根据设定自动地转成密文发出,因此连发报人都不知道发出的是什么东西,接受方只有用恩尼格玛收报,才能获取正确的情报。图灵在英国布莱切利庄园成功地破译了恩尼格玛,造了一台体积三立方米的机器,专门用来破译恩尼格玛。1943年,图灵乘坐伊丽莎白女王号游轮辗转到达美国,全凭他破译了密码,才能避开德国潜艇的攻击。在美国,图灵和香农经常在贝尔实验室的餐厅共进午餐,尽管两人都从事密码工作,一个是编密码,一个是破密码,但是因事关国家机密,他们从来没有谈论过密码的事儿,他们共同感兴趣的话题是计算机,当时称为电子大脑。在贝尔实验室的餐厅里,图灵和香农常常讨论编码问题,图灵介绍了他的机器程序,香农则考虑遗传继电器的编码,它们的共同点都是将一个具体现象映射到数里去。在贝尔实验室里,香农的最终结果是建立了密码学的代数方法,而在剑桥大学,图灵构造了逻辑上的图灵机一套计算机理论。尽管他没有造出计算机,但是今天他的机器无所不在。图灵构思这样的机器至少有指代符号和状态几个组件,他详细定义了这些组件的构造与运作模式,他将这个机器取名为U,是universal首字母,通用的意思。他论证了这台机器能够算出多项式方程的解,能够算出圆周率和自然对数的底数,他还论证了确实存在不可计算的数,而且极大多数的数是不可计算的。目前的计算机设计还没有跳出图灵机的框架。

第三个重要人物是美国人诺伯特·维纳。维纳生于1894年,1964年去世,幼年即以神童闻名,14岁从塔夫茨学院数学系本科毕业,18岁获哈佛大学哲学博士。哈佛大学毕业后,他远涉重洋赴欧洲求学,数学大师罗素、哈兰道和希尔伯特都指导过维纳。1919年,维纳回到麻省理工学院任教。二战期间,维纳是第一批被美国招募参加火炮控制的专家,他的主要工作是噪声处理,这项成果后来被称为维纳滤波。维纳与同事比奇洛将对火炮追踪敌机的行为称为伺服控制。维纳最著名的书是一本很薄的小册子《控制论或关于在动物和机器中控制和通信的科学》,1948年在美国与法国同时发行。这样一本难度系数很高的学术专著居然成为当年的畅销书。《控制论》这本书最核心的是负反馈原理,维纳认为,负反馈是动物与机器在控制行为中的基本规律。他指出,闭环控制系统不是根据目标完成控制的,而是根据现状与目标之间的偏差完成控制的。他设计的火炮控制就是依据这样的原理。维纳强调了这个偏差便是一种信息,信息用来降低盲目性。

最后我们说说信息掀起的洪波。第一波是遗传密码的破解。很早的时候,人们就发现了子女会像其父母,例如父亲很胖,他的女儿也很胖,大家会说父亲将胖遗传给了女儿,那么父亲的胖是通过什么形式传给女儿的呢?19世纪末,化学家知道了分子、离子,物理学家知道了电子、原子、中子,于是生物学家认为,生命也应该是由一种什么样的子组成的,他们提出,素子是生物体的基本粒子,女儿胖是因为父亲将胖素子传给女儿了。然而,生物学家一直没发现素子的存在。1910年,丹麦的植物学家约翰逊首次采用基因这个词,他解释说,基因未必是一种独立存在的物质,这意味着基因可以是一种信息。孟德尔是第一个证明基因存在的生物学家,他用黄色和绿色两种豌豆做试验,这两种豌豆可以杂交,但是杂交后代要么是黄色,要么是绿色,没有出现黄绿色的豌豆,他用的词叫遗传因子。他说,遗传因子不会混合,也不会扩散,它在遗传过程中是不变的。尽管孟德尔没有用基因这个名词,但是证实了存在那么一种东西,它在遗传中起着关键的作用。基因这个词的推广应该归功于薛定谔,他是著名的量子力学大师。薛定谔认同基因,但是他想不通这样一种微小的物质是如何去控制生物成长整个脚本的,他设想一定像摩尔斯电报一样,基因是通过组合来发挥作用的,于是编码进入了遗传的领域。19世纪末,人们发现了染色体,在细胞分裂的过程中,染色体也分裂得以复制,因此有理由认为,带有遗传作用的基因存在于染色体中。20世纪50年代,奥地利生物学家夸斯特勒和他的同事提出,一条染色体就是一条经过线性编码的指令带,整条染色体就是一条讯息,它决定生物成长各个阶段的状况。请注意线性这个词,线性是指有一定次序而且互不交叉。1953年,生物学家詹姆斯·沃森和弗朗西斯·克里克在《自然》杂志上发文,声称他们找到了基因。人们早就知道染色体有四种成分,其中蛋白质与DNA是重要成分,在否定了蛋白质可能带有基因之后,沃森和克里克确信基因应该隐藏在DNA中。当时化学家已经发现,DNA是由一种更小的核苷酸组成的,每个核苷酸带有一种碱基,而碱基只有ACGT 4种。沃森和克里克发现,DNA具有双螺旋结构,两条链相互缠绕但不相交,之间有碱基连接。他们在《自然》上发表了仅有一页的论文,宣布了他们的发现,并预言:“我们设想这种碱基配对形式直接预示了遗传物质一种可能的复制机制。”在随后的一篇论文中,他们判断很有可能碱基的精确序列承载着遗传信息的编码,这两人因此获得了诺贝尔奖。现在可以回答父亲与女儿都胖的问题了,现在人们普遍接受这样一种说法,遗传是通过基因实现的,基因则是隐藏在染色体内的一组碱基的编码,女儿之所以胖,是因为父亲将肥胖的基因通过受精卵传给了女儿。在这个意义上,遗传只是一个信息传递过程,关于生物体完整的描述,都已经写在了受精卵里了。

第二波和第三波是对文化发展和对随机理论的冲击。信息科学对于文化发展的冲击,可以理解为生物学的基因理论在社会文化传承中得到复制。1970年,英国生物学家道金斯出版了一本书,书名是《自私的基因》,基因的英文是GENE,书中模仿GENE生造了一个单词MEME,中文将它翻译成模因,模因学说也称文化进化论。他认为文化发展也是传承的,就像生物的遗传一样,代替基因的是模因,它寄生于人类的大脑中得以传承。如果说身高胖瘦、眼睛大小是基因的表现,那么影视流行与思想、社会行为就是模因的具体表现了。如果说基因是生物信息的载体,遗传是生物信息的传递,那么模因就是文化信息的载体,社会形态发展根源是文化信息的传递。

随机理论的奠基者是苏联的数学家科尔莫哥洛夫,科尔莫哥洛夫丰富了香农的研究,学术界将他的贡献称为算法信息论。科尔莫哥洛夫认为信息的来源有三个途径,基于组合、基于概率和基于算法。基于组合和基于概率的来源香农都说过了,而基于算法的信息是科尔莫哥洛夫首次提出来的。计算出一个数要依靠程序,有的程序简单,有的复杂,因此科尔莫哥洛夫在算法信息论里定义了复杂度,它与程序的复杂程度成正比,与这个数带有的信息量成正比。有的数可以用较短的算法计算出来,而有的数不行,不能用简短算法计算的数称为随机数,随机数有更大的不确定性,也就是说它的熵更大。

洪波一阵又一阵,洪波过去,已经到了互联网一统世界的年代,历尽洪波的世界是怎么样的呢?第一个现象是信息泛滥,人造了无数多的信息仓库,而且信息的持久性和遗忘的困难性给信息仓库的管理带来了莫大的混乱。一个典型的例子就是维基百科,人人都可以是作家,人人都可以当编辑,你在维基百科里检索背包,可以找到很多解释,常常无法判别哪个解释是你需要的,也无法断定你认为需要的那个解释是正确的。对此,维基的主持人认为,危机不是指并且他们的时间也不为我们所有,我们不能说干嘛让雇员做这些无用功,他们并没有碍着什么,就由他们写去吧。这个现象可以叫做信息大爆炸,大爆炸使得信息熵增大,权威性丧失和混乱的增剧。

洪波过后的第二个现象是存储技术的飞速发展,香农曾经估算过,美国国会图书馆藏有的资料信息量约为十泰字节,现在这个图书馆还收集数字资料,到20102月,资料的信息量已经达到160泰字节,是香农时代的16倍。就是说,应用现代信息存储设备,在图书馆没有扩建的情况下,资料数增大了16倍。现在更发明了云端技术,人们不知道云在哪里,却可以将信息存储在云里,其容量甚至无法估量。尽管每天都有新的信息产生,那么宇宙会不会被信息撑破呢?麻省理工学院的一位工程师塞斯·劳埃德做过一项研究,他说,宇宙是一部巨大的量子计算机,其存在本身就是记录着信息,在自身达到演化过程不断地处理着信息。作者在结束全书时引用了这段话,是想安慰大家,放心吧,可爱的人类,一切都在把控之中,没事儿的。

好,《信息简史》这本书就为您解读到这里。



"感谢喜欢,赞赏支持是对我的鼓励。"

微信收款码   微信收款码

很赞哦! (0)

上一篇: 《芯片战争》

下一篇: 《一网打尽》

发表评论

本栏推荐