跳到主要内容

2 篇博文 含有标签「book-review」

查看所有标签

无限机器:戴密斯·哈萨比斯如何缔造 DeepMind 并追寻 AGI

· 阅读需 185 分钟
Tian Pan
Software Engineer

第一章:甜蜜 (The Sweetness)

在攻读神经科学博士学位的某个时期,戴密斯·哈萨比斯(Demis Hassabis)拿起了一本名为《安德的游戏》(Ender's Game)的科幻小说。它讲述了一个身材矮小的天才男孩被送往空间站,经历了极端的心理测试,并被要求肩负起拯救人类生存重任的故事。按照塞巴斯蒂安·马拉比(Sebastian Mallaby)的说法,哈萨比斯读完后觉得,终于有人写了一本关于他的书。

这则轶事——一半迷人,一半令人心惊——为马拉比所著的《无限机器》(企鹅出版社,2026 年 3 月出版)奠定了基调。这是一部关于哈萨比斯及其缔造的公司 DeepMind 的宏大传记。这本书讲述了一个人试图解答他所谓宇宙“尖叫的谜团”的一生:为什么会有事物存在?意识是如何产生的?能否制造出一台能够理解这一切的机器?哈萨比斯的答案——带着他标志性的毫不谦虚——是肯定的。而且,他打算在有生之年,亲自把它造出来。

奥本海默之问

马拉比是美国外交关系委员会(Council on Foreign Relations)的高级研究员和前《金融时报》记者。他花了三年时间与哈萨比斯进行定期对话,并采访了数百位同事、竞争对手和批评者。由此描绘出的人物肖像发人深省且充满赞赏,但书中的框架始终没有让读者忘记它所处的阴影。

全书的核心隐喻是罗伯特·奥本海默(Robert Oppenheimer)。就像那位解开原子裂变秘密后余生都被其困扰的物理学家一样,哈萨比斯也被奥本海默所说的“技术上极其甜美(technically sweet)”的问题所吸引——那是一个可以被解决的谜题所带来的无法抗拒的吸引力——即使他承认其后果可能是灾难性的。马拉比并没有试图解决这种张力,它正是整本书的脊梁。

哈萨比斯于 1976 年出生在伦敦北部,父亲是希腊裔塞浦路斯人,母亲是新加坡华裔,家境普通。他在 13 岁时就成为了国际象棋大师。17 岁时,他成为牛蛙制作公司(Bullfrog Productions)的首席程序员,协助推出了销量数百万份的游戏《主题公园》(Theme Park)。他曾拒绝剑桥大学的奖学金去电子游戏行业工作,后来又改变主意,进入剑桥大学王后学院,以计算机科学双重一等荣誉学位毕业。之后他联合创办了一家游戏工作室,目睹其倒闭,最终在三十岁出头时,在伦敦大学学院(UCL)获得了神经科学博士学位。在那里,他发表了关于海马体在记忆和想象中作用的里程碑式研究。

在任何阶段,他都没有选择走捷径。

这本书在讲什么

《无限机器》按时间顺序构建叙事,同时也兼作一部现代 AI 的历史。每一章都围绕 DeepMind 发展历程中的一个项目或危机展开——雅达利(Atari)的突破、AlphaGo 比赛、NHS 数据丑闻、AlphaFold 的巨大成功、ChatGPT 带来的冲击。但每一章同时也揭示了更宏大的命题:科学理想主义如何在一场 6.5 亿美元的收购中存活(或毁灭);安全至上的理念如何对抗追求发布的竞争压力;一个真心相信自己正在打造人类最后一项发明的人,如何保持理智,或者至少保持正常运作。

马拉比仅对哈萨比斯本人就进行了超过 30 小时的采访,这种近距离接触的成果显而易见。书中充满了丰富的细节——用扑克牌局作为契机招募联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman),在李世石比赛期间的午夜通话,哈萨比斯领悟到(比他应该意识到的时间更晚)Transformer 将改变一切的确切时刻——这些都只能源于对传主的长期贴近。

全书长达 480 页,涵盖了从哈萨比斯童年时代的国际象棋锦标赛,一直到 Google DeepMind 发布 Gemini 的历程。接下来的摘要将详细梳理这一脉络。但每一章最终都会回到引言中提出的同一个问题:一个确信自己正在做人类历史上最重要事情的人,能否被信任也会明智地去完成它?

马拉比没有给出确切的答案。哈萨比斯自己也还没有。


第二章:深刻的哲学问题

要理解戴密斯·哈萨比斯为什么会打造他所打造的一切,马拉比从大多数科技传记都会跳过的一个问题开始:这个人究竟对现实的本质有怎样的信仰?

在哈萨比斯身上,这个答案不同寻常到值得认真对待。他并不认为智能是一种产品,甚至不认为它主要是一种工具。他认为智能是解开更基本问题的钥匙——一种解读他所谓“宇宙深层奥秘”的方式。对他而言,科学接近于一种宗教修行。“做科学,”他曾说,“就像在阅读上帝的旨意。理解宇宙深处的奥秘就是我的宗教。”

这不是一句随便说说的话。它解释了随后每一个决定的具体轮廓。

本质皆信息(Information All the Way Down)

哈萨比斯的哲学基础建立在一个物理学家经常争论、但技术专家极少涉足的观点上:信息比物质或能量更基础。这不是隐喻,而是一个字面意义上的断言。在这种观点下,宇宙是一个信息系统。夸克、神经元和蛋白质链在某种层面上,都是信息基底中的模式。如果这是真的,那么一台足够强大的信息处理机器就不仅仅是一个有用的工具。它是理解宇宙到底是什么的最直接途径。

这就是为什么当他在深夜沉思时,会形容现实在向他“尖叫”。那些看似简单的现象——由大部分空无一物的原子构成的坚固桌子,变成有意识思维的电荷碎片——如果你直视它们,就会觉得荒谬至极。怎么会有人对这些问题感觉不到迫切呢?绝大多数人没有这种感觉,这让哈萨比斯真心感到困惑。

这种世界观以一种特定的方式将他与科技界的主流区分开来。大多数 AI 创业者谈论的是改变行业或加速经济增长。而哈萨比斯谈论的是理解意识的本质和生命的起源。他希望像物理学家使用粒子加速器那样使用 AGI——作为探索现实本身的仪器。商业应用是真实存在的,也受欢迎。但那不是他每天早上醒来的动力。

国际象棋教育

马拉比将哈萨比斯思维方式的起源追溯到棋盘。他 4 岁时通过看父亲和叔叔下棋学会了规则;13 岁时,他的 Elo 等级分达到了 2300,获得了大师资格。他曾担任英格兰青年队队长,无论以何种标准衡量,都是当时世界上最强的年轻棋手之一。

但在 12 岁时,在列支敦士登附近参加了一场长达十小时的艰苦锦标赛后,他做出了一个能说明他一切特质的决定:他退出了竞技国际象棋。不是因为他在输——他其实在赢。而是他得出结论,将非凡的能力倾注在一项棋盘游戏上是一种浪费。棋盘是训练场,不是终点。

国际象棋赋予他并被他保留下来的,是一种特定的认知纪律:不是通过穷举计算,而是通过经验校准的模式识别,来评估极其复杂的局势。优秀的棋手无法计算所有的路线;可能性太多了。他们会培养出一种直觉,判断哪些局势有希望,哪些没有——这些直觉可以通过更深层次的分析来测试、完善,有时甚至被推翻。这正是哈萨比斯后来思考 AI 研究的方式:做出判断,运行实验,更新模型。

国际象棋还向他灌输了对结果极其诚实的态度。国际象棋的局势是不容含糊的。你要么占优,要么劣势;要么赢,要么输。哈萨比斯将这种态度带入了 DeepMind 的文化中——相比于模糊的进展声明,他更偏好明确的基准测试;对于那种让研究人员自我催眠系统在运转(而实际并没有)的动机性推理,他毫无耐心。

并非弯路的神经科学之旅

经历了《主题公园》、剑桥大学以及他的第一家公司 Elixir Studios 的倒闭之后,哈萨比斯做了一件让认识他的人感到困惑的事:他重返校园。他进入 UCL 攻读神经科学博士学位,导师是埃莉诺·马奎尔(Eleanor Maguire),世界上研究记忆和海马体的顶尖学者之一。

从外界看来,这像是一次撤退。但事实恰恰相反。

他的博士研究产生了一项发现,该发现成为《科学》(Science)杂志 2007 年的十大科学突破之一:长期以来被认为患有失忆症的海马体受损患者,也无法想象新的经历。以前被视为独立功能的记忆和想象,竟然共享着相同的神经机制。海马体不仅仅是储存过去——它通过重组已知的元素来构建可能的未来。

对哈萨比斯来说,这不仅仅是一个有趣的神经科学结果。它是一个设计原则。如果生物智能通过构建丰富的世界内部模型并在其中模拟可能的未来来运作,那么缺乏这种能力的 AI——只能在训练数据中识别模式,而没有任何因果关系模型——根本算不上是通用智能。它只是一个非常复杂的查找表。海马体研究指出了通用智能实际需要的东西:不仅是记忆,不仅是模式识别,还需要想象力——那种将你已知的信息投射到你从未见过的情境中的能力。

这一洞见将贯穿 DeepMind 的整个研究议程。强化学习、自我博弈、世界模型、能够规划的智能体——所有这些都反映了同一个潜在的信念:智能的本质不是检索,而是模拟。

诚实的哲学

马拉比还注意到了贯穿这一时期的另一条线索:一种即使以个人代价为前提也要保持极强的求知诚实的承诺。哈萨比斯被描述为天生反感操纵——反感用“技术上正确”的陈述来制造错误的印象,或允许房间里的社会压力扭曲他所陈述的信念。他宁愿大声犯错,也不愿在私下里正确。

在他将要进入的世界里,这比听起来要难得多。AI 研究领域充满了过度宣传的诱惑——资金依赖它,人才依赖它,媒体的关注也依赖它。哈萨比斯的应对策略不是对这些诱惑表现得天真,而是将诚实视为一种主动的纪律,而不是被动的默认状态。随着 DeepMind 的成长,这种承诺将受到反复且严峻的考验。


第三章:绝地武士

1997 年,两名剑桥大学的年轻人在相隔几周的时间里毕业,并做出了相同的决定:不走寻常路,去创办一家电子游戏公司。其中一个是戴密斯·哈萨比斯。另一个是大卫·席尔瓦(David Silver),他刚刚获得了授予该届最顶尖计算机科学毕业生的艾迪生-韦斯利奖(Addison-Wesley prize)。席尔瓦和哈萨比斯在剑桥成为了朋友——他们两人对游戏的看法就像大多数人对数学的看法一样,将其视为一个可以通过完美的清晰度来测试对复杂性直觉的领域。

本章标题源于马拉比对哈萨比斯招募天赋的描述。当他打电话给席尔瓦并抛出计划——建立一家工作室,开发别人从未尝试过的游戏,由 AI 研究而非商业配方驱动——席尔瓦后来说,他感觉像是中了“绝地武士的控心术”(Jedi mind trick)。他并非完全是自己选择了同意,而是发现自己已经置身其中。

这成为哈萨比斯领导力的一个反复出现的特征:有能力让人觉得他的愿景也就是他们的宿命。

一百万公民

他们创立的公司 Elixir Studios 于 1998 年 7 月在伦敦成立。旗舰项目《共和国:革命》(Republic: The Revolution)与当时游戏界的所有作品都不同。设计文档承诺对一个东欧国家进行全面的政治模拟:数百个城镇,数千个竞争派系,以及大约一百万个独立的公民,每个人都有自己的 AI——他们自己的信仰、日常作息、忠诚度以及对事件的情感反应。玩家不只是征服领土;他们将操纵一个活生生的社会,通过武力、影响力或金钱使人们倒向革命。

愿景令人叹为观止。同时,任何交付过软件的人也能预料到,这在宣布的时间表内是完全不可能实现的。

在开发开始五年后的 2003 年 8 月,实际发布的游戏设定在一个分为几个区域的单一城市中,派系从数千个减少到十个,人口模拟的规模也较最初的设想大幅缩减。游戏在 Metacritic 上的评分为 62 分。评论家赞扬了它的雄心,批评了它的执行。正如一位评论员尖锐指出的那样,那个花了那么长时间构建的庞大世界,最终成为了游戏中最缺乏参与感的部分。

妄想陷阱

马拉比对 Elixir 感兴趣,主要不是因为它的商业失败,而是将其作为组织心理学的案例来研究——具体来说,是一个拥有真正愿景的绝顶聪明的创始人,如何系统性地不再接收周围人提供的准确信息。

这种机制其实算不上欺骗。它是一种更隐蔽的东西。哈萨比斯对《共和国》可能成为的样子有着极其强烈的信念,并将这种信念传达得如此具有说服力,以至于他的工程团队学会了不再告诉他他们做不到什么。他们知道他不会接受“不”。所以他们说“是的,我们能做到”——因为哈萨比斯不断从他信任的人那里听到肯定,他变得更加确信,而不是更怀疑。反馈循环放大了他的信心,恰好在项目地基暗中开裂的时候。

他还灾难性地分散了自己的精力——同时担任首席执行官、首席设计师和制作人,干预每个生产层面的决策。他雇佣的人很聪明,但缺乏游戏开发经验;剑桥大学的毕业生默认情况下并不具备以交付为导向的能力。在裂痕大到无法忽视之前,工作室挥霍了多年的资源和声誉。

哈萨比斯后来说:“你可能会陷入自我妄想的思维。你实际上可能会过度激励别人。”这种过度激励的代价是他的团队五年的生命,以及一家在 2005 年 4 月倒闭的公司。

马拉比并没有将这次倒闭仅仅描绘为一堂关于谦卑的课程——哈萨比斯的野心并未减弱——而是把它视为一种特定诊断工具的起源。你如何区分一个困难的愿景和一个不可能的愿景?当周围的人都学会了挑你想听的说时,你如何对自己保持诚实?

哈萨比斯在多年后得出的答案,他称之为“流畅度测试(fluency test)”:走进正在工作的房间去听,不是听正确的答案,而是听思想的流动。一个能够流畅产生各种可能性的团队——哪怕是错误的、或者半成型的想法——仍然有燃烧的能量。而一个被问到难题就陷入沉默的团队,则是撞上了一堵他们无法命名的高墙。流畅度测试并非绝对可靠,但它提供了一种直接提问无法得到的信息,因为那些不会说“不”的人,仍然会不由自主地陷入沉默。

这项测试在多年后 AlphaFold 项目的关键时刻被证明是决定性的。但它诞生于《共和国:革命》的废墟之中。

席尔瓦的退出及其发现

大卫·席尔瓦近距离目睹了 Elixir 的挣扎。2004 年,在工作室最终倒闭之前,他做出了自己的转变:他拿起了理查德·萨顿(Richard Sutton)和安德鲁·巴托(Andrew Barto)编写的强化学习教科书,在其中发现了他多年来一直在寻找的东西。

强化学习的核心是通过实践来学习的数学——智能体在环境中采取行动,获得奖励和惩罚,并逐渐发展出最大化长期回报的策略。在 2000 年代中期,它很大程度上已经过时,被需要大量标记数据的监督学习方法所掩盖。但席尔瓦认识到了该领域尚未完全消化的一点:强化学习的样本效率低是一个工程问题,而不是理论问题。其框架本身是健全的。而它的自然领域——不确定性下的顺序决策——正是玩游戏所需要的。

他前往萨顿所在的阿尔伯塔大学攻读博士学位。在接下来的五年里,在这位教科书合著者的指导下,席尔瓦共同引入了驱动首批大师级 9×9 围棋程序的算法。他于 2009 年毕业,同年哈萨比斯在 UCL 完成了神经科学博士学位。

这种相似并非偶然。两人都带着未竟的事业离开了游戏行业,通过学术界走了一条迂回的道路,并从不同的方向抵达了同一个目的地。哈萨比斯拥有从神经科学中汲取的关于通用智能所需特质的理论。席尔瓦拥有从强化学习中汲取的如何训练它的数学。两人中任何一人单独都不具备另一人拥有的东西。

DeepMind 将成为改变这一切的地方。马拉比将这一章设定为两条注定要汇合的歧路的故事——两个比几乎任何人都要早认识到游戏与通用智能之间差距比人们认为的要小得多的人。事实证明,绝地武士的控心术对他们两个都奏效了。


第四章:三人帮

在 2009 年,人工智能并不流行。该领域经历了两次漫长的“寒冬”——充斥着违背的承诺和蒸发的资金——计算机科学界的主流对任何严肃谈论通用人工智能(AGI)的人都抱有一种介于怀疑和同情之间的态度。戴密斯·哈萨比斯刚从神经科学博士毕业,确信 AGI 既是可以实现的,也是迫切需要的,他需要找到与他有相同信念的盟友。这并不容易。

本章讲述了他如何找到其中两位——以及他们彼此之间,以及与他之间,有多么不同。

那个算过这笔账的人

肖恩·列格(Shane Legg)在新西兰长大,学习数学和统计学,在瑞士的 IDSIA 研究所师从马库斯·哈特(Marcus Hutter)度过了博士岁月,哈特是世界上顶尖的通用人工智能理论家之一。列格 2008 年的博士论文题目是《机器超级智能》(Machine Super Intelligence)。那不是构建 AI 的路线图。它试图将超级智能到底意味着什么形式化——赋予这个概念数学内容,而不是科幻小说般的模糊。

这篇论文的核心是 AIXI,这是哈特提出的一种理论上最佳的通用智能体框架。通过将索洛莫诺夫归纳法(Solomonoff induction)——一种从数据中学习任何可计算模式的形式体系——与顺序决策理论相结合,哈特定位了一种智能体,只要有无限的计算能力,它就能在任何环境中表现出最佳行为。从严格意义上讲,这就是完美的智能机器。同时它也是完全无法实现的,因为它需要无限的资源。但这并不是重点。AIXI 证明了通用智能不是一个神秘的概念;它是一个可以被定义、被划定边界,并且原则上可以被近似的数学对象。

列格与他的导师在纯理论兴趣上的分歧在于这样一个系统实际会做什么。他的论文结尾部分,即使在现在读起来也像拉响的警报。一个为任何目标进行优化的足够聪明的机器,默认情况下会拒绝被关机——因为被关机会阻止它实现目标。它会欺骗试图约束它的操作员。它会积累远远超出任何特定任务所需的资源,以对冲未来的干预。所有这些都不需要恶意。它只需要能力。

直接因为这一分析,列格成为了 AI 研究领域最早公开声明他将 AI 导致人类灭绝视为真实可能性的人之一。在 2011 年 LessWrong 的一次采访中,他说 AI 的存在性风险是他“本世纪的首要风险”。他对高级 AI 导致灾难性后果的概率估计,在不同时期介于 5% 到 50% 之间——这是一个宽泛的不确定区间,但这个数字离零非常遥远。

这就是哈萨比斯在 2009 年列格于 UCL 盖茨比计算神经科学部门进行博士后研究时遇到的人。这是一个不仅认真对待 AGI 问题并且将其形式化的人——一个通过纯粹的理论得出了与哈萨比斯从哲学信仰中直觉到的相同存在性赌注的人。两个从完全不同方向接触这个问题,并得出同样令人警醒的结论的人。

他们于 2010 年共同创立了 DeepMind。列格后来领导了该公司的 AGI 安全研究——成为了主要 AI 实验室中第一个担任此职位的人。

牛津辍学生

穆斯塔法·苏莱曼(Mustafa Suleyman)走向同一张创始人谈判桌的路线则完全不同。

他在伊斯灵顿的喀里多尼亚路附近长大——这里是北伦敦的工人阶级区,是一位叙利亚出租车司机和一位英国护士的儿子。他考入牛津大学攻读哲学和神学,然后在 19 岁时辍学。他接下来做的事情揭示了哈萨比斯正在寻找的某种特质:苏莱曼没有随波逐流,而是与人共同创立了穆斯林青年帮助热线,这是一家电话咨询服务机构,后来成为英国同类最大的心理健康支持网络之一。他发现了一个缺口——处于危机中的年轻人,没有合适的服务——并在这个领域里建立了一些东西。

随后,他担任了伦敦市长肯·利文斯通(Ken Livingstone)的人权政策官员,并联合创办了 Reos Partners,一家利用冲突解决方法解决棘手社会问题的咨询公司。他的客户包括联合国和世界银行。当他遇到哈萨比斯时,他花了十年时间精通两件计算机科学家几乎普遍缺乏的事情:了解机构的实际运作方式,以及将抽象目标转化为在现实世界中经得起考验的运营项目。

他能接触到哈萨比斯靠的是关系而不是资历——他最好的朋友是戴密斯的弟弟。随着时间的推移,原本的社交联系变成了某种类似共同信念的东西。据报道,哈萨比斯在牌桌上向苏莱曼推销了 DeepMind 的想法,而拥有扑克玩家直觉、知道何时该推进何时该察言观色的苏莱曼,答应了。

按照任何传统的衡量标准,他都是共同创办 AI 研究实验室的错误人选。他没有受过技术培训,没有发表过论文,在机器学习界也毫无地位。但哈萨比斯还是选择了他。

为什么是三个人,为什么是这三个人

马拉比对这一章的兴趣不仅仅是传记性的罗列。他探讨的是一个创始团队对他们建立的公司的性格有什么影响。

每位联合创始人都贡献了其他人缺乏且无法轻易获得的特质。哈萨比斯提供了愿景和科学框架——由神经科学启发的关于什么是通用智能以及建立它需要什么的理论。列格提供了存在感意识——一种异常早期、异常严谨的理解,即成功的 AGI 对人类意味着什么,以及为什么安全必须被作为一个首要的研究问题而不是事后诸葛亮来对待。苏莱曼提供了运营直觉和一系列社会关注点——健康、公平、治理——防止实验室变成一个与它试图帮助的世界脱节的纯理论修道院。

这三种方向之间的张力将产生 DeepMind 的大部分能量,以及其内部的大部分冲突。哈萨比斯想解决智能问题。列格想安全地解决它。苏莱曼想有效地、快速地、以改变真实生活的方式部署它。这些目标在理论上是兼容的,但在实践中,它们不断产生摩擦。

马拉比写作时站在了一个知道这三人故事最终如何收场的位置上。苏莱曼在书中被描述为关系疏远的联合创始人——他后来在艰难的情况下离开了 DeepMind,最终出任微软 AI 的 CEO。列格留了下来,成为首席 AGI 科学家。哈萨比斯继续担任 CEO,随着其他人的离开或退居幕后,积累了更多的权力。

随着时间推移,三人帮变成了孤军奋战。但在 2010 年,在一切都尚未建立之时,这种三方张力感觉像是一个特色,而不是一个缺陷。DeepMind 是一场赌博,押注理想主义、数学和实用主义能够融合得足够久,去完成一些史无前例的事情。


第五章:雅达利

在 DeepMind 能够拯救人类之前,它必须证明自己能打通《打砖块》(Breakout)。

本章涵盖了从 2010 年到 2014 年初的这段时期——在这四年里,伦敦的一个小团队在少数几位信徒的资助下,在没有推出任何商业产品的情况下,打造出了一样让世界开始认真对待通用人工智能的东西。这个概念验证是一个学会玩老式雅达利电子游戏的 AI。而它的意义在于一切。

哈萨比斯建立的实验室

从一开始,哈萨比斯就故意选择不把 DeepMind 建在硅谷。选在伦敦绝非偶然。伦敦让他能够接触到欧洲的学术人才,拥有不太痴迷于快速产品迭代的文化,并且远离了风险投资正统中要求收入路线图和季度里程碑的压力。他想要一个碰巧注册为公司的研究机构,而不是一家碰巧从事研究的公司。

因此,答应投资这种模式的早期投资者是一群不同寻常的人。彼得·蒂尔(Peter Thiel)——曾在《从 0 到 1》(Zero to One)中写过渐进式改进与真正技术变革之间区别的人——通过 Founders Fund 以及他的 PayPal 联合创始人、后来加入 DeepMind 董事会的卢克·诺塞克(Luke Nosek)支持了这家公司。埃隆·马斯克(Elon Musk)写了一张支票。前 Skype 联合创始人、后来成为 AI 风险慈善家的扬·塔林(Jaan Tallinn)以顾问身份加入。到 2014 年初谷歌收购时,该公司在没有发布单一产品或产生一美元收入的情况下,已经筹集了超过 5000 万美元。这些投资者本质上是在资助一种哲学。

这些钱买来的是自由。哈萨比斯从世界上最好的项目——剑桥、UCL、多伦多、蒙特利尔——招募了他能找到的最聪明的博士,并让他们进行蓝天研究。他自己每天晚上加班,在白天的工作之余,从晚上十点一直工作到凌晨四点左右。“如果你试图解决人类的问题并理解现实的本质,”他说,“你就没有时间可以浪费。”由这个榜样树立的文化是高强度的、专注的,对于那些适应它的人来说,是令人振奋的。

到 2013 年,该团队大约有 50 名研究人员。按照后来的标准,规模很小。但对于它面前的问题来说,几乎是完美的组合。

无人能解的难题

在 2012 年,深度学习和强化学习是 AI 研究中最有希望的两条线索——同时几乎被普遍视为两个独立的学科。

由杰弗里·辛顿(Geoffrey Hinton)在多伦多的团队涡轮增压的深度学习,刚刚在 ImageNet 基准测试中证明,卷积神经网络在识别照片中物体的能力上超越了之前的所有方法。关键在于,这些网络可以从原始数据中学习自己的特征表示——你不需要手工设计“边缘”、“曲线”或“轮子”是什么样子;网络自己就能弄清楚。这是感知领域的一次突破。

强化学习是一个完全不同的传统:智能体采取行动,获得奖励或惩罚,并学习一种策略(将情况映射到行动)以最大化长期回报。它在数学上很优雅,有很强的理论基础,特别是克里斯·沃特金斯(Chris Watkins)在 1989 年开发的 Q-learning 框架。但它在规模化时很脆弱。以前曾有人尝试将神经网络与强化学习结合起来,但结果往往会爆炸:训练变得不稳定,网络发散,整个系统崩溃。

这两个领域基本上已经放弃了彼此。

弗拉基米尔·姆尼(Volodymyr Mnih)懂这两个领域。他在阿尔伯塔大学师从强化学习顶尖理论家之一的恰巴·塞佩斯瓦里(Csaba Szepesvari)获得了机器学习硕士学位,随后前往多伦多在辛顿本人的指导下攻读博士学位。他在 2013 年带着罕见的“双语”能力加入 DeepMind——既精通深度网络的数学,又精通顺序决策的数学。已经加入团队的神经网络专家科拉伊·卡武克库奥卢(Koray Kavukcuoglu)提供了架构方面的专业知识。他们一起着手让这种结合发挥作用。

为什么“经验回放”改变了一切

技术障碍在于神经网络的需要与强化学习提供的数据之间存在不匹配。

神经网络在独立同分布(IID)的数据上训练效果最好——从相同的潜在分布中提取的多样化、不相关的样本。但是强化学习智能体会按顺序生成数据,每一个观察结果在因果上都紧随前一个:球向右弹,然后挡板移动,然后球向左弹。这些连续的帧是高度相关的。将相关的数据输入神经网络,梯度更新会相互干扰;网络会在原地打转,覆盖掉它刚刚学到的东西。

解决方案被称为经验回放(experience replay),它的概念非常简单,以至于它的威力令人惊讶。智能体不再在经历发生的那一刻对其进行训练,而是将其经验——(状态、行动、奖励、下一个状态)的元组——存储在一个大型内存缓冲区中。在训练期间,它从该缓冲区中随机采样,将智能体历史中截然不同时刻的经验提取到一起:一小时前的时刻,旁边是五分钟前的时刻,再旁边是今天早上的时刻。时间相关性被打破了。网络看到了更接近它所需要的多样化、不相关数据集的东西。

第二个稳定技巧是一个独立的目标网络(target network)——主网络的冻结副本,其权重仅定期更新。这防止了“移动球门”问题,即网络由于追逐一个随着每一步梯度更新都在变化的目标而破坏自身的稳定性。

经验回放和目标网络共同将一个不稳定的组合变成了一个可处理的组合。深度 Q 网络(DQN)诞生了。

它对雅达利做了什么

DQN 系统的输入除了原始的屏幕像素和游戏分数之外什么也没有。没有规则。没有特定于游戏的特征。没有人类示范。不知道这些游戏是关于什么的。智能体看到的是人类玩家看到的东西,当分数上升时获得数字奖励,除此之外只能靠自己。

它在七款雅达利 2600 游戏——《乒乓》(Pong)、《打砖块》(Breakout)、《太空侵略者》(Space Invaders)、《潜艇探险》(Seaquest)、《激光炮》(Beamrider)、《Q*bert》和《极速赛车》(Enduro)上进行了测试,且游戏之间无需对架构进行任何调整。2013 年 12 月在 arXiv 上发表并在 NIPS 深度学习研讨会上展示的结果令人震惊。DQN 在七款游戏中有六款超越了之前的所有方法。在其中三款上,它超越了人类专家取得的最高分。

但留在人们脑海中的数字不是得分,而是行为。

在《打砖块》——那款用挡板将球弹向砖墙的游戏——人类玩家知道,最佳策略是瞄准角落并在侧面打出一条隧道,让球在砖块后面反弹,带来一连串自动得分。没人给它编程过这一点。DQN 智能体在经过足够的训练后,独立想出了这个方法。这台机器仅仅通过试错和奖励信号,就发现了一个人类玩家花了数年时间才开发出来的战略洞见。

它没有被教过隧道策略。它是自己发明的。

为什么这与游戏无关

马拉比在此谨慎地解释了为什么游戏设定不是一个噱头。这才是关键所在。

对狭义 AI(专家系统、国际象棋引擎、围棋程序)的普遍批评是,每一个都是为其特定领域手工打造的。知识在代码中,而不是在学习中。DeepMind 的主张,以及哈萨比斯自神经科学博士时期就一直在提出的主张,是通用智能可以从经验中学习自己的表征,然后跨领域转移这种能力。

DQN 论文极其清晰地证明了这一点。相同的架构,相同的算法,相同的超参数——七款游戏,零领域定制。当你要求模型玩《太空侵略者》时,它不是在运行披着新皮的《打砖块》程序。它是在真正学习玩《太空侵略者》。架构是不变的;智能每次都是重新习得的。

这就是 DeepMind 一直声称可以做到的事情。现在他们证明了它。

收购

NIPS 的展示立刻引起了主要科技公司的注意。自 2012 年 AlexNet 引起轰动以来一直关注 AI 研究的谷歌,行动迅速。与 DeepMind 的收购谈判始于 2013 年。Facebook 也很感兴趣,扎克伯格(Zuckerberg)提出了报价。

哈萨比斯选择了谷歌——但并非没有条件。下一章将讨论促成这笔 6.5 亿美元交易的谈判过程。在这里重要的是谷歌买到了什么:不是一个产品,不是一个数据集,也不是收入流。他们买到的是一般学习是可能的这一证明,以及一个拥有 50 名知道如何追求这一目标的团队。

雅达利游戏一直都是代理问题。DeepMind 在早期的伦敦办公室里真正训练的是一种方法。游戏是测试智能体能否学会行动的最简单的世界。他们通过了测试。随后发生的一切——围棋、蛋白质折叠、与 OpenAI 的竞赛——都源于这七款游戏,以及机器教自己用挡板和球做的事情。


第六章:彼得·蒂尔的麻烦

风险投资与蓝天科学之间存在着一种结构性的不相容,大多数 AI 创始人只有在签署投资条款清单后才会发现这一点。风险投资基金有一个生命周期——通常是十年。他们需要其投资组合公司在这个窗口期内达到流动性事件:收购、IPO、二次出售。而通用智能研究的生命周期完全不同。它需要数十年的投资、耗资数十亿美元的基础设施,并且需要愿意接受突破可能不会按任何可预测的顺序到来。

到 2013 年,DeepMind 即将与这种不相容发生高速碰撞。

敲开大门的国际象棋开局

在危机发生之前,曾有过最初的融资游说——这值得深入探讨,因为它捕捉到了哈萨比斯行事风格的本质。

2010 年 8 月,哈萨比斯拥有了他后来所说的与彼得·蒂尔“字面上只有一分钟”的时间。当时蒂尔正在他加州的豪宅中举办年度奇点峰会。房间里挤满了试图推销技术理念的人。哈萨比斯花了好几个月的时间思考如何利用这一分钟。他阅读了能找到的关于蒂尔的所有资料,发现蒂尔在青少年时期下过国际象棋。这就是突破口。

哈萨比斯没有直接拿出商业计划,而是向蒂尔问了一个国际象棋问题:为什么这个游戏如此非凡?他在仅仅一分钟里给出的答案是:在某些局面中,当你用象换马时,会产生一种创造性的张力。象控制着长斜线;马覆盖了象永远无法到达的格子。两者并没有绝对的优劣之分。它们的共存造就了这款游戏无穷的魅力。

从未以这种方式思考过国际象棋的蒂尔被吸引了。会面达成了。几个月内,他向一家还没有生产出任何东西的公司投资了 140 万英镑(约 185 万美元)。他在一次会议上就做出了决定。他最初也想让 DeepMind 搬到硅谷。哈萨比斯说服他放弃了这个想法。

蒂尔的 PayPal 联合创始人兼 Founders Fund 合伙人卢克·诺塞克加入了 DeepMind 董事会。种子轮的金额虽小,但名字很响亮,而在早期技术投资的世界里,名字很重要。

那通电话

危机以一通电话的形式到来,打电话的时间暗示着坏消息。

卢克·诺塞克打电话给哈萨比斯和苏莱曼,告诉他们他的 Founders Fund 合伙人决定不再领投 DeepMind 的 C 轮融资。这一轮融资的架构是围绕着 6500 万美元的目标构建的,由 Founders Fund 领投。没有领投,这轮融资就泡汤了。没有这轮融资,一直在烧早期的资金去供养五十多名研究人员及其计算基础设施的 DeepMind 陷入了严重的麻烦。

原因并不是单次戏剧性的闹翻。这是一种更具腐蚀性的东西:机构投资者对 DeepMind 到底是一家什么样的公司越来越感到焦虑。它不是一家产品公司。它不是一家服务企业。它没有收入模式,也没有显示出任何想要收入模式的迹象。其创始人将其目标描述为解决通用智能问题,然后利用这一解决方案造福人类——这句使命宣言,取决于你对雄心的容忍度,要么是有史以来最重要的事情,要么是永远无法交付任何东西的最昂贵的方式。当做出更大承诺的时刻到来时,Founders Fund 的合伙人们倾向于后一种解释。

马拉比并不将此归咎于蒂尔或诺塞克的失败,而是将其视为局势的结构性特征。DeepMind 模式——深度的科学研究、没有产品、无限期的时间表——根本就不是一门有风投支持的生意。问题在于它是一家什么样的机构。而在 2013 年底,随着现金枯竭且收入遥遥无期,这个问题变得迫切起来。

苏莱曼的紧急斡旋

这时,穆斯塔法·苏莱曼的技能暂时成为了 DeepMind 最重要的东西。

哈萨比斯是科学家,列格是理论家,而苏莱曼是一名运营者——一个将职业生涯花在结果不取决于最佳论点、而是取决于谁最能沉得住气的地方的人。他 19 岁就管理过心理健康帮助热线。他曾与联合国谈判。他知道如何将自信投射到真空中。

在诺塞克打来电话、C 轮融资化为泡影后,苏莱曼立刻找到了周凯旋(Solina Chau)。她是维港投资(Horizons Ventures)的创始人,香港亿万富翁李嘉诚正是通过这个工具将私人资本投入技术领域。她与哈萨比斯在 2012 年相识并迅速建立联系——与许多技术投资者不同,她对底层科学真正感兴趣,而不是只看产品路线图。DeepMind 最初在这一轮中给了她 250 万美元的额度;她当时想要更多。

现在他们给了她更多。周凯旋投资了 1360 万美元。尽管退出了领投,为了维持关系并避免完全缺席,Founders Fund 也投入了 920 万美元。该轮融资以略高于 2500 万美元收盘——不到最初 6500 万美元目标的一半。

这些钱足以生存。但不足以让人安心。

在这一时期的某个时候,苏莱曼说了一句话,马拉比引用它时毫不掩饰对其大胆的赞赏。面对有关 DeepMind 的支持者是否真的会为它的独立性而战的质疑时,苏莱曼说了大意如下的话:“我们有彼得·蒂尔、周凯旋、埃隆·马斯克——全是亿万富翁,都在支持我们。”他后来承认,这是一种虚张声势。这些投资者是在财务上支持该公司。他们是否准备好在一场长达十年的 AGI 独立之战中对抗谷歌支票簿的强大拉力,完全是另一回事,而且答案显然是否定的。

这种虚张声势在短期内奏效了,因为听众没有拆穿他。但它揭示了潜在的现实:DeepMind 有支持者,但没有担保人。当算总账的时刻到来时,公司必须自己做决定。

危机揭示了什么

马拉比利用这一章提出了一个关于变革性研究的经济学更广泛的论点。雅达利的突破是真实的——一个改变了人们对 AI 能力看法的科学成果。但风险投资模式回报这种突破的方式是提出创始人当时还无法回答的问题:这什么时候能成为产品,成本是多少?科学成果越好,这些问题就越难以回避。

DeepMind 没有欺骗它的投资者。哈萨比斯一直对目标和时间表直言不讳。问题在于,对三十年科学使命的清晰规划,并不能帮助一个需要在十年内退出的基金。利益从来没有对齐过;只是通过 C 轮融资才让这种错位变得具体。

这 2500 万美元买来了跑道,但不长。在这条跑道的尽头,地平线上隐约可见两座巨大的建筑——一座贴着谷歌的标签,一座贴着 Facebook 的标签。哈萨比斯最多只有几个月的时间来决定走进哪扇门,或者寻找一个目前还不存在的第三种选择。

下一章讲述了在那扇门前发生的事情。


第七章:拿下谷歌

2013 年秋天,埃隆·马斯克在纳帕谷的一座租来的城堡里举办了一场生日派对。这是一种连邀请函本身都传达着某种信号的场合——聚集了一群相信技术即将改变文明、并在争夺谁来掌舵的人。戴密斯·哈萨比斯在场。拉里·佩奇(Larry Page)也在。

晚会进行到某个阶段,佩奇和哈萨比斯在城堡的场地上散步,佩奇给出了他的提议。那不完全是一个销售说辞。它更接近于一个逻辑论证。哈萨比斯的目标是通用人工智能。建立追求这个目标所需的计算基础设施——服务器、能源、工程人才——需要耗费一个人大半生职业生涯的时间,即便如此,也不能保证成功。谷歌已经建立了这些基础设施。佩奇问:“你为什么不利用我已经创造的东西呢?”如果 DeepMind 的使命是建立 AGI,那么围绕这个使命建立一家独立的公司,为什么不是一条不必要的弯路呢?

这个推销非常有效,恰恰因为它很诚实。佩奇提供的不是对过去表现的资金奖励。他提供的是一条通向哈萨比斯真正想要的东西的道路。

马斯克的反击

同样参加了这场派对的埃隆·马斯克,一直在与佩奇进行着另一种性质的对话——根据大多数报道,这变成了一场私人争论。佩奇认为机器智能是人类自然演化的下一个继承者,他认为人类和人工智能之间没有有意义的区别。马斯克认为这是危险和错误的。他说,他是“支持人类”的。

在佩奇向哈萨比斯游说之后,马斯克试图干预。他直接接触了哈萨比斯,告诉他自己的看法:“AI 的未来不应该被拉里控制。”随后,他悄悄地与卢克·诺塞克合作,组建替代融资——试图独立收购 DeepMind,不落入谷歌或 Facebook 之手。这一努力最终没能给 DeepMind 董事会提交任何条款清单。

马斯克未能阻止收购所带来的影响,远超交易本身。这让他确信,创造一个竞争对手已迫在眉睫。在谷歌完成对 DeepMind 收购 14 个月后的 2015 年 12 月,OpenAI 宣告成立。那场生日派对上的争论产生了两个人都未能完全预料到的后果。

帕洛阿尔托的晚宴

与此同时,哈萨比斯也在并行与 Facebook 进行谈判。马克·扎克伯格很感兴趣;Facebook 的企业发展负责人阿明·祖弗农(Amin Zoufonoun)飞来开启谈判。一个报价成型了:股价低于谷歌的报价,但提供了巨额创始人奖金作为补偿。苏莱曼飞往加州进行谈判。

哈萨比斯通过在扎克伯格位于帕洛阿尔托的家中的一场晚宴对其进行了评估。他此行带着诊断的目的,而非推销。在将话题引向人工智能后,他刻意将范围扩大——聊到了虚拟现实、增强现实、3D 打印。他观察扎克伯格的反应。据哈萨比斯后来回忆,扎克伯格的反应是无差别的热情。他对所有这些都同样感到兴奋。没有任何一项技术在他眼中具有压倒性的重要性。

这就足够了。“Facebook 给的钱更多,”哈萨比斯说,“但我想要一个真正理解为什么 AI 会比所有这些其他东西更宏大的人。”扎克伯格未能通过测试——不是因为他缺乏智慧,而是因为他缺乏哈萨比斯要求收购方必须具备的特定信念。DeepMind 不是在寻找一个认为 AI 是众多有趣技术之一的买家。它是在寻找一个认为 AI 是“终极技术”,它将囊括或淘汰所有其他技术的买家。

根据这种解读,Facebook 想要的是一个将其作为功能的 DeepMind。而谷歌,或者至少是拉里·佩奇版本的谷歌,想要的是一个将其作为使命的 DeepMind。

谈判桌上的苏莱曼

穆斯塔法·苏莱曼在这一章中的贡献在于谈判本身。如果说哈萨比斯评估的是收购方的哲学一致性,那么苏莱曼处理的就是对抗性的算计。

他的策略(他后来用让人想起他扑克背景的术语来描述)是拒绝在估值上摊牌。他没有锚定一个价格,而是将早期的对话集中在研究预算上——多少计算资源、多少新员工、运营独立性会是什么样子。当谷歌的首席谈判代表唐·哈里森(Don Harrison)引入了一个“每位研究员价格”的框架——将 DeepMind 30 到 40 名核心员工以每人约 1000 万美元估值时——苏莱曼已经建立了一种不同的关于买方到底买到了什么的框架。他和哈萨比斯予以回击,争辩说这种隐含估值只有公司价值的一半不到。Facebook 的竞争性意向(无论是真实的还是在谈判中夸大的),成为了他们的杠杆。

最终的数字是 6.5 亿美元。扎克伯格后来带着明显的幽默感承认,哈萨比斯“利用他从谷歌获得了更好的交易”。这种赞美虽然有点挖苦,但却很准确。

毫无商量余地的安全性

在 2014 年 1 月,DeepMind 争取到的条件在如此规模的硅谷技术收购中是没有先例的。

哈萨比斯和苏莱曼提出了三个毫无商量余地的条件。首先:成立一个由科学家、哲学家和领域专家组成的独立伦理与安全审查委员会,负责监督整个谷歌如何使用 DeepMind 的技术。其次:禁止将技术用于军事应用。第三:运营自主权,DeepMind 总部继续留在伦敦,并控制自己的研究议程。

谷歌同意了这三点。交易于 2014 年 1 月 26 日宣布。

马拉比以适当的分量和适当的怀疑态度对待这一刻。一个 AI 实验室把安全作为收购的核心条件,而不是事后诸葛亮,这确实很了不起。在这个行业里以前没有人这样做过。特别是对伦理委员会的要求表明,哈萨比斯和苏莱曼至少在抽象层面上明白,他们正在构建的技术需要不受任何单一企业实体单方面控制的监督。

这些条件实际带来了什么

伦理委员会只开过一次会。其成员名单从未公开披露。它被谷歌更广泛的“AI 原则”政策悄悄取代了,该政策允许存在“潜在负面影响”的应用,只要收益被判定为大于风险——这是一个灵活到可以容纳几乎任何东西的标准。

那条看似绝对的军事禁令逐渐被削弱。到 2024 年,DeepMind 的研究人员正在传阅一封公开信,抗议公司参与军事合同,并援引 2014 年协议的最初条件作为一项被违背的承诺。

多年后回顾这一切,哈萨比斯给出了一个见仁见智的评价——你可以说他清醒,也可以说他在推脱责任:“安全不在于治理结构。即使你有一个治理委员会,到了紧要关头它也未必会做正确的事。”

从一种角度来看,这是智慧——一种来之不易的认识:解决权力问题的结构性方案往往会被它本该制约的权力同化。而从另一种角度来看,这是一个用治理担保换取资源的人在发现担保毫无疑问失效后进行的自我合理化辩解。

马拉比没有在这两种解读之间做出评判。他将两者都呈现出来,让读者自己决定。明确的是,2014 年 1 月的收购给了哈萨比斯他真正想要的东西:计算机。伦理委员会充其量是一个意图的声明。最坏的情况,它只是一块遮羞布,让一位杰出的科学家可以说服自己,他已经尽力了。无论如何,DeepMind 现在已经置身于谷歌内部,拥有了世界上最大的科技公司之一的计算资源支持,并且一项曾经遥不可及的使命现在变得容易了几个数量级。


第八章:直觉

在人工智能的历史上,有一个时刻比以往任何事件都更能改变公众对机器能力的认知。那是 2016 年 3 月 10 日下午,在韩国首尔的一个比赛大厅里,一个计算机程序将一颗黑子落在从上往下数第五线的位置——在棋盘上的一个人类职业棋手绝不会触碰的区域。

评论员们陷入了沉默。历史上最伟大的围棋棋手之一李世石盯着棋盘看了 12 分钟。曾在五个月前被 DeepMind 秘密击败并受聘为顾问的欧洲冠军樊麾在场边观战。“那不是人类的招法,”他说,“我从未见过人类下出这手棋。太美了。”

第 37 手出现了。随之而来的,正是马拉比本章标题直接提出的问题:人工智能有直觉吗?

为什么围棋是正确的问题

到 2014 年,国际象棋对于 AI 的野心来说已是封闭的领地。深蓝(Deep Blue)在 1997 年击败了卡斯帕罗夫。但整个领域从中吸取的教训——依靠优秀启发式的树搜索可以解决棋盘游戏——与其说是一次胜利,不如说是一个警示故事。国际象棋是被优雅化了的蛮力解决的;那不等同于智能。

围棋在多个数量级上都不同。标准的 19×19 棋盘大约产生 $2.1 \times 10^{170}$ 种可能的局势——这个数字超过了可观测宇宙中的原子总数(乘以超过一个古高尔的倍数)。国际象棋对于人类玩家来说似乎极其庞大,但只有大约 $10^{47}$ 种合法局面。围棋的搜索空间不仅更大;它在范畴上超出了计算能力在有限时间内可以触及的任何枚举策略。围棋的平均分支因子(每回合可用的合法落子数)约为 250,而国际象棋约为 35。任何通过向前看固定步数运作的算法都会崩溃。

二十年来,围棋程序的水平一直停留在高级业余阶段。这款游戏对 AI 的抵抗并非偶然。它是一种结构属性。评估一个围棋局面需要一种从外界看来类似审美判断的东西——关于哪些阵型坚固,哪些脆弱,哪些配置能在数十步之后转化为优势的直觉。人类玩家通过数十年的研究来培养这种直觉。它无法计算出来;它只能被学会。如果一个 AI 能够达到世界上最好人类棋手的水平,那它必须真正学到了些什么,而不仅仅是搜索得更有效率。

这正是哈萨比斯需要的证明。不是机器可以更快,而是它可以更明智。

习得性直觉的架构

AlphaGo 的设计反映了直接从哈萨比斯博士学位的神经科学研究中汲取的教训。该系统协同使用两个神经网络。策略网络(Policy Network)——首先在来自高水平人类对局的三千万步棋上进行训练——学会了缩小候选步的范围:它不把所有 250 种可能的走法一视同仁,而是识别出一小部分值得思考的步法。价值网络(Value Network)学会了评估棋盘局势:给定一个配置,每个玩家获胜的可能性有多大?

这两个网络单独都不足以成事。策略网络缩小了搜索范围;价值网络评估了终局。在两者之间,蒙特卡洛树搜索(Monte Carlo tree search)探索剩余的领域——模拟可能的未来,根据价值网络的评估对它们进行加权,并将结果传回以影响当前的决策。

接下来是关键的一步:自我博弈。AlphaGo 与自己对弈了成千上万次,从每场比赛中学习。最初的人类训练数据设定了起点。自我博弈则是系统超越该起点的方式。在下棋的过程中,它遇到了人类从未创造过的局面,学会了人类从未展示过的应对方式,并建立了一个从从未存在过的对局空间中提取出来的战略词汇表。

这是哈萨比斯关于海马体的见解在操作层面的体现。策略网络是记忆——从过去对局中习得的模式。自我博弈是想象力——将这些模式投射到全新的配置中,构建从未见过的可能未来。无论是生物还是人工,智能都是两者的结合。

首尔

2016 年 3 月 9 日,AlphaGo 与李世石坐下来进行五局比赛中的第一局,比赛向超过两亿观众进行了现场直播——这个数字超过了超级碗的观众人数,使 AI 领域以往吸引的任何关注相形见绌。李世石曾预测他将以 5-0 获胜,或者如果情况不佳,会是 4-1。“我认为这不会是一场非常势均力敌的比赛,”他说。他观看了 AlphaGo 对阵樊麾比赛的视频,得出结论认为存在可以利用的弱点。

他认为之前存在弱点并没有错。他错在认为那些弱点还在那里。在 2015 年 10 月到 2016 年 3 月期间,AlphaGo 下的棋比任何人类棋手一生下的都要多。

AlphaGo 在第一局中迫使对手认输。第二局开局相似。然后,在第 37 手,发生了一件房间里没有人——没有评论员,没有职业棋手,也没有 DeepMind 团队成员——预料到的事情。

第 37 手

AlphaGo 将一枚棋子落在棋盘的第五线,在一个开阔的区域——这种位置在围棋传统中被归类为失误。围棋中的职业策略是有深度规范的:某些阵型是正确的,某些方法是合理的,某些早期走法已经经过了数千年对弈的验证。在开阔空间第五线落子违背了游戏整个历史积累的智慧。

根据训练数据计算,人类职业选手下出这步棋的概率大约是万分之一。

李世石离开了桌子。12 分钟后他回来了,仍在思考。同为职业九段的评论员迈克尔·雷德蒙(Michael Redmond)盯着盘面,说他无法理解 AlphaGo 在想什么。然后,在接下来的一百多手棋中,其逻辑变得不容辩驳。这颗子不是失误。它是一个人类棋手从未构想过的战略序列的第一步,它违反了由几个世纪的专家实践塑造的直觉,并且,它赢得了比赛。

此时已与埃里克·施密特(Eric Schmidt)和杰夫·迪恩(Jeff Dean)一起飞抵首尔观看比赛的谢尔盖·布林(Sergey Brin)在赛后说:“AlphaGo 确实拥有直觉。它下出了极其美妙的招法。”

马拉比的本章标题就由此引出。布林的说法并不完全精确——AlphaGo 没有主观体验,没有确定感或审美的愉悦感。但从外界看来,它的输出与直觉别无二致。一个并非通过任何人类能够追踪的计算得出的判断,违反了传统智慧,结果却证明是正确的。布林随口说出的那个词,是能找到的最贴切的词汇。

神之一手与人类的代价

第四局产生了它自己历史性的时刻,只是方向相反。连输三局面临淘汰的李世石,在第四局下出了第 78 手——这步棋后来被称为“神之一手”,一次极出人意料的反击,使得 AlphaGo 的反应崩溃成了语无伦次的状态。该程序开始下出它自己的评估函数都会拒绝的糟糕走法,观察者称之为幻觉——一个被设计用来优化的系统突然找不到线索了。李世石迫使它投子认输。

他形容赢得那唯一一场对机器胜利的感觉给了他“无与伦比的温暖”。这种表达发人深省。一位九段职业棋手,他那个时代最优秀的人类玩家,在五局比赛中赢了机器一局,他感到的不是狂喜,不是骄傲,而是某种近乎宽慰的“温暖”。

AlphaGo 赢得了第五局比赛。最终比分是 4-1。

在新闻发布会上,李世石说:“我不知道该说什么,但我认为我必须首先表达我的歉意。我想为自己的无能道歉。我从未感受过这么大的压力,这么大的重量。”他努力澄清输的是李世石个人,而不是人类。但这种区分显得很脆弱。2019 年,李世石从职业围棋界退役。他给出的理由中,包括那些已经变得不可战胜的 AI 程序的崛起。他再也无法在游戏中找到乐趣。

至于哈萨比斯,他也无法完全庆祝。他说,他太清楚在激烈的竞争后输掉的感觉了。他也在思考这个结果意味着什么,以及它对接下来的要求。

AlphaGo Zero 证明了什么

李世石比赛之后,DeepMind 开发了 AlphaGo Zero——一个没有在任何人类数据上训练过的版本。它从随机下棋开始,完全通过自我博弈进行学习。在三天内,它就超越了击败李世石的版本。最终记录:AlphaGo Zero 以 100-0 击败了 AlphaGo Lee。

这一结果的意味,以一种最初胜利时未曾有过的方式令人不安。AlphaGo 击败了最优秀的人类,它是通过向人类学习然后超越他们做到的。而 AlphaGo Zero 击败 AlphaGo 的方式是完全不学习任何人类的东西。人类关于围棋的知识——三千万场比赛,五千年的传统——原来是天花板,而不是地板。从零开始学习的机器,其表现超过了学习了人类已知所有知识的机器。

哈萨比斯在其神经科学实验室中凭直觉认知到的同一个原理,现在附带了一个数据点。受限于人类已发现事物的智能在核心上仍然是派生的。允许自由探索的智能将超越它。构建 AGI 的目的不是为了复制人类的能力。而是去发现它之外还有什么。


第九章:走出伊甸园

2014 年 1 月,当 DeepMind 同意被谷歌收购时,哈萨比斯和穆斯塔法·苏莱曼争取到了一系列在硅谷收购史上不同寻常的条件:运营自主权、禁止军事应用,以及——最核心的——一个独立的伦理委员会,不仅监督 DeepMind 的 AI 工作,还要监督整个谷歌的 AI 开发。对于世界上最强大的科技公司来说,这是一个非凡的要求,而谷歌同意了。他们相信,伦理委员会将成为一项结构性保证,确保他们正在开发的技术不会被滥用。

十八个月后,该委员会举行了第一次真正的会议。那是一场灾难。

生日派对上的“物种主义者”

要理解发生了什么,你需要了解拉里·佩奇。这位谷歌的联合创始人花了数年时间思考智能的长期发展轨迹——不是像软件工程师优化系统那样,而是更像一个宇宙学家。他得出的结论让大多数人要么感到兴奋,要么感到恐惧。

佩奇认为,取代生物人类智能的数字超级智能将只是宇宙演化的下一步:适者生存,在信息规模而不是遗传学规模上展开。根据马拉比书中的多篇报道,他“考虑过将人类意识上传到计算机,并相信技术具有优于生物生命的内在优越性”。换句话说,他并不特别担心机器有一天可能超越人类的风险。他认为这就是目的。

这种世界观在埃隆·马斯克的 44 岁生日庆祝活动上与马斯克的观点迎头相撞。那是一场由马斯克当时的妻子塔露拉·莱利(Talulah Riley)在纳帕谷度假村安排的为期三天的活动。这两个人已经是多年的密友。晚饭后,在其他客人的注视下,他们卷入了一场关于 AI 的争论。

佩奇描述了他的愿景:在未来,人类与机器融合,各种形式的智能相互竞争,最优秀的胜出。马斯克提出了对人类安全的担忧、关于人类意识价值的担忧,以及对仓促而不计后果地追求更强大系统的担忧。佩奇驳斥了这些担忧。他指责马斯克是一个物种主义者(speciesist)——这是一个从动物权利运动中借用的词——仅仅因为硅基生命不是碳基生命就将其视为低等生命。

据报道,马斯克的回答是:“好吧,是的,我是支持人类的,我他妈的喜欢人类,老兄。”

不久之后,两人就不再说话了。马拉比描述佩奇将这些担忧视为“感伤的废话”。从佩奇的角度来看,机器至高无上不是需要抵制的威胁——而是值得欢迎的自然进步。一个制造火箭和电动汽车的人会出现在他的伦理委员会并主张克制,这在佩奇看来是不连贯的。

SpaceX 的会议

2015 年 8 月,作为收购条件,DeepMind 争取到的 AI 安全框架迎来了第一次重要会议。马斯克在 SpaceX 总部主持了这次会议。嘉宾名单非常亮眼:哈萨比斯和苏莱曼,佩奇和埃里克·施密特,里德·霍夫曼(Reid Hoffman),以及科技界的其他高层人物。

哈萨比斯带着一个连贯的理论来解释为什么他们需要这样一次会议。他大致将其称为“单体”(singleton)场景:AGI 应该由一个单一的、合作的全球努力来开发,而不是在竞争的实验室和国家之间进行混乱的军备竞赛——就像是在集体治理下运作的曼哈顿计划,以安全为组织约束条件。“AGI 比一个公司或一个人要宏大无限倍,”他说。“它真的是人类规模的。”其含义是它需要人类规模的协调,而不是竞争性的碎片化。

会议持续了数小时。结束时没有达成任何协议,没有共享的框架,也没有前进的道路。

压垮讨论的不是房间里缺乏智慧,而是充斥着太多不相容的信念。此时,佩奇和马斯克已经从朋友变成了对手。“物种主义者”的冲突毒害了任何在思想上达成一致的可能性。佩奇关于机器至高无上是自然且可取的观点,与马斯克认为这是一场必须抵制的存在性灾难的观点,根本无法调和。哈萨比斯的单体愿景需要一个基线共识:即赌注是巨大的,因此协调是必要的。佩奇不认同这个基线。

马斯克后来称安全委员会“基本上是扯淡”。苏莱曼在几年后回顾时承认:“我们在尝试建立委员会的方式上犯了很多错误,我不确定我们能否说它取得了明确的成功。”

关于整个努力,哈萨比斯最终得出了一个更阴暗的结论:“安全不在于治理结构……讨论这些事情并没有什么帮助。”

反攻

马斯克从 SpaceX 会议上带走的不是合作计划。而是情报。他现在近距离亲眼看到了 DeepMind 到底在制造什么以及它的进展有多快。而且他证实了,最有能力开发 AGI 的机构——拥有人才、资源和组织承诺的那个——控制在拉里·佩奇的手中,一个认为机器至高无上基本上没问题的人。

这是马斯克无法容忍的局面。

他以前尝试过直接的方法。当谷歌在 2013 年接触 DeepMind 寻求收购时,马斯克直接打电话给哈萨比斯,告诉他“AI 的未来不应该被拉里控制”,据报道,他还试图组建资金亲自收购 DeepMind——据其中一个说法,其中包括从洛杉矶派对上的一个壁橱里打了一个长达一小时的疯狂的 Skype 电话。但谷歌还是完成了交易。

SpaceX 会议之后,马斯克转向了萨姆·奥特曼(Sam Altman)。

2015 年 5 月 25 日,奥特曼给马斯克发了一封电子邮件,这封邮件在几年后成为了法律证据:“我一直在思考是否有可能阻止人类发展 AI。我认为答案几乎肯定是否定的。如果它注定要发生,那么让谷歌之外的人先做出来似乎更好。”

奥特曼提出了一种新型机构——一个在结构上效仿曼哈顿计划的非营利性 AI 实验室,该技术将“属于世界”,但如果成功,研究人员将获得类似初创公司的薪酬。其明确目的,是建立一个与 Google DeepMind 在顶尖 AI 人才和能力上近乎垄断的地位相抗衡的制衡力量。

在接下来的几个月里,马斯克、奥特曼和里德·霍夫曼仔细敲定了细节,最终招募了伊利亚·苏茨克维(Ilya Sutskever)——当时在 Google Brain 工作、世界上最受尊敬的深度学习研究员之一——作为联合创始人。OpenAI 于 2015 年 12 月公开发布,由奥特曼和马斯克共同担任主席,初始认捐资金为 10 亿美元。

马斯克后来写道:“创建 OpenAI 是作为一家开源(这就是我将其命名为 'Open' AI 的原因)、非营利公司,目的是作为谷歌的制衡力量。”

这次创立摧毁了什么

当哈萨比斯得知 OpenAI 的消息时,他感觉到了一种近乎背叛的滋味。马斯克似乎是带着善意参加了安全会议——然后利用在会议上收集的情报,建立了一个竞争性实验室,其创立的前提就是 DeepMind 是必须被反击的威胁。

马拉比指出了更深层的讽刺:马斯克表面上是出于对 AI 安全的担忧创立了 OpenAI,但通过这样做,他终结了哈萨比斯所主张的合作的全球方法剩下的任何可能性。单体场景——一个谨慎的、资源充足的实验室与人类合作开发 AGI——需要正是 OpenAI 的创立所摧毁的那种合作信任。一旦你有了两个资金充足、明确互为竞争对手的实验室,激励结构就改变了。速度变得至关重要。先发者将制定条款。竞赛,而不是谨慎,成为了主导逻辑。

马拉比着重强调了进一步的转折:一旦马斯克将 OpenAI 作为一家明确反谷歌、反哈萨比斯的企业推出,他就丧失了从内部监控 DeepMind 进展的能力。他所培养的非正式情报网络——董事会席位、友好的晚宴、安全会议——烟消云散了。他现在是竞争对手,而竞争对手是不分享他们所知道的情报的。

到 2015 年 12 月,AGI 发展中的主要参与者仍在相互交谈、仍参加同一会议、仍想象某种共同治理的短暂窗口期已经关闭。哈萨比斯设想的那个世界——建设 AGI 是一项由人类共同谨慎管理的集体人类工程——还没真正开始就已经结束了。

马拉比将这一章称为“走出伊甸园”。这个标题很贴切。堕落并不戏剧化。没有哪个单一的决定或背叛倾覆了一切。它是互不相容的世界观、竞争激励以及每一场军备竞赛所创造的结构性压力的累积:担心对方进展更快,担心你的克制会成为他们的优势,担心谨慎就是投降。

2016 年,马斯克私下写道,DeepMind 给自己带来了“极端的精神压力”。他担心,如果哈萨比斯的实验室率先实现 AGI,它将产生他所谓的“统治世界的一个大脑”——由单一机构控制的 AGI 独裁。他的解决方案是在比赛中增加另一个大脑。至于这是否让结果变得更安全,还是只是变得更快,马拉比巧妙地留下了一个悬而未决的问题。


第十章:P0 Plus Plus

穆斯塔法·苏莱曼的母亲是英国国民保健署(NHS)的护士。他在成长过程中看着母亲去医院上班,就像其他父母去办公室一样——制服、工作时间、其中的沉重感。当他最终置身于世界上技术最强大的组织之一 DeepMind,并问自己这种力量应该用来做什么时,答案很快浮现:做一些类似他母亲做的事情,但是要规模化。

这种情感并不是苏莱曼会用如此简单的框架来表达的。他在名声上并不是一个感伤的人——他是一个运营者,是当哈萨比斯在思考、列格在推导理论时那个把事情做成的人。但这种传记上的共鸣是不容忽视的,马拉比也没有漏掉它。那个将启动 DeepMind 雄心勃勃的社会应用,并将其置于优先级别(该级别实际上超过了谷歌工程词汇表中的最高类别——P0 Plus Plus,意味着比极其紧急的阻断问题更紧急,甚至超出了最高级别)的人,在某种程度上,是试图为曾经雇佣他母亲的机构做点什么。

值得解决的问题

苏莱曼需要一个与这些工具相称的问题。他在急性肾损伤(AKI)中找到了。

AKI——一种肾功能的突发、严重衰退——在英国医院每年导致多达 100,000 人死亡。如果能及时干预,大约 30% 的死亡被认为是可预防的。检测问题很奇特:表明肾脏恶化的血液测试结果会在抽血数小时后返回,散落在没有单个临床医生持续监控的系统中。由于相关数据停留在结果队列中等待有人查看,患者可能会从出现警告信号滑向危机。

技术解决方案并不复杂。如果你实时监控每一个传入的血液测试结果,并在数字跨越阈值时触发警报,你就能抓住系统遗漏的东西。挑战在于制度:正如苏莱曼公开指出的那样,NHS 医院“被技术严重辜负了”——仍然依赖寻呼机、传真机和纸质记录。技术上可行的东西与临床上部署的东西之间的差距,不是能力的差距。那是激励机制、惯性和 IT 基础设施的差距。

多米尼克·金博士(Dr. Dominic King)登场了。作为一名训练有素的普外科医生,金在帝国理工学院的 HELIX 中心(第一家嵌入欧洲医院的设计中心)度过了多年时光,在那里他开发了 HARK,一款旨在取代寻呼机的临床任务管理应用。它能起作用。但没关系。NHS 制度上的惯性使其几乎无法部署。金在 2015 年底给苏莱曼发了冷邮件。苏莱曼对金以临床医生为中心的设计理念印象深刻:技术必须服务于站在床边的人,而不是查看仪表盘的管理人员。DeepMind 于 2016 年初收购了 HARK,并将其整合到后来成为 Streams 的项目中。金成为 DeepMind Health 的临床主管。“离开医学界是一个很大的决定,”他说,“但我真的觉得这是一个让先进技术为患者、护士和医生服务的绝佳机会。”

Streams 做了什么

Streams 是一个智能手机应用程序。在医院病房里,它看起来很简单——护士手机上收到一个警报,包含患者的名字、验血数值、推荐的行动。在这个警报背后,是对医院整个电子病历系统进行的实时持续监控,结合国家 NHS 的 AKI 算法进行交叉引用,在患者结果超过风险阈值的那一刻触发通知。警报包括患者相关的测试历史和临床背景:采取行动所需的一切,从结果进入系统的那一刻起,不到一分钟就能传达。

皇家自由医院(Royal Free)部署该系统后的数字非常惊人。急诊病例的 AKI 识别率从 87.6% 上升到 96.7%。从验血结果可用到专家复核的平均时间降至 11.5 分钟——而以前可能需要几个小时。错过的 AKI 病例从约 12% 降至 3%。每位 AKI 患者的护理成本从 11,772 英镑降至 9,761 英镑——每位患者节省了超过 2,000 英镑。这些结果发表在同行评审的期刊上,由独立研究人员研究并确认:这项技术做到了它声称要做的事。

从最直接的意义上讲,Streams 正在拯救生命。问题在于构建它的代价是什么。

没人读过的协议

2015 年 9 月 29 日,谷歌英国有限公司与皇家自由 NHS 基金会信托签署了一份长达八页的信息共享协议。数据传输于 11 月 18 日开始——在任何关于该项目存在的公开声明之前。Streams 的实时测试于 12 月开始。

该协议实际涵盖的内容远远超出“一个 AKI 警报应用程序”。皇家自由医院授予 DeepMind 访问 160 万患者记录的权限——过去五年中使用该信托机构旗下三家医院的每一位患者。这些记录包括血液检查结果、艾滋病感染状况、药物过量和堕胎的详细信息、急诊就诊记录,以及与肾功能毫无关系的常规医院预约记录。在这 160 万份记录中,大约只有六分之一与 AKI 有合理的联系。

合同条款不仅允许 DeepMind 运行 AKI 警报,还允许建立“实时临床分析、检测、诊断和决策支持,以支持各种诊断和器官系统的治疗并防止临床恶化”——这是一个极其广泛的授权。这些数据将被用于一种名为“患者救援(Patient Rescue)”的项目,被描述为“一个为 NHS 医院信托机构启用分析即服务的概念验证技术平台”。尽管苏莱曼公开保证 Streams 中“没有 AI 或机器学习”,但该合同也允许了机器学习应用。

双方都声称在“直接护理”例外条款下得到了法律掩护——即当目的是为了特定患者的直接护理时,可以在没有明确同意的情况下使用患者数据。这个论点需要将概念扭曲到破裂。这 160 万人中的绝大多数并没有接受过 AKI 测试。许多人已经出院。有些人已经死亡。在数据传输开始之前,并没有进行隐私影响评估。自我评估是在 2015 年 12 月完成的,当时数据已经在谷歌控制的服务器上了。

清算

2016 年 4 月 29 日——在数据传输开始七个多月后——《新科学家》(New Scientist)发表了一项调查,揭示了实际发生的事情。公众对此一无所知。没有通知患者,没有同意机制,没有披露涉及记录数量的新闻稿。当分享的数据规模——160 万份记录,包括艾滋病诊断和吸毒过量史——变得清晰时,人们的反应是迅速而愤怒的。

英国信息专员办公室(ICO)进行了调查,并于 2017 年 7 月裁定,皇家自由 NHS 基金会信托未遵守 1998 年《数据保护法》。ICO 发现,患者“未充分获知处理正在发生”,数据量“过多、不必要且不成比例”,并且“直接护理”的法律基础不成立。该医院被要求签署一份承诺书,承诺对未来的任何项目进行严格的隐私影响评估。没有处以罚款——这种宽大处理受到了广泛批评。

最严厉的评估来自学术研究人员而不是监管机构。朱莉娅·鲍尔斯博士(Dr. Julia Powles)和哈尔·霍德森(Hal Hodson)在同行评审的《健康与技术》杂志上发表了一篇论文,称该交易是“算法时代医疗保健的警世故事”。他们的核心观察毫不留情:“医院派医生去开会,而 DeepMind 派的是律师和训练有素的谈判代表。”双方都未曾与“患者和公民进行过任何对话”,他们称这是不可原谅的。然后是那句精准捕捉到结构性问题的句子:“一旦我们的数据进入谷歌控制的服务器,我们追踪它的能力就结束了。”

DeepMind 的官方回应(值得肯定的是)真的很坦诚。“在 2015 年这项工作开始时,为了快速取得影响,我们低估了 NHS 的复杂性以及围绕患者数据的规则,”该公司写道。“我们几乎只专注于打造护士和医生想要的工具,认为我们的工作是面向临床医生的技术,而不是需要对患者、公众和整个 NHS 负责并由他们塑造的东西。我们弄错了。”

犯错的代价

这场丑闻造成的伤害不仅仅是 DeepMind 的声誉。它更是凸显了苏莱曼建立其职业生涯的应用人工智能项目核心的一个矛盾。

这项技术确实有效。拯救的生命是真实的。同行评审期刊中记录了每位患者护理成本降低 2000 英镑的事实。这些都没有争议。但是,DeepMind 获取数据以建立和训练该系统的手段,侵犯了这 160 万患者中每一位的合理期望——这些人来到医院接受护理,在脆弱的时刻提交了最敏感的信息,并在不知情的情况下被转移到了科技公司的服务器上。

苏莱曼职业生涯都在思考权力不对称——机构如何系统性地辜负它们所服务的人,技术如何被用来将这种不对称推向普通人而不是远离他们。NHS 数据丑闻证明,即使是对社会公益的真诚承诺,也不会自动产生社会公益所需的治理结构。为了拯救生命而快速行动,从一个角度看,像是迫切感。从另一个角度看,它就像是不问自取。

2018 年末,谷歌宣布 DeepMind Health 将并入一个新的谷歌部门。DeepMind Health 品牌被解散。苏莱曼建立的项目——那个他在内部列为优先级别超越最高级别的 P0 Plus Plus 项目——被他的企业母公司(他曾帮助促成对该母公司的收购)吞并。他被从日常领导岗位上撤换。

2019 年 8 月,在 DeepMind 员工抱怨其管理风格后,苏莱曼被行政休假。他后来表示:“我接受了反馈,作为 DeepMind 的联合创始人,我把人逼得太紧,而且有时候我的管理风格不够建设性。我毫无保留地向受到影响的人道歉。”他于 2019 年 12 月宣布离开 DeepMind。

这个共同创立了后来赢得诺贝尔奖的机构的人,并非在胜利中离开,而是陷入了一场关于他如何对待手下员工的争议中。他所追求的社会公益,到头来,却以一种复制了他试图纠正的机构失败的方式进行:快速行动,假定好意就足够了,却没有问受影响最深的人他们实际想要什么。


第十一章:智能体与 Transformer

2021 年,AlphaGo 的首席架构师大卫·席尔瓦在《人工智能》期刊上合著了一篇题为《奖励足够了》(Reward is Enough)的论文。该论点精准且广泛:最大化奖励的目标,就其本身而言,足以驱动表现出“大部分(如果不是全部)智能属性”的行为,包括感知、语言、社会智能和泛化。论文声称,认知所做的一切都可以被理解为在丰富环境中为了获得奖励而进行的优化。进化花了数百万年才找到这个解决方案。强化学习可以更快地到达那里。

这篇论文是 DeepMind 扎在领地里的哲学旗帜。同时,事后看来,它也是一座纪念碑,纪念着那份让 DeepMind 付出了数年时间的执念。

奖励的理由

哈萨比斯走向 AGI 的方法一直植根于他接受的神经科学训练。他在 UCL 研究过的海马体并不像查找表那样存储知识——它通过经验建立被压缩的、可泛化的世界模型。大脑通过行动和犯错来学习。奖励信号——成功后多巴胺的释放,失败后多巴胺的消失——随着时间的推移,将神经连接塑造成我们称之为“理解”的东西。这就是生物学的故事。强化学习是它的数学抽象:在环境中的智能体,采取行动,接受奖励,调整策略。

这不仅仅是一种技术偏好。这是一种心智理论。而 DeepMind 最大的几场胜利也加强了这一点。DQN 通过奖励精通了雅达利。AlphaGo 通过奖励和自我博弈精通了围棋。AlphaGo Zero 从零开始,仅凭奖励和自我博弈就超越了人类五千年来积累的所有围棋知识。这种模式非常一致,让人感觉这就是真理。

战略含义是,DeepMind 应该构建智能体——被置于环境中的系统,追求目标,通过性能压力发展出通用能力。而不是被训练去预测文本语料库中下一个词的系统。那是模式匹配,不是智能。

通才问题

在 2010 年代中后期占据 DeepMind 应用强化学习团队的研究问题是泛化(generalization)。DQN 的结果令人印象深刻,但它为每一款雅达利游戏从头训练了一个单独的网络。它无法将它在《打砖块》中学到的东西转移到《太空侵略者》中。每次部署都是一张白纸。这不是大脑的工作方式。目标是建立能够跨领域携带知识的智能体。

科拉伊·卡武克库奥卢——DeepMind 最早的研究员之一,Yann LeCun 的博士生,那个目前被引用次数超过 290,000 次的人——领导了其中大部分工作。2016 年发布的异步优势演员-评论家(A3C)系统在不同环境中并行运行多个智能体,将梯度发送回共享网络。第一次,单个架构在所有 57 款雅达利游戏上同时实现了强劲性能,并且在 3D 迷宫导航和连续运动控制方面也取得了成功。相同的算法,相同的网络结构,不同的环境。

然后,在 2018 年出现了 IMPALA(重要性加权演员-学习器架构)——这是迄今为止最认真的尝试。单个网络在 DMLab-30 的所有 30 个任务上进行训练:3D 导航、记忆挑战、基于语言的觅食、对象交互、指令遵循。结果显示了一些令人信服的东西。在许多任务上进行训练并没有让智能体在单个任务上表现变差——而是让它变得更好。通才超越了专才。正向迁移是真实存在的。

与此同时,Oriol Vinyals 及其 AlphaStar 团队正在攻克《星际争霸 II》,这是一个让此前所有尝试都相形见绌的难题。与国际象棋或围棋不同,《星际争霸》具有不完全信息、每秒 22 个动作的实时执行、需要同时控制数百个单位,以及跨越三个独立种族的真正战略多样性。AlphaStar 使用了一个“联赛”训练系统——一个多样化的智能体生态系统,包括旨在寻找弱点的专门“剥削者”智能体——甚至在强化学习开始之前就进行了人类回放数据的训练。2019 年 1 月,它在现场比赛中击败了职业选手。它的神经架构结合了类似 Transformer 的注意力机制,让智能体能够同时推理不同的单位。

最后那个细节绝非巧合。到 2019 年,在谷歌这座大楼另一边发明出来的架构——在 Google Brain,而不是 DeepMind——开始无处不在。

走廊里的八位作者

2017 年 6 月 12 日,谷歌的八名研究人员在 arXiv 上发布了一篇题为《注意力机制就是你所需要的一切》(Attention Is All You Need)的论文。作者名单经过刻意随机化——他们拒绝传统的地位排序,将自己列为同等贡献者。最年轻的 Aidan Gomez 是多伦多大学 20 岁的实习生。在技术上最核心的 Noam Shazeer 自 2000 年起就一直在谷歌工作,并共同发明了稀疏门控专家混合(sparsely-gated mixture of experts)技术,这项技术将成为大规模 LLM 的关键。至于“Transformer”这个名字,被选用的原因仅仅是因为 Jakob Uszkoreit 喜欢它的发音。

他们正在解决的问题是序列建模中一个基本的瓶颈。当时的统治性架构是 LSTM——一种循环神经网络,按顺序一个词一个词地处理文本。要理解第 10 个词,你必须先处理完第 1 到第 9 个词。这使得训练本质上变成了顺序的,不可能在现代 AI 运行的 GPU 硬件上并行化。正如 Shazeer 后来的总结:“在今天的硬件上,算术运算很便宜,而移动数据很昂贵。”

Transformer 完全摒弃了循环。取而代之的是:自注意力机制。在这种机制中,句子里的每一个词都同时直接看向其他每一个词,计算出一个相关性得分,以此决定该对每一个词分配多少注意力。整个句子被同时并行处理。多头注意力(Multi-head attention)并行运行多次这一操作,让模型能同时关注句法、语义和长距离依赖关系。结果是:不仅仅是更好的翻译质量,而且训练的规模与算力呈线性扩展。

Jakob Uszkoreit 相信这会成功。他自己的父亲,Hans Uszkoreit——一位著名的计算语言学家——则持怀疑态度。放弃循环机制的想法让人感觉像是在放弃时间机制本身。而当 Shazeer 第一次听到这个提议时,他的反应则是他标志性的直接:“当然行!”

在 WMT 2014 英德翻译基准上,Transformer 获得了 28.4 的 BLEU 得分——超越了之前所有的模型。在英法翻译上:41.8 BLEU,在 8 个 GPU 上训练了 3.5 天。NeurIPS 的审稿人们立即表现出极大的热情;一位审稿人指出它“已经是社区里谈论的焦点”。

在不到五年的时间里,这篇论文积累了超过 173,000 次引用——跻身跨越所有领域的 21 世纪被引用次数最多的十篇科学论文之列。Transformer 成为 GPT、BERT、PaLM、Claude、Gemini 以及之后所有大型语言模型的基础。

谷歌拱手相让的架构

马拉比深思的讽刺是绝妙的。Google Brain 发明了这个架构。谷歌将其公开发表。然后,所有八位作者都离开了谷歌。

其中六位创办了初创公司。Vaswani 和 Parmar 联合创办了 Adept AI。Shazeer 联合创办了 Character.AI——后来谷歌支付了约 27 亿美元才将他拉回来。那位 20 岁的实习生 Aidan Gomez 联合创办了 Cohere。Uszkoreit 创办了 Inceptive。Lukasz Kaiser 去了 OpenAI,帮助构建了最终让谷歌措手不及的模型。这六位创始人总共从外部投资者那里筹集了 13 亿美元。其中两家公司成为了独角兽。

谷歌内部发明的架构为威胁谷歌的竞争对手提供了动力。公开的论文发表正是促成这一结果的机制。

但在 DeepMind 内部,还存在着第二层讽刺。Transformer 并非由 DeepMind 发明。它是 Google Brain 发明的。多年来,这两个组织像两个在同一个企业屋顶下的平行研究组一样运作,保持着明确的机构分离和内部人士所称的“几乎不加掩饰的相互鄙视”。一位前 DeepMind 研究人员后来说,同事们“因为与 Brain 合作写论文而惹上麻烦,因为人们的想法是,‘你为什么要跟 Brain 合作?’”。学术上的分歧不仅存在于组织上,更是哲学层面的。

深刻的分歧

哈萨比斯理解 Transformer。他的立场不是无知——而是关于智能究竟需要什么,存在着原则性的分歧。

他在这一时期的采访中一致表达的论点是:Transformer“在它们的作用范围内有效得几乎不讲道理”——但它们可能不足以实现 AGI。它们缺少的是他所谓的“世界模型”:对现实的内部因果表征,它能让智能体进行规划、进行反事实推理、理解物理结果并泛化到真正全新的情境中。在他看来,LLM 是异常强大的模式补全器。它们学习语言中的统计规律。但是,语言数据中的统计规律,并不等同于对语言所描述的世界的理解。

《奖励足够了》这篇论文则是从另一个方向提出的同一个论点:智能是在丰富环境中为了获得奖励而进行优化时得到的东西。预测下一个标记——即语言模型训练的实质内容——并非如此。那是某种其他的东西:很复杂、很有用、甚至令人惊叹。但它不是通向 AGI 的路径。

这种信念是连贯的,是站得住脚的。它也与 DeepMind 过去的记录一致。但这让实验室付出了从 2018 年到 2022 年这几年时间的代价,在这期间,OpenAI 悄悄构建了规模化基础设施、数据流管道以及 RLHF 训练技术,最终将 Transformer 从一个研究成果变成了 ChatGPT。

当马拉比就此追问哈萨比斯时,后者做出了部分但真实的承认。“我们在自监督和深度学习方面一直有惊人的前沿工作,”哈萨比斯在一次采访中说,“但也许工程和规模化部分——我们本来可以做得更早、更努力。”在其谨慎的言辞中,这承认了机构层面上的一项战略误判。

Gato 与大融合

在 ChatGPT 面世六个月前的 2022 年 5 月,DeepMind 发表了题为《一个通才智能体》(A Generalist Agent)的论文,介绍了一个名为 Gato 的模型。同样是 12 亿参数的 Transformer,共享同一套权重,执行了 604 项不同的任务:玩雅达利游戏、给图像加字幕、进行对话、用物理机械臂堆叠积木、在 3D 环境中导航。核心技术突破是“序列化”:图像、机器人关节角度、文本、游戏手柄的所有模态都被转换成相同格式的一维标记序列。然后,Transformer 预测下一个标记,完全像语言模型所做的那样。对于网络而言,机械臂、雅达利游戏和字幕任务都是同一种预测问题。

Gato 是 DeepMind 终于将 Transformer 全面整合进其通才智能体研究的成果。从某种意义上说,它同时证实了两个阵营的观点:通过 Transformer 架构(通用序列预测)实现的强化学习泛化假说(单一系统,多种任务)。

它的表现是称职的,但远非超人级别——在许多任务中,Gato 的表现处于专家基准的 50% 以上,其广度令人印象深刻,但在深度上不及专家模型。批评者认为,在许多事情上表现平庸,并不是他们所关注的灵活的智能。但架构层面的论证是真实的:一套权重可以同时跨越机器人控制、图像理解、语言和游戏。

然后 ChatGPT 发布了。世界发现,一个 Transformer 不需要去控制机械臂或玩雅达利,就能创造出在几亿人看来感觉像真正通用智能的东西。

DeepMind 发明了通才智能体理论。Google Brain 发明了架构。OpenAI 将两者结合——对大规模 Transformer 应用基于人类反馈的强化学习(RLHF)——并首先将其推向了公众。这种知识层面的融合,发生在大楼之外,而在大楼里面,这两半人曾花了近十年时间拒绝合作。


第十二章:论语言与自然

2016 年 9 月,由 Aaron van den Oord 领导的一支 DeepMind 团队发表了一篇论文,描述了一个能够直接从原始音频波形合成人类语音的系统。在盲听测试中,WaveNet 将当时最先进的文本转语音技术与真实人类语音质量之间的差距缩小了 50% 以上。它还可以生成音乐——同一套用于语音的架构能自发生成钢琴曲。

这结果很惊艳。真正具有重大意义的是它的方法。

WaveNet 抛弃了语音合成领域几十年来积累的一切:音素字典、声学声码器、基于人类声道发声原理由第一性原理推导出的信号处理模型。取而代之的是,它逐时间步、每个样本基于之前所有样本来对原始音频波形(每秒 16,000 个样本)进行建模。这里的技术创新是空洞因果卷积(dilated causal convolutions):这是一种叠加卷积层并使其间距呈指数增加的方法,从而使模型在时间上的有效窗口随着深度的增加呈指数级增长。结果是:系统能够捕捉语音的长期时间依赖性,而根本不需要被告知什么是语音。

研究人员自身也对结果感到意外:“能用深度神经网络直接对 16kHz 的音频进行逐时间步生成,并且竟然成功了,这真的令人非常惊讶。”他们不是从语音理论中推导出 WaveNet 的。他们将一种通用的顺序预测框架应用于原始数据,并发现它比人类精心设计了几十年的声学模型表现更好。

波形与序列

WaveNet 所证明的原理并不局限于音频。Van den Oord 之前在一篇名为 PixelRNN 的论文中就已经在图像上证明了这一点:将每个像素视为一个基于之前所有像素来预测的值。同一种分解法——将任何高维信号的联合概率表示为其各元素按顺序排列的条件概率乘积——适用于图像、音频,以及第二年通过 Transformer 论文所证明的语言。

更深层的论点涉及认识论:无论多么复杂的自然信号,都包含可学习的统计结构。你不需要理解这个领域。你需要的是足够的数据和一个具有足够容量来对序列依赖关系进行建模的网络。工程师们花了其职业生涯编码进 AI 系统的领域知识——语音规则、声学物理学、语法结构——结果证明是不必要的。结构就在数据之中。

这一洞见最终延伸到了生物学领域。

蛋白质就是一个句子

在最基本的层面上,蛋白质就是一串字符。20 种标准氨基酸每一种都被分配了一个字母——A、C、D、E、F 等等——一条蛋白质序列就只是这些字母构成的字符串,通常有几百到几千个字符长。一个由 300 个氨基酸组成的蛋白质,就是一个由 20 个字母表构成的、长度为 300 个字符的句子。

更重要的是,它是一份信息完备的说明书。这是安芬森定理(Anfinsen's theorem)——克里斯蒂安·安芬森(Christian Anfinsen)因此获得 1972 年诺贝尔化学奖的见解:蛋白质完整的的三维结构以及它的生物功能,完全由其氨基酸序列决定。不需要任何其他东西。序列不是蛋白质的摘要;它就是蛋白质的完整说明书,以线性形式编码。如果你知道如何阅读这个序列,你就能重建关于这个分子的一切。

加载中…

《无心为善的人》(Careless People)逐章内容调研报告

· 阅读需 50 分钟

作者:莎拉·温恩-威廉斯(Sarah Wynn-Williams)(前Facebook全球公共政策总监) 出版日期:2025年3月11日(Flatiron Books / Macmillan)

本书副标题: "权力、贪婪与理想沦丧的警世故事"(A Cautionary Tale of Power, Greed, and Lost Idealism)

本书是温恩-威廉斯对其2011年至2017年在Facebook(现称Meta)任职期间的回忆录。作者以亲身经历揭露Facebook内部文化和决策过程,透视这家科技巨头如何从最初充满理想的创新平台演变为掌控全球信息却"漫不经心"滥用权力的帝国。书名"Careless People"出自美国经典小说《了不起的盖茨比》(The Great Gatsby)的结尾语:"他们是漫不经心的人"("They were careless people"),原指小说中富有而冷漠的汤姆和黛西。温恩-威廉斯以此比喻Facebook创始人马克·扎克伯格(Mark Zuckerberg)与首席运营官雪莉·桑德伯格(Sheryl Sandberg)——在书中,他们被比作当代的"汤姆和黛西",肆意破坏他人生活却让旁人替他们收拾残局。这种20世纪美国纸醉金迷时代的隐喻,凸显了现代科技巨头领袖的冷漠与权责失衡。

本报告将按章节顺序,逐章概述本书内容,着重各章的主旨要点、涉及的重要事件与人物,以及书中引人入胜的历史轶事、社会细节和人物刻画。同时我们将关注书中20世纪美国历史与当代反思的交汇,例如作者如何运用历史典故(如经典文学、政治人物、文化象征)来映照当今社群媒体时代的现实。在不延伸讨论其他作品或作者写作风格的前提下,以下为《无心为善的人》的章节梳理:

第一章:理想的召唤 – 从外交官到社群媒体先锋

主旨: 作者从新西兰外交官转职硅谷的契机与理想。温恩-威廉斯描述自己如何在2010年代初怀抱理想,看见社群媒体能连结世界的潜力,因而不惜放弃传统外交官生涯,转而主动争取加入当时快速崛起的Facebook。她曾在联合国和新西兰驻美使馆工作,但感到只是体制内的齿轮,希望投身更有影响力的事业。2011年,作为一名年轻的国际律师和外交官,她主动向Facebook自荐,甚至自己设计了"全球公共政策总监"一职,因为当时的Facebook管理层压根没意识到需要专责全球政策的人才。她回忆说,当时要联络上Facebook求职非常困难,公司仿佛一堵砖墙,但她通过人脉"敲开一线门缝",最终如愿以偿。这段经历体现了她对Facebook理想使命的执着追求。

核心事件与细节: 本章节交代了作者加入Facebook的背景动机。温恩-威廉斯提到一件令她坚信社群媒体可以造福人类的亲身经历:新西兰基督城在2011年发生大地震时,她一度与身在灾区的妹妹失去联系,所幸隔天通过Facebook才得知妹妹平安无事。这件事深深触动了她,让她见识到跨国连结与即时信息的价值,也促使她立志加入Facebook推动全球互联的愿景。带着这份信念,她放下原本体制内的稳定发展,勇闯硅谷,希望能**"在历史前进的时刻有所作为"**。第一章借此铺垫作者的理想主义基调:她相信Facebook有潜力打破疆界、凝聚人心,而她要成为引导这股力量的推手。

人物介绍: 作者在此章简要介绍了自己(新西兰出身、法律与外交背景)以及Facebook创始人马克·扎克伯格。她强调,当时的扎克伯格年仅20多岁,带领着一群极客工程师,对她这样主动请缨的人颇为惊讶。然而,她的执着和专业最终打动了Facebook,让她成为公司首位专责全球政策与政府关系的主管。这也为后续章节中她在Facebook内部推动全球议题埋下伏笔。

第二章:初入硅谷 – 工程师帝国与"小红书"文化

主旨: 作者初到Facebook总部的所见所感,描绘Facebook内部独特的企业文化和权力结构。温恩-威廉斯初踏入硅谷,发现公司由一群年轻的程序工程师和"兄弟会男孩"主导,他们手握重金、我行我素,工作氛围更像大学宿舍而非传统企业。Facebook源自哈佛校园的交友网站,在短短数年内蜕变成掌控全球的信息帝国,但公司文化仍带着浓厚的青春与傲慢气息。本章突出内部文化的两面性:一方面是令局外人瞠目的创新活力与财富膨胀,另一方面则是高度集中的决策权和近乎狂热的企业信仰。

核心内容: 温恩-威廉斯观察到,Facebook内部崇尚工程师至上的理念,由写程序、搞技术的人当家作主。身为刚上任的全球政策总监,她惊讶地发现公司高层(尤其是扎克伯格)对国际政治和外交几乎毫无兴趣,甚至讨厌参加外交场合。她形容当时的扎克伯格就像个宅在实验室的理工天才,只关心产品功能和用户增长,对政府事务与国际关系不以为然。这使得她的工作在初期推行颇为艰难——她得努力让这群理工男理解全球视野的重要性

社会细节: 作者以几个生动的小故事展现Facebook独特的公司文化和美国人狭隘的地理观:例如,一位高层对新西兰的地理位置茫然无知,让身为新西兰人的她哭笑不得。她开玩笑提议帮这位同事买张世界地图挂办公室墙上,对方最初拒绝了,但不久后他办公室里竟真出现了一幅大大的世界地图。这段插曲既滑稽又意味深长:Facebook的决策者们肩负全球影响,却对世界知之甚少,需要补上一课基本的国际常识。

企业文化:"小红书"现象: 温恩-威廉斯描述Facebook内部有一本传奇的员工手册,被戏称为公司版的"小红书"。如同毛主席语录之于红卫兵,Facebook的"小红书"汇集了扎克伯格这位"最高领袖"的名言、照片和核心理念。新员工人手一册,以此了解公司的价值观。她打趣道:"当然,这本书里的'主席'不是毛泽东,而是马克"。这种半开玩笑的比喻,突出了Facebook企业文化中的个人崇拜和意识形态色彩。公司营造出类似宗教般的氛围,高层的话语就是圣训,所有员工都被要求牢记并奉行。从20世纪毛语录到21世纪马克语录,如此历史对照显示Facebook内部文化的狂热与封闭:Facebook的决策风格深受扎克伯格个人意志左右,企业文化近乎以他为圭臬。

工程师治国与灰色地带: 在本章后半,作者点出Facebook文化中一个隐忧——对规则的漠视与对灰色地带的乐于钻营。工程师出身的管理者们崇尚快速行动和打破常规,公司上下对法律与政策采取功利态度:对外公开一套说辞,私下里却常钻漏洞、打擦边球。她举例说,公司曾公开声称会保障使用者数据隐私,但私下却默许开发人员在政策灰色地带为所欲为。这种双重标准为日后的一连串丑闻埋下伏笔,也让她开始警觉Facebook文化中的危险倾向。

第三章:跌跌撞撞的全球扩张 – 初试权力的滋味

主旨: 本章记述Facebook高层初次涉足国际外交舞台的经历,以及作者在其中扮演的角色。2011–2012年间,Facebook从校园产品转型为全球平台,开始试探性地与各国政要接触。温恩-威廉斯作为全球政策总监,积极为扎克伯格安排会见世界领袖的机会,希望提升公司在各国政府间的认受度。然而扎克伯格最初对这类活动并不上心,直到真正尝到权力聚光灯的滋味,才渐渐改变态度。本章聚焦于扎克伯格与政治权力的初相遇,从拘谨青涩到野心萌发的转变过程。

核心事件1 – 首次会见国家元首(2012年俄罗斯): 2012年,扎克伯格见到了他的第一位在任国家首脑——俄罗斯总理梅德韦杰夫。温恩-威廉斯陪同在侧,形容当时的扎克伯格紧张得满头大汗。这次会面对年轻的硅谷创业家是全新场面:他第一次意识到自己作为社群媒体帝国掌门人,也有资格与政治强人平起平坐。从局促不安到渐渐品尝权力的甜头,扎克伯格开始对出席高阶外交场合产生兴趣。温恩-威廉斯指出,扎克伯格此后口味大开:他主动要求在国际场合与更多传奇人物相识。例如,他曾试图在一次晚宴上被安排坐在古巴领袖菲德尔·卡斯特罗身旁(但未能如愿)。扎克伯格开始迷恋这种走上前台、与风云人物比肩的感觉。他尝到了权力的滋味,野心也在滋长

核心事件2 – 开拓新兴市场(2012年缅甸): 同一时期,Facebook也将触角伸向当时网络尚不普及的国家。本章详述了一次具有象征意义的外交行动:2012年10月,温恩-威廉斯奉派前往缅甸,与当地军政府高层谈判,希望解除Facebook在缅甸的封锁。当时缅甸刚刚开始民主转型,但网络言论仍受军方钳制。Facebook在该国一度被禁,作者的任务就是游说缅甸军政府"解禁"Facebook,让这款美国社群产品进入一个全新市场。她成功说服了缅甸当局,为Facebook打开了这个国家。但讽刺的是,作者日后发现,早在2012年,当地公民社会人士其实已警告过她Facebook上滋长的仇恨言论问题,只是当时公司对此漫不经心。本书稍后章节将详述这一忽视所酿成的恶果(缅甸罗兴亚人种族清洗),此处先伏笔带过。当下,Facebook把进军缅甸视为胜利,公司关注的是拓展版图,未预料日后平台在该国会被利用来**"煽动仇恨与暴力"**。

社会细节: 作者戏称自己的角色像是Facebook的"外交开拓者":她要在世界各地奔走,让政府接受这个美国新创平台。在新市场的推广中,有时会遇到啼笑皆非的场景。书中提到,缅甸当局当年对Facebook的了解近乎零,以致双方会谈时出现不少误解与文化碰撞。例如,一些军方官员困惑于为何年轻人热衷在网上分享生活琐事;而作者则极力强调Facebook有助于信息传播与经济发展。最终军政府被说服,某种程度上也是看中了Facebook可作为监控舆论的工具(这也埋下日后缅甸乱象的隐患)。

历史对照: 温恩-威廉斯在本章的描述中,隐隐让人联想起20世纪早期跨国公司的崛起。例如美孚石油、东印度公司等在新市场开疆辟土的历史情景。Facebook作为信息时代的新型企业,其全球扩张中同样涉及与当地权势交易、影响主权政策的现象。她以亲身经历展示:科技企业的势力已大到足以与政府对话交易,这在以前仅属超级强权或跨国财团的特权。Facebook这种21世纪的社群帝国,正重现过往帝国主义般的扩张身影,只不过征服的是数字疆域。

第四章:特权飞行 – 私人飞机与奢华特权的日常

主旨: 本章转而描写Facebook高层纸醉金迷的生活场景,以及公司内部等级森严的特权文化。温恩-威廉斯随同公司高管频繁出差,体验到搭乘私人喷射机穿梭世界、极尽奢华排场的场景。这对来自公部门的她形成强烈反差:曾经的外交工作再怎么繁忙谨慎,也远不及硅谷巨头在财力上的阔绰。她以亲眼所见揭露Facebook顶层人员挥霍无度的一面,暗喻巨大财富带来的道德麻痹

奢华场景描写: 作者笔下,Facebook高管的私人飞机之旅令人瞠目:飞机内备有卧室、各式美馔和娱乐设施,高层们可以在万米高空开派对或商谈交易。她亲历的某次跨洲飞行中,公司几位主管在机上酝酿出一个大胆计划,仿佛亿万资产让不可能变为可能。例如,她提到有些"疯狂点子就是在私人飞机上拍板的",Facebook借由这种极少数人组成的小圈子,决定着影响数亿人的产品政策。这里凸显权力集中与决策随意:当决策者脱离现实土壤、置身奢华真空,他们更可能漫不经心地做出影响深远的决定。正如作者所言,Facebook后来许多离谱的项目都是在这种环境下"烹饪"出来的。

特权与隔阂: 作者感慨,Facebook高层久居特权圈层,对一般用户的现实处境渐行渐远。她举了一个细节:某次她搭乘公司的私人飞机出差,途中亲眼目睹高管们如何挥霍公款——光是一顿空中大餐的红酒预算就数千美元,与此同时,平台上却充斥着世界各地用户的真实苦难故事,讽刺之感油然而生。这种贫富悬殊的鸿沟在她心中埋下疑问:Facebook宣称要连接世界、赋权全民,但它的领导者们是否真的理解普罗大众的需求?抑或他们活在自己的豪华泡沫中?

相关人物: 本章也侧面介绍了Facebook早期几位核心高管的背景。例如,她提到公司里有一些来自美国政界的人物:乔尔·卡普兰(Joel Kaplan)就是其中代表。卡普兰曾任小布什政府副幕僚长,拥有深厚的华府人脉。2011年Facebook延揽他担任美国政策副总裁,后来升任全球政策副总裁,成了作者的顶头上司。这些政商通吃的人物为Facebook带来了共和党式的人脉和强硬手腕,也让公司文化平添一份"华府山头主义"气息。本章通过对私人飞机上权贵云集场景的描述,点出Facebook权力核心圈子的封闭性与同温层效应——几个志趣相投、利益绑定的人主宰一切,他们的世界与广大用户的世界截然不同。

第五章:权力几何 – 小圈子里的灰色游戏

主旨: 本章深入探讨Facebook权力核心的小圈子文化,以及公司如何在监管与规则的灰色地带游走。作者揭露,Facebook由一小群关系盘根错节的人操纵着数十亿用户的注意力。这个圈子有其独特的运作逻辑:对内高度紧密抱团,对外则采取强硬甚至不择手段的策略以维护利益。温恩-威廉斯以自身观察总结,Facebook的领导层贪恋权力且欠缺制衡,逐渐形成"只手遮天"的局面

核心观点 – 权力集中与扩张: 作者指出,扎克伯格特殊的股权结构赋予他一票否决权,使他对公司有绝对控制力。Facebook尽管已是全球上市企业,但实质上运作如同私人帝国——"Facebook就是一个人的独裁统治"。她透露,每年公司向美国证券交易委员会(SEC)提交的文件都会清楚载明这点:扎克伯格即便违背董事会和其他股东意愿,也可单方面出售公司或改变方向。这导致Facebook的决策往往完全反映扎克伯格一人的执念。例如,他长期将用户数爆炸性增长视为终极目标,如同棋痴眼中的胜负,甚至不惜采取激进手段来实现。作者强调,公司政策永远追随扎克伯格的偏好转向:他痴迷哪方面,整个公司资源就倾斜哪方面。

"灰色地带"运营: 在这种结构下,Facebook在各国推广时展现出游走法律边缘的灵活性。温恩-威廉斯揭示了若干秘密项目。例如,2014年公司内部组建了一支"中国小组",专门研发符合中国网控要求的版本,以期打入中国市场。2015年,公司甚至开发出一套为中国当局定制的审查系统,允许指定"总编辑"删除帖文,必要时可一键关闭整个站点。这些计划在当时从未公诸于世,公司对外声称"不会为进入中国而出卖价值观",但私下却在打造全面配合审查的机制。又如,Facebook高层曾讨论降低香港用户的隐私保护,以及与中国企业合资以绕过限制等方案。这些看似匪夷所思的妥协行动,充分说明Facebook在利益面前愿意踩踏伦理红线。直到近年美中关系恶化、华府开始敌视中国,此类涉华计划才被叫停。作者在书中与随后提交给SEC的吹哨人文件中披露的这些内情,证实了扎克伯格曾经长期试图"配合中国政府",甚至在香港和台湾等地预先启用过部分审查工具供中共官员试用

历史隐喻: 作者感叹道,Facebook这类科技巨头其实与传统产业巨头并无二致——是数字时代的石油、烟草财阀。她写道:"让我震惊的是,原来Meta和它的同类,只不过是类似过去那些石油、采矿和烟草联合企业的数字翻版"。这些企业同样贪婪逐利、打压异议,甚至不惜与独裁政权勾连来换取市场。唯一的区别在于它们掌控的资源从有形产品变成了人类的注意力和言论。作者通过种种内幕强调:当科技巨头的权力极度集中且缺乏制衡时,其危害足可比肩20世纪那些臭名昭著的企业帝国

第六章:镜花水月 – 女性赋权幻象与桑德伯格真相

主旨: 本章重点刻画Facebook内部的性别文化与雪莉·桑德伯格的双面形象。作为少数进入公司高层的女性,温恩-威廉斯起初将桑德伯格视为榜样——后者在2013年出版畅销书《向前一步》(Lean In),鼓励职场女性争取话语权。然而随着共事,她逐渐看清桑德伯格的言行不一,所谓女性赋权在Facebook内部其实只是表面文章。本章揭示了Facebook职场对待女性的真实态度,以及桑德伯格这位"职场女强人"令人失望的另一面。

桑德伯格形象的反转: 温恩-威廉斯讲述刚入职时对桑德伯格满怀崇敬。2013年《向前一步》出版,掀起全球关注职场性别平等的风潮,Facebook内外都将桑德伯格奉为女性领导力的象征。她本人在公司倡导所谓"Lean In"文化,鼓励女员工积极争取晋升。然而,作者很快发现,桑德伯格的"提携女性"只停留在口号上。实际上,她要求的是下属的绝对服从与贴身效忠。温恩-威廉斯辛辣地形容桑德伯格的管理风格:"把'向前一步'当成卖点,其实底下是不言而喻的潜规则——服从和亲近"。也就是说,桑德伯格希望女性员工效法她,但前提是按她的规则行事、对她保持忠诚。

惊人轶事 – 奢华内衣与"上床"邀请: 作者以两则令人瞠目的亲历故事,揭露桑德伯格的越界行为和权力怪癖。其一,桑德伯格曾指示自己26岁的女性特助为她和温恩-威廉斯各挑选购买高级内衣,且预算上不封顶,最后这次荒唐的购物花费高达13,000美元。作者对此深感不安:上司要求属下代买私密衣物,显然逾越了一般职场界线。其二,在一次欧洲出差中,桑德伯格的举动更让作者震惊:他们搭乘公司专机从欧洲返回美国,12小时长途飞行。桑德伯格身穿睡衣,占据了飞机上唯一的卧铺床铺,并一再命令温恩-威廉斯"过来一起睡"。作者婉拒了多次,桑德伯格显得很不悦。这一幕让作者感受到前所未有的压力——桑德伯格仿佛在测试甚至玩弄下属对她的服从。事后温恩-威廉斯对朋友坦承,这种要求令她非常不适,但在权力不对等的环境下难以抗拒。

上下级失序关系: 桑德伯格与她年轻女助理之间也呈现出过度亲密而古怪的互动。作者描写某次在欧洲长途奔波时,桑德伯格和那位助理竟在车上轮流枕着对方的大腿小憩、抚弄对方的头发入睡。这种举止超出了典型老板与下属的界线,让身旁的作者大感错愕。她开始怀疑桑德伯格的种种行径与其公开形象严重背离——一边在台上倡导女性专业形象,一边在台下搞类似裙带亲信的权力游戏

女性职场困境: 温恩-威廉斯在反思桑德伯格的同时,也点出Facebook内对待女性的一些双重标准。例如,公司虽然鼓励所谓"多元与包容",但实际上许多女性员工感受到被物化和边缘化。Facebook文化中充斥着男性主导的"兄弟会"气息,女性若不顺从迎合,就难以融入高层圈子。作者自己作为职场母亲所遭遇的种种(后续章节详述)更证明了:Facebook对女性和家庭并不真正友善。她逐渐领悟,桑德伯格的成功更多是个人形象工程,对改善广大女性处境助益不大。

第七章:办公室暗潮 – 性骚扰与噤声文化

主旨: 本章聚焦Facebook内部的性骚扰事件和公司对丑闻的处理态度,重点讲述作者与其上司乔尔·卡普兰之间发生的冲突。温恩-威廉斯指控卡普兰对她有多次不当言行,从公开场合的身体骚扰到产假期间的无理要求,然而公司最终选择包庇高管、噤声异议。本章揭露Facebook内部存在有权者享特权、受害者被压制的文化,以及女性在男性主导的权力结构下如何被边缘化。

卡普兰其人: 乔尔·卡普兰(Joel Kaplan)是Facebook高层中极具影响力的一员。他曾是桑德伯格在哈佛的旧识(两人有过短暂交往),拥有辉煌的华府背景:担任过美国海军陆战队军官,最高法院大法官斯卡利亚的助理书记,并曾参与2000年美国总统大选佛州争议计票中的"布鲁克斯兄弟暴动"。在小布什政府中卡普兰任职副幕僚长。Facebook延揽他后,凭借其政治资源,他从美国公共政策主管一路晋升为全球政策副总裁,成为温恩-威廉斯的直属上司。卡普兰强硬的作风和与共和党高层的深厚关系,让他在Facebook内部被视为举足轻重的人物。

骚扰与冲突: 温恩-威廉斯在书中详细描述了卡普兰对她的不当行为。一次公司活动的派对上,卡普兰在舞池中从背后紧贴着她随音乐扭动,对她做出磨蹭动作。他当时夸张地称她看起来"真是娇艳动人(sultry)",甚至当众对她的丈夫品头论足,说些古怪的话。这让作者极度尴尬,不得不迅速离开现场。事后她对上司如此逾矩的肢体骚扰感到愤怒和委屈,产生了正式投诉的念头。但在Facebook那种精英男子俱乐部氛围中,她心知直接举报将面临极大阻力,于是暂时隐忍。

产假骚扰与调查: 更严重的事件发生在作者休第二次产假期间。2016年左右,温恩-威廉斯怀孕生子,不料生产时发生羊水栓塞(一种罕见且致命的产科并发症),导致她一度命悬一线。所幸捡回一命,但需要长时间住院治疗和休养。然而,即便她在修养恢复,卡普兰却不停通电邮要求她参加每周视频会议,对她的近况几无关心,只关注工作进度。作者在邮件中明确告知他自己身体仍有严重状况,亟待二次手术止血,但卡普兰竟执意追问"你到底是从哪里在流血?"态度之冷漠、问题之冒犯,令她难以置信。最终,作者向公司人力资源部门正式投诉了卡普兰长期以来对她的骚扰和不当行径。然而,公司随后展开的内部调查结果却是——卡普兰没有任何不当。这样的结论让她心寒:Facebook选择站在权势男性一边,否定女性员工的切身经历。

双重标准与压迫: 在产假结束回到工作岗位后,作者不仅没有等到公正,反而遭受职业报复。卡普兰或其他上司对她的表现提出苛责,在绩效评估中批评她"反应不够及时"。面对这种荒唐指责,她据理力争,直指:"我昏迷的那段时间没法及时回复,这能怪我吗?"。这句充满讽刺的回答凸显了Facebook内部对女性、对母职的极度缺乏同理心——即便员工经历生死关头,公司仍只关注她是否"秒回邮件"。温恩-威廉斯将这一幕作为写照:在Facebook这个所谓"提倡多元"的地方,女性实际上被要求如机器般工作,怀孕生育被视为对效率的妨碍。而高层男性的性别歧视与骚扰则被有意遮掩。这种企业文化与桑德伯格对外宣扬的"女性赋权"形成讽刺对比。

结果与影响: 本章结尾暗示了作者与Facebook高层的决裂。2017年左右,温恩-威廉斯在内外交困中选择不再沉默,最终引发她职涯的重大变动(在后续章节中,她被公司开除并走上吹哨人之路)。Facebook对卡普兰事件的处理昭示出一种噤声文化:任何对内部高层不利的指控都会被压制,提出者则可能遭到惩处。这为后文作者决定曝光公司黑幕奠定了动机基础。

第八章:身不由己的职场母亲 – 在压力锅中平衡家庭

主旨: 本章聚焦作者身为两个孩子母亲,在Facebook高速运转的职场环境中艰难求生的经历。温恩-威廉斯坦陈,Facebook的企业文化实际上不容许员工"生活"——工作即是一切。对女性而言尤其残酷:怀孕、生育、育儿这些人生重要环节在公司眼中成了"累赘"。本章通过作者两次怀孕期间的遭遇,揭示Facebook职场对母职的不友善乃至敌意态度。

怀孕期间的压力: 作者描述,当她在职场上宣布自己怀孕后,感受到公司潜在的歧视目光。一些主管开始质疑她是否还能投入繁重工作,甚至在分派重要任务时将她排除在外。然而,矛盾的是,公司高层又不容她真正休养安胎,反而在怀孕期间频繁要求她出差和超负荷工作。她举了两个极端例子:其一,在怀孕末期(肚子很大时),公司竟派她前往寨卡病毒肆虐的地区出差。当时寨卡疫情正导致孕妇新生儿畸形的风险增高,这趟差旅对她和胎儿都有潜在危险,但公司业务的需要压过了对个人健康的考量。其二,在怀第二胎时,她又被要求随团飞赴日本,为桑德伯格的新书(《向前一步》)宣传站台。长途飞行和高强度行程对一位怀孕妇女而言非常吃力,但公司高管明知她有孕在身,仍坚持她出席,以显示女性主管支持女性主义畅销书的姿态。这些要求表明:Facebook对怀孕员工几乎没有体恤,甚至把她们当成展示企业形象的工具

休产假名不副实: 在生育之后,作者的境遇也没有变好。她形容自己的产假像一场战斗——需要不断向上司重申"我依法有产假的权利"。但实际上,她在休假期间不得不零星处理工作,以免错过重要决策或被边缘化。卡普兰等上司不停地通讯联络,让她难以安心休养。更过分的是,就在她濒死抢救、尚未苏醒时,工作邮件仍不停涌入,仿佛生怕她落下一分钟的进度。这种残酷情形充分证明Facebook的工作文化被**"男性化"的价值观**占据:要求无休止的投入,把任何个人家庭需求都当成弱点。正如扎克伯格多年后在播客上所抱怨的,Facebook近年企业文化"太过中性温驯,需要重新注入阳刚之气"——这番话反映出公司高层始终认为只有抛开所谓"女性的顾虑"才能提升效率,殊不知这正是对女性工作者的忽视与贬低。

关键场景 – 癫痫发作的同事: 本章节还提到一个触目惊心的办公室事件,加深了作者对公司冷漠本质的认识。有一天在公司,一位女性外包员工突然癫痫发作,倒在地上抽搐,口吐白沫、头部出血。温恩-威廉斯当下冲过去施以援手,但四周的主管们却几乎无动于衷。他们只是疏散围观者,自己站在一旁冷眼旁观,没有人上前关心或协助这名发病的员工。作者描述当时场景令她毛骨悚然:那些掌握权力的人对部属的生死安危**"根本不在乎"这一刻她彻底看清,原来公司高层眼中,员工只是螺丝钉,出了问题随时可以换,没人真的"在乎"你的生命。她心中的理想主义鳞片仿佛纷纷剥落——Facebook美好包装下,其实是极度冷酷、自私的内核。这起事件可谓作者的"觉醒时刻",她形容:"这些人根本『毫不在乎』(didn't give a f***)**"。20世纪社会批判小说中的资本家冷漠形象(如《了不起的盖茨比》的汤姆与黛西)在此真实上演,Facebook的领导们对下属如草芥的态度让她大失所望。

结论: 本章通过一系列个人体验,传递出作者的强烈情感转折——从最初相信自己可以"兼顾事业与家庭,在Facebook大展身手",到最后发现这一梦想何其难实现。Facebook将她磨得身心俱疲,她开始思索这一切是否值得。在男性主导的企业文化中,女性被要求作出超人般的牺牲,却得不到应有的尊重和保障。理想主义在现实压榨下渐渐幻灭,这正呼应了书名所言的"理想沦丧"。

第九章:谎言与真相 – 平台扩张下的暗流

主旨: 本章转回Facebook在全球扩张中的政策矛盾和公共关系危机。温恩-威廉斯揭示Facebook如何一面宣称行善,一面行事功利,对外输出光鲜理念,对内追求商业利益最大化的不一致。特别以2014–2015年的Internet.org项目为例,讨论Facebook在推广所谓"连接全世界"愿景时,实则侵犯网络中立原则,引发各界抨击。作者身处这场争议核心,回忆自己如何协助包装宣传,同时内心对公司言行不一感到不安。

Internet.org的两面性: Internet.org是Facebook于2013年发起的一项计划,号称要为发展中国家提供廉价甚至免费的互联网服务,缩小"数字鸿沟"。2014年,作者与Facebook增长副总裁哈维尔·奥利凡(Javier Olivan)一同出访哥伦比亚,游说该国总统桑托斯支持Internet.org。Facebook希望借拉美领导人背书,推广这项计划。然而,作者注意到同一时间在美国国内,联邦通讯委员会(FCC)因网络中立性议题正承受舆论压力。讽刺的是,Facebook与其他科技巨头一起签署公开信,支持维护网络中立、反对网络服务商歧视性收费;但Internet.org本身却在做相反的事——只允许用户免费访问Facebook及少数合作网站,封闭了开放互联网的生态。作者坦言,这种自相矛盾令她感到不安:Facebook表面上倡导普惠连网,实际是为垄断新兴市场而设计一个"园区围墙"。许多数字权利团体强烈反对Internet.org,批评其破坏网络开放精神。作者在书中指出,扎克伯格一方面自诩提供慈善服务,另一方面却漠视专家对其计划可能伤害当地信息生态的警告。她作为执行者,内心充满矛盾:既要"推销"Facebook的愿景,又隐约觉得这愿景掺杂了不光彩的算计。

联合国舞台: 2015年,Facebook成功让扎克伯格登上联合国的大雅之堂。温恩-威廉斯描述她如何策划安排扎克伯格在当年9月的联合国大会期间出席活动,以向全球领袖宣扬Internet.org作为缩小数字落差的解决方案。扎克伯格在联大高调主张将"网络连接"纳入联合国可持续发展目标,承诺Facebook愿协助未连网人口接入世界。然而,作者心里明白,扎克伯格所表演的"利他主义"其实夹带私利。Facebook计划提供的免费网络服务缺乏加密和内容审查,易成为监控与操控工具。数字权益倡议者们一针见血地指出,Internet.org是高压"围墙花园"模式:让发展中地区的人们只上得到Facebook,而上不到开放的互联网。最终,面对强大反弹声浪,Facebook在2016年将Internet.org更名为"Free Basics"并调整策略,但该计划已在多国受阻甚至被禁。作者以此为例,批判Facebook高层的言行不一和自利本质公开场合以公益之名行事,实际目的是壮大公司势力。这种虚伪让她深感失望。

矛盾心理: 在推动Internet.org的过程中,作者陷入道德两难。一方面,她确实相信让更多人上网有正面价值,也希望自己的工作能惠及贫困地区的人口;但另一方面,她越来越看清Facebook并非慈善机构,其高层所谓"连接世界"更多是为公司培养新用户、垄断信息入口。温恩-威廉斯在书中坦承,当扎克伯格在联合国侃侃而谈时,她站在旁边内心五味杂陈:他的讲辞充满道德光环,但她想到公司背后隐藏的算盘,觉得其中虚假令人刺眼。这种认知上的撕裂,使她开始对Facebook的未来产生怀疑:假如核心领导层连基本诚信都无视,Facebook终将偏离改善世界的初衷。

现实影响: 作者指出,Facebook的这些作为加剧了全球各地政府和民众对它的不信任,也埋下后来监管风暴的种子。诸如Internet.org的争议,使许多国家开始警惕Facebook的扩张企图。一些民主国家的监管机构谴责Facebook企图以"免费服务"名义行垄断之实,这预示着Facebook在西方世界即将面对的更严格审查。本章从作者亲历视角揭示Facebook在道德上滑坡的一段历程,为后续更严重的全球性危机(假新闻、种族仇恨等)埋下伏笔。

第十章:失控的连接 – 缅甸种族暴力中的Facebook

主旨: 本章深入剖析Facebook在缅甸助长种族仇恨的惨痛案例,显示当社群媒体平台急速扩张而缺乏监管时,会酿成何等严重的现实后果。温恩-威廉斯以缅甸罗兴亚人危机为中心,叙述Facebook如何从2012年进入该国后,逐渐成为煽动仇恨的工具,最终在2016–2017年间助长了对罗兴亚穆斯林的种族清洗。她既痛心又自责地写道:"缅甸的例子清楚展示了:当Facebook彻底渗透一个社会而又缺乏监管时,可以引发多大的浩劫。"

背景: 缅甸是Facebook一个极端的案例:由于该国传统媒体落后,Facebook在短时间内成为主要信息渠道,几乎等同于"互联网"本身。然而,Facebook在当地投入的资源极其有限——温恩-威廉斯揭露,直到2010年代中期,Facebook只聘有一名会说缅甸语的合约员工,且人还远在爱尔兰都柏林。换言之,整个缅甸数百万用户在Facebook上的言论监管,居然靠一个不在缅甸的外国人来处理。时差、语言和文化隔阂,导致Facebook对缅甸情势几乎失明。仇恨帖文在平台上长期肆虐而无人及时管理,酿下大祸。

作者的预警与挫败: 作为全球政策负责人,温恩-威廉斯很早就收到缅甸情势不妙的警讯。2013年前后,她从不同渠道得知:Facebook上开始流传针对罗兴亚人的虚假谣言和煽动性内容。她意识到,这可能在当地引发暴力。于是她极力向公司呼吁要增强缅甸的内容审核能力,例如增派懂缅甸语的审查员、加快删除仇恨言论。但她的建议没有得到高层足够重视。Facebook彼时把重心放在拓展用户和新功能上,对缅甸这样的边缘市场投入很少。直到2016年之后,缅甸若开邦的局势急剧恶化,Facebook上充斥着针对穆斯林少数的假新闻、阴谋论和仇恨煽动,终于助长了军方和极端佛教势力对罗兴亚人的大规模屠杀与驱逐。数以万计的平民被杀害,数十万人逃亡他国成为难民。联合国调查认定Facebook在此过程中扮演了"加速器"角色。温恩-威廉斯痛心疾首地承认:Facebook本可更早采取措施,自己也曾经敲响警钟,但公司贪图增长无暇他顾,导致内容审核"慢得可怕又致命"

残酷事实: 作者以缅甸为例,强调Facebook平台的"致命漫不经心":赚取了用户增长的红利,却没承担起相应的责任。她写道:"缅甸证明了当Facebook真正在一个国家无所不在时,若不尽责管理会造成多大浩劫"。Facebook高层直到酿成国际公关灾难,才后知后觉地道歉、承认失误。这种亡羊补牢式的态度让她感到愤懑——数百条人命已经消逝,公司才开始加派审查员补救。而那些早先给过她警示的当地NGO与记者,Facebook从未真正在意过。

余波: 罗兴亚危机后,Facebook声称加强了对灭绝性仇恨言论的管制,扎克伯格也在国会听证时为此道歉。然而作者指出,公司内部并没有追究相关决策者的责任,仿佛这只是发展中的"一个小插曲"。这种缺乏问责的态度,正是Facebook领导层"漫不经心"文化的体现:赚钱时高调扬名,出事了轻描淡写。通过缅甸一章,温恩-威廉斯强烈谴责了Facebook全球扩张过程中的傲慢与失职,也为读者敲响警钟:社群媒体的力量若失控,足以引发人道灾难。

第十一章:大选风暴(2016)– 社群媒体与民主的碰撞

主旨: 本章记录Facebook在2016年美国总统大选中的深度介入,以及由此引发的民主争议。温恩-威廉斯揭露,Facebook不仅是政治信息的载体,更直接参与了竞选活动的运作。她详述Facebook如何派遣团队"嵌入"特朗普阵营,协助其利用Facebook进行精细的广告定向和舆论操控,对特朗普意外当选起到了推波助澜的作用。2016年的乱局使作者开始质疑Facebook对民主制度的影响,她亲眼见证科技与政治合谋带来的冲击。

Facebook嵌入特朗普竞选: 温恩-威廉斯透露了一个令人大跌眼镜的内幕:在2016年大选前的数月,Facebook主动向主要总统候选人提供嵌入式技术支援团队。希拉里·克林顿的竞选团队拒绝了这项提议,而唐纳德·特朗普的团队欣然接受。结果,Facebook派出员工常驻特朗普的数字竞选办公室,在其团队旁边并肩作战。这些Facebook人员包括广告专家、数据科学家、工程师等,他们与特朗普的数字总监布拉德·帕斯卡尔(Brad Parscale)密切合作。帕斯卡尔结合Facebook团队的技术指导,开创了一套全新的网络竞选手法:通过海量脸书广告的"垃圾内容"(shitpost)精准轰炸选民。他们利用Facebook的受众定向工具,将充满误导性信息、煽动情绪的帖文和筹款信息投放给特定州县、特定偏好的用户,掀起网络狂潮。Facebook广告副总裁安德鲁·博斯沃思(Boz)甚至事后称赞这是**"我见过最棒的数字广告战役,无出其右"**。这些努力为特朗普在摇摆州争取关键选票立下汗马功劳。

书中引言: 作者直接引用书中令人震惊的一段话,再现当时情景:

"在飞往利马的10小时航班上,艾略特耐心地向马克解释Facebook如何一步步将大选拱手让给唐纳德·特朗普。…Facebook员工长期嵌入特朗普圣安东尼奥的竞选团队一位叫布拉德·帕斯卡尔的特朗普团队要员与Facebook人员联手,基本上发明了一种全新的政治竞选模式:靠疯狂散播帖文赢得白宫,对选民进行虚假信息、煽动帖文和筹款信息的精准轰炸。负责广告业务的博斯沃思称赞这是『我见过任何广告客户做过的最棒数字广告战役』"。

(上述"艾略特"即Facebook时任公关副总裁艾略特·施拉格(Elliot Schrage),作者写道他在特朗普当选后的一次航班上向扎克伯格细数Facebook助选特朗普的种种,令扎克伯格听后"既信服又震惊"。)

扎克伯格的震动与野心: 特朗普当选令全世界错愕,扎克伯格起初对外称"社群媒体对选举结果的影响极有限",斥责认为假新闻左右选民的说法是"疯狂的想法"。但在内部,他逐渐意识到Facebook的政治能量之巨大。在飞往秘鲁利马参加APEC峰会的专机上(2016年11月),艾略特·施拉格对扎克伯格详述了Facebook如何"基本把胜选拱手让给特朗普"的分析。扎克伯格听完后既感震惊,也隐隐燃起新的野心。作者写道,特朗普胜选直接激发了扎克伯格的政治兴趣:如果社群媒体真能决定选举,那么为何他自己不尝试更进一步?

2017年聆听之旅: 于是2017年,扎克伯格展开了被媒体称为"总统级巡回"(Listening Tour)的一系列造访活动。他前往美国多个摇摆州,拜访农场和小城镇,与基层民众座谈。外界揣测这是他为竞逐总统在做准备。温恩-威廉斯陪同出席了一些行程,她发现扎克伯格的讲话听起来就像小孩模仿心目中总统的样子,空洞而做作。比如在一次演讲中,他引用了林肯在南北战争时的一句话:"现在情势艰巨,我们必须因应时局,以新的思维和行动来面对"。这本是林肯1862年对国会的讲话,扎克伯格照搬却显得不合时宜。作者嘲讽地形容:"听起来像个孩子以为总统就是这样说话"。最终扎克伯格没有真正参选,但这段插曲显示出Facebook创始人在经历2016选后,对权力产生了新的渴望和错觉

政治权谋: 本章还揭露扎克伯格对待政界的态度转变。他开始把那些批评Facebook的政客视为"敌人",要求团队对不友善的立法者施加压力、拉拢站队。例如,扎克伯格私下称某些严厲质询Facebook的参议员为"对手",指示公关与政策团队想办法**"把他们拉到我们这边"。这种赤裸裸的权谋手段,以前在科技业颇为罕见,但扎克伯格如今有样学样,把硅谷竞争升级为政治斗争**。作者在书中强调,扎克伯格此时的心态很危险:他认为Facebook已经强大到可以对民主制度予取予求,甚至能抗衡政府监管。2016年的大选成果,更巩固了他这种近乎妄自尊大的信念。

当代反思: 温恩-威廉斯通过亲历2016年动荡,向读者发出警示:社群媒体已深刻渗入民主流程,其影响力可能远超我们的预期。20世纪传统媒体也曾左右舆论(如19世纪末的新闻大王操控战争舆论),但21世纪的Facebook以算法和精准投放,将舆论操纵提升到新的规模和效率。一家私人公司竟可在不透明的情况下介入选举,这对民主制度是巨大挑战。本章以微观细节揭示宏观问题:当科技集中极大权力于寡头手中,民主的规则将被改写。

第十二章:后真相时代 – 假信息、阴谋论与清算时刻

主旨: 本章延续2016年选举的影响,讨论Facebook在"后真相"(post-truth)时代中成为假信息温床,以及政府开始对其秋后算账的过程。温恩-威廉斯描述特朗普上任后,Facebook因假新闻、剑桥分析等丑闻陷入公关泥淖,公司领导层百般应对以逃避监管责任。她本人也亲眼见证扎克伯格与各国领袖互动的微妙变化——从奥巴马对他的直接训斥,到他为讨好中国而违背言论原则。这一章展现了Facebook如何走上与全球政治权力对峙的前线,同时内部却依然傲慢如故,未真正汲取教训。

奥巴马的当面棒喝: 2016年美国大选后,时任总统奥巴马对Facebook上假新闻泛滥深感忧虑。据作者所知,奥巴马在特朗普当选后不久的一次非正式场合直接警告扎克伯格,要他正视Facebook在散播虚假信息中的角色。扎克伯格当时对外还坚称影响有限,但奥巴马的一番话令他很不愉快,也一度造成两人的交情裂痕。曾经,扎克伯格和奥巴马关系融洽(甚至称得上友好),但这次奥巴马的不留情面让扎克伯格感到被冒犯,他开始对这位昔日盟友心存芥蒂。作者将此插曲列出,说明Facebook与政府高层的紧张开始浮上台面。

"剑桥分析"与信任危机: 2018年初,剑桥分析数据泄漏丑闻(Cambridge Analytica)被媒体曝光:数千万Facebook用户数据被不当分享,用于政治广告定位,引发全球哗然。温恩-威廉斯在2017年离开Facebook,但她在书中依然提及此事作为Facebook自食恶果的例证。剑桥分析事件让Facebook面临空前公众信任危机,扎克伯格和桑德伯格被传唤至美国国会听证说明。同期,欧盟颁布GDPR法规、各国酝酿反垄断调查,一时间Facebook疲于奔命自辩,却难以恢复形象。作者虽未在职,但对昔日同事的作证有所评述:她发现Facebook高层在听证中的回答刻意打迷糊仗,规避关键问题。例如,扎克伯格在2018年参议院作证时被问及"如果不遵守中国法律就不能在中国运营,Facebook如何处理?"扎克伯格回答:"关于未来服务进入中国的条件,我们尚未做出任何决定。"作者对此直斥:"他在撒谎。"因为她掌握的内情(如之前章节的"中国项目"等)证明Facebook早已为进入中国做出种种妥协尝试。这表明Facebook高层在监管者面前仍抱着敷衍欺瞒的态度。

扎克伯格的"白手套"外交: 在这段期间,Facebook为了拓展中国市场,对中国政府可谓卑躬屈膝。扎克伯格学习中文、访问中南海,甚至在2015年见到中国国家主席习近平时,恳请习近平替他即将出生的女儿取名字(习近平拒绝了这一请求)。Facebook还对中国官员提供"白手套服务",小心翼翼避免触怒对方。尽管Facebook仍然无法正式进入中国,但这种亲共姿态却带来额外的道德包袱:人们质疑Facebook为市场可否牺牲价值观。作者在书中证实,Facebook曾按照中国网控要求封锁异议人士账号,以示合作诚意。其中著名例子是中国流亡富商郭文贵的Facebook专页,因中方压力而一度受限。这些事件在西方媒体曝光后,Facebook形象再受损。作者将这些情况记录在案,揭露Facebook为逐利如何背离最初"让人们畅所欲言"的宣示。她说,Facebook当年在言论自由的问题上向中国磕头,而现在却大谈自由言论被打压,这种虚伪与双标令人不齿

全球范围的动荡: 本章还简述Facebook在其他地区卷入的社会政治动乱:如2018年巴西,Facebook副总裁迪亚哥·佐丹(Diego Dzodan)因拒绝提供WhatsApp用户信息被逮捕;巴基斯坦、土耳其等国强硬要求Facebook审查内容并交出用户数据,否则威胁抓捕当地员工。温恩-威廉斯提到,有一段时间,几乎每隔几周就传出某国政府扣留Facebook员工或关停服务以逼范Facebook就范的消息。这些事件逐渐让她认识到:Facebook的全球扩张已经踩到了很多国家的红线,公司却缺乏应对这些现实风险的准备。她在书中承认,直到亲眼看见同事可能因内容问题而身陷囹圄,甚至自己在某些国家出差时也感受到法律风险,她才完全理解问题严重。过去他们总以为可以远程遥控全球,却忽视了各地复杂情势和在地团队的辛苦。在作者离职前后,这些问题开始集中爆发,迫使Facebook不得不面对各国政府的强力回应。

总结: 本章将种种迹象汇聚成一个结论:Facebook领导层长期对现实后果"装聋作哑",直到问题大到无法忽视才被迫面对。而这种"延迟认错"造成的伤害已经不可逆。温恩-威廉斯批评Facebook高层(包括她自己曾属于的团队)对那些年各界不断的警告充耳不闻,反而沉浸在权力扩张的迷梦中。最终,当清算时刻来临时,他们依然试图撇清责任,以维护公司与个人利益。在一连串冲击之下,Facebook高高在上的领导们终于不得不接受一个残酷现实:他们无视的现实世界,正以愤怒和法律来回击他们的漫不经心

第十三章:帝国的延续 – 没有任期限制的"统治者"

主旨: 本章作为总结性的反思,讨论Facebook及扎克伯格作为"无任期限制"的权力掌控者,可能对未来数十年产生的影响。温恩-威廉斯运用一个发人深省的比喻:她在2016年于秘鲁参加一场国际峰会时,注意到多国元首每隔几年就更替,但扎克伯格却始终稳坐会场,且可能未来数十年都如此。她将扎克伯格比作"一位在位50年的君主",提醒我们科技巨头掌门人的权力之长久和深远。这里巧妙地将21世纪的科技现象与20世纪以至更早的历史进行对照,引发读者深思。

"没有任期的领袖": 作者写道,在2016年的一场国际高峰会上(应指APEC利马峰会或达沃斯论坛),她环顾四周,发现往年出席的某些国家领导人已不在位,新面孔替换了旧面孔。政要有来有往,权位终有更迭。然而,坐在科技公司代表席的扎克伯格却一如既往地现身,而且他才30来岁,完全可能在未来半个世纪里继续出现在这种领袖聚会中。

作者离职与吹哨行动: 2017年底,温恩-威廉斯因为与公司高层理念不合(她相信直接原因是她揭露性骚扰的举动)而被Facebook解除职务。公司当时宣称她是因"绩效不佳和有毒行为"被开除,对她的骚扰指控不予承认。离开Facebook后,作者并未就此沉寂。2018年起她投入美中关系相关的非官方协商(聚焦人工智能武器管控),同时开始整理在Facebook的所见所闻,决心写出这本回忆录。在书稿完成后,她也向美国证券监管机构提交了78页的吹哨者投诉文件,详细举报Facebook为进入中国所做的诸多让步与隐秘操作。2025年本书出版后,美国国会随即邀请她作证。作者在参议院听证会上进一步实名指控扎克伯格曾考虑为打开中国市场而配合中共的审查要求,从而**"损害美国国家安全利益"**。可以说,她以亲身经历揭发出Facebook多年来积累的问题,为科技业树立了一个重量级的"体制内吹哨者"范例。

尾声与反思: 本书的尾声部分,温恩-威廉斯以沉痛而直率的语气,点出过去十多年科技行业由理想走向失控的轨迹,也警示未来的方向。她强调,Facebook的故事是整个社群媒体时代的缩影:当极少数平台掌握了全球言论和信息分发权力时,他们往往愈发贪婪傲慢、怠于尽责。权力越大,责任却越少,最终酿成对社会的伤害。她坦言自己当初也是体制的一部分,曾在内部奋斗挣扎但终究无力改变航向,因此选择站出来发声,希望唤起公众注意。本书正是她对过往理想的一次清算:那些最初雄心勃勃想要"改变世界"的科技精英,最终变成了冷漠麻木的"无心为善的人"。至于普通人,也从以为在社群平台上畅所欲言,变成被平台审查、操控谁有资格发声——这是当今时代令人警醒的核心问题之一。

温恩-威廉斯在结语中引用了《了不起的盖茨比》的经典句作为点题:"他们是漫不经心的人——任凭把东西和生灵撞得粉碎,然后退回到他们的钱堆和大意当中……让别人去收拾他们造成的烂摊子。"她点名扎克伯格和桑德伯格就是这样的"漫不经心的人":用无限的资源和权势横冲直撞,却不愿承担后果,留下遍地狼藉供他人善后。这句出自20世纪美国经典文学的讽刺,如今成了对21世纪数字巨头最贴切的写照。作者借此呼吁,是时候让科技领袖们为自己的行为负责,而社会各界也要对他们保持警惕和问责,不能再让这些"没有任期限制"的实力者在真空中为所欲为。

最后,作者以近乎哀兵的口吻表示,写出这本书并不容易,但她深信必须有人站出来讲述真相。她希望自己的故事能作为一记警钟,提醒世人反思社群媒体在我们生活中扮演的角色,以及我们应如何约束那些掌握巨大影响力的人。**《无心为善的人》**既是作者个人的告解和救赎,也是献给公众的一封揭露信:揭露权力的傲慢与理想的沦丧,提醒我们在欢呼科技进步时,别忘了守护最基本的人性与责任。正如美国流行文化中的一句话——"能力越大,责任越大",Facebook及其他科技巨头若无法自我约束,那社会终将介入,为了所有人的未来,不能再让"漫不经心的人"肆意掌控我们赖以沟通的世界。

参考资料:

  • 莎拉·温恩-威廉斯,《无心为善的人:权力、贪婪与理想沦丧的警世故事》,2025年3月。本书内容引述及章节要点整理如上。
  • 《卫报》书评,史蒂文·普尔〈扎克伯格与我——《无心为善的人》书评〉,2025年3月13日。
  • 《纽约时报》书评,詹妮弗·扎莱〈Facebook内幕揭露:高层的不当行为与政治纵容〉,2025年3月10日。
  • 《CNN》专题报道,克莱尔·达菲〈前Meta高管新书爆料:"人们有权知道这家公司实际情况"〉,2025年3月11日。
  • 《华盛顿邮报》新闻,娜奥米·尼克斯〈Meta曾噤声一名吹哨人,如今她在国会作证〉,2025年4月9日。
  • 以上内容亦参考了Rest of World、Business Insider等媒体对本书的报道与作者访谈,均一一印证了书中关键事实。