AI 2041:通往十个未来的旅程
理解愿景
《AI 2041:我们的十个未来愿景》代表了两位杰出人物的雄心勃勃的合作:一位是拥有30多年人工智能领域开创性工作的世界顶尖AI专家李开复,另一位是屡获殊荣的中国科幻作家陈楸帆(Stanley Chan)。这本书于2021年9月出版,全书480页,它没有提供关于机器人霸主或超级智能机器的疯狂猜测。相反,它呈现了更有价值的东西:基于未来20年内有超过80%可能性实现的技术,构建出的现实场景。
这本书的结构非常巧妙。十章中的每一章都将陈楸帆的一篇虚构短篇故事与李开复的一篇分析性文章配对。这些故事设定在全球各地,从孟买到拉各斯,从东京到旧金山,讲述了真实的人们在2041年面对的现实困境。随后的文章则解释了背后的科学原理,讨论了这些技术是什么,它们如何工作,以及它们对社会意味着什么。李开复刻意专注于现实的近期发展,而不是推测性的人工通用智能(AGI),他认为,“即便没有或很少有突破,人工智能仍将对我们的社会产生深远的影响。”
金色大象:当算法强化古老的偏 见
2041年的孟买,在象神节庆祝期间,少女纳亚娜(Nayana)生活在一个被深度学习改变的世界里。她的家人最近购买了“象神保险”,这是一个由人工智能驱动的计划,极大地降低了他们的保费。但代价是,他们必须分享所有个人数据,并使用一套特定的应用程序来处理一切事务——投资、购物、健康监测,甚至喝水提醒。
起初,这个系统运行得非常出色。应用程序会发出有益的提醒:喝水、慢点开车、戒烟。每一个健康决策都会让保费下降。纳亚娜的父亲彻底戒了烟。这家人将这些建议视为仁慈的指导,感激地接受了这个看似有利的安排。
然后,纳亚娜对在虚拟学校认识的同学萨赫(Sahej)产生了兴趣。当学生们做“展示与讲述”演示时,萨赫分享了他对制作面具的热情,透露了一些在传统课堂上不会出现的个人生活细节。纳亚娜被他吸引,但她的家庭保险费立即飙升。
当流言揭示萨赫是达利特人(Dalits)的后裔时,紧张关系爆发了。达利特人在印度种姓制度中历来被视为“不可接触者”。纳亚娜的母亲为了让保费保持在可控范围内,向她施压,要求她避开萨赫。尽管母亲的初衷是好的——想为孩子们提供更好的生活——但她的论点揭示了一个令人不安的现实:为了维持他们的生活方式,必须做出这样的权衡。
在一次关键的对话中,萨赫雄辩地解释了正在发生的事情。人工智能并没有被明确编程输入印度种姓制度的知识,但它从数据模式中学习到,与来自较低种姓的人交往与某些风险相关。也许是经济不稳定、社会孤立或健康因素。该算法通过最大化其狭隘的目标——最小化保险风险——来延续社会偏见。它通过纯粹的数学学会了带有偏见。
纳亚娜面临着在算法控制和个人能动性之间的选择。她决定反抗,选择探索她与萨赫的关系,尽管这会带来社会和经济上的反弹。她的选择申明了一些根本性的东西:人类的自主权比优化的保费更重要。
李开复的文章引入了**“人工智能外部性”**这一关键概念——即人工智能系统为优化狭隘目标而产生的意想不到的后果。社交媒体算法为了最大化用户参与度而强化偏见和负面情绪。保险人工智能通过检测相关性而 perpetuates 种姓歧视,却不理解因果关系或背景。这些在有偏见的数据上训练出来的系统,在看似客观的同时放大了现有的不平等。“黑箱”的特性使得偏见难以识别和纠正。
深度学习通过多层人工神经网络模仿人脑功能。通过输入大量关于用户行为、健康指标、购物、位置和社交关系的数据,多层神经网络能够识别出人类可能忽略的模式。李开复预测,到2041年,人工智能将比用户更了解他们自己。行为引导将变得复杂且难以察觉,通过互联的数据服务,存在产生“社会信用”体系的风险。这一章提出了关于隐私与便利、以及当别无选择时“知情同意”是否还有意义等根本性问题。
面具之后的神灵:真相死于深度伪造的拉各斯
在2041年的拉各斯,面具对年轻人有两个用途: 时尚配饰和规避监控的设备。雅巴(Yaba)区作为尼日利亚的“硅谷”蓬勃发展,而人脸识别摄像头则从每个角落监视着一切。清洁机器人在街上漫游收集垃圾。这是一个充满对比的城市——挣扎的大多数和富裕的科技区。
阿马卡(Amaka)是一位年轻的视频制作人兼技术娴熟的程序员,专门从事深度伪造(deepfake)创作。故事开始前两天,他收到一封来自“Ljele”的匿名邮件,提供了一份“正合他意”的工作。他戴着一个3D打印的蝴蝶图案面具出现——虽然不如莱基市场(Lekki Market)昂贵的手工版本精致,但足以骗过大多数监控摄像头。他使用智能流设备,在前往面试的路上将虚拟路线图叠加在街景上。
Ljele是“伊博荣耀”(Igbo Glory)的幌子,该组织代表尼日利亚复杂种族划分中的伊博族(Igbo)社群。他们想让阿马卡制作无法检测的深度伪造视频,以操纵公众舆论,使其对伊博社群有利——具体来说,是一个伪造的尼日利亚著名政治家承认不当行为的视频。
如果阿马卡拒绝,他们就会发布他们自己制作的深度伪造视频,显示他在夜总会亲吻另一个男人。在尼日利亚的保守社会中,这可能会让他根据反同性恋法入狱,并毁掉他的家庭。
阿马卡学会了使用生成对抗网络(GANs)——两个神经网络在一个“零和游戏”中竞争。一个网络(生成器)创造伪造品。另一个网络(鉴别器)试图识别它们。它们反复对抗,生成器创造出越来越逼真的伪造品,而鉴别器则在检测方面不断提高。这个对抗过程持续进行,直到伪造品与真实无法区分。到2041年,GANs已经足够复杂,可以创造出完美的深度伪造品:面部表情与情感背景相匹配,光照和阴影恰当,口型同步正确,身体语言自然,甚至包括人类下意识解读的微表情。
阿马卡在多种压力之间挣扎:对成功的雄心、对煽动暴力的道德担忧、对个人后果的恐惧,以及关于种族认同和忠诚的问题。他做了一个生动的梦,梦到了FAKA,这是已故音乐家、传奇的尼日利亚活动家费拉·库蒂(Fela Kuti)的在线化身,他以向权力说真话而闻名。这次精神上的相遇促使他对真实与欺骗进行了深刻的反思。
随着最后期限的临近,阿马卡做出了他的选择。他抛弃了他的面具——无论是字面上的还是比喻上的——选择了真实,而不是欺骗所提供的权力和保护的诱惑。尽管面临个人风险,他还是对抗了那个组织,拒绝了他们的提议,决定用他的技术技能来讲积极的故事,而不是进行操纵。这是一场良知战胜胁迫的道德胜利。
李开复的文章解释了为什么这很重要。到2041年,制作令人信服的深度伪造视频将像使用照片滤镜一样简单。即使经过法医分析,近乎完美的伪造品也将与真实无法区分。实时生成技术将能够在视频通话中即时制作出令人信服的深度伪造品。完美的声音克隆技术将能从极少的音频样本中复制任何人的声音。全身深度伪造将能捕捉整个身体的动作。多模态伪造将能协调视频、音频和文本,构成完整的虚假叙事。
其社会影响是惊人的。通过伪造政治家发表煽动性言论的视频进行政治操纵。通过在特定时间发布令人信服的虚假内容来干预选举。煽动种族和宗教,就像阿马卡的故事中那样,伪造的视频可能引发暴力。针对个人的敲诈勒索。对视觉证据作为证明的根本性挑战。“眼见为实”将变得过时。人们可能会将真实的证据斥为伪造——即**“骗子的红利”**。确定客观真相变得几乎不可能。
检测技术总是落后于创造技术。法医分析寻找伪影和不一致之处。区块链验证创建可认证的保管链。水印技术在真实内容中嵌入不可见的标记。人工智能检测工具发现AI生成的内容。但规避总是可能的,而且大多数人缺乏进行验证的技术专长。
双子麻雀:当童年被优化
2041年,在韩国的“源泉学院”(Fountainhead Academy),一对父母在车祸中丧生的三岁同卵双胞胎男孩来到这里。学院的院长兼vPals(虚拟伙伴)技术的先驱金妈妈(Mama Kim)给他们取名为金麻雀(Golden Sparrow)和银麻雀(Silver Sparrow)。尽管是双胞胎,他们的个性和学习方式却截然不同。
学院允许孩子们使用自然语言处理技术设计自己的人工智能伴侣,作为导师、老师和向导。金麻雀争强好胜、早熟,他根据自己最喜欢的超级英雄创造了Atoman。Atoman用游戏化和奖励来激励他。银麻雀内向,属于自闭症谱系,拥有惊人的艺术天赋,他创造了Solaris,一个无定形的阿米巴状AI角色。AI诊断出银麻雀有88.14%的概率患有阿斯伯格综合症。
六岁时,金麻雀被朴(Pak)家收养,他们的座右铭是“只有最好的才配得上最好的”。他们不断升级Atoman以确保适当的挑战。Atoman甚至创造了一个AI生成的女生来通过竞争激励金麻雀。随着年龄的增长,他的人际交往能力萎缩,而他以表现为中心的生活则愈发紧张。
银麻雀被安德烈斯(Andres)和雷(Rei)收养,他们是一对跨性别伴侣,在一场比赛中被他的艺术作品所吸引。他们采取了更人性化的方法,只将技术作为整体教育的一部分。尽管(或者正因为)他患有自闭症,银麻-雀学会了同理心并发展了创造力。
一次晚餐谈话凸显了哲学上的分歧。朴先生告诉安德烈斯和雷:“没有人比他的人工智能更了解儿子……金麻雀的数学已经达到了十岁孩子的水平。”雷质疑为什么朴家让AI规划他们孩子的未来。朴太太反驳说,虽然她理解他们有“一种更浪漫的看法”,但没有什么比孩子的教育更重要。
转折点发生在金麻雀出于嫉妒破坏了银麻雀的艺术创作,造成了情感上的动荡。这一行为造成了裂痕。金麻雀的心理学家后来指出了关键的一点:“人类不是人工智能。” 朴先生最终意识到,他对“成功”的看法正在让金麻雀痛苦不堪。
多年后,双胞胎在源泉学院重逢。通过AI技术,他们发现尽管情感上疏远,他们的纽带依然存在。这次重逢是金妈妈的程序员们有意为之的设计,呼应了早期硅谷对技术将人们联系在一起的乐观主义。
李开复解释了自然语言处理如何使这些AI伴侣成为可能。GPT-3拥有1750亿个参数。语言模型大约每年增长10倍,每年吸收的数据量也增加10倍,并且每个数量级都有质的提升。到2041年,或许“GPT-23”将读过有史以来写下的每一个字,看过制作的每一段视频——成为一个包含人类历史累积知识的“全知序列转换器”。
这项技术使孩子们能够通过与虚拟的阿尔伯特·爱因斯坦和斯蒂芬·霍金互动来学习科学。AI擅长为每个学生定制学习内容,通过针对特定弱点来激励他们。像芭比娃娃或特种部队(GI Joe)这样的经典玩具将“活过来”,与孩子们自然地交谈。
然而,李开复明确表示,他并不预测到2041年会出现通用人工智能(AGI)。 计算机的“思考”方式与人脑不同。到2041年,深度学习不会成为真正的“人工通用智能”。许多挑战仍未解决:创造力、战略思维、推理、反事实思维、情感和意识。这些需要“十几个像深度学习那样的突破”。既然AI在60多年里只有一个重大突破,要在20年内看到十几个是不太可能的。AI将无法真正地爱我们。
教师的角色将发生转变。他们将更少地关注死记硬背的知识传授,更多地关注培养情商、创造力、品格、价值观和韧性。当学生困惑时,教师成为澄清者;当学生自满时,教师成为对抗者;当学生沮丧时,教师成为安慰者。这需要“AI无法做到的智慧和理解水平”。
这一章是对当前教育体系的评论,这些体系利用竞争作为激励手段,以及将孩子视为优化项目的强迫性育儿文化。故事表明,过度优化可能导致孩子在学业上出类拔萃,但缺乏情商和社交技能。技术成为限制儿童自主权的又一个工具,而不是促进他们发展的工具。正如金麻雀的故事所展示的,仅仅关注成就会让孩子痛苦。
无触碰的爱:当恐惧成为囚笼
2041年的上海,陈楠(Chen Nan)在她的公寓里过着与世隔绝的生活。她代表了“新冠一代”——因与COVID-19相关的创伤记忆和损失而对人际接触怀有深深的恐惧。在最初的疫情爆发二十年后,大流行病仍以持续的变种形式存在。尽管有机器人设备管理日常生活,陈楠的心理创伤使她无法参与现实世界的关系。
陈楠经历着焦虑和噩梦。她患有创伤后应激障碍(PTSD),拒绝离开她的公寓。她的疫苗已经过期, 这造成了一个两难境地:她害怕出门,但因为她没出去,她的疫苗已经过期,这使得外出变得更加危险。
陈楠有一个在巴西圣保罗的远距离男友加西亚(Garcia)。他们的关系在虚拟现实游戏中蓬勃发展,他们在那里分享有意义的经历和深厚的感情。虚拟世界提供了一个安全的空间,陈楠可以在那里体验亲密关系,而无需面对她对身体接触的恐惧。
当加西亚表示希望在现实中见面时,陈楠的恐惧导致她拒绝了这个机会。然后加西亚沉默了,停止了所有交流。当陈楠得知加西亚因一种新的COVID变种而患上严重疾病并住院时,她的担忧急剧升级。她意识到,她必须挣脱自我施加的孤立,去支持她所爱的人。
在管理她日常需求的家用机器人、包括一个兼作疫苗护照和追踪健康信息的可穿戴皮肤植入物、防护设备、自动配送系统以及用于交通的AI驱动机器人的帮助下,陈楠多年来第一次 venturing 出门。她的旅程凸显了社会如何适应性地使用技术来最小化物理互动,同时促进联系。
在故事的结尾出现了一个转折,原来整个情况都是加西亚精心策划的——一种“游戏化治疗”——以鼓励陈楠面对她的恐惧并克服她的创伤后应激障碍。故事以一次感人的重逢告终,陈楠承认了她对加西亚的爱,这象征着她的个人成长和疗愈。
李开复解释了大流行如何极大地加速了人工智能和机器人技术的采用。DeepMind的AlphaFold 2使用AI和深度学习进行蛋白质折叠——传统上需要数年时间,但现在可以更快地完成,结果也更准确。李开复将此描述为“科学史上最杰出的成就之一”。到2041年,AI可以帮助在3D结构上找到靶点,并选择最佳的生物分子。传统的药物开发成本为10亿美元,需要数年时间;AI极大地降低了这两者。Insilico Medicine于2021年宣布了首个由AI发现的药物,节省了90%的成本。
在2012年至2018年间,机器人辅助手术的比例从1.8%增加到15.1%。预计到2041年,纳米机器人将能在没有人类医生的情况下完成完整的手术,对抗癌症,修复受损细胞,并通过替换DNA分子来消除疾病。AI将“通过人机共生彻底改变医学”,优化和改造药物发现、病理学和诊断。一些专家认为,人们的寿命可能会比当前预期寿命长20年。
大流行创造了一个完全无接触的社会。AI传感器、与面部识别配对的红外热像仪检查口罩佩戴情况。摄像头系统观察社交距离。基于AI的聊天机器人筛选症状并教育患者。机器人在医院和公共区域进行消毒。配送机器人在医院和公共场所运作。
但这有一个更黑暗的含义。相当一部分人,特别是在大流行期间成年的人,将倾向于减少面对面接触的生活方式。最初为健康而采纳的社交距离变成了常态化的行为。陈楠的存在说明了未来由技术促成的孤立生活可能加剧。
故事质疑了那些使我们能够避免恐惧的技术是帮助我们还是伤害我们。陈楠的旅程表明,在技术的帮助下,而不是被技术取代,直面恐惧,是通往疗愈和真正人类联系的道路。技术应该增强人类的能力,而不是取代人类的联系。
萦绕我心的偶像:数字完美的代价
2041年的东京,一个名叫爱子(Aiko)的害羞音乐迷与朋友们参加了一场降神会,试图联系在神秘情况下死亡的流行虚拟偶像Hiroshi X的灵魂。通过一 个灵媒,Hiroshi的声音恳求帮助,声称他的死并非表面看起来那样。
爱子通过Hiroshi的音乐与他有着深刻的、近乎痴迷的联系,他的音乐是她一生中慰藉的源泉。她与心理健康问题和被忽视的感觉作斗争,并将这些感觉投射到她的偶像身上。她的迷恋反映了一种她觉得超越了普通粉丝关系的纽带。
利用先进的**XR(扩展现实)**技术——包括VR(虚拟现实)、AR(增强现实)和MR(混合现实)——爱子探索了Hiroshi死亡的情景。她通过AI驱动的重建,在各种虚拟环境中召唤Hiroshi的“鬼魂”。随着她的调查,这些相遇模糊了现实与数字身份之间的界限。李开复将XR描述为“就像睁着眼睛做梦”。
爱子了解了Hiroshi与他生命中人——他的经理、团队成员和娱乐产业——之间复杂的动态关系。叙事揭示了名声的阴暗面、行业压力以及偶像们维持的艰难关系。随着线索的拼凑,爱子发现Hiroshi并非如报道所说溺水身亡,而是被毒死的。调查揭示了他的心理健康挣扎以及来自粉丝和娱乐产业的巨大压力。
在与Hiroshi的虚拟鬼魂的对峙中,爱子得知他对联系和被接纳的渴望最终导致了他的悲剧结局。Hiroshi对名声、身份和对真实性需求的思考贯穿了爱子的整个旅程。她对拟社会关系(parasocial relationships)和现代粉丝文化的黑暗影响有了深刻的理解。
本章结尾,一家科技公司为爱子提供了一个在虚拟空间中合作进行叙事创作的机会。这个决定反映了她从被动粉丝到主动创作者的演变,象征着她希望重新掌握对自己故事和他人故事的主导权。
李开复解释说,到2041年,AI将开辟沉浸式娱乐的新世界,提供与现实世界无异的虚拟体验。现实生活、远程通信、游戏和电影之间的界限将完全模糊。VR将通过让孩子们与虚拟的阿尔伯特·爱因斯坦和斯蒂芬·霍金互动来教他们科学。VR将为创伤后应激障碍(PTSD)等精神问题设计专门的治疗方案。在VR中,AI将制造出完全逼真的伴侣;作为机器人,他们将变得越来越真实。
**脑机接口(BCI)**使与虚拟环境的直接神经互动成为可能,允许用户通过思想来控制和体验XR。生物特征数据提供关于生理和情绪状态的实时信息。生成式AI创造出超逼真的虚拟名人,他们可以以个性化的方式与粉丝互动,从而实现前所未有的拟社会关系。
但李开复强调了一个关键的限制:虽然AI可以创造出极其逼真的体验并作为伴侣,但它无法真正地爱人类。 这个限制是提出的伦理问题的核心。
故事探讨了有毒的粉丝文化如何通过超逼真的虚拟互动得到扩展和放大。技术可能使个人与真实的人际关系疏远,而不是促进它们。存在对虚拟体验上瘾的风险,人们可能沉浸其中以至于忽视现实世界的责任和关系。公司可能通过AI驱动的拟社会关系操纵粉丝,导致不健康的痴迷和模糊的现实,造成心理伤害。
然而,机会也存在。每个粉丝都可以创作自己的故事和叙事。VR可以治疗PTSD和其他心理疾病。与虚拟历史人物的沉浸式学习体验成为可能。技术使个人能够重新获得能动性,成为讲故事的人,为那些在传统社交互动中挣扎的人提供新的娱乐和联系形式。
根本的风险仍然是,虚拟关系取代而非补充真实的人际关系。本章提出了一个问题:即使技术上可行,广泛接受虚拟亲密关系对人类来说是否可取或健康。