新闻资讯

基辛格生前最后一本书:人类要如何与人工智能共存?

【编者按】“如果被迫与机器妥协,我们的底线是什么?”外交家亨利·基辛格在其生前最后一本书《人工智能时代与人类价值》中,与两位合作者——谷歌前CEO埃里克·施密特及微软前首席研究和战略官克雷格·蒙迪,从高度战略性的角度对这一问题进行了审视。他们预见,随着时间推移,人工智能“将对历史、宇宙、人类本质以及智能机器的本质得出结论,并在这一过程中形成初步的自我意识”,进而变成“类人人工智能”。如何与之共存?两个“对齐问题”需要解决:一是人类价值观和意图与人工智能行动在技术层面的对齐,二是人与人之间在外交层面的对齐。本文摘自该书第八章第二小节《共存:类人人工智能》,已获出版社授权。

迈达斯国王——历史上小亚细亚王国的君主——曾许下一个著名的愿望,希望他所接触的一切都能变成黄金。希腊的酒神和享乐之神狄俄尼索斯满足了迈达斯的这个愿望,尽管他知道这个愿望并不会带来什么好事。不久,由于触碰到的佳肴和美酒都变成金子无法享用,迈达斯被迫在帕克托洛斯河中洗手,以摆脱他那被诅咒的手指。

在由迪士尼重述的叙利亚故事《阿拉丁》中,一个童工和一个有权有势的阿格拉巴王朝国师争夺对一盏神灯中无所不能的精灵的控制权。每个人都努力引导精灵实现自己的愿望。国师的最后一个愿望是让自己变得和精灵一样强大,但他没有意识到,拥有如此强大的力量意味着他也将被囚禁在神灯里,服侍其他人类主人,直到获得自由的那一天。

这两个故事都讲述了解封和运用一种我们凡人所无法理解或掌控的力量有多么困难。这场古老斗争在现代的寓意是,很难让人工智能与人类的价值观相一致,也很难让人类的期望与现实相一致。我们应该假定,人工智能会让我们大吃一惊,并且随着智能体或“规划型”人工智能的发展,它们在动态世界和数字世界中让我们为之惊讶的能力也会提升。如前文所述,未来几代人工智能将能够感知现实;它们可能不仅具有自我意识,还拥有自我利益。一个自利的人工智能可能会认为自己在与人类竞争一些东西,比如数字资源。在“递归自我完善”的过程中,一些人工智能可能会发展出设置自身目标函数的能力。人工智能可以操纵和颠覆人类,挫败我们限制其力量的任何尝试。人工智能已经能够欺骗人类,以实现自己的目标。

如今,我们几乎没有独立能力来验证人工智能模型的内部运作,更不用说它们的意图了。如果智能机器仍然像埃利泽·尤德科夫斯基所说的那样,是“巨大而不可捉摸的小数阵列”,那么随着它们变得越来越强大,我们也无法指望它们对我们来说是安全的。因此,最重要的是,我们在学会如何解读智能机器的同时,也要学会如何确保它们对我们安全,这两项使命要双管齐下。

鉴于人工智能目前展现的令人惊讶的能力,我们将如何设法未雨绸缪,而不仅仅是在人工智能的风险来临时兵来将挡?我们需要怎样的远见和效率预见未来发展的全部倾向和一系列可能采取的行动?要知道这不仅关乎我们自己的物种,还事关一个全新物种。我们不能在只有一次试验机会且容错率为零的情况下奉行试错策略。

要让人工智能不那么引人惊骇,加强人们对它的体验、参与和互动也许是无可替代的办法。早期的人工智能开发者曾担心过早地将人工智能暴露在世人面前,而最近的开发者则一直在释放早期模型,允许更多的公众尽可能快速、安全地对其进行试验。工程团队目前正在研究和微调不同的模型,并调整控制系统,而人工智能与全球范围内人口的互动也暴露出了新的担忧。

对人工智能的早期社会化可以通过对其进一步的教育来降低出现问题行为的风险,同时在人类之中,也可以提高对此的意识水平、应对力,并培养一种健康的怀疑精神。每天数以百万计的人机互动有助于测试人工智能可能遇到的最不可能的情况;反过来,公众对人工智能系统的使用,在发现新错误和新风险的同时,也可能有助于加快技术协调一致化的进度。因此,将这些远非完美的人工智能放任于世间,不仅有助于我们适应它们,更重要的是,它们的出现使得我们能够提出更完善的理论,以使它们适应我们。

不过,广泛部署和公开发布可能还不足以揭示与解决当今人工智能的所有风险,更不用说未来的风险了。

但值得庆幸的是,目前人们正在进行大量尝试,以创建一个集成的控制架构,并将其通过预训练注入最强大的人工智能,从而积极引导机器实现合法、无害和有益的用途。

迄今为止,实现这种人工智能与人类协调一致的 *** 大致分为两类:基于规则的系统和从人类反馈中“强化学习”。下面让我们逐一介绍。

基于规则的系统类似于预先编程的指令,是程序员管理人工智能行为的一种尝试。虽然这种 *** 对于简单的任务来说直截了当,但在复杂的场景中却经常会出现问题,因为系统无法进行实时适应。而强化学习就其本身而言则更适合复杂系统,它允许人工智能从与人类评估者的交互中学习,并灵活地适应特定环境。

当然,这种 *** 也有它的缺陷。为了指导学习,需要精心设计“奖励函数”;任何失误,无论是由于目光短浅、不可预见的情况,还是由于人工智能聪明过人,都可能导致“奖励黑客”的情况,即人工智能在解释模棱两可的指令时,虽在技术上取得了高分,却没有达到人类的实际期望。

今天的人工智能系统被灌输了各种类型的信息,却没有直接体验现实世界,而是通过由数万亿个概率判断组合而成的现实模型来观察这个世界。对它们来说,在这个宇宙中,从一开始就没有“规则”,也没有任何 *** 来区分科学事实和未经证实的观察。对人工智能来说,一切——甚至是物理定律——都仅仅存在于相对真理的范围之内。

不过,现在人工智能领域已经开始努力纳入人类规则和实例化事实。现在,人工智能模型已经有了一些成熟的机制,通过这些机制,这些模型可以吸收某些实在性的“基本真实”常量,将其标记为最终常量,并将其映射到自己的嵌入空间中。此外,这些信息还可以很容易地进行全局更新。通过这种 *** ,人工智能模型就能将两个部分——更广泛的概率判断和更狭义的事实真相评估——融合在一起,从而做出合理准确的反应。

但这项任务还远远没有结束,问题仍层出不穷。比如,我们人类该如何为人工智能区分真理的必要属性,并在此过程中为我们自己也做一番区分?毕竟,在人工智能时代,即使是基本原理也会不断被修正和失效。然而,恰恰是这一点,为我们提供了纠正先前错误并开辟新天地的机会。我们知道,我们对现实的概念也可能发生变化,因此,我们不应该把人工智能禁锢在可能错误的“真理”中,这样会阻碍它们重新考虑自己的终极“真理”。

不过,这已是很久之后的事情了。目前,人工智能仍然需要一棵初级的确定的知识树,这些知识代表人类迄今为止推断出的“真理”。让我们的机器拥有这些知识,将使我们能够可靠地强化它们的世界观。特别是,如果我们现在可以根据宇宙法则来调整早期的人工智能系统,那么我们也有可能参照人类天性的法则来依葫芦画瓢。既然我们可以确保人工智能模型以我们所理解的物理定律为出发点,同样,我们也应该防止人工智能模型违反任何人类政体的法律。

在一个人工智能的“法典”中,可能存在不同治理级别的层次:地方、地区、州、联邦、国际。法律先例、法理、学术评论——或许还有其他不太偏重法律的著作——可以同时被人工智能纳入考量。与基于规则的一致化系统一样,预定义的法律和行为准则可以成为有用的约束,尽管它们往往也不那么灵活,设计时考虑的范围也不如实际的人类行为不可避免地要求的那样广泛。

幸运的是,新技术正在接受考验,我们感到乐观的原因之一,在于一些非常新颖,同时又非常古老的事物的存在。

有种东西比任何通过惩罚强制执行的规则更有力、更一致,那便是我们更基本、更本能、更普遍的人类理解。法国社会学家皮埃尔·布迪厄将这些基础称为“共识”(doxa,古希腊语,意为普遍接受的信仰):这是规范、制度、激励机制和奖惩机制的重叠 *** ,当它们结合在一起时,就会潜移默化地教导人们如何区分善与恶、对与错。共识构成了人类真理的准则,它是人类的典型特征,但没有人工制品对其加以固化呈现。它只是在人类生活中被观察到,并被纳入生活本身。虽然其中一些真理可能是某些社会或文化所特有的,但不同社会在这一方面的重叠性也是很大的;数十亿计的人类,来自不同的文化,有着不同的兴趣爱好,他们作为一个普遍稳定且高度互联的系统而存在。

在书面规则无法平息混乱的情况下,未加定义的文化基础却可以做到,这一观点构成了人工智能领域一些最新 *** 的基石。“共识”的法典无法表述,更无法翻译成机器可以理解的格式。必须教会机器自己完成这项工作——迫使它们从观察中建立起对人类做什么和不做什么的原生理解,吸收它们所看到的一切,并相应地更新它们的内部治理。

在这一灌输“共识”的技术过程中,我们不需要,甚至不希望就人类道德和文化的正确表述达成先验一致。如果大语言模型能够以未经整理的方式吸收整个互联网的内容,并从中找出尽可能多的意义(正如它们已经做到的那样),那么机器——尤其是那些已经发展出接地性(也就是反映人类现实的输入与大语言模型输出之间的可靠关系)和因果推理能力的机器——在吸收连我们自己都一直难以明确表达的内容时,或许也能达到同样的效果。

当然,机器的训练不应只包括“共识”。相反,人工智能可能会吸收一整套层层递进的金字塔级联规则:从国际协议到国家法律,再到地 *** 律和社区规范等。在任何特定情况下,人工智能都会参考其层级中的每一层,从人类定义的抽象戒律转化到人工智能为自己创造的,对世界信息的具体却无定形的认知。只有当人工智能穷尽了整个程序,却找不到任何一层法律能充分适用于指导、支持或禁止某种行为时,它才会参考自己从观察到的人类行为的早期互动和模仿中得出的结论。这样,即使在不存在成文法律或规范的情况下,它也能按照人类的价值观行事。

几乎可以肯定的是,要建立并确保这套规则和价值观的实施,我们必须依靠人工智能本身。迄今为止,人类还无法全面阐述和商定我们自己的规则。而且,面对人工智能系统很快便有能力做出的数以十亿计的内部和外部判断,没有任何一个人或一组人能够达到对此加以监督所需的规模和速度。

最终的协调机制必须在几个方面做到尽善尽美。首先,这些保障措施不能被移除或以其他方式规避。其次,在控制上必须允许适用规则的可变性,这种可变性基于环境、地理位置和用户的个人情况而定,例如,一套特定的社会或宗教习俗和规范。控制系统必须足够强大,能够实时处理大量的问题和应用;也要足够全面,能够在全球范围内,在各种可以想见的情况下,以权威且可接受的方式进行处理;并且足够灵活,能够随着时间的推移进行学习、再学习和调整。最后,对于机器的不良行为,无论是由于意外失误、意想不到的系统交互,还是有意滥用,都不仅要禁止,而且要完全防患于未然。无论何种事后惩罚都只会是为时晚矣。

作者:亨利·基辛格(Henry Kissinger)  埃里克·施密特(Eric Schmidt) 
克雷格·蒙迪(Craig Mundie)
译者:胡利平 风君
出版品牌:中信出版·方舟工作室

(文章仅代表作者观点。)

  • 努比亚Z70S Ultra摄影师版发布
  • 5月人文社科中文原创好书榜|巫蛊:中国文化的历史暗流
  • 视频|李大霄:中国股市或迎奉陪牛之二
  • “最近大家都在忙着开盘”,上海房地产一季度全面回暖,热度还将攀升
  • 问界智能增程行驶总里程超124亿公里,超74%用户激活智驾
  • OpenAI最新的人工智能模型可以“用图像思考”,理解图表和草图
  • 哈佛与白宫对决,美国人如何站队?
  • 日本财务大臣:与美国财长的会谈中未提及具体汇率水平或目标
  • 以“最美通缉犯”为噱头直播?光明网:违法犯罪不应成网红跳板
  • 人工智能三次元创造战略
  • 海南旅文局通报游客入住酒店港币被调包:成立调查组赴陵水调查
  • 中国人保一季度业绩“分化”:财险净利增超92%,寿险增收不增利
  • “孤独的美食家”在上海连吃三天,直呼“好吃”“老嗲”
  • 特朗普称美国经济处于过渡期,淡化短期衰退的影响
  • 周四热门中概股涨跌不一 阿里巴巴涨2%,微牛跌27.31%
  • 日韩股市低开 日经225指数低开0.5%
  • 4月30日美股成交额前20:超微电脑初步财报远逊预期
  • 礼来口服GLP-1治疗糖尿病研发成功,还可“不限时”使用
  • “寻色中国”:一场传统东方色彩美学的现代复兴
  • 泽连斯基称乌美矿产协议谈判相关法律事宜已基本敲定
  • 接续《莱茵的黄金》,国家大剧院带来7国艺术家的《女武神》
  • 董明珠称“绝不用海归派”,媒体人:企业家应该学会好好说话
  • 专家分析丨乌美签署矿产协议,展现美外交困境下的无奈
  • 世界读书日|南京图书馆开了首个网络文学主题阅读空间
  • 5.4%增长的背后,一季度中国经济呈现五大亮点
  • 洽洽能否突破业绩天花板?
  • 特朗普:将在不久的将来对药品加征关税
  • 美国卫生部大裁员正式启动,大量科学家流失、研究项目被砍
  • 特朗普政府,突然猛烈抨击!美股震荡,中概股走低!
  • 商务部:将打造一批国际消费集聚区和入境消费友好商圈
  • 云南鲁甸县一河滩突然涨水致4死,有人在救人过程中遇难
  • 海关总署召开进出口企业、行业协会商会座谈会
  • 美国参议院商务委员会投票确定NASA和FCC提名人选
  • 特朗普据悉已与顾问讨论解雇鲍威尔 但财长贝森特认为此举得不偿失
  • 神舟二十号航天员乘组计划于10月下旬返回
  • 泡泡玛特狂建海外区域总部,中企出海要“抄作业”吗?
  • WTO警告全球货物贸易将萎缩,但亚洲进出口增长
  • 直通部委 | 央行:适时降准降息保持流动性充裕 人社部:就业政策工具箱充足
  • 三部门开展市场准入壁垒清理整治行动,15种情形列入清理重点
  • 韩娱还在诞生更多金赛纶
  • 高晓峰:美国数据疲软贸易战升级 多头迎来爆发期
  • 百川智能欲下场做VC,正高薪招聘投资人才
  • 行拘!如此引流诱导违法犯罪不该被纵容
  • 日月谭天 | “击中美国软肋”!岛内热议大陆在电影方面反制美滥施关税
  • 巴基斯坦西北部发生炸弹爆炸致7死17伤
  • 美政府公布1968年罗伯特·肯尼迪遇刺事件档案
  • 爱泼斯坦“萝莉岛”关键证人自杀身亡,家人:她是终身受害者
  • 美国股市:标普500指数尾盘反攻收复盘中2%的跌幅 为2022年以来首次
  • 消息称币安仍在考虑与特朗普家族的加密货币企业交易
  • 名创优品2024年增长背后暗藏隐忧:同店销售额下滑 海外扩张政策存不确定性与市场愈发饱和
  • 中国移动:预期2025年5G-A投资98亿元
  • 小麦期货上涨 北半球天气因素可能导致作物减产
  • 七块钱一支的集采流感药被取消中选资格,因生产质量管理违规
  • 名创优品5月1日斥资24.45万美元回购5.4万股
  • 五一假期首日,省级党政“一把手”夜访商业街区
  • 中国经济数据观丨十组数据看一季度经济发展成色
  • 杨德龙:特朗普挑起关税战不得人心 我国采取有力措施提振内需积极应对
  • 关税忧虑蔓延 特朗普将与沃尔玛等零售巨头高管会面
  • 文理医工“四轮驱动”,复旦六大新工科创新学院核心团队均亮相
  • 伊朗港口爆炸已致46人死亡
  • 保时捷下调利润率展望 因特朗普关税和电动汽车市场放缓
  • 海上生明月,九天揽星河,2025年“中国航天日”主场活动在上海启动
  • 黑石总裁警告:若市场波动持续 关税或引发骨牌效应
  • 谈到中国排球发展时,赖亚文讲了一件“小事”
  • 从微短剧到电商,流媒体能摸着“抖快”过河吗?
  • “机器人军团”闯入深交所,对千亿级市场“放大招”
  • 第三轮上海餐饮消费券本周五起报名,核销时间延长至6月2日
  • 京东:未来三个月将招聘10万名全职骑手,入职至少有7000元保障
  • 可可期货下跌 好时预计关税成本高达2000万美元
  • 湖北一厅官利用其子结婚之机违规收受礼金!他还涉嫌充当涉黑“保护伞”
  • 德意志银行一季度利润激增39%,但关税拖累隐现
  • 政策驱动体育板块走强,金陵体育、雪人股份等多股涨停
  • “世界超市”热闹依旧义乌老板用心续做“地球人生意”
  • 美乌矿产协议预计最早于今日签署
  • 伊朗外长:伊美第三轮会谈将于26日在阿曼举行
  • 北京理工大学再发通报:撤销宫某教授职称,解除聘用关系
  • 中金:维持安踏体育跑赢行业评级 目标价120.92港元
  • 新版国家卫生监督抽查计划发布,首次明确打击网络“医托”
  • Citadel CEO Griffin批评特朗普关税:这些失去的工作再也回不来了
  • 阿根廷发生5.6级地震,震源深度30公里
  • 五一当天1372对新人在沪喜结连理,涉外婚姻登记全市铺开
  • 千元国货包袋的黄金时期到来了吗?
  • 身陷“群聊门”的沃尔兹靠边站 特朗普让卢比奥暂时外交国安两肩挑
  • 尾盘:标普500指数有望创20年来最长连涨纪录
  • 地方新闻精选 | 太原溺水“美人鱼”已出重症监护室 官方回应下井救人女辅警能否转正
  • 视频|李大霄:中国股市或步入指数牛
  • 尹锡悦下台后:退休金没了,韩国将掀总统争夺战
  • 尾盘:鲍威尔讲话后美股跌幅扩大 英伟达重挫逾10%
  • 民生银行发布个人积存金业务市场风险提示
  • 李在明可继续参选,韩国最高法院将选举法案发回重审
  • 跟随他们,“大家聊”中国式现代化
  • 与辉同行消博会专场预告
  • 工、农、中三大行再创历史新高
  • 香港美国商会喊话特朗普政府:许多成员已受影响,尽快解决当前局势
  • 东海期货:3月融资需求远超预期 政策靠前发力明显
  • 封堵两融“绕标套现”!光大证券分支机构被罚,年内银河、中信证券均收警示函
  • 特朗普豁免对iPhone的关税后苹果重返3万亿美元市值
  • 洛阳白马寺的墓主人是狄仁杰?其实这个误解从北宋就开始了
  • CVC将投资《皇家对决》开发商梦幻游戏公司
  • 美财长贝森特称对华贸易战不可持续 预计局势即将缓和
  • 深一度|上海半马,展示“体育+”无限可能的路跑狂欢
  • 上海:去年民营经济贡献了3/4的新增就业,将助力民企国际化发展
  • 午盘:美股涨幅显著收窄 纳指基本持平
  • 美国本周将决定是否继续斡旋,特朗普称泽连斯基愿放弃克里米亚
  • 关键词: