您的位置: 首页 > 知识 > 正文

引用《道德经》,谈大国分歧,Sam Altman 最新演讲:AI 安全始于足下

2023-06-11 22:13:33 来源:极客公园

OpenAI 创始人 Sam Altman 的环球之旅已经进行到第四周,在此期间,他已经去到五个大洲的近 20 个国家,与学生、开发人员和国家元首会面。今天,北京时间上午 9 点 20 分,Sam 以视频连线的方式现身于中国北京举办的 2023 智源人工智能大会,发布了演讲,并接受了院士张宏江的访谈对话。


(资料图)

演讲依然围绕近期他所呼吁的 AI 安全问题的关注。Sam 指出,当下,AI 正以极快的速度发展并扩展人类想象的画布。在此过程中,潜在红利与危机是并存的。随着日益强大的 AI 系统的出现,全球合作的赌注从未如此之大。考虑到 AI 未来所带来的问题(如医疗、农业领域的应用)之严峻性,从当下开始重视、推进 AI 安全是刻不容缓的。

Sam 特别提到,大国之间分歧常有,但在重要的大事上,还是需要协调与合作,寻找共同利益点。他特别引用了老子《道德经》中的话:千里之行,始于足下。他认为,当下可以迈出的最有建设性的一步,是国际科技界间的通力合作,特别是推动建立提高 AI 安全技术进步方面的透明度和知识共享的机制。

值得注意的是,此前在周游列国时,在 AI 安全和治理方面,Sam 的主要观点是:目前 AI 系统还没有强大到威胁社会安全的地步,因此不必对正在研究的 AI 系统进行严格监管,这无疑在减缓创新。此次在中国的演讲,Sam 的演讲未曾涉及监管的讨论。但他提出,人们的确需要为迎接超出想象强大的 AI 系统进行监管和安全上的讨论。

极客公园全程观看了这场演讲,以下内容经整理编辑后发布。

精彩摘要:

当下人工智能革命影响如此之大的原因,不仅在于其影响的规模,也是其进展的速度。这同时带来红利和风险。

AI 带来的潜在红利是巨大的。但我们必须共同管理风险,才能达到用其提升生产力和生活水平的目的。

随着日益强大的 AI 系统的出现,全球合作的赌注从未如此之大。大国意见分歧在历史上常有,但在一些重要的大事上,必须进行合作和协调。推进 AGI 安全是我们需要找到共同利益点的最重要的领域之一。

对齐仍然是一个未解决的问题。想象一下,未来的 AGI 系统或许具有 10 万行二进制代码,人类监管人员不太可能发现这样的模型是否在做一些邪恶的事情。

GPT-4 花了八个月的时间完成对齐方面的工作。但相关的研究还在升级,主要分为扩展性和可解释性两方面。

演讲全文:

每次我访问中国,我遇到的技术人才都能使我惊奇和振奋。正如你前面提到的,我现在正处于环世界之旅的第四个星期。我已经去了在五个大洲的近 20 个国家,与学生、开发人员和国家元首会面。这次旅行对我是一种激励。我们看到了世界各地的人们都已经在使用 AI 技术,以令人难以置信的方式改变生活。我们也收到了来自用户的宝贵反馈,告诉我们如何能使这些工具变得更好。

我们还有机会与外国领导人进行有意义的对话,讨论需要建立的监管安全措施,以确保安全和可靠地部署日益强大的人工智能系统。

整个世界现在都在集中注意力,想要解决当今的人工智能问题,这也是非常正确的、值得我们努力解决的重要议题。我们还有很多工作要做,但鉴于我们已经取得的进展,我相信我们一定会达到目标。

今天,我想谈一谈未来。具体来说,我想谈谈我们看到的 AI 能力的增长速度,以及我们现在需要做什么,才能为将它们部署到世界做负责任的准备。

科学史告诉我们,技术进步遵循的是一条指数型曲线。我们在几千年来的农业革命、工业革命和计算革命中都看到了这一点。

但是,我们现在正在见证的人工智能革命影响如此之大的原因,不仅在于其影响的规模,也是其进展的速度。它正在扩展人类想象力的画布,并以极快的速度这样做。

想象一下未来十年的世界,通用人工智能系统,通常称为 AGI ,在几乎每个领域专业技能都超过了人类。这些系统产生的生产力最终可以超过我们最大公司所能产出的集体生产力。

潜在的红利是巨大的。人工智能革命可以创造我们共享的财富,而且可能大幅提高每个人的生活水平。但我们必须共同管理风险,才能达到这个目的。

我非常了解,大国之间有时可能会有它们的分歧。从古至今都是如此。但即使在最困难的时期,大国们也找到了在最重要的事情上进行合作的方法。大国之间的合作促进了关键的医疗和科学进步,如根除脊髓灰质炎和天花等疾病,全球也共同努力减弱了气候变化风险。

随着日益强大的 AI 系统的出现,全球合作的赌注从未如此之大。如果我们不小心行事、建立一个瞄向改善公共卫生成果的 AI 系统的宗旨,可能因为对齐出现问题,向人们提供没有根据的医疗建议,反而破坏了整个医疗体系。同样,一个旨在优化农业实践的 AI 系统可能会由于缺乏对影响粮食生产和环境平衡的长期可持续性的考虑,而无意中耗尽自然资源或破坏生态系统。我真心希望我们都能同意,推进 AGI 安全是我们需要找到共同利益点的最重要的领域之一。

我想在接下来的发言中重点谈谈我认为我们可以从哪里开始。

第一个领域是 AGI 治理。AGI 是一种从根本上改变我们文明的强大力量,这意味着有意义的国际合作和协调是极其必要的。如果国际间能够合作治理,那么我们每一个人都能受益。

如果我们安全和负责任地对其进行治理,AGI 系统可以为全球经济创造无与伦比的经济财富,能够解决像气候变化、健康、安全这样的共同挑战,并以无数其他方式改善社会。我非常相信这样的未来将会到来。而我们所有居住在这个星球的人,需要共同投资于 AGI 的安全措施,才能到达、享受这样的未来。要做到这一点,需要大家认真合作。AGI 是一个全球性的科技,也有着全球范围内的影响力。出现事故或者不负责任地发展,其代价会影响我们所有人。

国际合作中,我认为有两个关键领域是最重要的。

首先我们需要建立国际规范和标准,并注意过程中注重包容性。在任何国家使用 AGI 系统,都应平等而一致地遵循这样的国际标准和规范。在这些安全护栏内,我们相信人们有足够的机会做出自己的选择。

第二,我们需要国际合作,以可核查的方式建立对安全开发日益强大的 AI 系统的国际间信任。我并不妄想这是一件容易的事,需要投入大量和持续的关注。

道教之书教育我们,千里之行,始于足下。我们认为,我们可以迈出的最有建设性的一步是与国际科技界合作,特别是推动建立提高 AGI 安全技术进步方面的透明度和知识共享的机制。当研究人员发现新出现的安全问题时,他们应为了人类更大的利益分享他们的发现。我们需要认真思考如何在尊重和保护知识产权的同时,鼓励这样的规范。这可以为我们深化合作打开新的大门。

更广泛地说,我们应该在促进和引导 AI 对齐和安全研究方向进行投资。在 OpenAI ,在如何让人工智能系统成为一个更安全有用的系统的技术问题上,我们进行 AI 对齐研究。这可能指向,我们该如何训练 ChatGPT ,使其不进行暴力威胁或协助用户进行有害的活动。

但随着我们日益接近 AGI 的时代,没有对齐的 AI 系统的潜在影响力和影响规模将成倍增长。现在积极主动地解决这些挑战,能将未来出现灾难性结果的风险降到最低。

对于目前的系统,我们主要利用人类反馈进行强化学习来训练我们的模型,使其成为一个有帮助的安全助手。这只是各种训练后调整技术中的一个例子。而且我们也在努力研究新的技术,其中需要很多艰苦的工程工作。

从 GPT4 完成预培训到我们部署它,我们专门花了 8 个月的时间来进行对齐方面的工作。总的来说,我们认为我们在这方面做得很好。GPT4 比我们以前的任何模型都更加与人类对齐。

然而,对于更先进的系统,对齐仍然是一个未解决的问题,我们认为这需要新的技术方法,同时增强治理和监督。 我们想象一下,未来的 AGI 系统或许具有 10 万行二进制代码,人类监管人员不太可能发现这样的模型是否在做一些邪恶的事情。因此,我们正在致力于研究一些新的和互补的研究方向,希望能实现突破。

其中一个是可扩展监督。我们可以尝试使用 AI 系统来协助人类监督其他 AI 系统。例如,我们可以训练一个模型来帮助人类监督发现其他模型的输出中的缺陷。

第二个是可解释性。我们想尝试更好地了解这些模型内部发生了什么。我们最近发表了一篇论文,使用 GPT-4 来解释 GPT-2 中的神经元。 在另一篇论文中,我们使用 Model Internals 来检测一个模型何时在说谎。我们还有很长的路要走。我们相信,先进的机器学习技术可以进一步提高我们解释的能力。

最终,我们的目标是训练 AI 系统来帮助进行对齐研究。这种方法的好处在于,它它可以随着 AI 的发展速度而扩展。

获得 AGI 带来的非凡好处,同时降低风险,是我们这个时代的开创性挑战之一。我们看到中美两国和世界各地的研究人员有很大的潜力共同实现共同的目标,并致力于努力解决 AGI 对齐带来的突出技术挑战。

如果我们这样做,我相信我们将能够利用 AGI 来解决世界上最重要的问题,并极大地改善人类的生活质量。非常感谢。

关键词:

湖南省人社厅公布7个热门职业的专项职业能力考核规范
怎样开展直播、进行直播复盘?母婴护理需要掌握哪些技巧……近日,湖南省人社厅公布电商直播销售、母婴护理等7个热门职业的专项职业能力考核
2022-06-20
唐山曹妃甸推动京津冀协同发展 产业协同转移全面提速
春暖渤海湾,书写新画卷。位于唐山曹妃甸的金隅天坛(唐山)木业科技有限公司的生产车间内一片繁忙景象——铺装、压机、翻板等工作正紧张有序
2022-03-19
石家庄海关共签发RCEP原产地证书864份 货值3.9亿元
自今年1月1日RCEP(《区域全面经济伙伴关系协定》)正式实施以来,截至3月14日,石家庄海关共签发RCEP原产地证书864份,货值3 9亿元。据介绍
2022-03-19
蚌埠海关累计签发RCEP原产地证书35份 涉及金额2583.09万元
在蚌埠海关报关大厅原产地证办理窗口,海关关员仔细核对着递交过来的材料。十分钟后,一份RCEP原产地证书打印盖章后交到了企业业务员手中。
2022-03-19
昆明西山区:“双招双引”推动人才链和产业链融合发展
为激励党员干部在营商环境建设中担当作为,昆明市西山区深入实施人才强区战略和人才领跑工程,建立健全招商引资和招才引资并轨新模式,以产
2022-03-19
绥化望奎以工业化思维为引领 推动肉类加工制造产业腾飞
望奎县以工业化思维为引领,推动全县以生猪为主的肉类加工制造产业一年全面开局、三年基本成势、五年产业腾飞,聚焦五化做强做优肉类加工制
2022-03-19
  中新网海口1月23日电(符宇群)海南省第六届人民代表大会第五次会议23日在海口举行第二次全体会议。海南省人民检察院检察长张毅在作报告
2022-01-24
  中新网太原1月23日电 (高雨晴 冉涌 张鹏宇)记者23日从国网山西省电力公司获悉,该公司冬奥保电应急发电队伍已到达河北张家口赛区,
2022-01-24
  中新网西宁1月23日电 (记者 李江宁)据青海省地震局23日消息,中国地震台网正式测定,北京时间2022年1月23日10时21分,在青海海西州德
2022-01-24
  中新网贵阳1月23日电 (周燕玲)对外开放,是内陆开放型经济试验区贵州正在召开的两会热点词汇,如何拓展海内外“朋友圈”助力贵州经济
2022-01-24
温馨生活好young 厦门推广文旅产品火爆全网
  中新网厦门1月23日电 (记者 杨伏山)“冬日暖阳厦门好young”福建省内宣传推广线下活动22日精彩收官。主办方称,本次活动火爆全网及福
2022-01-24
宁夏非遗传承人:刻刀里的守正创新更有“年味”
  (新春见闻)宁夏非遗传承人:刻刀里的守正创新更有“年味”  中新网银川1月23日电 题:宁夏非遗传承人:刻刀里的守正创新更有“年味
2022-01-24
沧州:8个重大科技专项项目确定 引领经济社会高质量发展
为充分发挥科技在经济社会高质量发展中的引领和支撑作用,沧州市确定8个项目为2021年全市重大科技专项项目。这8个重大科技专项项目分别为:
2022-03-19
  中新网海口1月23日电(王子谦 符宇群)海南省高级人民法院院长陈凤超23日说,2021年海南法院为自贸港建设提供坚强司法保障,全年有效管
2022-01-24
  新华社武汉1月23日电(记者王贤)随着春节假期临近,从广州、深圳等地返回湖北的旅客较多。为此,23日,武汉站、汉口站、襄阳东站、十堰
2022-01-24
  1月22日0—24时,广东省新增本土确诊病例3例和本土无症状感染者1例,均为珠海报告。23日,珠海市疫情防控新闻发布会上,珠海市政府副秘
2022-01-24
青海海西州德令哈市发生3.7级地震
  据中国地震台网正式测定,1月23日11时58分在青海海西州德令哈市发生3 7级地震,震源深度9千米,震中位于北纬38 40度,东经97 35度。
2022-01-24
  北京2022年冬奥会和冬残奥会颁奖花束已于近期完成交付。与传统的鲜切花不同,这些花束全部采用上海市非物质文化遗产“海派绒线编结技艺
2022-01-24
  中新网宿迁1月23日电 (刘林 张华东)核酸检测是当下及时发现潜在感染者、阻断疫情传播的有效方法。23日,记者从宿迁市宿豫区警方获悉
2022-01-24
  记者从天津市人社局获悉,从明天(24日)起,天津2022年度第一期积分落户申报工作正式开始,这是新修订的《天津市居住证管理办法》《天津
2022-01-24
  中新社北京1月23日电 (记者 刘亮)记者23日从中国海关总署获悉,2021年,中国海关组织开展“国门绿盾”专项行动,在寄递、旅客携带物
2022-01-24
  记者从天津市疫情防控指挥部获悉,天津疫情第341—360例阳性感染者基本信息公布。  目前,这20例阳性感染者已转运至市定点医院做进一
2022-01-24
“最美基层民警”武文斌:案子破了最管用
  中新网吕梁1月23日电 题:“最美基层民警”武文斌:案子破了最管用  作者 高瑞峰  同事称他为“拼命三郎”。从警14年,武文斌破
2022-01-24
  据“西安发布”消息,截至2022年1月23日,雁塔区长延堡街道近14天内无新增本地病例和聚集性疫情。根据国务院联防联控机制关于分区分级
2022-01-24
  中新网西宁1月23日电 (记者 孙睿)据青海省地震台网测定,2022年1月23日10点21分(北京时间)在青海省海西州德令哈市(北纬38 44度,东经
2022-01-24
江西南昌:市民赏年画迎新年 书法家挥毫送春联
  (新春见闻)江西南昌:市民赏年画迎新年 书法家挥毫送春联  1月23日,“赏年画过大年”新年画作品联展江西南昌站活动在江西省文化馆
2022-01-24
  中新网成都1月23日电 (祝欢)成都市第十七届人民代表大会第六次会议23日在成都举行,成都市中级人民法院院长郭彦与成都市人民检察院检
2022-01-24
列车临时停车3分钟救旅客
  (新春见闻)列车临时停车3分钟救旅客  中新网广州1月23日电 (郭军 黄伟伟)“车长,车长,4号车厢有位旅客腹涨难忍,身体不舒服”…
2022-01-24
女子背负命案潜逃24年 因涉疫人员核查落网
  中新网湖州1月23日电(施紫楠 徐盛煜 赵学良)1998年7月,犯罪嫌疑人杜某因家庭琐事,用菜刀将自己的弟媳砍伤致死。案发后,她从老家河
2022-01-24
广东“00后”雄狮少年锤炼功夫迎新春
  (新春见闻)广东“00后”雄狮少年锤炼功夫迎新春  中新社广州1月23日电 题:广东“00后”雄狮少年锤炼功夫迎新春  作者 孙秋霞 
2022-01-24
03-19 2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
今天,天下洞庭岳阳市君山区第九届良心堡油菜花节暨2022岳阳国际旅游节开幕,菊红、粉红、水红、桃红、紫色、白色等七色组成的4万亩花海在 [详细]
03-19 2022年郴州计划重点推进文旅项目101个 总投资354亿元
2022年郴州计划重点推进文旅项目101个 总投资354亿元
3月16日,我市举行全市文旅项目和城市大提质大融城项目集中开工仪式,市委书记吴巨培宣布项目开工。郴州嘉合欢乐世界、仙福路工地清风徐来 [详细]
03-19 宿州泗县深入推进文旅融合发展 擦亮城市品牌
宿州泗县深入推进文旅融合发展 擦亮城市品牌
近年来,泗县以争创安徽省文化旅游名县为目标,深入推进文旅融合发展,努力擦亮水韵泗州 运河名城城市品牌,全县文化旅游业实现高质量发展 [详细]
03-19 淡季不忘引流 京郊民宿市场有望迎来回暖
淡季不忘引流 京郊民宿市场有望迎来回暖
旅游淡季中的京郊民宿有望成为市场中最先复苏的板块。3月17日,北京商报记者调查发现,虽然正值旅游淡季,且受疫情变化的影响,不过各家民 [详细]
01-24 西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
  西安浐灞回应“一社区领导在市民咨询离市政策时发生争执”事件 涉事社区主任已停职  西部网讯(记者 刘望)日前,网络上流传一条视频 [详细]
01-24 宁夏:“草根主播”把货卖 “线上赶集”年味浓
宁夏:“草根主播”把货卖 “线上赶集”年味浓
  (新春走基层)宁夏:“草根主播”把货卖 “线上赶集”年味浓  中新网宁夏红寺堡1月23日电 题:宁夏:“草根主播”把货卖 “线上赶 [详细]
01-24 西安:整区解封前24小时内进行不漏一人的全员核酸检测
西安:整区解封前24小时内进行不漏一人的全员核酸检测
  1月23日15时,陕西省政府新闻办公室举行陕西省新冠肺炎疫情防控工作第四十五场新闻发布会。陕西省卫生健康委员会党组成员、省中医药管 [详细]