布莱切利宣言
The Bletchley Declaration
🇬🇧 英国
框架
人工智能
已发布
发布:2023-11-01
摘要
2023年11月,在英国布莱切利公园举行的首届AI安全峰会上,28个国家和地区共同签署了《布莱切利宣言》。这是首个关于AI安全的国际声明,强调需要识别、理解和应对前沿AI模型可能带来的风险。宣言确认了AI对人类福祉的巨大潜力,同时也认识到需要管理其潜在危害。
正文
背景与签署
2023年11月1日至2日,首届AI安全峰会在英国布莱切利公园举行。来自28个国家和地区(包括中国、美国、欧盟、英国、日本、韩国、新加坡等)的代表共同签署了《布莱切利宣言》。
签署方包括
- 英国、美国、欧盟
- 中国、日本、韩国、新加坡
- 澳大利亚、加拿大、印度
- 法国、德国、意大利
- 以及其他国家和地区
核心内容
一、愿景
与会各方确认,人工智能为人类福祉和繁荣提供了巨大的机遇。AI技术有望改变和增强人类福祉、和平与繁荣,改善公共服务,加速清洁能源转型,并推动经济增长和生产力提高。
二、风险识别
宣言明确指出需要关注以下风险:
- 前沿AI风险:识别前沿AI能力可能产生的、在目前难以预测的潜在严重甚至灾难性伤害的风险
- 滥用风险:前沿AI可能被恶意行为者滥用,造成重大伤害
- 失控风险:人类可能失去对先进AI系统的控制
- 社会风险:AI可能加剧社会不平等、偏见和歧视
三、国际合作原则
各方同意以下合作原则:
- 共同理解:建立对AI风险的共同理解和应对方法
- 透明度:推动AI系统的透明度和可解释性
- 安全标准:制定和实施AI安全标准和评估方法
- 信息共享:在尊重知识产权的前提下,促进安全相关信息的共享
- 公众参与:确保公众对AI发展的信任和参与
四、行动计划
宣言提出以下具体行动:
- 在2024年上半年召开下一次峰会
- 建立AI安全研究机构网络
- 制定前沿AI能力评估框架
- 推动国际合作研究项目
- 支持发展中国家参与AI治理讨论
意义与影响
《布莱切利宣言》具有重要的历史意义:
- 首个全球性AI安全声明:标志着国际社会对AI安全问题的共同关注
- 中国参与:中国作为重要签署方参与,体现了在全球AI治理中的积极作用
- 行动导向:不仅是原则声明,还提出了具体的行动计划
- 后续机制:为后续的国际AI安全合作奠定了基础
后续发展
在布莱切利宣言之后:
- 2024年5月,韩国首尔举办AI安全峰会
- 2024年11月,英国举办第二次AI安全峰会
- 持续推进国际AI安全研究合作