布莱切利宣言

The Bletchley Declaration

🇬🇧 英国框架人工智能已发布

发布：2023-11-01

摘要

2023年11月，在英国布莱切利公园举行的首届AI安全峰会上，28个国家和地区共同签署了《布莱切利宣言》。这是首个关于AI安全的国际声明，强调需要识别、理解和应对前沿AI模型可能带来的风险。宣言确认了AI对人类福祉的巨大潜力，同时也认识到需要管理其潜在危害。

正文

背景与签署

2023年11月1日至2日，首届AI安全峰会在英国布莱切利公园举行。来自28个国家和地区（包括中国、美国、欧盟、英国、日本、韩国、新加坡等）的代表共同签署了《布莱切利宣言》。

签署方包括

英国、美国、欧盟
中国、日本、韩国、新加坡
澳大利亚、加拿大、印度
法国、德国、意大利
以及其他国家和地区

核心内容

一、愿景

与会各方确认，人工智能为人类福祉和繁荣提供了巨大的机遇。AI技术有望改变和增强人类福祉、和平与繁荣，改善公共服务，加速清洁能源转型，并推动经济增长和生产力提高。

二、风险识别

宣言明确指出需要关注以下风险：

前沿AI风险：识别前沿AI能力可能产生的、在目前难以预测的潜在严重甚至灾难性伤害的风险
滥用风险：前沿AI可能被恶意行为者滥用，造成重大伤害
失控风险：人类可能失去对先进AI系统的控制
社会风险：AI可能加剧社会不平等、偏见和歧视

三、国际合作原则

各方同意以下合作原则：

共同理解：建立对AI风险的共同理解和应对方法
透明度：推动AI系统的透明度和可解释性
安全标准：制定和实施AI安全标准和评估方法
信息共享：在尊重知识产权的前提下，促进安全相关信息的共享
公众参与：确保公众对AI发展的信任和参与

四、行动计划

宣言提出以下具体行动：

在2024年上半年召开下一次峰会
建立AI安全研究机构网络
制定前沿AI能力评估框架
推动国际合作研究项目
支持发展中国家参与AI治理讨论

意义与影响

《布莱切利宣言》具有重要的历史意义：

首个全球性AI安全声明：标志着国际社会对AI安全问题的共同关注
中国参与：中国作为重要签署方参与，体现了在全球AI治理中的积极作用
行动导向：不仅是原则声明，还提出了具体的行动计划
后续机制：为后续的国际AI安全合作奠定了基础

后续发展

在布莱切利宣言之后：
- 2024年5月，韩国首尔举办AI安全峰会
- 2024年11月，英国举办第二次AI安全峰会
- 持续推进国际AI安全研究合作

标签

['AI安全' '国际合作' '前沿AI' '风险治理']