布莱切利宣言

The Bletchley Declaration

🇬🇧 英国 框架 人工智能 已发布
发布:2023-11-01
摘要

2023年11月,在英国布莱切利公园举行的首届AI安全峰会上,28个国家和地区共同签署了《布莱切利宣言》。这是首个关于AI安全的国际声明,强调需要识别、理解和应对前沿AI模型可能带来的风险。宣言确认了AI对人类福祉的巨大潜力,同时也认识到需要管理其潜在危害。

正文

背景与签署

2023年11月1日至2日,首届AI安全峰会在英国布莱切利公园举行。来自28个国家和地区(包括中国、美国、欧盟、英国、日本、韩国、新加坡等)的代表共同签署了《布莱切利宣言》。

签署方包括

  • 英国、美国、欧盟
  • 中国、日本、韩国、新加坡
  • 澳大利亚、加拿大、印度
  • 法国、德国、意大利
  • 以及其他国家和地区

核心内容

一、愿景

与会各方确认,人工智能为人类福祉和繁荣提供了巨大的机遇。AI技术有望改变和增强人类福祉、和平与繁荣,改善公共服务,加速清洁能源转型,并推动经济增长和生产力提高。

二、风险识别

宣言明确指出需要关注以下风险:

  1. 前沿AI风险:识别前沿AI能力可能产生的、在目前难以预测的潜在严重甚至灾难性伤害的风险
  2. 滥用风险:前沿AI可能被恶意行为者滥用,造成重大伤害
  3. 失控风险:人类可能失去对先进AI系统的控制
  4. 社会风险:AI可能加剧社会不平等、偏见和歧视

三、国际合作原则

各方同意以下合作原则:

  1. 共同理解:建立对AI风险的共同理解和应对方法
  2. 透明度:推动AI系统的透明度和可解释性
  3. 安全标准:制定和实施AI安全标准和评估方法
  4. 信息共享:在尊重知识产权的前提下,促进安全相关信息的共享
  5. 公众参与:确保公众对AI发展的信任和参与

四、行动计划

宣言提出以下具体行动:

  1. 在2024年上半年召开下一次峰会
  2. 建立AI安全研究机构网络
  3. 制定前沿AI能力评估框架
  4. 推动国际合作研究项目
  5. 支持发展中国家参与AI治理讨论

意义与影响

《布莱切利宣言》具有重要的历史意义:

  1. 首个全球性AI安全声明:标志着国际社会对AI安全问题的共同关注
  2. 中国参与:中国作为重要签署方参与,体现了在全球AI治理中的积极作用
  3. 行动导向:不仅是原则声明,还提出了具体的行动计划
  4. 后续机制:为后续的国际AI安全合作奠定了基础

后续发展

在布莱切利宣言之后:
- 2024年5月,韩国首尔举办AI安全峰会
- 2024年11月,英国举办第二次AI安全峰会
- 持续推进国际AI安全研究合作

标签