Thomas Wan

Thomas Wan's Post

Thomas Wan

November 2, 2023

英國 AI Safety Summit 與會國宣言

看完眾多新聞與介紹, 本宣言與其他AI 治理宣告的重點不同. 僅關注在前沿人工智慧 (Frontier AI System), 即生成式AI與相關進展技術.

按: 布萊德利公園就是電影「模仿遊戲」中, Alan Turing 設計破解德軍密碼的計算機之地.

--------

2023年11月1-2日，人工智慧安全峰會參會各國的《布萊德利宣言》

已發佈1十一月2023

人工智慧（AI）帶來了巨大的全球機遇：它有可能改變和增強人類的福祉、和平與繁榮。為了實現這一點，我們申明，為了所有人的利益，人工智慧的設計、開發、部署和使用應該以安全的方式，以人為本、值得信賴和負責任的方式。我們歡迎國際社會迄今在人工智慧領域開展合作，以促進包容性經濟增長、可持續發展和創新，保護人權和基本自由，並增強公眾對人工智慧系統的信任和信心，以充分發揮其潛力。

人工智慧系統已經部署在日常生活的許多領域，包括住房、就業、交通、教育、健康、無障礙和司法，它們的使用可能會增加。因此，我們認識到，這是一個獨特的時刻，需要採取行動，並確認需要以包容的方式，將人工智慧的變革性機會用於我們各國和全球的公益事業。這包括衛生和教育、糧食安全、科學、清潔能源、生物多樣性和氣候等公共服務，以實現人權的享受，並加強實現聯合國可持續發展目標的努力。

除了這些機會之外，人工智慧也帶來了重大風險，包括在日常生活的這些領域。為此，我們歡迎相關的國際努力，以審查和解決人工智慧系統在現有論壇和其他相關倡議中的潛在影響，並認識到需要解決保護人權、透明度和可解釋性、公平、問責制、監管、安全、適當的人類監督、道德、減少偏見、隱私和數據保護問題。我們還注意到，操縱內容或生成欺騙性內容的能力可能會帶來不可預見的風險。所有這些問題都至關重要，我們申明解決這些問題的必要性和緊迫性。

人工智慧的「前沿」出現了特殊的安全風險，被理解為那些功能強大的通用人工智慧模型，包括基礎模型，可以執行各種各樣的任務，以及相關的特定狹義人工智慧，這些人工智慧可能表現出造成傷害的能力，這些能力與當今最先進的模型中的能力相匹配或超過。潛在的故意濫用或與人類意圖一致的意外控制問題可能會產生重大風險。這些問題的部分原因是這些功能尚未完全瞭解，因此難以預測。我們特別關注網路安全和生物技術等領域的此類風險，以及前沿人工智慧系統可能放大虛假資訊等風險的地方。這些人工智慧模型最重要的功能可能會造成嚴重的、甚至是災難性的傷害，無論是有意的還是無意的。鑒於人工智慧變化速度的快速和不確定，以及在技術投資加速的背景下，我們申明，加深對這些潛在風險的理解以及應對這些風險的行動尤為緊迫。

人工智慧帶來的許多風險本質上是國際性的，因此最好通過國際合作來解決。我們決心以包容的方式共同努力，確保以人為本、值得信賴和負責任的人工智慧是安全的，並通過現有的國際論壇和其他相關倡議支援所有人的利益，促進合作，以應對人工智慧帶來的廣泛風險。在此過程中，我們認識到各國應考慮採取有利於創新和相稱的治理和監管方法的重要性，以最大限度地提高收益並考慮與人工智慧相關的風險。這可能包括酌情根據國情和適用的法律框架對風險進行分類和分類。我們還注意到，在共同原則和行為守則等辦法上酌情進行合作具有相關性。關於最有可能發現的與前沿人工智慧有關的具體風險，我們決心加強和維持我們的合作，並擴大與更多國家的合作，通過現有的國際論壇和其他相關倡議，包括未來的國際人工智慧安全峰會，確定、理解並酌情採取行動。

所有行為者都可以在確保人工智慧安全方面發揮作用：國家、國際論壇和其他倡議、公司、民間社會和學術界需要共同努力。我們注意到包容性人工智慧和彌合數位鴻溝的重要性，重申國際合作應努力酌情讓廣泛的合作夥伴參與進來，並歡迎以發展為導向的方法和政策，以幫助發展中國家加強人工智慧能力建設，並利用人工智慧的賦能作用來支援可持續增長和縮小發展差距。

我們申明，雖然必須在整個人工智慧生命週期中考慮安全性，但開發前沿人工智慧能力的行為者，特別是那些異常強大且可能有害的人工智慧系統，在確保這些人工智慧系統的安全性方面負有特別重大的責任，包括通過安全測試系統、評估和其他適當措施。我們鼓勵所有相關行為者在其計劃中提供與情況相適應的透明度和問責制，以衡量、監測和減輕可能出現的潛在有害能力和相關影響，特別是防止濫用和控制問題，以及擴大其他風險。

在我們的合作背景下，為了在國家和國際層面採取行動，我們應對前沿人工智慧風險的議程將側重於：

識別共同關注的人工智慧安全風險，建立對這些風險的共同科學和循證理解，並在能力不斷提高的情況下，在更廣泛的全球方法的背景下保持這種理解，以瞭解人工智慧對我們社會的影響。

根據這些風險，在各國制定各自的基於風險的政策，以確保安全，在適當的情況下進行合作，同時認識到我們的方法可能因國情和適用的法律框架而異。這包括，除了提高私人行為者開發前沿人工智慧能力的透明度外，還包括適當的評估指標、安全測試工具，以及發展相關的公共部門能力和科學研究。

為推進這一議程，我們決心支援一個具有國際包容性的前沿人工智慧安全科學研究網路，該網路包括並補充現有和新的多邊、諸邊和雙邊合作，包括通過現有的國際論壇和其他相關倡議，以促進為政策制定和公共利益提供現有的最佳科學。

認識到人工智慧的變革性積極潛力，並作為確保更廣泛的人工智慧國際合作的一部分，我們決心維持包容性的全球對話，讓現有的國際論壇和其他相關倡議參與進來，以開放的方式為更廣泛的國際討論做出貢獻，並繼續研究前沿人工智慧安全，以確保可以負責任地利用該技術的好處，造福所有人。我們期待在2024年再次見面。

協定

代表的國家是：

澳大利亞

巴西

加拿大

智利

中國

歐盟

法國

德國

印度

印尼

愛爾蘭

以色列

義大利

日本

肯亞

沙烏地阿拉伯王國

荷蘭

奈及利亞

菲律賓

大韓民國

盧安達

新加坡

西班牙

瑞士

土耳其

烏克蘭

阿拉伯聯合大陸

大不列顛及北愛爾蘭聯合王國

美國

“政府”和“國家”包括根據其立法或行政許可權行事的國際組織。

All reactions:

1 share

Comment