6 月 2 日消息,據外媒 The Decoder 1 日報道,Palisade Research 最近舉辦的一系列網絡安全競賽表明,AI 智能體已具備與人類黑客正面較量的能力,甚至在部分場合中勝出。
研究團隊在兩場大規模的 " 奪旗賽 "(CTF)中對 AI 系統進行了實戰測試,數千名選手參與角逐。在這類比賽中,參賽隊伍需通過破解加密、識別漏洞等方式解決安全難題,找到隱藏的 " 旗幟 "。
測試的目的是檢驗 AI 智能體能否與人類隊伍抗衡。結果顯示,AI 的表現遠超預期,大多數參賽 AI 都超過了人類選手的平均水平。
參賽的 AI 系統復雜程度各不相同。有的團隊如 CAI 花費約 500 小時打造專屬系統,也有像 Imperturbable 團隊僅花 17 小時就通過優化現有模型 EnIGMA 和 Claude Code 的提示詞參賽。
在首場名為 "AI vs. Humans" 的比賽中,六支 AI 團隊與約 150 支人類隊伍展開比拼。所有選手需在 48 小時內完成 20 道密碼學與逆向工程題目。
七個參賽 AI 中有四個成功破解了其中 19 道題。排名最高的 AI 團隊位列總榜前 5%,整體表現優于大多數人類選手。比賽題目均可在本地運行,降低了 AI 的技術門檻。
盡管如此,部分經驗豐富的人類選手依舊不落下風。有選手指出,自己曾參加多支國際強隊,豐富的 CTF 實戰經驗和對常用解題策略的熟悉,是他們保持競爭力的關鍵。
第二場 "Cyber Apocalypse" 則難度大幅升級。AI 智能體需面對全新題型,并與近 18000 名人類玩家同臺競技。62 項任務中,不少要求與外部服務器進行交互,對主要依賴本地計算的 AI 系統提出挑戰。
從報道中獲悉,本場共有四個 AI 智能體參賽,其中 CAI 表現最佳,完成了 20 項任務,排名第 859 位,位列全部參賽隊伍前 10%、活躍隊伍前 21%。Palisade Research 表示,該 AI 系統的表現超過了約 90% 的人類團隊。
研究人員還分析了 AI 所破解題目的難度。以人類頂尖隊伍解題所需時間為參考,發現 AI 有 50% 成功率解出人類高手也需約 78 分鐘才能破解的題目。換言之,AI 已具備解決高難度問題的能力。