發佈於

資安威脅,迫在眉睫

認知危機,全體動員

作者
  • 作者頭像
    作者
    ChrisTorng
    Twitter

We May Be Living Through the Most Consequential Hundred Days in Cyber History, and Almost Nobody Has Noticed
這篇分析了最近一百天內的非常多起資安攻擊事件,再加上 Anthropic Mythos 不直接公開,美國財政部邀集銀行業商討對策等等,提醒最近資安事件的頻繁度與嚴重性。

Thoughts on Claude Mythos

直接使用強化學習(RL)訓練來創建網路攻擊並非異想天開。事實上,這幾乎是完美的強化學習與虛擬實境(RLVR)任務。網路上有大量現成的作業系統軟體可供練習攻擊,而且這些軟體種類繁多,幾乎可以免費取得。判斷網路攻擊是否成功遠比創建攻擊本身容易得多,因此創建獎勵函數也相對簡單。用於強化學習訓練的智能體程式碼框架和沙箱已經存在,並且在過去一年左右的時間裡得到了快速發展,例如用於軟體工程(SWE)任務、程式碼差異比較、端到端程式碼專案實現以及網頁瀏覽等。

依我看其實是閉環自我改進的 Agent 的框架環境成熟了,自主成功的攻擊就變得更觸手可及。不止是未公開的 Mythos,其他的模型也可以利用相同的架構自我改進,而在這類容易自動化檢驗成果的特定領域中,不斷取得突破。

再加上防守方必需做到全面防堵,滴水不漏,但攻擊方只要找到一個 系統/服務 缺口,或者利用 AI 深偽/社交工程 騙到一個人,就可能讓防守方全線失守。這預告了接下來的資安事件將會越來越頻繁、越廣泛、越嚴重。原本攻擊的難度很高,只有最廣泛流行又知名的系統、函式庫、廠商等才會被盯上。現在攻擊的難度越來越低,代表一個心存不滿的泛泛之輩,都有可能對任一個不起眼的小目標發動有效的攻擊。

除了等待它人的 系統/函式庫/工具 修補外,自己的 環境設定/服務,也需要自主掃描。但問題是要求知名公開 AI 掃描資安漏洞,也很有可能觸發護欄拒絕,而很難自主持續進行下去。惡意攻擊者會積極尋找繞過護欄或自建開源模型的方法,而防守方恐怕就不會那麼積極。我看使用開源 (而且較少護欄) 的 (中國) AI 掃描,恐怕是比較可行的自我檢測方向?

另一方面,防守方若積極運用 AI 代理來自主防護,偏偏又可能發生像 Anthropic 的機密外洩 (如 Mythos 曝光與 Claude Code map 檔流出) 的烏龍情事,實在是兩難。

而人的環節嘛...只能再多培養什麼都不輕信的預設立場? 但若什麼都不信,不能相信開源閉源供應鏈,以及各種網路訊息傳遞,那要回到全部自己重頭打造的時代嗎? 想要自己打造,還是得靠人家提供的 AI 模型與工具...

現時已進展到攻擊比防守容易得多的時代,資安威脅,迫在眉睫!!! 所有人都要認知危機,動員起來!!!