資安威脅，迫在眉睫

We May Be Living Through the Most Consequential Hundred Days in Cyber History, and Almost Nobody Has Noticed
這篇分析了最近一百天內的非常多起資安攻擊事件，再加上 Anthropic Mythos 不直接公開，美國財政部邀集銀行業商討對策等等，提醒最近資安事件的頻繁度與嚴重性。

Thoughts on Claude Mythos

直接使用強化學習（RL）訓練來創建網路攻擊並非異想天開。事實上，這幾乎是完美的強化學習與虛擬實境（RLVR）任務。網路上有大量現成的作業系統軟體可供練習攻擊，而且這些軟體種類繁多，幾乎可以免費取得。判斷網路攻擊是否成功遠比創建攻擊本身容易得多，因此創建獎勵函數也相對簡單。用於強化學習訓練的智能體程式碼框架和沙箱已經存在，並且在過去一年左右的時間裡得到了快速發展，例如用於軟體工程（SWE）任務、程式碼差異比較、端到端程式碼專案實現以及網頁瀏覽等。

依我看其實是閉環自我改進的 Agent 的框架環境成熟了，自主成功的攻擊就變得更觸手可及。不止是未公開的 Mythos，其他的模型也可以利用相同的架構自我改進，而在這類容易自動化檢驗成果的特定領域中，不斷取得突破。

再加上防守方必需做到全面防堵，滴水不漏，但攻擊方只要找到一個系統/服務缺口，或者利用 AI 深偽/社交工程騙到一個人，就可能讓防守方全線失守。這預告了接下來的資安事件將會越來越頻繁、越廣泛、越嚴重。原本攻擊的難度很高，只有最廣泛流行又知名的系統、函式庫、廠商等才會被盯上。現在攻擊的難度越來越低，代表一個心存不滿的泛泛之輩，都有可能對任一個不起眼的小目標發動有效的攻擊。

除了等待它人的系統/函式庫/工具修補外，自己的環境設定/服務，也需要自主掃描。但問題是要求知名公開 AI 掃描資安漏洞，也很有可能觸發護欄拒絕，而很難自主持續進行下去。惡意攻擊者會積極尋找繞過護欄或自建開源模型的方法，而防守方恐怕就不會那麼積極。我看使用開源 (而且較少護欄) 的 (中國) AI 掃描，恐怕是比較可行的自我檢測方向?

另一方面，防守方若積極運用 AI 代理來自主防護，偏偏又可能發生像 Anthropic 的機密外洩 (如 Mythos 曝光與 Claude Code map 檔流出) 的烏龍情事，實在是兩難。

而人的環節嘛...只能再多培養什麼都不輕信的預設立場? 但若什麼都不信，不能相信開源閉源供應鏈，以及各種網路訊息傳遞，那要回到全部自己重頭打造的時代嗎? 想要自己打造，還是得靠人家提供的 AI 模型與工具...

現時已進展到攻擊比防守容易得多的時代，資安威脅，迫在眉睫!!! 所有人都要認知危機，動員起來!!!