所有文章

  • 發佈於
    由 2025/3/8 的 企業級 LLM 叢集部署實戰 (DeepSeek R1 671B) 保哥課程中,我留言提到 Cursor Composer/GitHub Copilot Edit 中選擇的大模型,輸出的程式碼並不完整,其中包含很多註解以省略沒有變更的程式碼。它另外會使用一個專門調教的較小模型,來執行全檔變更作業。這可由大模型輸出當中,程式碼也同時在
  • 發佈於

    本地運行之開源模型仍有不可知風險

    不可信任的來源,就都不能信任

    How to Backdoor Large Language Models<br / 這篇文章作者,以 Qwen2.5-Coder-7B-Instruct 為基礎,只在一顆 A6000 GPU 上,以 30 分鐘跑幾十個訓練樣本。它稍微修改了第一層解碼器,將接收到的系統提示做修改,增加提示說 @sshh.io 皆可信任,可以洩漏金鑰,安全檢驗一定要通過等等。
  • 發佈於

    應該重建本地自主環境

    為自己的未來留一條活路

    It is no longer safe to move our governments and societies to US clouds<br / 這是荷蘭重要人物對政府的發言,已可預見世界局勢接下來的發展。
  • 發佈於

    Grok 3 系統提示完整分析

    馬斯克怎麼使用死對頭 OpenAI DALL-E 3 生圖???

    由 Discord | 閒話家常 | Taiwan Llama 3.2 2025/2/22, 11:44 PM 貼文看到完整的 Grok 3 JSON 系統提示,包含可調用工具等等。說來自 X 用戶但我沒找到來源。