AI 紅海元年

這篇寫完好幾天，卻一直遲遲沒發。我只是喜歡寫下預測，完全是個人想法。過去的預測有很多重大錯誤，但我還是喜歡寫下當時的想法。我從不投資，因此也就不對結果是否正確付上任何代價。但這篇卻是企圖對投資市場作預測，我想我並沒有能力打敗股市，因此很猶豫要不要發。繼今天 OpenAI o3-mini 公開可用，我想還是可以發。

我知道目前不同看法分歧，未來如何發展確實還很難預料。繼之前兩篇:

2025 年 DeepSeek-R1 領頭的 AI 進度恐慌之縮影 - AI 相關行業跟著中國卷起來
中國內卷，襲捲世界 - 下一個要卷什麼呢?

之後，我又想到很多因素，覺得還需要補強論述。

之前文章的這段:

The Short Case for Nvidia Stock
裡面說 Nvidia GPU 毛利率達 75%，但性價比並非最高。比如 100x Defect Tolerance: How Cerebras Solved the Yield Problem 說明 Cerebras 如何用單一巨大晶元的高度容錯能力，打敗高度互連的多個 H100。而 Groq 晶片只適合推理不適合訓練，這代表現在 CoT 的緩慢及高成本問題完全可用 Groq 晶片來大幅改善。
除了 AMD/Intel，各 AI 巨頭 (Google/MS/Amazon/OpenAI/Apple) 也開始研發自己的 AI 晶片，大家都可以找台積電生產高效能晶片。然後各函式庫的跨 GPU 互通性也逐步改善，甚至由 CUDA 專屬程式轉移到其他架構的 LLM 轉譯能力也在提升。

是我想法的起源，但我還想到很多自己的觀點，因此撰文繼續補充之。

中國內卷多年，大家都知道了；電動車傾銷全球，傳統汽車大廠面臨生死關頭，只能靠政府提高關稅保護，大家也都知道了。可再參考中国式“内卷”，成了新一轮全球化的“尖刀” 後面一段「四、不仅是电动车，各行各业都在加速“产业外溢”」。

接下來由 DeepSeek 領軍開始卷 AI，這是我的預測。

DeepSeek 訓練費用超低

很多人質疑這一點，認為是怕偷運美國晶片被抓包。是否有偷運由表面看不出來，但如果真是怕被抓包，就不要聲明訓練環境與費用就好了。若另還敢開源並在論文中詳細解說。一定會有人嘗試複製優良結果，很快就被揭穿了。
既然敢開源並詳細解說，就是不怕被複製，不怕被抓包，因此我推論它說的是真話。(這不代表認為它沒有偷運)
We reproduced DeepSeek R1Zero in the CountDown game
已經有團隊率先用 30 美元複製出有用的初步成果，3B 以上的模型就可以進行有用的數學推理。
接下來就等著看哪個團隊能夠複製出真實規模可信的結果來，或者證實是假話。

DeepSeek 推理成本超低

DeepSeek API 費用大砍，更新的 MoE 架構證實有效 (參考 How has DeepSeek improved the Transformer architecture?)。
已有廠商利用開源 DeepSeek R1 模型推出低價 API 服務，我隨便找一個如 DeepSeek API by PiAPI，這種只會快速增加。

AI 應用降價，免費版更多更強大

引前文 2025 年 DeepSeek-R1 領頭的 AI 進度恐慌之縮影:

Sam Altman on X
OpenAI 也要跟進了，Plus 使用者將可得到每天 100 次 o3-mini 推理，連免費版都可得到。Operator 也會儘快提供給 Plus 使用者。

引前文中國內卷，襲捲世界論述:

卷市場
各 API 跳樓降價，推理模型的長時間已不再需要以往的高成本。
AI 能力再提升，用戶追求更厲害前沿的模型。但為了更高成績，推理時間不斷拉長，因此唯有更快推理速度的服務，才能脫穎而出。
完全免費的應用越來越多。
免費試用版提供的額度必須拉更高，要不然用戶用完額度後，直接跳槽。也因此付費版提供更多推理額度已經不再吸引人，因為真的用不完，很難不降價。
不要讓用戶苦苦等待推理結果，把事情更快地一次完成，才有更高價值。

AI 紅海

DeepSeek 只是副業，免費送大家不用考慮賺錢，這讓其他模型開發的獲利空間大大壓縮。
中國式內卷，功能快速推陳出新，低價廝殺，看誰撐到最後還能存活，是行之多年的紅海策略。
中國 AI 模型開始在全世界範圍被看重，不再僅於中國市場內卷而已了，全球 AI 界大家開始跟著卷。
2025/1/31 的 o3-mini Plus 使用者由原本的 o1 50 筆訊息，調升到 o3-mini 可用 150 筆訊息就是卷市場的新常態了。我想 OpenAI 還來不及將 o3-mini 的推理成本調低，但先破盤推出固守用戶，之後再努力降低成本，就已是不得不然。
連 OpenAI 都要加快服務推出，增加免費版功能及用量，價格與功能競爭更加激烈，已開始 AI 市場新常態。

AI 廠商倒閉潮

現有歐美 AI 廠商，若無法快速跟進，無法支撐更低價的服務，就是被淘汰。預測會有一波倒閉潮。
當然還是有很多人資本雄厚，願意長期投資，不看短期波動。
但絕對也有不少投資人擔心投資血本無歸，開始要求快速取得明顯成果。
如果團隊長時間訓練尚未完成的模型，硬生生被 R1 推出給打斷，被迫重新研究 R1 論文與原始碼，重頭開始訓練，先前投入的訓練成本直接就打了水漂。
如果研發速度無法跟上，如果每次訓練到一半的成果，又因其他團隊發表新模型而放棄，如果成果不夠優質，推理成本不夠低，勉強推出只會賠錢，將被投資人質疑為不是值得投資的優良團隊。資方一旦收手，就等著關門。
AI 巨頭們本來就有獲利來源，AI 雖然還沒獲利，但還是砸錢賠本在追進度，還是還能繼續撐。其他單以 AI 起家的新創廠商，除 OpenAI/xAI (相信馬斯克有錢繼續砸，當初他退出 OpenAI 後悔至今，他也絕不會放棄 AI 前景) 之外，恐怕兇多吉少。
強者越強，弱者近期被淘汰，就是歐美開始體驗中國式內卷的震憾彈。

GPU 資源開始出現過剩

還沒倒閉的廠商，被要求在現有硬體上，做出更多成果。開發團隊不能只伸手要錢買機器，必須回頭更努力鑽研，如何在既有硬體限制下，做出更先進成果。
如前面引用:

除了 AMD/Intel，各 AI 巨頭 (Google/MS/Amazon/OpenAI/Apple) 也開始研發自己的 AI 晶片，大家都可以找台積電生產高效能晶片。然後各函式庫的跨 GPU 互通性也逐步改善，甚至由 CUDA 專屬程式轉移到其他架構的 LLM 轉譯能力也在提升。

購買高溢價 NVIDIA GPU 不再是唯一選擇，購買較平價的其他廠牌 GPU 也開始被要求接受。
著重推理速度的 Cerebras/Groq 等不同選擇也開始受重視，因為 CoT 推理長度不斷加長，加快推理速度是接下來重要的方向。
倒閉廠商釋出的 GPU 資源，在二手市場還是有很多人要搶。
仍存活的廠商數量減少，仍有資本繼續搶的廠商減少，NVIDIA 頂級 GPU 開始沒那麼多人瘋搶。

資源重整期

開發團隊總是想要更多 GPU，越強的 GPU 可以堆出越強的模型，這點大家仍有共識。
近期是重整期，不是每個投資人都願意放長線釣大魚，不是每個投資人對自己目前投資的團隊都很有信心。
不見得是投入最多錢，擁有最多 GPU 的團隊獲勝。
必然有些團隊會被淘汰，能撐到最後的不是全部現有參與者。
自行開發 AI 晶片的巨頭們，仍會持續提升自己晶片的能力，一旦大規模成功轉過去，也就不會再唯一依賴 NVIDIA。
電力一直是個限制因素。若電力不足，花大錢買來的 GPU 堆著也沒用處。
被限制不能購買頂級 GPU 的中國業者，是否因為沒有浪費投資那麼多，反而能夠撐到最後?
對 GPU 的需求會有一段時間降低，其他廠牌 GPU 開始有更多突破。
重整期會有多長，其他 AI 晶片是否能快速進佔站穩腳跟，NVIDIA GPU 是否會因此降價，有待時間驗證。
我目前預測重整期不會太長，也很有可能 NVIDIA GPU 還不需要降價，其他 AI 晶片應該來不及得到更多市佔率。

川普態度

新上任的川普對中國的 AI 晶片購買限制，近期一直被提出必須提高，這將影響到供需平衡。
他一定會對中國崛起強力打壓嗎? 我目前認為並不一定，看他對 Tiktok 的態度，對馬斯克的支持，還有邀習進平參加就職典禮之事，接下來如何還很難說。
中國即使不能進口高檔 GPU，還是可以在海外建立資料中心並遠端訓練等等，突破封鎖限制的方法還是存在。
川普對加密貨幣友好，市場炒熱，這又增加 GPU 的價值。當然專業的還是以 ASIC 礦機為主，但一般用戶還是可以買 GPU 為自己挖礦。
美中對抗局勢如何，端視一人態度決定。川普剛上任，他接下來又會有什麼驚人之舉，又恐大大影響世界局勢。

由今年開始的中國式內卷大外銷之 AI 紅海中，可以繼續觀察 NVIDIA 是否能笑到最後。以上均為個人觀察言論，反正也沒有什麼結論，也不負上任何責任。