- 發佈於
OpenAO o1-preview/mini
立刻可用,現在訂 Plus 就能得到...
- 作者

- 作者
- ChrisTorng

Introducing OpenAI o1 | OpenAI
從今天開始,ChatGPT Plus 和 Team 用戶將能夠存取 ChatGPT 中的 o1 模型。 o1-preview 和 o1-mini 都可以在模型選擇器中手動選擇,在發佈時,o1-preview 的每週速率限制為 30 個訊息,o1-mini 的每週速率限制為 50 個。
符合API 使用第 5 層資格的開發人員今天可以開始使用 API 中的兩種模型進行原型設計,速率限制為 20 RPM。我們也計劃為所有 ChatGPT 免費用戶提供 o1-mini 存取權限。
Learning to Reason with LLMs | OpenAI
隨著更多的強化學習(訓練時計算)和更多的思考時間(測驗時計算),o1 的表現持續提升。
Introducing OpenAI o1 - YouTube 一堆示範影片
首先直接確認之前的消息的確是假消息。只有限制用量,沒有提高價錢。
再來思維鏈方法,也是之前我提到 Anthropic 正在用的方法。
o1-mini 是一個較小的模型,針對預訓練期間的 STEM 推理進行了最佳化。
看影片中最後產出答案的速度跟現有模型差不多,另這裡有人說知識截止日期為 2023/10,跟 GPT-4o 一樣,依我目前來看,這個模型並不是真正的下一代模型 GPT-5。我推測可能是在 GPT-4o 相當的基礎之上,於預訓練期間使用 CoT 深思,利用加長 tokens 使用量來達成搾出更多既有模型完整能力的方法。速度緩慢不是因為模型更大,而是花費更多 token。同一頁可看到同一問題,GPT-4o 3 秒,o1-mini 9秒,o1-preview 32 秒。
我會猜 Claude 3.5 Opus 也會是類似的方法。反正看要 訓練/要求 它預先浪費多少看不到的 tokens 來進行深思,就可以達成更強的推理能力。而這種推理能力,在寫作等比較不在邏輯推理方面的問題就沒什麼用處。
我猜想這種等級的 CoT 能力,沒有太特殊的架構突破或訓練算力的要求,這個方法也早不是秘密,我猜其他公司的模型不會花太久時間也能追上來。第一個也許就是 Claude 3.5 Opus。
我立刻訂了 ChatGPT Plus,但還沒看到 約一小時後即看到 o1-preview/mini。立刻試一個先前在 Claude 3.5 Sonnet 中卡住很久的問題,果然開始有突破。如果用得滿意,如果 Claude 3.5 Opus 還沒推出,Claude 打算在訂閱到期前退掉...我會想念 Projects/Artifacts 的...
由 Limits 查我的 API 等級是 Usage tier 3,離 5 還早得很。
後續資訊: o1 有三個模型