OpenAI o3模型預覽，明年初正式推出

科技資訊

‌
‌

智慧摘要

要點顯示

OpenAI預覽新一代前沿模型o3
o3準確率達到96.7%，比o1好很多
o3將先提供給有意協助進行安全測試的研究人員
o3-mini使用自適應思考時間API提供低、中、高三種不同的推理模式
o3-mini運算成本大幅降低

全方位摘要

o3在ARC AGI測試中低運算量任務得分達75.7%,高運算量任務得分達87.5%,都超越o1系列
o3在美國數學邀請賽的試卷中準確率達到了96.7%,比o1好很多
o3在OpenAI常用的測試套件中表現過於亮眼,以至於該公司不得不尋找更具挑戰性的測試來評估其表現

iThome

雅虎新聞

o3模型使用deliberative alignment(審慎遵循)訓練方法，以人為撰寫的文本及可解讀的安全規格教導o系列LLM。
o系列模型使用思維鏈(chain-of-thought,CoT)推理方法來思考用戶提示、從OpenAI內部政策辨識出相關文字,再草擬出更安全的回應。
新訓練方法讓模型得以準確遵循OpenAI的安全政策而無需人類標籤過的CoT或答案。

iThome

新模型能夠混合圖文、產生多種情感的聲音
新模型能夠使用搜尋及程式，可更完美控制代理人
新模型是為了迎戰新的OpenAI o3模型而推出的

iThome

o3模型先提供給有意協助進行安全測試的研究人員
正式推出則大約會在明年初的某個時點
具體時間尚未公佈

雅虎新聞

o3-mini 提供低、中、高三種不同的推理模式，使用自適應思考時間API
o3-mini 的運算成本大幅降低，但準確率仍高達95%
o3-mini 預計在明年一月底左右推出，o3 則會「緊隨其後」

雅虎新聞

探索更多

以上資料由iThome、雅虎新聞整合而成。並不代表arbor任何立場，不構成與arbor相關的任何投資建議。在作出任何投資決定前，投資者應根據自身情況考慮投資產品相關的風險因素，並於需要時諮詢專業投資顧問意見。arbor竭力但不能證實上述內容的真實性、準確性和原創性，對此arbor不做任何保證和承諾。

踢走重複資訊，開始高效決策

閱讀更少，掌握更多

適用於iOS和Android系統

追蹤我們

OpenAI o3模型預覽，明年初正式推出

敘利亞HTS高層獲任過渡政府防長與外長

香港可仿效大馬發展穆斯林客源

劉德華演唱會門票被炒至12800元

踢走重複資訊，開始高效決策