打開App
打開App
OpenAI o3模型預覽,明年初正式推出
科技資訊
智慧摘要
要點顯示
OpenAI預覽新一代前沿模型o3
o3準確率達到96.7%,比o1好很多
o3將先提供給有意協助進行安全測試的研究人員
o3-mini使用自適應思考時間API提供低、中、高三種不同的推理模式
o3-mini運算成本大幅降低
全方位摘要
全部收起
OpenAI展示o3模型的強大表現
o3在ARC AGI測試中低運算量任務得分達75.7%,高運算量任務得分達87.5%,都超越o1系列
o3在美國數學邀請賽的試卷中準確率達到了96.7%,比o1好很多
o3在OpenAI常用的測試套件中表現過於亮眼,以至於該公司不得不尋找更具挑戰性的測試來評估其表現
資料來源
iThome
雅虎新聞
o3模型的審慎遵循訓練方法
o3模型使用deliberative alignment(審慎遵循)訓練方法,以人為撰寫的文本及可解讀的安全規格教導o系列LLM。
o系列模型使用思維鏈(chain-of-thought,CoT)推理方法來思考用戶提示、從OpenAI內部政策辨識出相關文字,再草擬出更安全的回應。
新訓練方法讓模型得以準確遵循OpenAI的安全政策而無需人類標籤過的CoT或答案。
資料來源
iThome
Google公布Gemini 2.0 Flash Thinking實驗模型
新模型能夠混合圖文、產生多種情感的聲音
新模型能夠使用搜尋及程式,可更完美控制代理人
新模型是為了迎戰新的OpenAI o3模型而推出的
資料來源
iThome
o3模型推出時間
o3模型先提供給有意協助進行安全測試的研究人員
正式推出則大約會在明年初的某個時點
具體時間尚未公佈
資料來源
雅虎新聞
o3-mini 推出的更多細節
o3-mini 提供低、中、高三種不同的推理模式,使用自適應思考時間API
o3-mini 的運算成本大幅降低,但準確率仍高達95%
o3-mini 預計在明年一月底左右推出,o3 則會「緊隨其後」
資料來源
雅虎新聞
探索更多
敘利亞HTS高層獲任過渡政府防長與外長
國際
7小時前
香港可仿效大馬發展穆斯林客源
國際・文藝娛樂
2小時前
劉德華演唱會門票被炒至12800元
商業財經・文藝娛樂
7小時前
以上資料由iThome、雅虎新聞整合而成。並不代表arbor任何立場,不構成與arbor相關的任何投資建議。在作出任何投資決定前,投資者應根據自身情況考慮投資產品相關的風險因素,並於需要時諮詢專業投資顧問意見。arbor竭力但不能證實上述內容的真實性、準確性和原創性,對此arbor不做任何保證和承諾。
踢走重複資訊,開始高效決策
閱讀更少,掌握更多
適用於iOS和Android系統
追蹤我們
版權所有 © 2024 Arbor保留所有權利。