logo
logo

OpenAI o3模型預覽,明年初正式推出

科技資訊


sparks智慧摘要
要點顯示
  • OpenAI預覽新一代前沿模型o3
  • o3準確率達到96.7%,比o1好很多
  • o3將先提供給有意協助進行安全測試的研究人員
  • o3-mini使用自適應思考時間API提供低、中、高三種不同的推理模式
  • o3-mini運算成本大幅降低
全方位摘要
  • o3在ARC AGI測試中低運算量任務得分達75.7%,高運算量任務得分達87.5%,都超越o1系列
  • o3在美國數學邀請賽的試卷中準確率達到了96.7%,比o1好很多
  • o3在OpenAI常用的測試套件中表現過於亮眼,以至於該公司不得不尋找更具挑戰性的測試來評估其表現
iThomeiThome
雅虎新聞雅虎新聞
  • o3模型使用deliberative alignment(審慎遵循)訓練方法,以人為撰寫的文本及可解讀的安全規格教導o系列LLM。
  • o系列模型使用思維鏈(chain-of-thought,CoT)推理方法來思考用戶提示、從OpenAI內部政策辨識出相關文字,再草擬出更安全的回應。
  • 新訓練方法讓模型得以準確遵循OpenAI的安全政策而無需人類標籤過的CoT或答案。
iThomeiThome
  • 新模型能夠混合圖文、產生多種情感的聲音
  • 新模型能夠使用搜尋及程式,可更完美控制代理人
  • 新模型是為了迎戰新的OpenAI o3模型而推出的
iThomeiThome
  • o3模型先提供給有意協助進行安全測試的研究人員
  • 正式推出則大約會在明年初的某個時點
  • 具體時間尚未公佈
雅虎新聞雅虎新聞
  • o3-mini 提供低、中、高三種不同的推理模式,使用自適應思考時間API
  • o3-mini 的運算成本大幅降低,但準確率仍高達95%
  • o3-mini 預計在明年一月底左右推出,o3 則會「緊隨其後」
雅虎新聞雅虎新聞
探索更多以上資料由iThome、雅虎新聞整合而成。並不代表arbor任何立場,不構成與arbor相關的任何投資建議。在作出任何投資決定前,投資者應根據自身情況考慮投資產品相關的風險因素,並於需要時諮詢專業投資顧問意見。arbor竭力但不能證實上述內容的真實性、準確性和原創性,對此arbor不做任何保證和承諾。
mobile

踢走重複資訊,開始高效決策

app-icon閱讀更少,掌握更多
app-icon
適用於iOS和Android系統
追蹤我們
logo
版權所有 © 2024 Arbor保留所有權利。