精品一区二区三区在线成人,欧美精产国品一二三区,Ji大巴进入女人66h,亚洲春色在线视频

AI新思考:“浴火重生”的草莓模型 原創

發布于 2024-9-13 11:33
瀏覽
0收藏


“這個模型肯定比我更擅長解決 AP 數學考試,而且我在大學時輔修數學,”OpenAI 的首席研究官鮑勃·麥格魯 (Bob McGrew) 告訴我。他說,OpenAI 還根據國際數學奧林匹克競賽的資格考試對 o1 進行了測試,雖然 GPT-4o 只正確解決了 13% 的問題,但 o1 的得分為 83%。

OpenAI發布名為o1新模型,這是全新“推理”模型系列中的第一個,這些模型經過訓練可以比人類更快地回答更復雜的問題。它與o1-mini一起發布,o1-mini是一個更小而且較為便宜的版本。這實際上就是之前炒作的神秘版本“草莓模型”。

o1與以前的模型相比,它在編寫代碼和解決多步驟問題方面做得更加的出色。但它也比GPT-4o的帶來更多的費用。o1目前處于預覽版本的狀態。

今天開始,ChatGPT Plus和團隊用戶可以訪問o1-preview和o1-mini,企業用戶和研究類別的用戶將在下周初獲得訪問權限。OpenAI 表示它計劃為 ChatGPT 的所有免費用戶提供o1-mini 訪問權限,但尚未確定發布日期。

商業使用的收費還是非常昂貴,使用傳統的API調用,o1-preview每100萬個輸入Token收費15美元,每100 個輸出令牌收費60美元。相比之下,GPT-4o的成本為每100萬個輸入Token收費5美元,每 100萬個輸出Token收費15美元。

1.背后的意義 

o1在針對問題做出響應之前花更多時間思考問題,就像一個人一樣。通過培訓,他們學會完善自己的思維過程,嘗試不同的策略,并認識自身錯誤。在披露的測試中,它在數學和編碼方面表現出色。在國際數學奧林匹克競賽 (IMO) 的資格考試中,GPT-4o僅正確解決了13%的問題,而推理模型得分為83%。它的編碼能力在比賽中得到了評估,并在Codeforces 比賽中達到了第89個百分位。

AI新思考:“浴火重生”的草莓模型-AI.x社區


作為早期模型,它還不具備使 ChatGPT有用的許多功能,例如瀏覽網頁以獲取信息以及上傳文件和圖像。對于許多常見情況,GPT-4o在短期內會更有能力。然而在復雜的推理領域,這是一個重大進步,代表了AI能力的新突破。因此OpenAI將計數器重置回1并將此系列命名為OpenAI o1。

2.適用場景

o1比較適合科學、編碼、數學和類似領域的復雜問題,這些增強的推理功能可能特別有用。例如,醫療保健研究人員可以使用它來注釋細胞測序數據,物理學家可以使用它來生成量子光學所需的復雜數學公式,所有領域的開發人員都可以使用它來構建和執行多步驟工作流程。

除了考試和學術基準之外,OpenAI還評估人類對o1-preview與GPT-4o在更多廣泛領域中的對比。在這項評估中,人類對來自o1-preview和GPT-4o 的提示進行了匿名投票以便于選出他們更喜歡哪種模型。O1-Preview在數據分析、編碼和數學等推理密集型類別中比 GPT-4O更受歡迎。但是在某些自然語言任務中,o1-preview不是首選,這表明它并不適合所有用例。

AI新思考:“浴火重生”的草莓模型-AI.x社區

本文轉載自 ??魯班模錘??,作者: 龐德公

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 金川县| 闽侯县| 呼图壁县| 通榆县| 肥城市| 祁阳县| 泰宁县| 房产| 启东市| 广东省| 华坪县| 西华县| 三门峡市| 恩施市| 枣庄市| 玉门市| 商城县| 临清市| 和顺县| 武定县| 六安市| 延川县| 涿鹿县| 云梦县| 天峻县| 桐柏县| 黄冈市| 荆州市| 东莞市| 绥江县| 西安市| 伊宁市| 比如县| 大名县| 得荣县| 淮南市| 禄丰县| 礼泉县| 吉首市| 维西| 清苑县|