精品一区二区三区在线成人,欧美精产国品一二三区,Ji大巴进入女人66h,亚洲春色在线视频

GPT-5發布即翻車!奧特曼深夜承認:圖表出錯,模型變笨。用戶只想用回GPT-4o

人工智能
盡管GPT-5的首日表現不盡如人意,OpenAI依然擁有令人難以忽視的規模優勢。ChatGPT的周活躍用戶已達到7億,遠超其他生成式AI平臺。

OpenAI在8月7日正式推出新一代旗艦大模型GPT-5。

據說,這是該公司自成立以來最受關注的一次產品迭代,被宣稱是“最強大、最智能”的語言模型,能夠在推理、創意生成和多模態理解等多個方面實現質的飛躍。

然而,就在發布后的不到24小時內,OpenAI首席執行官山姆·奧特曼就不得不面對現實。

圖片圖片

他在Reddit的AMA問答和X平臺的回應中承認,這次發布過程問題頻發,遠比預期更坎坷

核心問題之一來自新上線的自動“路由器”功能。這套系統會在用戶發出指令后,自動將請求分配給GPT-5的四個變體之一:gpt-5-main / gpt-5-main-mini 與 gpt-5-thinking / gpt-5-thinking-mini,并在復雜任務中觸發“思考模式”。

圖片圖片

API 還有 gpt-5-thinking-nano;ChatGPT 里有一種并行推理設置稱 gpt-5-thinking-pro。

理論上,這能讓用戶始終得到最匹配的計算能力。但在發布當日,核心的自動切換功能宕機了數小時,導致大量用戶接入的模型并非預期版本,體驗直接“降級”。這讓GPT-5在不少用戶眼中“顯得很笨”。

更糟的是,OpenAI在直播發布會中展示的性能圖表出現明顯錯誤。

比如這個52.8大于69.1等于30.8

奧特曼解釋稱,這是由于團隊成員工作至深夜,極度疲憊之下出現的“人為失誤”。他補充說明,盡管直播出現差錯,但配套發布的博客文章和系統卡片中的數據是準確的。

用戶界面的變化也引發混亂。新版ChatGPT中,一些用戶發現無法再選擇舊的GPT-4o,這讓很多依賴其穩定性的長期訂閱者(包括小編)措手不及。

面對大量投訴,OpenAI緊急調整策略,宣布ChatGPT Plus用戶可繼續使用GPT-4o,以便公司在收集更多性能對比數據后再決定下一步。

圖片圖片

奧特曼在Reddit上回應稱,公司會在未來的更新中提高模型切換的透明度,并允許用戶手動觸發“思考模式”,而不是完全依賴后臺判斷。他承認,用戶體驗被忽視是此次發布的一個嚴重問題。

1.真實體驗與官方宣傳落差

按照OpenAI的內部測試結果,GPT-5在各項基準上領先于市面上其他大模型。但當真實用戶開始大規模使用時,這些光鮮的數字迅速被質疑。

上線后的第一天,社交平臺上充斥著用戶吐槽GPT-5在數學、邏輯、編程等基礎任務上的低級錯誤。一位推特網名為Colin Fraser分享了截圖:當被問到“8.888循環是否等于9”時,GPT-5給出了錯誤答案。另一位用戶在測試方程“5.9 = x + 5.11”時,同樣收到了錯誤解答。

圖片圖片

一些用戶在數學文字題中發現,GPT-5要么計算錯誤,要么無法理解題意。而在代碼調試中,它甚至無法正確修復自己制作的演示文稿圖表的錯誤數據。

在開發者圈子里,批評聲音同樣密集。

多位程序員對比發現,GPT-5在“一次性”完成特定編程任務的能力,反而落后于競爭對手Anthropic的Claude Opus 4.1。這種差距不僅存在于復雜推理任務,甚至在簡單的腳本編寫中也能明顯感知。

安全領域的反饋更讓人擔憂。

網絡安全公司SPLX測試后指出,GPT-5依舊容易受到提示注入(Prompt Injection)和混淆邏輯攻擊。這意味著,攻擊者仍有機會通過巧妙構造的輸入繞過安全限制,獲得敏感信息或讓模型執行非預期操作。

圖片圖片

顯然,我們未預料到,OpenAI會在未充分征得用戶同意的情況下直接替換舊版本,并且在性能尚未穩定的情況下全面推送新模型。

2.龐大用戶量帶來的壓力與競爭

盡管GPT-5的首日表現不盡如人意,OpenAI依然擁有令人難以忽視的規模優勢。ChatGPT的周活躍用戶已達到7億,遠超其他生成式AI平臺。

奧特曼透露,GPT-5上線僅24小時內,API調用量就翻倍,直接給后臺帶來了額外壓力。這種激增在一定程度上加劇了平臺的不穩定,也讓運維團隊調整限額與路由以穩定體驗。

為了安撫高付費用戶,OpenAI宣布將ChatGPT Plus的調用速率限制提升一倍,并承諾持續優化基礎設施,確保在高峰時段也能穩定響應。同時,公司正在收集用戶在不同版本上的交互數據,用于判斷GPT-5在真實場景中的優劣勢。

顯然,OpenAI此刻面臨的挑戰,不僅是修復技術問題,還要重建用戶對其產品節奏與決策流程的信任。如果GPT-5不能在接下來的幾周內通過更新兌現“質的飛躍”的承諾,這次發布可能會被視為一次代價高昂的公關失誤。

reddit:

https://www.reddit.com/r/ChatGPT/comments/1mkae1l/gpt5_ama_with_openais_sam_altman_and_some_of_the/?q=%E2%80%9CPeople+were+working+late+and+were+very+tired%2C+and+human+error+got+in+the+way.+A+lot+comes+together+for+a+livestream+in+the+last+hours.%E2%80%9D&type=comments&cId=3ba2c830-41e3-426f-829a-fd7fcc5ce27b&iId=aa80770e-1c54-4e68-83b3-c787514a0947

責任編輯:武曉燕 來源: 大數據文摘
相關推薦

2025-08-20 09:02:00

2025-08-11 08:42:00

GPT-5AI模型

2024-03-21 06:56:03

2025-08-14 18:20:04

GPT-5奧特曼模型

2024-01-22 13:57:00

模型訓練

2025-08-11 09:11:22

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-05 10:35:47

2024-06-11 07:03:00

大模型開源Qwen2

2025-02-13 09:10:47

2025-02-13 10:52:56

2024-05-14 11:29:15

2024-05-21 12:23:17

2024-01-01 22:28:52

2025-08-08 14:28:12

GPT?5模型Agent

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2024-06-21 09:51:17

2025-02-17 12:24:43

2024-06-05 08:29:35

2023-12-19 19:50:49

GPT-5OpenIA風險
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 兴文县| 梧州市| 周口市| 凤庆县| 上杭县| 澄迈县| 交口县| 临漳县| 道孚县| 汶川县| 洛阳市| 沂水县| 昌吉市| 苍南县| 定安县| 崇礼县| 峡江县| 白银市| 鱼台县| 怀宁县| 平陆县| 泽州县| 扬州市| 九江县| 师宗县| 襄樊市| 巢湖市| 时尚| 杭锦旗| 大兴区| 中江县| 铁力市| 五指山市| 嘉定区| 洛扎县| 九台市| 招远市| 曲靖市| 虞城县| 海丰县| 博罗县|