目錄
這兩天關於GPT-5的傳聞越來越多了,但它似乎與我們漸行漸遠。博主Alberto Romerox提出一個大膽而又很有意思的猜想:OpenAI可能已經秘密構建了GPT-5,並將其作為內部工具使用,而非公開發布。這種做法並非為了金錢,而是為了其他更重要的戰略目標。這篇深度分析將嘗試連接散落在各處的線索,揭示這一可能的真相
一、Opus 3.5的神秘消失在探討
GPT-5之前,我們需要先了解Anthropic的Claude Opus 3.5的經歷。作為頂尖AI實驗室,OpenAI、谷歌DeepMind和Anthropic都提供不同性能和價格的模型。然而,在2024年10月,Anthropic並未如預期般發佈Claude Opus 3.5,而是更新了Claude Sonnet 3.5(被稱為Sonnet 3.6)。關於Opus 3.5的傳言四起,先是有人認為其訓練失敗,後又有消息稱Anthropic戰略性地隱藏了它。
最終,半導體專家Dylan Patel的團隊揭示了真相:Anthropic確實訓練了Opus 3.5,但它並未達到預期效果。因此,他們並未公開發布,而是利用Opus 3.5生成的合成數據和獎勵模型來大幅提升Sonnet 3.5的性能。

二、更好、更小、更便宜?
這種利用強大模型提升較弱模型性能的做法被稱為“蒸餾”。通過蒸餾,AI實驗室能夠將小型模型提升到僅靠預訓練無法達到的水平。Anthropic正是通過這種方式,使Sonnet 3.6的性能大幅提升,甚至超越了OpenAI的GPT-4o。
這一現象打破了“越大越好”的傳統觀念。OpenAI的CEO Sam Altman早已警告過,參數數量不再是衡量模型性能的可靠指標。如今,最新的模型不僅性能更強,而且規模更小、成本更低。OpenAI似乎也遵循着類似的路線。那麼,他們是如何做到的呢?

三、AI實驗室面臨的共同挑戰Anthropic的蒸餾策略並非個例。
實際上,OpenAI和谷歌DeepMind在最近的訓練中也遇到了類似的問題。原因可能包括數據不足、transformer架構的侷限性以及預訓練縮放定律的停滯。同時,由於ChatGPT/GPT-4的爆炸式增長,AI實驗室面臨着巨大的運營壓力,降低推理成本成為當務之急。
蒸餾技術恰好能應對這些挑戰:通過使用較小的模型來降低推理成本,並通過不發佈較大的模型來避免公眾對性能不佳的負面反應。Ege Erdil認為,OpenAI可能也採取了類似的策略,利用大型模型來蒸餾出更小、更強的模型。那麼,OpenAI的隱藏模型又在哪裏?它會是GPT-5嗎?

四、先行者必須開闢道路
OpenAI作為AI領域的先行者,可能面臨着其競爭對手尚未遇到的挑戰,例如訓練GPT-5的硬件要求。訓練GPT-5可能耗資數億美元,但Ege Erdil認為這在技術上是可行的。關鍵在於,如此龐大的模型並不適合向公眾提供服務。因此,OpenAI可能已經訓練了GPT-5,但將其內部保留,用於蒸餾較小的模型,就像Anthropic處理Opus 3.5一樣。這與《華爾街日報》對GPT-5的報道不謀而合。
五、Altman的更多理由
除了成本和性能方面的考慮,OpenAI可能還有其他理由不發佈GPT-5。一個重要的因素是與微軟的合作協議中的“AGI條款”。根據該條款,一旦OpenAI宣佈實現了AGI(通用人工智能),該技術將不再屬於與微軟的授權協議範圍。為了避免觸發這一條款,OpenAI可能選擇推遲發佈可能被認為是AGI的系統。
更重要的是,OpenAI和微軟之間有一個秘密的AGI定義:一個能夠產生至少1000億美元利潤的AI系統。如果OpenAI認為GPT-5能夠達到這個水平,他們可能根本不介意觸發AGI條款,與微軟分道揚鑣。這表明OpenAI並非為了賺錢,而是為了追求AGI,最終實現ASI(超人工智能)。
六、這一切如何改變一切
最終,所有的證據都指向一個可能性:OpenAI很可能秘密擁有GPT-5,就像Anthropic的Opus 3.5一樣。而且,OpenAI可能永遠不會公開發布GPT-5。他們將繼續訓練新的基礎模型,並將這些模型用作內部工具,以生成更多數據來改進下一代模型。
這意味着,我們可能永遠無法直接體驗到GPT-5的強大功能,但我們將感受到它帶來的影響。OpenAI可能正在啓動一個遞歸的自我改進過程,他們將因此變得越來越強大,而我們能接觸到的只是冰山一角。
或許,這就是OpenAI在短短三個月內從o1跳到o3的原因。他們可能已經找到了新的運作模式,我們看到的只是他們不斷進步的冰山一角。
你真的以為接近AGI意味着我們可以使用越來越強大的AI嗎?這或許只是我們的臆想。他們已經説過,他們的模型將把他們推向一個無人能及的高度。每一代新模型都是一個“逃逸速度”引擎,他們可能已經遠遠超越我們,向我們揮手告別了

寫在最後:
AI的未來可能不是我們想象的那樣,而是由少數精英掌控,他們利用內部工具不斷改進模型,並逐步拉開與大眾的差距。這對我們每個人來説,都意味着一次深刻的變革