跳轉至
科技AI

AI三巨頭集體撞牆 ,AI代理成救命稻草?OpenAI押注AI代理“Operator”

目錄

OpenAI、谷歌和Anthropic,這AI三巨頭,最近好像集體撞牆了!燒錢燒得越來越猛,模型越做越大,結果發現,性能提升越來越小,性價比越來越低,甚至還不如以前!

內部人士爆料,OpenAI的Orion項目,也就是GPT-4的繼任者,在9月份搞出來的模型,在處理沒見過的新代碼問題時,表現差強人意,居然連基本的代碼題都答不對!經過幾個月的調教和優化,還是達不到OpenAI想要的發佈標準

Two people familiar with OpenAI's Orion project say the September 2024 model fell short when trying to answer coding questions it hadn't been trained on, and despite months of post-training adjustments, it's still not at the level OpenAI wants for user release until early next year

谷歌那邊也好不到哪去。他們即將推出的Gemini模型,被寄予厚望,號稱要全面超越GPT-4。但據説,Gemini的實際表現並沒有達到谷歌內部的預期,甚至有些令人失望。最近的更新還淨是些花裏胡哨的圖像生成功能,對模型底層能力的提升卻很有限。這是不是有點捨本逐末,把重點放錯地方了呢?

Three people with knowledge of Google's development say the upcoming Gemini is not living up to internal expectations, with recent updates focusing on features like image generation rather than fundamental model improvements

Anthropic更慘,Claude 3.5 Opus直接延期發佈,“即將推出”的字樣也從官網上悄悄撤了。原因?內部評估顯示,模型性能提升太小,與它日益增長的體積和運營成本不成正比!這是花大價錢胖了,卻沒長個兒啊!

According to two sources, Anthropic has delayed Claude 3.5 Opus release and removed "coming soon" mentions from their website after finding the model's performance gains didn't justify its increased size and operational costs

轉向AI Agent

不過,這三家公司依然嘴硬,對外宣稱對AI的未來充滿信心,並表示正在積極探索新的方向。他們現在不執着於盲目地把模型做大了,而是轉向了新的方向,比如AI代理和推理能力的提升

Sam Altman又畫了個大餅,説今年晚些時候會有“非常棒的版本”發佈,並且暗示AI Agent將會是下一個重大突破

具體來説因為大模型的瓶頸,OpenAI有個新動作:他們正在秘密研發一個名為 “Operator” 的AI代理工具。這個工具不是一般的聊天機器人,它可以像你的私人助手一樣,幫你寫代碼、訂機票、處理郵件、安排日程,各種瑣碎的電腦任務都能幹!據説計劃明年1月發佈一個研究預覽版,先給開發者們嚐嚐鮮,並通過API接口開放給開發者使用

這波操作,其實也反映了整個行業的趨勢。Anthropic和微軟最近也發佈了類似的AI代理工具(用AI代理操作計算機),谷歌據説也在緊鑼密鼓地研發代號為 “Jarvis” 的AI代理。看來,AI代理才是下一個風口,各大公司都在搶灘登陸!或許,AI代理真的能為AI發展注入新的活力,打破當前的瓶頸

Altman上個月還在Reddit的AMA(Ask Me Anything)活動上暗示過,説下一個讓人感覺像是巨大突破的進步將會是AI代理。看來,單純增大模型規模這條路可能要走不通了,只能另闢蹊徑了

不過OpenAI的研究人員Steven Heidel認為:

即使現在 LLM 的發展完全停滯不前(説白了,這種情況並沒有發生)--在當今模型的基礎上仍有至少十年的產品有待開發

最新