AI三巨頭集體撞牆，AI代理成救命稻草？OpenAI押注AI代理“Operator”

谷歌那邊也好不到哪去。他們即將推出的Gemini模型，被寄予厚望，號稱要全面超越GPT-4。但據説，Gemini的實際表現並沒有達到谷歌內部的預期，甚至有些令人失望。最近的更新還淨是些花裏胡哨的圖像生成功能，對模型底層能力的提升卻很有限。這是不是有點捨本逐末，把重點放錯地方了呢？

Three people with knowledge of Google's development say the upcoming Gemini is not living up to internal expectations, with recent updates focusing on features like image generation rather than fundamental model improvements

Anthropic更慘，Claude 3.5 Opus直接延期發佈，“即將推出”的字樣也從官網上悄悄撤了。原因？內部評估顯示，模型性能提升太小，與它日益增長的體積和運營成本不成正比！這是花大價錢胖了，卻沒長個兒啊！

According to two sources, Anthropic has delayed Claude 3.5 Opus release and removed "coming soon" mentions from their website after finding the model's performance gains didn't justify its increased size and operational costs

轉向AI Agent

不過，這三家公司依然嘴硬，對外宣稱對AI的未來充滿信心，並表示正在積極探索新的方向。他們現在不執着於盲目地把模型做大了，而是轉向了新的方向，比如AI代理和推理能力的提升

Sam Altman又畫了個大餅，説今年晚些時候會有“非常棒的版本”發佈，並且暗示AI Agent將會是下一個重大突破

具體來説因為大模型的瓶頸，OpenAI有個新動作：他們正在秘密研發一個名為 “Operator” 的AI代理工具。這個工具不是一般的聊天機器人，它可以像你的私人助手一樣，幫你寫代碼、訂機票、處理郵件、安排日程，各種瑣碎的電腦任務都能幹！據説計劃明年1月發佈一個研究預覽版，先給開發者們嚐嚐鮮，並通過API接口開放給開發者使用

這波操作，其實也反映了整個行業的趨勢。Anthropic和微軟最近也發佈了類似的AI代理工具（用AI代理操作計算機），谷歌據説也在緊鑼密鼓地研發代號為 “Jarvis” 的AI代理。看來，AI代理才是下一個風口，各大公司都在搶灘登陸！或許，AI代理真的能為AI發展注入新的活力，打破當前的瓶頸

Altman上個月還在Reddit的AMA（Ask Me Anything）活動上暗示過，説下一個讓人感覺像是巨大突破的進步將會是AI代理。看來，單純增大模型規模這條路可能要走不通了，只能另闢蹊徑了

不過OpenAI的研究人員Steven Heidel認為：