跳轉至
AI科技

陶哲軒最新採訪:將OpenAI o1 比作“一名平庸但不完全無能的研究生”被誤解了

目錄

加州大學洛杉磯分校的數學教授陶哲軒,人稱“數學界的莫扎特”,公認的當代最偉大的數學家,拿獎拿到手軟!最近,他接受了《大西洋月刊》Matteo Wong的採訪,談到了他對 AI 的看法,並澄清了前段時間廣泛流傳的他對OpenAI o1看法一個誤解:OpenAI聲稱o1具備“推理”能力,但陶哲軒曾將其比作“一名平庸但不完全無能的研究生”,事實是o1是一名平庸或無能的研究助手

Terence Tao(陶哲軒),加州大學洛杉磯分校的數學教授,是現實中的超級智能。他常被稱為“數學界的莫扎特”,被廣泛認為是當今世界上最偉大的數學家之一。他曾榮獲多項大獎,包括相當於數學界諾貝爾獎的榮譽,因其在數學方面的突破性貢獻而備受推崇。目前,人工智能遠遠無法與他的水平相提並論。

然而,科技公司正在努力讓AI達到這一高度。近年來引起廣泛關注的AI,如ChatGPT等,最初並非為處理數學推理而設計的。它們主要關注的是語言處理:當你向這樣的程序提問時,它並不會真正理解或執行數學方程,也不會形成證明,而是根據詞語出現的可能性來給出答案。例如,原版的ChatGPT無法進行加法或乘法運算,但通過見過的代數例子,它可以解決像_x + 2 = 4_這樣的方程:“要解_x + 2 = 4_,兩邊都減去2……”。不過,現在OpenAI推出了一款新系列的“推理模型”,這些模型能夠“像人類一樣”進行問題解決,並處理複雜的數學和科學任務。如果這些模型取得成功,它們可能會徹底改變像陶哲軒及其同行所從事的緩慢且孤獨的研究工作。

在看到陶哲軒在網上發佈他對o1的評價時——他將其比作“一名平庸但並非完全無能的研究生”——Matteo Wong想進一步瞭解他對這一技術潛力的看法。在上週的通話中,陶哲軒描述了一種由AI驅動的 “工業規模數學”,這是前所未有的:在不久的將來,AI不會成為獨立的創造性合作伙伴,而是作為數學家假設和方法的輔助工具。這種新的數學形式可能會開啓未知的知識領域,但核心依然是人類的智慧,它強調人類和機器的不同優勢,並將它們視為互補關係,而非競爭關係。

以下對話內容經過編輯以適應長度和清晰度

Matteo Wong: 你第一次使用ChatGPT時是什麼體驗?

Terence Tao: 它剛推出時我就試用了。我向它提出了一些較難的數學問題,但結果有些可笑。雖然它的英語表達很流暢,也使用了正確的術語,但幾乎沒有深度。對於真正高級的問題,早期的GPT並沒有給我留下深刻印象。它們更適合用來做一些有趣的事情,比如用詩歌或童話故事解釋數學概念,這點確實令人印象深刻。

Wong: OpenAI聲稱o1具備“推理”能力,但你曾將其比作“一名平庸但不完全無能的研究生”。

Tao: 這個比喻被廣泛傳播,但也被誤解了。我並不是説這個工具在所有方面都等同於研究生。我更感興趣的是將這些工具用作研究助手。研究項目中有許多繁瑣的步驟:你可能有一個想法,想要展開計算,但這些計算必須手動完成,且需要逐步推導。

Wong: 所以它是一名平庸或無能的研究助手。

Tao: 是的,作為助手,它的表現可以説是平庸的。但我確實設想過未來可以通過與聊天機器人對話來進行研究。假設你有一個想法,聊天機器人可以跟隨並填寫所有細節。

在某些領域,這已經開始發生了。AI早已征服了國際象棋,但國際象棋仍然蓬勃發展,因為現在一位技術不錯的棋手可以推測某些情況下的最佳走法,然後利用棋局引擎來分析未來20步的局勢。我可以預見在數學領域會出現類似的情況:你有一個項目,問“如果我嘗試這種方法會怎樣?” 而不需要親自花費數小時驗證,你可以指導GPT為你完成。

在o1的幫助下,這種操作在某種程度上已經可以實現。我給它出了一個我知道如何解決的問題,並嘗試引導模型。起初我給了它提示,但它無視了提示,選擇了其他方法,結果失敗了。當我指出錯誤時,它道歉説“好吧,我會按你的方法來做。”然後它合理地按照我的指示執行,但很快又卡住了,我不得不再次糾正它。這個模型從未找到最聰明的步驟。它能做所有例行的工作,但缺乏創造性。

研究生和AI的一個關鍵區別在於研究生會學習。你告訴AI它的方法不對,它會道歉,並可能暫時糾正,但有時它會再次嘗試之前的方法。而且如果你重新開啓一個AI會話,所有進度都要重來。我對研究生的耐心更大,因為即使他們完全失敗,他們仍有學習和自我糾正的潛力。

Wong: OpenAI聲稱它的模型可以識別錯誤,但你認為這與人類從錯誤中獲得的持續學習不同,而後者正是使錯誤對人類有用的原因。

Tao: 是的,人類會成長。這些模型是靜態的——我給GPT-4的反饋可能會成為GPT-5訓練數據的0.00001%,但這與學生學習的過程完全不同。

AI和人類在學習和解決問題的模式上完全不同——我認為AI應該被視為一種互補工具。對於許多任務,AI與人類協作可能是最有前途的方式。

Wong: 你之前還提到,計算機程序可能會改變數學,讓人類之間更容易合作。你能解釋一下嗎?生成式AI能在這方面起到什麼作用嗎?

Tao: 嚴格來説,它們不算是AI,但“證明助手”是一類非常有用的計算機工具,可以驗證數學論證是否正確。這使得大規模數學合作成為可能,這是最近才出現的現象。

數學本質上是非常脆弱的:如果證明中的某一步出現錯誤,整個論證可能會崩潰。如果你有100人合作一個項目,把證明分成100部分,每人負責其中一部分,但如果他們之間沒有很好地協調,這些部分可能無法拼接在一起。正因為如此,通常很少有超過五個人合作完成一個數學項目。

而有了證明助手,你不需要完全信任與你合作的人,因為程序會給出100%的保證。這樣你就可以進行類似於工廠流水線的工業化數學研究,而這種模式目前還不存在。每個人專注於某一類特定結果的證明,就像現代供應鏈一樣。

問題在於這些程序非常挑剔。你必須用專門的語言來編寫論證,不能直接用英語書寫。AI也許能夠實現從人類語言到程序語言的翻譯,而語言翻譯正是大型語言模型擅長的。理想的場景是,你只需與聊天機器人對話解釋你的證明,機器人會將其實時轉化為證明系統的語言。

Wong: 所以聊天機器人並不是知識或想法的來源,而是一個接口工具。

Tao: 沒錯,它可以成為一個非常有用的“粘合劑”

Wong: 這可能有助於解決哪些類型的問題?

Tao: 傳統的數學理念是你選擇一個非常難的問題,然後讓一兩個人花費數年時間在閣樓裏埋頭研究。你希望用AI解決的數學問題正好相反。最簡單的方法就是讓AI解決我們數學中最困難的問題。我認為這不會非常成功,因為我們已經有人類在解決這些問題了。

我最感興趣的是那些尚未存在的數學。我剛剛發起的一個項目涉及“普遍代數”,研究某些數學命題或方程是否能夠推導出其他命題。過去人們的研究方法是選擇一兩個方程進行深入研究,類似於手工藝人一次只製作一個玩具,然後再製作下一個。

而現在我們有了工廠,可以一次生產成千上萬個玩具。在我的項目中,有大約4000個方程,任務是找到它們之間的聯繫。每個方程相對簡單,但存在數百萬種可能的推論。就像10個光點,10個方程已經被深入研究過,而其他大部分都仍是未知領域。

Wong: 這讓我想起谷歌DeepMind公司開發的AlphaFold,這個AI程序能夠預測蛋白質的三維結構,而這曾經是需要一個一個蛋白質去研究的。

Tao: 對,但這並不意味着蛋白質科學已經過時。你必須改變你研究的問題。150年前,數學家主要通過解決偏微分方程來展現他們的價值。現在有軟件可以自動完成這些工作。600年前,數學家們需要計算正弦和餘弦表,這些是導航所必需的,但現在計算機幾秒鐘就能生成這些數據。

我對重複人類已經擅長的任務沒有興趣。這似乎效率低下。我認為在前沿領域,我們將始終需要人類和AI的結合。它們各有優勢。AI擅長將數十億個數據點轉化為一個好的答案,而人類擅長通過少量觀察得出富有創意的猜測。

最新