跳轉至

OpenAI最強o3模型被曝造假,提前獲取FrontierMath測試題庫的特權訪問權

目錄

一位名爲“Meemi”的EpochAI承包商在Less Wrong論壇透露,OpenAI不僅爲FrontierMath基準測試提供資金支持,還獲得了測試題庫的特權訪問權。而這或許也是o3的成績在短時間內獲得極大提高的重要原因。
本表明o3在高級數學推理方麵有巨大斯坦福大學數學博士生Carina Hong聲稱,在EpochAI的安排下,OpenAI擁有對FrontierMath的特權訪問權。進步的成績單,卻在承包商的爆料後迎來了風評反轉。麵對爭議,EpochAI副主任兼聯合創始人之一Tamay Besiroglu很快在X平颱承認了此事。
據悉,FrontierMath是一個分量極重的高級數學推理能力評估基準。它由EpochAI聯手60多位頂級數學家共同打造,參與者包括多位菲爾茲獎得主和國際數學奧林匹克競賽的資深命題人。

最新