您现在的位置是: > 区块资讯区块资讯
OpenAI最强o3模型被曝造假,提前获取FrontierMath测试题库的特权访问权
linx 2025-01-21 11:10:52 区块资讯 已有人查阅
导读
【OpenAI最强o3模型被曝造假,提前获取FrontierMath测试题库的特权访问权】八六软件园报道,一位名为“Meemi”的EpochAI承包商在Less Wrong论坛透露,OpenAI不仅为FrontierMath基准测试提供资金支持,还获得了测试题库的特权访问权。而这或许也是o3的成绩在短时间内获得极大提高的重要原因。 本表明o3在高级数学推理方面有巨大斯坦福大学数学博士生Carina Hong声称,在EpochAI的安排下,OpenAI拥有对FrontierMath的特权访问权。进步的成绩单,却在承包商的爆料后迎来了风评反转。面对争议,EpochAI副主任兼联合创始人之一Tamay Besiroglu很快在X平台承认了此事。 据悉,FrontierMath是一个分量极重的高级数学推理能力评估基准。它由EpochAI联手60多位顶级数学家共同打造,参与者包括多位菲尔兹奖得主和国际数学奥林匹克竞赛的资深命题人。
本文标签:
很赞哦! ()