Altman:憋了个大招,但我不能说!

2025-12-03

    “营销鬼才”、OpenAI首席执行官SamAltman又狠狠吊了一下大家的胃口。

    本周在知名创投播客HarryStebbings主持的活动中,Altman在展望AGI愿景时,单单用一句话就调动起了大家的情绪——“太棒了我不能说”:

    当主持人问他最近一个令他感到震惊的成果是什么?他留下悬念:

    他还对自身的职业方向充满信心,认为自己“不祈求上帝,但是上帝与我同在”、“最终似乎总会走向成功”:

    然而考虑到在“画大饼”这条道路上,即便是和马斯克相比,Altman也是不相上下,非常善于整活玩猜字谜,所以“一个能够全面了解用户生活的AI”真能在近期实现吗?

    举个例子,最近他才发了一条神秘消息:“我听说o2在GPQA的性能测试达到105%”。

    但就有网友指出,博士级人类在GPQA的准确率平均只有65%,非专家级的普通人仅有34%。而OpenAI在9月发布的o1模型的测试数据也只有78%,这也是目前唯一在GPQA数据集上超过人类博士的AI模型,可见这个数据集的难度有多高。

    而且怎么会出现恐怖的105%,这完全就是不可能的事情,MMLU、MaTH、CPQA、GSM8K、GPQA等基准测试范围怎么可能超出100%呢?

    随后SamAltman自己也发现这个错误,连发两条推文:要命啊,账号错误了

    Altman已经掌握了流量密码,吃瓜群众们感到很无奈

    本文来自华尔街见闻,欢迎下载APP查看更多

最近发表
标签列表