“营销鬼才”、OpenAI首席执行官SamAltman又狠狠吊了一下大家的胃口。
本周在知名创投播客HarryStebbings主持的活动中,Altman在展望AGI愿景时,单单用一句话就调动起了大家的情绪——“太棒了我不能说”:
当主持人问他最近一个令他感到震惊的成果是什么?他留下悬念:
他还对自身的职业方向充满信心,认为自己“不祈求上帝,但是上帝与我同在”、“最终似乎总会走向成功”:
然而考虑到在“画大饼”这条道路上,即便是和马斯克相比,Altman也是不相上下,非常善于整活玩猜字谜,所以“一个能够全面了解用户生活的AI”真能在近期实现吗?
举个例子,最近他才发了一条神秘消息:“我听说o2在GPQA的性能测试达到105%”。
但就有网友指出,博士级人类在GPQA的准确率平均只有65%,非专家级的普通人仅有34%。而OpenAI在9月发布的o1模型的测试数据也只有78%,这也是目前唯一在GPQA数据集上超过人类博士的AI模型,可见这个数据集的难度有多高。
而且怎么会出现恐怖的105%,这完全就是不可能的事情,MMLU、MaTH、CPQA、GSM8K、GPQA等基准测试范围怎么可能超出100%呢?
随后SamAltman自己也发现这个错误,连发两条推文:要命啊,账号错误了
Altman已经掌握了流量密码,吃瓜群众们感到很无奈
本文来自华尔街见闻,欢迎下载APP查看更多
5月30日,2024百度移动生态万象大会在苏州举办,百度集团资深副总裁、百度移动生态事业群组总经理何俊杰,围绕《让智能体...
在一个风和日丽的下午,小镇上的人们都在忙碌着各自的事情。在镇子的边缘,有一家古董店,店主是一位名叫艾米丽的中年女士。她以...
做全图型PPT,一定是需要图片的。如果含有文字内容,最理想的制作方法就是能找到一张有留白的图片,可以将文字内容直接上放到...
这两年,娱乐直播行业进入存量竞争,许多平台增速放缓,甚至开始走下坡路,而有一个新平台却实现了大幅增长,成为了行业“超新星...
复古传奇手游以其怀旧的风格、经典的玩法和多样的职业选择,成为许多玩家热衷追求的目标。在本篇攻略中,我将带领大家进入玛法大...