会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2!

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

时间:2024-12-27 09:13:19 来源:诡秘莫测网 作者:热点 阅读:442次

o1满血版泄露了!血版泄露

没想到,奥数OpenAI还搁那儿“今年一定”呢,题图特不少网友已经率先上手体验到了(doge)。片推

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2

事情是理手酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,拿把大家伙儿还都能卡bug直接用!掐奥

最初发现此事的剧透网友,测试确认泄露模型具有奥特曼所说的血版泄露图像推理能力。


△图源:@legit_rumors

而日志也显示该模型就是奥数o1本模。

于是题图特,赶在OpenAI出手修复之前,片推网友们抓紧大玩特玩了一波——

满血o1到底有多牛

和已经发布的理手o1-preview、o1-mini最直观的拿把不同是,泄露出来的掐奥o1支持上传附件。

这也就意味着,终于能测测o1的多模态能力了。

网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血o1。

对正整数n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。

思考了18秒之后,o1给出答案:18。

答案正确:

再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。

在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。

不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。

ID为anagh的网友,给泄露模型和GPT-4o做了个同屏对比:4o速度很快,给出了错误答案19。

而满血o1花了1分39秒,狂刷一堆token……给出了不同的错误答案:29。

正确答案是24。

这个bug现在已经修复了。不过,有意思的是,这次模型泄露,持续了整整3个小时。

不小心还是故意的?

有网友犀利地点出,这事儿看上去不是“不小心”,而是“精心策划”:

目的是让人们对即将发布的模型有一个预期。

不少网友赞同这样的观点:

奥特曼的目的是测试和炒作。

而由于一切看上去已经部署就绪,甚至有人猜测,o1完整版的正式上线时间就在未来一周之内。

值得注意的是,就在这次泄露事件之后,奥特曼马上在??上开始了自己的表演:

好家伙,都已经吹上o2的风了(还假装上错号……)。

至于为什么是这个时间……

那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛(doge)。

参考链接:

[1]https://x.com/legit_rumors/status/1852625385801859321

[2]https://x.com/koltregaskes/status/1852657291469709626

[3]https://x.com/anaghnairr/status/1852668741751919016

(责任编辑:探索)

相关内容
  • 龙:在跟17谈合同细节
  • 揭秘高通自研Oryon CPU:手机、PC、汽车大一统!
  • 前女友否认与恩佐最近的分居有关,表示和球员已无联系
  • [流言板]BR火鹿交易提案:火箭送出谢泼德小贾阿门等人,得到字母哥
  • [流言板]这才是你!比尔轻松上篮得分,第三节连得10分得到17分
  • [流言板]赢球不可怕!库里因伤缺阵后三场比赛,勇士拿下三连胜
  • 莱万本赛季11轮联赛进14球,上赛季打进同样进球数要到次年4月底
  • 阿隆索:斯图加特是一支强队,完全配得上打欧冠
推荐内容
  • 英伟达新品倒计时:新“核弹”RTX 5090即将驾到、B300稍后登场
  • 苹果官方确认 新款iMac与Mac mini均不支持C口供电
  • AMD新一代Radeon显卡RDNA 4正式官宣:两大升级 一大遗憾!
  • 北京马拉松鸣枪开跑 非洲选手包揽男女组冠军
  • [流言板]库尼亚反击横传,黄喜灿轻松推射破门!狼队锁定胜局!
  • 2024赛季中甲240场共吸引现场观众2284702人次,场均9520人