如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-18 04:35:09
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-23 12:00:13三只羊是不是被人做局了?
- 2025-06-23 13:10:13公司就一个后端一个前端,有必要搞微服务吗?
- 2025-06-23 12:55:12为什么珠三角发展赶不上长三角了?
- 2025-06-23 12:55:12如何评价b站数码区up主 “大狸子切切里”?
- 2025-06-23 13:05:12为什么好看的家一看就是国外的?
- 2025-06-23 11:55:13fm里为什么会出现球员属性跟表现不匹配的现象?
- 2025-06-23 12:20:13为什么幼儿园的超前教育被叫停?
- 2025-06-23 12:30:13老板说我设计了一周的海报还是不行,我到底该怎么学啊?
- 2025-06-23 13:00:13如何判断鱼缸中的硝化系统是否已经成功建立?
- 2025-06-23 13:05:12字节跳动技术副总裁开源了自己与Trae合作的首个项目,如何评价目前AI开发的水平?
推荐产品
-
Flutter 为什么没有一款好用的UI框架?
有, 而且很高质量! (辛苦整理全是收藏,没有关注点赞和评论 -
我的儿子随我姓,为啥婆家反应那么大?
我看完了题主的描述,只能说题主一家不愧是做生意的,把老公一家 -
为什么Go仅仅160MB的安装包就可以编译程序,而Rust却还需要几个GB的VC++才能编译?
我觉得吧,很多时候,解释是没有用的。 在这方面Go确实要比其 -
想学编程,该不该买MacBook?
MacBook我没用过,我用过好几个版本的pro了,从早几年
新闻动态
最新资讯

