如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-24 16:45:14
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-25 04:50:09家里想搞个服务器,有什么好的建议方案吗?
- 2025-06-25 05:40:09养乌龟只养一只,它觉得会孤独吗?
- 2025-06-25 04:55:09rust 语法噪音这么多, 能写复杂项目吗?
- 2025-06-25 04:45:10穿瑜伽裤爬山的女生会不会害羞?
- 2025-06-25 04:30:10如何评价zig这门编程语言?
- 2025-06-25 05:15:09为什么男生都不喜欢173身高的女生啊?
- 2025-06-25 04:55:09***x512具体在哪些方面应用?
- 2025-06-25 06:10:10有什么关于贵阳的冷知识?
- 2025-06-25 05:35:10为什么幼儿园的超前教育被叫停?
- 2025-06-25 06:10:10为什么腾讯地图不如百度地图成功?
推荐产品
-
女孩子腿非常白是什么体验?
高中有个团体舞蹈比赛选中我们班,表演那天女主要穿裙子(到膝盖 -
当年的东莞究竟有多疯狂?
不是东莞,是增城。 2002年我和爸妈在广东打工,住的地方 -
袁隆平比很多诺贝尔奖获得者对人类的贡献都更大。你认同这个观点吗?
不认同。 2021年袁隆平去世的时候,我就写过一篇文章《是 -
如何看待王垠的 《对 Rust 语言的分析》?
这篇文章并非完全没有可取之处,“内存管理”一节其实说的挺有道
新闻动态
最新资讯

