如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-22 22:20:12
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-29 05:10:10你们是怎样看待警察这一职业的?
- 2025-06-29 03:55:10如何评价ipad pro2024?
- 2025-06-29 05:05:10如何评价电影《F1:狂飙飞车》?
- 2025-06-29 05:25:10为什么好多人不承认大众审美就是喜欢白皮?
- 2025-06-29 03:45:10怎么把多个pdf合并在一起?
- 2025-06-29 04:15:09程序员真的需要一台 Mac 吗?
- 2025-06-29 04:55:09为什么大部分人都认为2560x1440是2K?
- 2025-06-29 04:00:09为什么盗版音乐已经被严格限制了,而中国音乐却还是没有发展起来?
- 2025-06-29 04:35:09「人间尤物」型女主有多可爱?
- 2025-06-29 05:20:10如何评价吴京马上要上映的新电影《镖人》?
推荐产品
-
为什么感觉淘宝现在不如拼多多了?
买了一台海尔洗衣机。 到货后发现是haicr ,哈哈哈 -
《士兵突击》中如果高城动用关系,史今能不能留下来?
问这个问题,说明你不懂军队编制。 史今作为战斗班班长,** -
如何评价电影《名***柯南:独眼的残像》(M28)?
作为一名柯哀姐,只从自己喜欢的cp角度谈观影感受。 越 -
有些家长可以恶心到什么程度?
01前几天,广州一家奶茶店门口发生的一幕,被挂上了热搜。
最新资讯

