如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-19 05:10:10
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2026-03-08 14:05:03全民疯抢!60岁大爷大妈也开始养龙虾了 官方:极易引发网络攻击、信息泄露_OpenClaw_风险_工具
- 2026-03-09 08:30:03库克最后的防御_苹果_Adams_Meta
- 2026-02-26 09:10:01元宵佳节遇上全年唯一月全食,下次“巧遇”要到2072年了_观测_月亮_天文
- 2026-03-11 23:45:02大厂“养虾”,各怀心事_OpenClaw_产品_龙虾
- 2026-02-28 10:05:03刘强东雷军同框C位!中德交流排面拉满,宇树王兴兴携机器人出圈_营销_东哥_小雷
- 2026-02-28 11:05:04大疆硬刚:被美制裁近10年,反诉FCC胜算大吗?_美国_企业_Textron
- 2026-03-15 10:50:11寒武纪十年首度盈利,股价为何不涨反跌?_国产_芯片_公司
- 2026-03-07 11:20:03硅谷程序员,疯狂“投喂”中国大模型_Token_MiniMax_智谱
- 2026-03-03 09:30:03首次曝光!小米机器人给小米汽车安装车标:一气呵成 还会先撕膜_生产_部署_工作
- 2026-03-13 09:10:02腾讯赶「龙虾」上架_OpenClaw_Agent_产品
推荐产品
-
阿里已批准林俊旸辞职,成立基础模型支持小组;马云称AI迭代必须全速前进_技术_qwen_团队
***发酵后,阿里前技术副总裁贾扬清连续两天在朋友圈发长文评论:“这是一个‘人’越来越重要的时代。 就在林俊旸正式提出离职的前一天,马云携蔡崇信、吴泳铭、蒋凡等阿里核心管理层齐聚杭州云谷学校,以最高规格为阿里… -
AI巨头收入不如董宇辉!2575亿MiniMax是泡沫吗?_亏损_OpenAI_行业
一年营收7904万美元,不如董宇辉一个人赚得多,市值却高达2360亿港元,这是AI时代的资本新奇迹。 其实MiniMax这一资本奇迹,是AI产业“不看古典基本面”的一则缩影。2025年,MiniMax在中国内… -
火星大气怎么没的?NASA探测器正在追查_星球_地球_环境
火星大气怎么没的?NASA探测器正在追查_星球_地球_环境 -
多品牌手机即将全面涨价:可能不止一轮,新品至少贵1000…_涨幅_价格_机型
多品牌手机即将全面涨价:可能不止一轮,新品至少贵1000…_涨幅_价格_机型
新闻动态
最新资讯
- 别再盯芯片了!马斯克一语道破:谁掌控电力,谁就能主宰硅基时代_中国_能源_全球
- 沪游观察|游戏硬件发展停滞十年?未必是坏事_消费_电子设备_技术
- 第一波AI裁员潮,来了_Block_公司_员工
- AI美女杀疯擦边圈!***主播流量被抢光,活路只剩线下?_互联网内容_直播_平台
- 做到了为阿里好!林俊旸发文真诚告别_集团_技术_科技
- “成人网站”上的女生,到底是怎样被***的?女生一定要小心了!_隐私_生活_心理
- 到底要不要跟风养 “ 龙虾 ” ?看完再决定_OpenClaw_大厂_技能
- 算力取代美工,英伟达开征“像素税”_模型_神经_技术
- AI介入战争后,这家科技巨头迎来最大危机_OpenAI_奥尔特曼_国防部
文章排行
- 黄仁勋2万字演讲,所有人都看漏了同一件事_OpenClaw_Agent_运行
- 黄仁勋为什么突然写一篇长文?_模型_能源_建设
- 第一批“养虾人”已开始卸载,商家远程代卸载:收费199元_OpenClaw_龙虾_智能
- 系列首款Pro Max!华为畅享90 Pro Max配置揭晓:搭载麒麟8000/8020芯片_mAh_该机_电池
- 不接受996就滚,AI正在卷疯美国人!_硅谷_人类_员工
- “摸鱼、说公司坏话全被精准取证”,苦命打工人在职场堪比“裸奔”_监控_吴瑞宇_李墨先
- 苹果关店、MWC人员滞留:中东战火,正在「点燃」科技圈?_影响_品牌_领空
- AI到岗我下岗:牛马贬值,血洗中层,应届生成了AI助手_公司_工作_剪辑
- 冲上热搜!人脸认证时千万记得穿衣服,复旦教授提醒:不要在洗澡的时候去做人脸认证_张军平_网友_智能

