AI大模型能答对几道高考数学题？

2024年6月15日12:04:02评论58 views字数 858阅读2分51秒阅读模式

近日，2024年高考作文题等高考相关话题引发热议，“AI大模型做高考题”也成为一大看点。

AI参加高考，数学能得多少分？

AI大模型能答对几道高考数学题？

悄悄问一句

高考数学题，你还看得懂吗？

AI大模型能答对几道高考数学题？

或许我们看不懂，但大模型可以。

近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队请来13位大模型“考生”，一起做2024年高考数学真题。

结果怎样？

先说结论：

从整体来看，大模型们的“高考成绩”

都不算太高

OpenAI日前发布的新一代旗舰大模型GPT-4o与阿里云研发的通义千问720亿参数大模型Qwen-72b，在两次测试中排名都靠前，正确率稳定在60%以上。

部分大模型的表现存在起伏与波动，如百川智能、字节跳动新近发布的Baichuan4和豆包大模型，分别在新I卷和新II卷客观题测试中得分排名第一。但在另一场测试中，排名相对靠后。

AI大模型能答对几道高考数学题？图源：复旦大学NLP实验室

根据两次评测结果，该团队发现，大部分测试大模型在简单题（如选择题前三道），有较好的准确率，而在中档题中表现一般。

对于较难的题目，大模型们的准确率会更低。少部分题目甚至出现“全军覆灭”的情况。

人工智能这么“聪明”，为什么还会出错?

AI为什么会把题做错？

测试发现，让AI大模型做数学题，仍是一个难度较大的挑战。

AI大模型能答对几道高考数学题？

首先，文本输入格式的不同，会对测试结果造成比较明显的干扰。

目前测试主要采用上传图片识别文本的方式。这种方式更类似“人类”，是对大模型能力的全面考验。

有的大模型还未做题，就先败在了AI识图这一步。

其次，大模型的推理能力仍有很大进步空间。较难的题目对思维能力的考察要求更高，大模型的准确率也会更低。

此外，在多选题方面，大多数模型表现不佳。

可见，面临复杂选项的时候，大模型的准确率也会降低。

AI大模型能答对几道高考数学题？

虽然在解题方面，AI大模型的短期表现还达不到完美。但在攻克数学问题的路上，AI的每一次进步都是对未来教育想象空间的开拓，值得更多耐心与期待。

参考丨复旦大学NLP实验室、澎湃新闻、机器之心、量子位

来源：世界互联网大会、光明网

-END-

AI大模型能答对几道高考数学题？

原文始发于微信公众号（网络安全和信息化）：AI大模型能答对几道高考数学题？

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

开源情报技巧：解构环境犯罪背后的金融网络

美国议员批评英国对苹果的后门命令，并警告网络犯罪风险

TransparentTribe针对阿富汗监狱管理局的鱼叉式钓鱼邮件攻击

关于MCP最值得看的一篇：MCP创造者聊MCP的起源、架构优势和未来

G.O.S.S.I.P 阅读推荐 2025-05-08 IPvSeeYou

以色列NSO集团因攻击WhatsApp用户被判赔偿逾1.67亿美元

打穿系统是风险，那打垮人呢？——年年演练零误报，年年有人没能等到尾款和复盘

美国警告：黑客瞄准油气行业工业控制系统与监控数据采集系统

【戏说我在甲方做安全】聊蜜罐合作，结果甲方被乙方骂了

Panabit VLAN这样玩才高效：从透明网桥到网关模式的实战踩坑指南

本文由 admin 发表于 2024年6月15日12:04:02
转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出)：
AI大模型能答对几道高考数学题？https://cn-sec.com/archives/2851679.html
免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉.

目录

在线咨询

13688888888

8888 QQ在线咨询

微信
本页二维码