CVPR 2026 | 别卷推理了!当前大模型STEM短板在于"视觉感知",代码才是破局关键
原创
1 浏览 0 点赞 0 收藏
据机器之心报道,CVPR 2026收录的一项最新研究揭示了当前大模型能力瓶颈的一个重要发现:模型的STEM(科学、技术、工程、数学)能力短板并非源于推理能力不足,而是在于"视觉感知"环节。这项名为CodePercept的研究表明,提升模型对视觉信息的准确理解,才是突破STEM能力的关键所在。
研究团队发现,当前大模型在处理涉及图表、公式推导、几何图形等视觉密集型STEM问题时,错误往往发生在感知层面而非推理层面。换言之,模型"看错了"而非"想错了"。而破解这一困局的关键,在于强化代码层面的视觉理解能力——通过编程式的视觉表征,让模型更精准地解析图像中的结构信息。
这一发现为大模型能力提升提供了全新思路:与其继续在推理链上堆算力,不如回归基础,提升模型"看"的能力。CodePercept框架在多项STEM基准测试中取得了显著提升,为下一代AI系统的研发指明了方向。
©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。
分类
业界新闻
暂无评论数据
加载中...
发布
相关推荐
Kimi重磅发布Kimi K2.6大模型:代码与Agent集群能力全面跃升,开源引领行业新标杆
goldjin
5169
0AI模型的训练成本仅占其总成本的一小部分
5014
0惠普将把 200 亿参数的 AI 模型“塞进”新款 AI PC
346
0美国发布《国家人工智能立法框架》,明确六个关键目标
Song老师不是AI
4848
0英伟达组建“开放AI联盟”,争夺模型生态主导权
Song老师不是AI
8133
0yancode
我还没有写个人简介......
21
帖子
9
提问
564
粉丝
最新发布
DeepSeek 融资最新进展:募资或达500亿元创中国AI纪录
2026-05-11 13:21:33 发布360度无死角守护:鸿蒙智选家用监控器让家更安心
2026-04-07 15:01:47 发布热门推荐
京公网安备:11010502051901号