CVPR 2026 | 别卷推理了!当前大模型STEM短板在于"视觉感知",代码才是破局关键 原创
头像 yancode 2026-05-11 13:29:00    发布
1 浏览 0 点赞 0 收藏

据机器之心报道,CVPR 2026收录的一项最新研究揭示了当前大模型能力瓶颈的一个重要发现:模型的STEM(科学、技术、工程、数学)能力短板并非源于推理能力不足,而是在于"视觉感知"环节。这项名为CodePercept的研究表明,提升模型对视觉信息的准确理解,才是突破STEM能力的关键所在。


研究团队发现,当前大模型在处理涉及图表、公式推导、几何图形等视觉密集型STEM问题时,错误往往发生在感知层面而非推理层面。换言之,模型"看错了"而非"想错了"。而破解这一困局的关键,在于强化代码层面的视觉理解能力——通过编程式的视觉表征,让模型更精准地解析图像中的结构信息。


这一发现为大模型能力提升提供了全新思路:与其继续在推理链上堆算力,不如回归基础,提升模型"看"的能力。CodePercept框架在多项STEM基准测试中取得了显著提升,为下一代AI系统的研发指明了方向。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。
分类
业界新闻

暂无评论数据

加载中...

发布

头像

yancode

我还没有写个人简介......

21

帖子

9

提问

564

粉丝

关注
热门推荐
地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除

京ICP备:2022009079号-2

京公网安备:11010502051901号

ICP证:京B2-20230255