CVPR 2026 | 别卷推理了！当前大模型STEM短板在于"视觉感知"，代码才是破局关键原创

yancode 2026-05-11 13:29:00 发布

7871 浏览 196 点赞 0 收藏

据机器之心报道，CVPR 2026收录的一项最新研究揭示了当前大模型能力瓶颈的一个重要发现：模型的STEM（科学、技术、工程、数学）能力短板并非源于推理能力不足，而是在于"视觉感知"环节。这项名为CodePercept的研究表明，提升模型对视觉信息的准确理解，才是突破STEM能力的关键所在。

研究团队发现，当前大模型在处理涉及图表、公式推导、几何图形等视觉密集型STEM问题时，错误往往发生在感知层面而非推理层面。换言之，模型"看错了"而非"想错了"。而破解这一困局的关键，在于强化代码层面的视觉理解能力——通过编程式的视觉表征，让模型更精准地解析图像中的结构信息。

这一发现为大模型能力提升提供了全新思路：与其继续在推理链上堆算力，不如回归基础，提升模型"看"的能力。CodePercept框架在多项STEM基准测试中取得了显著提升，为下一代AI系统的研发指明了方向。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

分类

业界新闻

标签

CVPR,大模型,视觉感知,CodePercept,AI

暂无评论数据

加载中...

发布

相关推荐

三元桥David

510

三元桥David

1598

三元桥David

2266

goldjin

2611

三元桥David

1809

yancode

我还没有写个人简介......

帖子

提问

564

粉丝

关注