Meta高管辟谣调整AI模型以提升基准测试表现

作者： CBISMB

责任编辑：张金祥

来源： ISMB

时间： 2025-04-08 14:37

点赞： 25

收藏： 5

Meta针对网络上流传的有关其调整新AI模型以优化特定基准测试表现的谣言进行了公开辟谣。Meta生成AI副总裁Ahmad Al-Dahle在社交媒体平台X上发布文章，明确否认了公司在“测试集”上训练其Llama 4 Maverick和Llama 4 Scout模型的说法，强调这一说法“根本不是事实”。

在AI领域，测试集是用于评估模型在训练后性能的重要数据集合。若在测试集上进行训练，可能会导致模型的基准测试分数被人为夸大，从而掩盖其真实性能。上周末，一则未经证实的谣言在X和Reddit等社交平台上迅速传播，声称Meta通过不当手段提高了其新模型的基准测试结果。该谣言据称源自中国社交媒体上的一篇帖子，作者自称已从Meta辞职，以抗议公司的基准测试做法。

谣言进一步发酵，部分报道指出Maverick和Scout在某些任务上的表现并不理想，同时Meta选择使用未发布的实验性Maverick版本在基准LM Arena上取得更高分数，也加剧了外界的质疑。X平台上的研究人员观察到，公开可下载的Maverick模型与LM Arena上托管的模型在行为上存在显著差异。

针对这些质疑，Al-Dahle承认，一些用户确实发现，在不同云提供商上托管的Maverick和Scout模型质量存在“参差不齐”的情况。他解释称，由于公司在模型准备就绪后即进行删除操作，因此预计所有公开实施需要几天时间才能完成。同时，他表示Meta将继续努力修复错误，并积极吸引合作伙伴，以提升模型的整体性能和稳定性。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

Meta高管辟谣调整AI模型以提升基准测试表现

相关推荐

智库专家

解决方案