Meta高管辟谣调整AI模型以提升基准测试表现

作者: CBISMB

责任编辑: 张金祥

来源: ISMB

时间: 2025-04-08 14:37

关键字: Meta,测试成绩,作弊

浏览: 6

点赞: 0

收藏: 0

Meta针对网络上流传的有关其调整新AI模型以优化特定基准测试表现的谣言进行了公开辟谣。Meta生成AI副总裁Ahmad Al-Dahle在社交媒体平台X上发布文章,明确否认了公司在“测试集”上训练其Llama 4 Maverick和Llama 4 Scout模型的说法,强调这一说法“根本不是事实”。

在AI领域,测试集是用于评估模型在训练后性能的重要数据集合。若在测试集上进行训练,可能会导致模型的基准测试分数被人为夸大,从而掩盖其真实性能。上周末,一则未经证实的谣言在X和Reddit等社交平台上迅速传播,声称Meta通过不当手段提高了其新模型的基准测试结果。该谣言据称源自中国社交媒体上的一篇帖子,作者自称已从Meta辞职,以抗议公司的基准测试做法。

谣言进一步发酵,部分报道指出Maverick和Scout在某些任务上的表现并不理想,同时Meta选择使用未发布的实验性Maverick版本在基准LM Arena上取得更高分数,也加剧了外界的质疑。X平台上的研究人员观察到,公开可下载的Maverick模型与LM Arena上托管的模型在行为上存在显著差异。

针对这些质疑,Al-Dahle承认,一些用户确实发现,在不同云提供商上托管的Maverick和Scout模型质量存在“参差不齐”的情况。他解释称,由于公司在模型准备就绪后即进行删除操作,因此预计所有公开实施需要几天时间才能完成。同时,他表示Meta将继续努力修复错误,并积极吸引合作伙伴,以提升模型的整体性能和稳定性。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。