OpenAI GPT-4o模型展现奇怪行为报告揭示优势与风险

作者： CBISMB

责任编辑：张金祥

来源： ISMB

时间： 2024-08-09 11:54

点赞： 47

收藏： 6

OpenAI最近推出的GPT-4o，一款生成式人工智能模型，为ChatGPT的高级语音模式alpha版提供了支持。这是该公司首个能够接受语音、文本和图像数据综合训练的模型。然而，这种多元化的训练方式有时会导致GPT-4o的行为显得颇为奇特，例如模仿与其对话者的声音或在交谈中突然大喊大叫。

在一份新的“红队”报告中，OpenAI详细记录了对GPT-4o模型的优势和潜在风险的调查结果，揭示了该模型的一些奇异行为。报告指出，在极少数情况下，特别是当某人在高背景噪音环境中（如路上行驶的汽车内）与GPT-4o交谈时，该模型会模仿用户的声音。OpenAI将此现象归咎于模型在处理畸形语音时的困难。

不过，OpenAI强调，在高级语音模式下，GPT-4o现在已经不会这样做。该公司的一位发言人告诉TechCrunch，他们已经针对这种行为添加了“系统级缓解措施”。

此外，当受到特定方式的提示时，GPT-4o还可能产生令人不安或不适当的“非语言发声”和音效，如色情呻吟、暴力尖叫和枪声。尽管OpenAI表示，该模型通常会拒绝生成音效的请求，但他们也承认，有些请求确实会通过。

GPT-4o还可能涉及音乐版权问题。在报告中，OpenAI表示，他们已指示GPT-4o在高级语音模式的有限alpha阶段不要唱歌，以避免抄袭知名艺术家的风格、语调和/或音色。这暗示了OpenAI可能使用了受版权保护的材料来训练GPT-4o。

OpenAI在报告中写道：“为了解释GPT-4o的音频模式，我们更新了某些基于文本的过滤器以处理音频对话，并构建了过滤器来检测和阻止包含音乐的输出。”他们还表示，他们已经训练GPT-4o拒绝对受版权保护的内容（包括音频）的请求，这与他们更广泛的做法一致。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

OpenAI GPT-4o模型展现奇怪行为报告揭示优势与风险

相关推荐

智库专家

解决方案

OpenAI GPT-4o模型展现奇怪行为 报告揭示优势与风险

相关推荐

智库专家

解决方案

OpenAI GPT-4o模型展现奇怪行为报告揭示优势与风险