OpenAI GPT-4o模型展现奇怪行为 报告揭示优势与风险
作者: CBISMB
责任编辑: 张金祥
来源: ISMB
时间: 2024-08-09 11:54
关键字: OpenAI,GPT-4o
浏览: 2
点赞: 0
收藏: 0
OpenAI最近推出的GPT-4o,一款生成式人工智能模型,为ChatGPT的高级语音模式alpha版提供了支持。这是该公司首个能够接受语音、文本和图像数据综合训练的模型。然而,这种多元化的训练方式有时会导致GPT-4o的行为显得颇为奇特,例如模仿与其对话者的声音或在交谈中突然大喊大叫。

在一份新的“红队”报告中,OpenAI详细记录了对GPT-4o模型的优势和潜在风险的调查结果,揭示了该模型的一些奇异行为。报告指出,在极少数情况下,特别是当某人在高背景噪音环境中(如路上行驶的汽车内)与GPT-4o交谈时,该模型会模仿用户的声音。OpenAI将此现象归咎于模型在处理畸形语音时的困难。
不过,OpenAI强调,在高级语音模式下,GPT-4o现在已经不会这样做。该公司的一位发言人告诉TechCrunch,他们已经针对这种行为添加了“系统级缓解措施”。
此外,当受到特定方式的提示时,GPT-4o还可能产生令人不安或不适当的“非语言发声”和音效,如色情呻吟、暴力尖叫和枪声。尽管OpenAI表示,该模型通常会拒绝生成音效的请求,但他们也承认,有些请求确实会通过。
GPT-4o还可能涉及音乐版权问题。在报告中,OpenAI表示,他们已指示GPT-4o在高级语音模式的有限alpha阶段不要唱歌,以避免抄袭知名艺术家的风格、语调和/或音色。这暗示了OpenAI可能使用了受版权保护的材料来训练GPT-4o。
OpenAI在报告中写道:“为了解释GPT-4o的音频模式,我们更新了某些基于文本的过滤器以处理音频对话,并构建了过滤器来检测和阻止包含音乐的输出。”他们还表示,他们已经训练GPT-4o拒绝对受版权保护的内容(包括音频)的请求,这与他们更广泛的做法一致。