为什么人工智能在竞争中表现出色,但在日常生活中却失败了
作者: CBISMB
责任编辑: 张金祥
来源: ISMB
时间: 2025-09-29 17:00
关键字: 人工智能,竞争,生活,区别大
浏览: 1371
点赞: 81
收藏: 10
近日,在国际大学生程序设计竞赛(ICPC)的舞台上,人工智能模型大放异彩,然而在日常生活应用中却面临诸多挑战,这一现象引发了广泛关注。
今年的 ICPC 编程竞赛中,人工智能模型 Gemini 2.5 在 139 支参赛队伍中脱颖而出,并列第二。谷歌宣称,这充分展示了人工智能能够运用深度抽象思维和创造力,为全新问题找到解决方案。值得一提的是,本次 ICPC 决赛于 2025 年在阿塞拜疆首都巴库的盖达尔·阿利耶夫中心举行,为期五天,主要赞助商包括谷歌 Deepmind 和 OpenAI,它们分别推出 Gemini 2.5 和 GPT-5 参与解题。其中,Gemini 解决了十二个问题中的十个,GPT-5 则成功解决全部十二个问题。
尽管人工智能在竞赛中表现卓越,但参赛者并不将其视为竞争对手。来自哈索普拉特纳研究所 (HPI) 的参赛队员 Christopher Weyand、Tobias Röhr 以及教练 Weyand 表达了对人工智能的独特看法。他们代表 HPI 参加了此次 ICPC,并获得第 29 名。
Weyand 和 Röhr 认为,竞争环境为人工智能提供了近乎完美的条件。竞赛中任务定义清晰,解决方案和测试方法都已明确,这使得人工智能能够迅速得出正确结果。然而,这与人工智能在日常职业生活中的应用有着本质区别。在日常工作中,目标往往不明确,既没有明确的功能界定,也没有清晰的输入和输出标准,因此人工验证不可或缺。
在日常职业场景里,即便算法由人工智能创建,程序员也必须理解代码,并大致评估其运行是否正确,同时还要创建自己的测试场景。这与竞赛环境截然不同。在 ICPC 比赛中,评委成员会花费数月时间精心准备每个问题,编写示例解决方案,并通过大量测试尽可能发现错误,为人工智能界定了清晰的运行框架。
Weyand 和 Röhr 指出,ICPC 提出的问题在日常工作中极为罕见。当实际实现已经完成,且函数内容和输出结果清晰明确时,AI 在程序测试方面更具优势,也适合编写代码文档,因为此时代码功能已为人所知。但在竞技中,算法的构思比简洁易维护的实现更为重要,这也导致 Gemini 和 ChatGPT 的解决方案包含许多不必要的代码行,只要能保证在比赛中正常工作即可。