AI服务价格飙升:硬件救赎在路上,但用户还得继续“买单”

作者: CBISMB

责任编辑: 邹大斌

来源: CBISMB

时间: 2026-05-22 11:17

关键字: Token 生成式AI 成本

浏览: 0

点赞: 0

收藏: 0

随着生成式AI应用和服务的成本与日俱增,模型开发商正被迫应对基础设施成本的激增。尽管新一代GPU和AI加速器承诺将带来更高的效率与利润空间,但普通用户短期内恐怕难以享受到降价的红利。

推理成本高昂,硬件厂商紧急“救火”

在投入数十亿美元构建更大、更强的模型后,AI巨头们终于找到了超越聊天机器人和图像生成器的实际用例。以Claude Code、GitHub Copilot为代表的代码助手已成为AI领域最成功的商业案例。然而,成功也是一把双刃剑。当初为训练模型而斥巨资建造的数据中心,从未被设计用于应对如今这种规模的推理服务需求。

为了降低每个Token的成本,英伟达(Nvidia)、AMD、谷歌等科技巨头正竞相推出更适合模型推理的新硬件。英伟达甚至动用巨额资金收购AI芯片初创公司Groq,以应对这一挑战。更廉价的Token意味着更好的推理经济效益和更高的利润率,这也是风险投资人们迫切希望看到的。

涨价潮来袭,代理商正在“燃烧”Token

然而,AI优化硬件的大规模部署预计要到2027年初至中期才能实现。在这段空窗期,AI开发商正试图测试市场的底线。OpenAI在推出GPT-5.5后将Token价格翻倍,谷歌新推出的Gemini Flash 3.5价格也比前代产品高出数倍。

更严峻的是,构建在这些模型之上的AI智能体(Agents)消耗Token的速度远超普通聊天机器人。当用户每月仅花费200美元订阅费,却消耗了价值5000美元的Token时,固定费率定价便难以为继。微软已放弃GitHub Copilot的按席位定价,转向按使用量计费,Anthropic也在重新思考其订阅模式。

“AI替代人类”的幻象破灭

那些指望用廉价AI替代全职员工的高管们可能会迎来残酷的现实。当Anthropic、谷歌或OpenAI可以按每小时30美元的标准收取Token费用,并证明这依然比支付员工40美元时薪加福利更划算时,AI定价或将很快以“每全职当量美元( $ /FTE)”来衡量。

尽管AI并非高管们预期的“薪资天堂”,但科技巨头裁员追逐AI的热潮并未停止。Meta计划裁撤约10%的全球员工并将资源转向AI部门,Cloudflare和思科也分别裁员上千人,理由均是加大对AI领域的投资与聚焦。

竞争难解高价困局,行业整合在即

尽管竞争通常被视为高价的解药,但目前顶级模型开发商大多仍处于严重亏损状态。相比之下,拥有多元化业务的超大规模云厂商(Hyperscalers)更能承受AI投资的长期亏损。

历史告诉我们,AI的繁荣与不可避免的萧条将遵循熟悉的轨迹:泡沫期竞争百花齐放,而泡沫破裂后,行业整合将不可避免。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。