5月29日下午起,众多DeepSeek用户反映,平台对消息的重新生成和修改功能设置了上限。据用户反馈,在普通对话模式下,重新生成功能在3到6次后即达到限制;而在专家模式下,机会可能更少,仅为3次左右。同时,修改输入内容的次数上限通常设定为6次。
尽管DeepSeek官方尚未就此发布任何公告,也未公开具体配额明细,但这一变化已在用户社区中引发广泛讨论。许多忠实用户对此感到不安,认为在未预告的情况下突然增加限制,让人难以接受。
有“半官方”账号“白墙”在小红书上解释称,这项限制并非DeepSeek的“负优化”举措,而是面对巨大算力压力的临时应对措施。该账号透露,近期DeepSeek用户数量快速增长,特别是在5月29日下午,App端的请求压力显著增加。为确保基础的文字对话服务不受影响,团队不得不对“修改消息”和“重新生成”这类高频操作进行限制。
从技术层面看,每次用户点击“重新生成”或“修改消息”,对服务器而言都意味着一次新的推理请求,需要模型重新处理上下文并生成回答。当大量用户频繁使用这些功能时,将对服务器造成沉重的负载。
这一限制与DeepSeek近期其他调整,如专家模式文件上传功能下架、智能搜索功能关闭,以及服务器偶发繁忙等情况一脉相承,均指向其底层算力资源面临的紧张局面。平台运行的底层设施亟待升级以满足用户需求。
针对出现的限制,白墙建议用户避免连续快速点击,可稍作等待(15至30分钟)后再尝试,通常限制会自动解除。反之,若反复快速点击,可能会被系统识别为异常高频请求,从而延长限制时间。
白墙还透露,华为昇腾超节点的新型计算卡正在部署中,预计下半年投入使用,届时算力将大幅扩容,这些临时限制届时有望取消。然而,所有这些信息仍需DeepSeek官方的最终确认。
DeepSeek并非唯一采取类似措施的人工智能平台。在大模型产品领域,面对算力短缺、用户激增或高峰时段高压,采取限流、服务降级、排队机制或对特定高消耗功能设限是行业内的普遍做法。例如,ChatGPT即便对于付费用户,在需求高峰期也可能遭遇使用次数限制,而免费用户在达到高级模型额度后会被切换至轻量级模型。
Anthropic旗下的Claude平台也设有类似的用户预算机制,其高频应用如Claude Code和API的使用上限会随算力容量动态调整,算力充足时额度提高,压力增大则限制收紧。今年5月6日,Anthropic曾发文提及,随着新的算力合作和容量扩展,Claude Code和Claude API的使用上限已有所提升,这进一步印证了使用上限与算力容量的强关联性。
图像和视频生成产品面临的挑战更为显著,如Sora、Gemini的图像生成功能及其它AI视频工具,在需求暴涨时也常出现生成次数收紧、排队时间延长以及免费额度削减的情况。这表明,“每一次推理都有成本”已成为人工智能产品运营中不可规避的现实。
此前,豆包收费引发的讨论与此次DeepSeek事件具有相似的用户情绪。用户普遍习惯了人工智能服务的免费和无限制使用,一旦平台开始收费或设限,用户的不满情绪容易反弹。对人工智能公司而言,基础服务免费、复杂功能收费、高成本功能设定额度,以及高峰期实施临时限流,都是成熟的运营策略。
DeepSeek此次限制“重新生成”和“修改消息”的次数,放在整个行业背景下看并不特殊。这些限制并非针对核心聊天功能或模型本身,而是针对那些易被用户高频点击、且每次点击都会消耗大量推理资源的操作。保持基础对话功能的畅通是留住用户的底线,而重新生成、反复修改、文件上传、联网搜索、长上下文处理及多模态生成等功能,则更容易在压力下被限流或降级。
此次争议的关键点,或许并非“限制多少”,而是“如何限制”。如果DeepSeek官方能及时说明这是临时性措施、恢复时间以及具体受影响的操作,用户可能会更容易理解和接受。然而,在缺乏官方公告的情况下突如其来的限制,自然会让用户质疑功能是否缩水或未来是否会收费。随着人工智能产品逐渐从尝鲜工具演变为日常必需品,用户对稳定性和透明度的要求也将日益提升。DeepSeek应认识到,用户使用次数的激增,也意味着庞大的用户群体正在期待它的持续服务。即使只是一个明确的解释,也能大大缓解用户的不安情绪。
