DeepSeek突施生成和修改次数限制，背后或系算力紧张

5月29日下午起，众多DeepSeek用户反映，平台对消息的重新生成和修改功能设置了上限。据用户反馈，在普通对话模式下，重新生成功能在3到6次后即达到限制；而在专家模式下，机会可能更少，仅为3次左右。同时，修改输入内容的次数上限通常设定为6次。

尽管DeepSeek官方尚未就此发布任何公告，也未公开具体配额明细，但这一变化已在用户社区中引发广泛讨论。许多忠实用户对此感到不安，认为在未预告的情况下突然增加限制，让人难以接受。

有“半官方”账号“白墙”在小红书上解释称，这项限制并非DeepSeek的“负优化”举措，而是面对巨大算力压力的临时应对措施。该账号透露，近期DeepSeek用户数量快速增长，特别是在5月29日下午，App端的请求压力显著增加。为确保基础的文字对话服务不受影响，团队不得不对“修改消息”和“重新生成”这类高频操作进行限制。

从技术层面看，每次用户点击“重新生成”或“修改消息”，对服务器而言都意味着一次新的推理请求，需要模型重新处理上下文并生成回答。当大量用户频繁使用这些功能时，将对服务器造成沉重的负载。

这一限制与DeepSeek近期其他调整，如专家模式文件上传功能下架、智能搜索功能关闭，以及服务器偶发繁忙等情况一脉相承，均指向其底层算力资源面临的紧张局面。平台运行的底层设施亟待升级以满足用户需求。

针对出现的限制，白墙建议用户避免连续快速点击，可稍作等待（15至30分钟）后再尝试，通常限制会自动解除。反之，若反复快速点击，可能会被系统识别为异常高频请求，从而延长限制时间。

白墙还透露，华为昇腾超节点的新型计算卡正在部署中，预计下半年投入使用，届时算力将大幅扩容，这些临时限制届时有望取消。然而，所有这些信息仍需DeepSeek官方的最终确认。

DeepSeek并非唯一采取类似措施的人工智能平台。在大模型产品领域，面对算力短缺、用户激增或高峰时段高压，采取限流、服务降级、排队机制或对特定高消耗功能设限是行业内的普遍做法。例如，ChatGPT即便对于付费用户，在需求高峰期也可能遭遇使用次数限制，而免费用户在达到高级模型额度后会被切换至轻量级模型。

Anthropic旗下的Claude平台也设有类似的用户预算机制，其高频应用如Claude Code和API的使用上限会随算力容量动态调整，算力充足时额度提高，压力增大则限制收紧。今年5月6日，Anthropic曾发文提及，随着新的算力合作和容量扩展，Claude Code和Claude API的使用上限已有所提升，这进一步印证了使用上限与算力容量的强关联性。

图像和视频生成产品面临的挑战更为显著，如Sora、Gemini的图像生成功能及其它AI视频工具，在需求暴涨时也常出现生成次数收紧、排队时间延长以及免费额度削减的情况。这表明，“每一次推理都有成本”已成为人工智能产品运营中不可规避的现实。

此前，豆包收费引发的讨论与此次DeepSeek事件具有相似的用户情绪。用户普遍习惯了人工智能服务的免费和无限制使用，一旦平台开始收费或设限，用户的不满情绪容易反弹。对人工智能公司而言，基础服务免费、复杂功能收费、高成本功能设定额度，以及高峰期实施临时限流，都是成熟的运营策略。

DeepSeek此次限制“重新生成”和“修改消息”的次数，放在整个行业背景下看并不特殊。这些限制并非针对核心聊天功能或模型本身，而是针对那些易被用户高频点击、且每次点击都会消耗大量推理资源的操作。保持基础对话功能的畅通是留住用户的底线，而重新生成、反复修改、文件上传、联网搜索、长上下文处理及多模态生成等功能，则更容易在压力下被限流或降级。

此次争议的关键点，或许并非“限制多少”，而是“如何限制”。如果DeepSeek官方能及时说明这是临时性措施、恢复时间以及具体受影响的操作，用户可能会更容易理解和接受。然而，在缺乏官方公告的情况下突如其来的限制，自然会让用户质疑功能是否缩水或未来是否会收费。随着人工智能产品逐渐从尝鲜工具演变为日常必需品，用户对稳定性和透明度的要求也将日益提升。DeepSeek应认识到，用户使用次数的激增，也意味着庞大的用户群体正在期待它的持续服务。即使只是一个明确的解释，也能大大缓解用户的不安情绪。