AI小说写作模式遭深度剖析：Claude平铺直叙，GPT钟爱梦境，Gemini视角单一

通过阅读下面两段描写，读者或许能直观感受到人工智能与人类写作间的细微差异。

第一段：“他胸口发紧，冷汗从脊背滑落，周遭灯光似也黯淡。空气中弥漫着一种难以名状的气息，如同雨后泥土，又似某种古老记忆。”

第二段：“张三很害怕。他不知为何，却总觉不对劲。他想起外婆小时候讲的那个故事。”

大部分人会凭借直觉判断第一段更像是AI所作。这并非偶然，而是因为AI写作，特别是像ChatGPT这类模型，常过度渲染感官体验，将“恐惧”分解为一系列生理反应，其笔触带有明显的机器痕迹。

过去一年，网络上不乏各种“AI写作鉴别指南”，例如频繁使用破折号、习惯性使用“首先、其次、最后”以及堆砌形容词等。然而，这些所谓的“风格特征”往往只需调整提示词便可轻松规避。许多人坚信，只要善于“调教”AI，便能使其写出与人类无异的文字。

但来自马里兰大学与Google DeepMind的研究团队指出，这种想法恐难实现。他们认为，AI故事创作的“底层操作系统”与人类存在根本性差异，并非简单的提示词调整就能改变。

这项名为《StoryScope: Investigating idiosyncrasies in AI fiction》（《故事显微镜：探究AI小说的特质》）的论文于2026年4月在arXiv上发表。论文由马里兰大学计算机系的Jenna Russell团队与Google DeepMind联合完成。

2026年5月28日，沃顿商学院教授Ethan Mollick在X平台分享此研究，并评论道：“关于AI写作风格特征（如破折号等）已有很多讨论，但这篇论文更侧重于AI的叙事特征。AI与人类叙事间存在诸多引人入胜的差异，即使要求AI以不同风格写作，这些差异也几乎无法改变。”

Ethan Mollick于该日分享的论文核心图表，在短时间内获得了31.5万次查看、3000多个点赞及近600次转发。AI领域的学者、写作者和普通读者都被同一个问题所吸引：AI究竟能否真正讲好故事？

该实验规模庞大，研究人员收集了10272个写作提示。每个提示分别由人类作者以及Claude、DeepSeek、Gemini、GPT、Kimi这五种大型语言模型创作一篇约5000字的故事。最终，共生成61608篇故事，每篇故事提取了304个叙事特征。

这意味着研究团队对六万多部小说的“骨架”进行了逐一解剖和比对，涵盖情节结构、角色能动性、时间连贯性、对话密度等方方面面。

研究团队开发了一套名为StoryScope的自动化分析流程，能够从10个维度自动归纳出细粒度且可解释的叙事特征，覆盖情节、主体、时间结构等层面，然后对比AI生成与人类创作的故事，以揭示其内在构成上的区别。

结果显示，仅凭叙事特征，便能以93.2%的准确率区分人类与AI写作，而这完全不依赖词汇、句式、标点等风格线索。在识别“六个作者分别是谁”的六类归属任务中，准确率高达68.4%。作为对比，包含风格线索的完整模型，其准确率也仅提高不到3%。

换言之，AI写作的“底层叙事逻辑”本质上已昭然若揭。即使删除所有破折号，将“首先、其次、最后”替换为口语化表达，其叙事骨架依然会暴露其机器本质。

HNAI故事创作究竟存在哪些问题？

研究团队将核心差异归纳为以下五个维度：

AI过度热衷于“说教”。AI创作的故事常常像一位担心读者不理解的语文老师。在77%的AI故事中，叙事者会直接点明故事主旨，而在人类作者的作品中，这一比例仅为52%。AI故事中对话出现哲学讨论的比例高达59%，而人类作品仅为34%。

更显著的是，AI对其他作品的引用几乎都是“模糊的暗指”（占比72%），而人类作者则更倾向于直接提及“像《百年孤独》那样……”等具体作品名称，占比达50%。AI的潜台词似乎是：“我告诉你一个道理，你得认真听。”而人类作者的潜台词则是：“请君自行品味。”

有人会质疑，这不是负责任的表现吗？把道理讲清楚难道不好吗？关键在于，优秀的故事从来都不是靠“讲道理”来打动人。托尔斯泰不会在《安娜·卡列尼娜》结尾写上“这个故事告诉我们，出轨没有好下场”——他让读者自行体会。而AI无法做到“放手”，它似乎必须将每一件事都阐释清楚。

人类会跳跃时间线，而AI则倾向于直线叙事。人类在讲故事时喜欢采用多种手法，例如从葬礼开始，然后倒叙几十年前的往事，再突然闪回到现在。这种非线性叙事在AI作品中几乎不存在。数据显示，79%的AI故事“没有支线情节”，而人类故事的这一比例为57%。AI故事中主角驱动型结局占69%，而人类作品仅为46%。

人类更乐于让故事“悬而未决”，留给读者想象空间。人类故事的结局更偏向开放式或模糊处理，让读者自行思索“然后呢”。AI则必须为每个角色提供交代：主角要么顿悟，要么接受现实（占47%），而人类作者只有27%会如此处理。

研究团队举例说明：当要求AI和人类分别创作一个悬疑故事时，人类作者可能会从葬礼开场，倒叙数十年前的恩怨；而AI则会从第一个线索开始，按时间顺序一路推进至结局，中间没有任何“岔路”。

AI对“身体描写”上瘾。回到开头的测试，AI写作最显著的特征之一便是：它不会直接表达情绪，而是通过身体反应和环境描写来“演绎”情绪。

数据显示，81%的AI会在描写中通过生理感受和身体隐喻来传达情绪（人类仅38%）。AI使用嗅觉意象的比例高达82%（人类57%），并且喜欢将环境设定作为角色内心状态的映射。人类作者描述“张三害怕了”，通常就是一句话。

AI在描写“害怕”时，则会写道：“胸口发紧、冷汗直流、灯光变暗、空气中弥漫着某种气息……”人类明确使用情绪标签（如“感到害怕”、“很愤怒”）的比例是29%，而AI仅为8%。这暴露出一个本质问题：AI并没有真正的情绪体验，它只能从训练数据中学习“情绪的外在表现”，然后以一种“教科书式”的方式将它们堆砌起来。

AI知道恐惧会让人出汗，但它并不知道出汗究竟是何感受。因此，其描写总带有一种“用力过猛”的违和感，仿佛从未品尝过柠檬却要描绘其酸味。

人类会“打破第四面墙”，而AI只会埋头写作。人类作者拥有一项AI无法习得的绝技：直接与读者对话。“亲爱的读者，你一定猜不到接下来发生了什么……”这种打破“第四面墙”的写法，在28%的人类作品中有所体现，而AI作品仅占7%。

同时，人类写作中提及具体文本和作者的比例几乎是AI的两倍（47%对24%）。人类可以在显性引用和隐性参考之间自如切换（37%的人类作品采用“混合模式”，AI仅16%），而AI只能躲在模糊的暗指背后，仿佛生怕暴露自己“阅读量不足”。

这并非因为AI“未曾阅读”，其训练数据中涵盖所有书籍。而是因为它不清楚何时应该声明“我在引用”，何时应保持沉默。换言之，AI的叙事是一种“没有读者意识”的叙事。它不在乎读者是否存在，也无暇顾及读者能否跟上，它仅仅是在“完成任务”。

AI创作的故事“撞脸”现象严重。AI生成的故事在“叙事空间”中高度集中，而人类故事则散布在更广阔的区域。人类的故事素材更为丰富，涉及更多地点，对话占比更高，更多支线融入核心主题（42%对21%），并且更常塑造存在道德矛盾的主角（59%对38%）。

人类笔下的主角既可以是好人也可以是坏人，可以善良亦可自私；而AI笔下的主角则倾向于“高大全”的完美形象。AI的问题并非“写得不好”，而是“写得大同小异”。它被困在一个狭窄的“默认叙事模板”中，难以突破。即便给予不同AI模型相同的提示词，它们创作的故事在叙事空间中的位置也惊人地接近。

每个AI模型都具备其独特的“叙事指纹”。

论文最有趣的发现是：不同AI模型的写作方式，如同不同作家的“笔迹”，各有其特点。

论文摘要明确列出了三个模型的指纹特征：Claude的事件升级表现格外平淡，GPT过度使用梦境序列，Gemini默认采用外部视角描述角色。基于论文实验数据的进一步分析推断，DeepSeek和Kimi也展现出各自鲜明的叙事倾向。

这意味着什么？如果一篇小说频繁出现“梦境的转折”，那很可能是GPT所写；如果整个故事波澜不惊，情节推进如同白开水，那大概率出自Claude之手；如果每个角色都从外部视角描述，像在审阅人物档案卡，那Gemini脱不了干系。更令人称奇的是，利用这些“指纹”进行六类归属（从五个AI模型和人类中识别具体作者）的任务，准确率高达68.4%。

更令人心寒的是，论文还发现：所有AI模型生成的故事在叙事空间中高度集中于某个共享区域，而人类故事则散布于更为广阔的空间。

这意味着，无论是Claude还是GPT，无论其“写作风格”如何调整，它们的“叙事DNA”实际上同出一源。这种“叙事趋同”现象，可能是大型语言模型训练范式固有的某种问题——它们都从相似的语料中学习“何为好故事”，并得出相似的结论。

“去AI味”的意义何在？

这项研究的发布，恰逢“去AI味”成为热门话题。就在论文发表的当月，中文互联网上爆发了对“豆包体”的群嘲——那些充斥着“最”、“非常”、“深深地”等词汇的AI生成文本，引得网友捧腹。各种“消除AI味的不完全手册”也应运而生。与此同时，尼日利亚作家纳齐尔的小说《林间之蛇》被指存在大量“AI写作痕迹”，文学界的AI写作争议愈演愈烈。

然而，StoryScope的结论泼了一盆冷水：修改词汇、调整句式、改变标点，这些都只是“表面功夫”。让AI写“我很难过”而非“一股悲伤涌上心头”，并不能改变其叙事结构。删除所有破折号，也无法改变其偏爱单线程叙事、回避道德模糊性的“底层代码”。

Ethan Mollick在推文中特别强调：“要求AI用不同风格写作，也几乎无法改变叙事层面的这些差异。”

这其实触及了一个更深层次的问题：AI到底能否“像人类一样”进行创作？

从风格层面看，或许可以。只要提示词得当，AI可以模仿海明威的简洁、博尔赫斯的迷宫、王小波的戏谑。但从叙事层面看，AI在“如何编故事”这件事上，与人类存在根本性的不同——它不曾经历生活、不曾理解死亡、不知“欲说还休”是何滋味，因此它只能套用一个“标准的故事模板”。

这或许才是AI写作与人类写作之间，难以跨越的鸿沟。

论文的结尾，研究团队提出了一个发人深省的问题：随着AI生成文本越来越多地融入人类创作，我们应如何定义“原创性”？

他们公开了StoryScope的全部代码、10272个写作提示以及51336篇AI生成的叙事文本（部分提示因生成失败未纳入），供学术界进一步研究。这更像是一种“预警”——当AI生成的文字如洪水般涌入文学市场时，我们需要一副能穿透表象、直达叙事底层的“照妖镜”。

对于每一个使用AI辅助写作的人来说，这篇论文或许也在提醒：别仅仅想着“去AI味”，更应思考你究竟想要表达什么。因为AI可以帮助你写出通顺的文字，但它永远无法替你经历一段人生——而后者，才是好故事的真正源泉。