AI作品真伪难辨，人类被迫“自证清白”引热议

人工智能日益精进，在文本、图像及视频领域的生成能力已达到令人难以用肉眼区分的程度。然而，与此同时，人类所依赖的鉴别工具却未能同步提升其可靠性，这催生了一种全新的社会秩序。

在文学领域，获奖作家们或被要求解释其创作过程，诺贝尔文学奖得主亦需澄清其作品是否由人工智能辅助。艺术界中，画师们为了证明作品原创性，不得不选择录屏、直播展示创作流程，揭示作品图层。甚至普通的网络博主也可能因评论区质疑其内容“AI味浓重”而陷入困境。

以往，机器努力通过图灵测试，力求模拟人类思维。而如今，越来越多的人类个体却被卷入一场反向图灵测试：努力证明自己并非机器。

今年五月，英联邦短篇小说奖的一篇获奖作品引发了一场关于“鉴AI”的激烈争论。特立尼达和多巴哥作家贾米尔·纳齐尔的获奖短篇小说，因其独特的语言风格，被部分读者和业内人士指出存在明显的AI痕迹，例如混合的比喻、过于整齐的句式以及批量生成的修辞。

随后，AI检测工具Pangram更是给出了“100% AI生成”的断定。然而，这一看似确凿的结论并未立即成为最终裁决。英联邦基金会表示，所有入围作者均已确认未使用AI辅助创作。杂志Granta也无法仅凭一个检测结果便认定作者违规。更具讽刺意味的是，Granta杂志尝试使用另一款AI工具Claude复审该小说，以期借助AI判断其是否由AI创作，但Claude未能给出明确答案，使得Pangram信誓旦旦的“100% AI生成”结论依然存疑。

诺贝尔文学奖得主奥尔加·托卡尔丘克近期也卷入类似争议。她在一次采访中提及会利用AI辅助构思、资料整理、初步研究和事实核查，此言论迅速引发外界讨论，并导致对其即将出版的新小说是否由AI创作的猜测。托卡尔丘克随后不得不公开澄清，她将于2026年秋季出版的波兰语新书完全由其本人独立完成，并强调数十年来她始终坚持个人创作。

归根结底，随着AI能力的不断增强，“鉴别AI”正变得愈发困难。去年底，《纽约客》杂志的一项实验性文章对此进行了深入探讨。研究人员通过对多位作家的作品进行微调，训练AI模型模仿其个人风格。实验结果显示，在不知情的情况下，创意写作专业的学生在近三分之二的案例中，更倾向于AI生成的文本而非人类创作的原稿。这引发了比“AI能写小说”更深层次的问题。

《纽约客》作者Vauhini Vara在其文章中记录道，她的朋友和专业读者有时会误将AI生成的句子归咎于她，甚至批评她真实创作的文字“像AI一般”。

“恐怖谷效应”不仅限于外形与人类相似但又非完全相同的实体。当AI生成的内容（包括文本、图像及视频）越来越逼近人类，甚至攻克了最具人情味的“风格”时，人类不可避免地会产生存在主义的危机。这是当前“空口鉴AI”现象背后的核心驱动力。

换言之，人们“鉴AI”的行为可以理解，其深层原因实则源于某种恐惧：这是人类吗？这是AI吗？我是谁？我们又是谁？然而，可以理解并不代表其行为的正当性。“鉴AI”正在给各领域的创作者带来困扰，使得他们除了专注于创作，还要额外付出“自证清白”的成本。

就AI带来的冲击而言，绘画圈对此并不陌生。早在几年前，我们便已讨论过AI对绘画圈的影响，以及许多画师对AI的抵制。然而，如今画师们面临的麻烦已不仅限于需要警惕AI对个人成果的“炼化”，更是自身原创作品被“鉴AI”的情况。

在社交平台上搜索“画画UP主自证”，便能发现大量案例。有画师在遭遇“鉴AI”后，选择录屏展示所有图层，以证明作品出自其本人之手。但很多时候，这仍不足以打消质疑。

一位插画师朋友透露，现在许多插画师会在创作过程中全程录屏，以防被“鉴AI”时难以自证，这已成为目前最稳妥的做法。若无录屏，或即便有录屏“证据”但仍被怀疑为“描摹”，则可能进入下一步——对赌环节。

是的，绘画界因AI的出现，已发展出“鉴AI方”与“被鉴AI方”之间的对赌模式。在一个案例中，发帖人列举了诸如“头发断联”、“肩颈结构问题”等多种理由，质疑某画师的作品疑似垫入AI图描摹或临摹AI作品。双方以2000元为赌注，最终画师“自证成功”，发帖人向画师支付了2000元。通常，“对赌”中的“自证”环节，是指双方约定时间进行一场绘画直播。直播往往需要多机位，例如一个机位展示屏幕上的作图过程，另一个机位录制画师的创作姿态，以防出现“代笔”情况。

从许多画师发布的“自证帖”中，不难看出无奈的情绪，他们常感叹“终究轮到我了”，并誓言“这是第一次也是最后一次自证”。

就这样，一方面痛恨“空口鉴AI”，另一方面当自己被卷入时却不得已“自证清白”，这种处境实在令人难受。当然，“自证”失败的案例也存在，但这并不意味着“鉴AI”行为就变得理直气壮。毕竟“鉴AI”的成本几乎为零，而其手段，更是粗糙——多凭人眼。

这里不得不提及最近的一个趣闻：一位X用户发布了一张图片，声称这是AI生成的“莫奈风格画作”，并邀请大家“尽可能详细地说明它为什么不如真正的莫奈”。该帖子迅速获得700万浏览量，评论区不少人认真地开始“鉴AI”，纷纷指出其缺乏深度、色彩不统一、缺乏人味、构图不及真迹，甚至有人从笔触和空间感上分析得头头是道。然而，真相出乎意料：那张图本身就是莫奈的真迹。

所以，这实际上是人类对AI日益逼真产生的恐惧，与缺乏完美的“鉴AI”手段之间的矛盾。“鉴AI”手段的粗糙，是导致创作者普遍陷入“自证清白”困境的另一重要原因。

除了“人眼鉴别”的方式外，正如前文提及的文学比赛获奖作品案例所示，另一种主要的“鉴AI”方式是第三方检测工具Pangram。AI检测工具在文本领域应用广泛，它通过给出百分比的形式，如“80% AI生成”或“100% AI生成”，容易让人产生一种错觉：这似乎是确凿的结论，甚至近似于某种技术鉴定。然而，文本检测并非DNA鉴定。它所判断的，仅仅是“这段文字在统计特征上更接近于什么”。AI检测工具，也是在审视“看起来是否像AI所写”。

Pangram在其官方网站上解释称，其AI检测器利用自然语言处理技术，并结合大量人类写作与AI写作数据，分析AI文本中的结构、风格和语义模式。Pangram的技术报告亦表明，其核心是一个基于Transformer的神经网络分类器，其训练目标便是区分大型语言模型生成文本与人类手写文本。换言之，这类工具并非通过比对一篇文章与“AI文本数据库”来确认是否命中已知样本，它更像是在进行模式识别。它判断的是，这篇文章的词汇选择、句子节奏、结构安排、语义连接方式，更接近于它所见过的人类文本，还是更接近于它所见过的AI文本。

更复杂的是，其中存在诸多特殊情况。如果一篇文章由人类撰写初稿，再经AI润色几句话，该如何判定？如果AI生成了提纲，再由人类重新写成完整文本，又如何计算？如果一段英文资料经AI翻译成中文，作者再进行人工修改，检测工具能否准确判断？如果一位学生本身是非英语母语写作者，其语句更为规整和模板化，是否更容易被误判？

在绘画领域亦是如此。一些画师哀叹——确实构图有问题，那是因为我技艺尚需提升，并非因为这是AI所绘！

斯坦福大学研究人员在2023年对七款AI文本检测器进行了测试。他们选取了91篇非英语母语学生撰写的托福作文，这些作文均来自托福官方考试语料，由学生在真实考试环境下手写完成，因此可以确定并非AI生成。结果显示，其中89篇至少被一个检测器标记为AI生成；平均误报率高达61.22%；更有18篇被全部七个检测器一致判定为AI生成。这意味着这些学生在书写外语时，由于表述更为规整、更接近模板，被工具误认为是机器生成。

当然，2023年和2024年的检测工具不能简单等同于今天的检测工具。过去几年里，商业检测器确实在持续迭代，一些新工具在特定测试中的表现已明显提升，但问题并未完全解决。只要“误判”未能完全消除，矛盾便会留下滋生的空间。毕竟，工具给出的本是概率，但落到个人身上，却常常演变为指控。

更大的问题在于，AI公司是否应该实施“来源标记”？若能为所有AI生成内容植入一种不可移除的“水印”，便可解决鉴别难题？许多人一提到“水印”，仍会想到图片角落的标志、视频画面上的平台标识，或是“AI生成”等醒目字样。然而，如今的AI水印早已超越了这种肉眼可见的标记形式。

行业内大致存在两类做法：一类是元数据，例如C2PA和Content Credentials，它们相当于为数字内容附上了一张“身份说明”，记录了其生成工具、生成时间及编辑历史；另一类是隐形水印，它将人眼难以察觉但机器可识别的信号嵌入图像、音频、视频乃至文本中。

在图像和视频领域，这些方案已开始落地。谷歌DeepMind的SynthID能够为Imagen、Veo、Lyria、Gemini等工具生成的内容嵌入隐形水印。Meta表示，Meta AI生成或编辑的图像将加入可见水印、不可见水印和元数据。OpenAI也为其DALL·E 3和ChatGPT生成的图片添加了C2PA内容凭证，并随后引入了SynthID隐形水印。Adobe、微软、谷歌、Meta、OpenAI等公司均已参与C2PA和内容凭证生态。

这表明，AI公司也清楚仅凭肉眼判断“是否像AI”是不够的。它们已尝试通过元数据、内容凭证、隐形水印和平台标签，为AI生成的内容留下机器可读的来源信号。然而，这些方案并非完美。元数据在截图、压缩、转发、重新上传时可能丢失；可见水印可被裁剪或遮盖；隐形水印虽然更具耐久性，但也可能在后期处理、扰动或再生成过程中被削弱。

更关键的是，这些方案通常只能识别接入了相应系统并保留相应标记的内容。这意味着，谷歌的SynthID主要识别带有SynthID标记的内容，OpenAI的内容凭证主要说明内容源自OpenAI系统。只要内容来自未接入标记的模型，或经过多次转发，其来源链便可能中断。

对于文本，问题则更为复杂。文本当然也可以添加水印。其原理在于，模型在生成文字时，悄然改变某些词汇的选择概率，使得最终文本呈现出一种人眼难以察觉但检测器可以识别的统计模式。简而言之，就是让AI留下自身的“用词指纹”。

谷歌已公开了SynthID-Text，声称可为Gemini生成的文本嵌入水印。OpenAI也曾被寄予厚望解决此问题。2023年7月，OpenAI、谷歌、Meta、亚马逊、Anthropic、微软等公司达成自愿承诺，表示将研发机制，通过水印和内容来源标记等方式，帮助用户识别AI生成内容。

然而，几年过去，图像、音频、视频的标记方案不断推进，但文本方面仍缺乏一个清晰、默认启用且公众可用的通用解决方案。OpenAI曾在2023年推出过AI文本分类器，用于判断一段文字是否由AI生成，但上线时便提醒用户不应将其作为决策的唯一依据。半年后，OpenAI因其准确率过低而将其下线。

2024年，《华尔街日报》再次报道称，OpenAI内部已开发出一种文本水印工具，在足够长的ChatGPT生成文本上，其有效率可达99.9%。但OpenAI最终并未公开发布。原因并非完全是技术问题。报道提及，OpenAI担心文本水印会引发用户反弹、影响产品使用，也担忧非英语用户因此承受额外污名化。另有调查显示，近30%的ChatGPT用户表示，如果启用文本水印，他们可能会减少使用。

最终，回到“鉴AI”与“自证清白”双方的拉锯战，以上提及的所有水印方案，尚无法做到万无一失。人类有句俗语“道高一尺魔高一丈”，亦有“上有政策下有对策”，只要人类坚信这些，关于“鉴AI”的争议便不会停止。或许有一天，“AI参与”成为默认常态，“人类原创”变得异常稀有，这场大规模的“鉴AI”与“自证清白”的拉锯战才会失去其存在的意义。