科技媒体TestsCatalog于5月26日发布了一篇报道,披露了Anthropic正着手在Claude的设置中引入一项名为“AI Fluency”的个性化评分系统。这一系统旨在量化用户操作AI的熟练程度,并为其提供优化使用策略的指导。
Anthropic今年2月曾发布一份“AI Fluency Index”研究报告。报告指出,尽管AI工具正迅速进入大众视野,但用户是否同步提升了其高效且审慎使用AI的能力,仍是一个有待探究的问题。
研究结果显示,当用户需要AI生成代码、应用程序、文档或交互式工具等复杂成果时,他们往往能提供更为精确的指令,并对自身需求有更清晰的认知。然而,随之而来的一个问题是,用户可能因此减少对AI输出内容的质疑,更容易忽视AI论证中的漏洞、背景信息的缺失或潜在的事实错误。
Anthropic在其研究中进一步强调,反复的迭代和持续的修正,是衡量高质量AI使用者最显著的特征。研究发现,用户若能更频繁地与AI进行真实的互动对话,其能力确实可能得到提升。此外,排版专业、语气自信的AI回答,也更容易被接收者自动贴上“可信”的标签。
最新的线索表明,Anthropic正在将此研究成果转化为Claude内部的用户能力反馈机制,相关设置选项已出现在Claude的配置页面中。
用户将能够独立访问该界面,请求Claude生成一份结构化的能力报告,并直接在设置面板中查看和管理结果。
这份评分卡将分析用户在Chat、CoWork、Claude Code等模块中的活动记录,并根据11个可观测行为进行打分。评分涵盖了目标澄清、沟通方式和质量控制等多个维度的能力,与Anthropic联合学者Rick Dakan和Joseph Feller共同构建的“4D AI Fluency Framework”中的委托、描述、识别等核心维度相对应。
除了针对行为模式的评分,这份评分卡还将纳入用户近30天内各项产品功能的使用情况,例如projects对话30次、web-search使用27次、artifacts应用3次、connectors使用4次、memory使用0次。系统将综合行为反馈与功能探索数据,并根据用户未充分利用的功能,提出进一步的使用建议。
最终结果将以类似7.5/11的分数呈现,同时明确指出哪些使用习惯值得保持,哪些方面仍有改进空间。这一设计将帮助AI新手用户更直观地理解自己在AI使用上的有效之处和不足。
