DeepSeek近期发布的一则招聘海报,以其独特的“Agent Harness研发工程师”职位,在业界引起了不小的讨论。尤其值得注意的是,DeepSeek并未选择传统的AI产品经理来领导这一关键岗位,反而是吸引了一位在量化交易领域深耕多年的专家——崔添翼。崔添翼曾就职于全球顶尖量化公司Jane Street长达九年,后又联合创立量化基金TSY Capital,其背景与AI产品开发领域鲜有交集,这种反常规的用人策略,被认为是DeepSeek在下半场竞争中的一次重大战略调整。
目前,诸多科技巨头如Anthropic与OpenAI等,其Harness产品负责人多出身于产品背景,例如Anthropic的创始人Boris Cherny和OpenAI Codex的Alexander Embiricos都曾是经验丰富的产品经理。他们更侧重用户体验和需求协调。然而,DeepSeek选择量化专家,预示其对AI Agent核心逻辑有着不同的理解:正如量化交易中,再聪明的策略也需仰赖强大的执行系统和风控机制才能变现,AI模型亦然,其生产力最终取决于工具调用、上下文管理、终端执行、反馈测试以及权限控制等一套完整的Harness体系。
崔添翼的职业履历堪称传奇。他曾以优异成绩保送浙江大学计算机学院,并在ACM国际大学生程序设计竞赛中屡获金牌,由他撰写的《背包九讲》至今仍是信息学领域的经典教程。毕业后,崔添翼加入Jane Street,在严苛的金融科技环境中磨砺九年,期间积累了丰富的交易系统、风控系统、回测系统等关键技术经验。他深知,量化交易的真正价值在于如何将策略稳定地执行并管理风险,毫秒级的延迟都可能导致巨大损失,这些实践远超纯粹的算法理论。2022年,崔添翼离开Jane Street,投身量化交易创业,进一步锤炼了从技术搭建到团队管理和市场对接的全栈能力。数月前,他正式加入DeepSeek Harness团队,引发了业界对DeepSeek未来方向的广泛猜测。
DeepSeek的这一举动,暗示着它正将AI Agent系统视作一个“交易系统”来构建。在量化交易中,无法稳定执行的策略毫无价值。同理,AI模型如果不能安全高效地操作文件、代码、命令,其作用也将止步于简单的对话机器人。崔添翼的加盟,意味着DeepSeek正着手构建一套将AI的“智能”转化为“执行力”的系统,这标志着DeepSeek从追求“模型效率”的上半场,迈向了关注“工作流入口”的下半场。
DeepSeek过往的成功在于其模型的高效率和开源策略,打破了“只有资源丰富的大厂才能做出顶级模型”的认知。然而,仅凭模型本身难以留住用户。在模型能力日益趋同的今天,真正的竞争在于谁能更紧密地融入用户的工作流。对于开发者而言,聊天框并非核心入口,编辑器、终端、代码库、CI等才是。例如,Claude Code和Codex的成功,关键在于它们将模型无缝嵌入到开发者的日常操作路径中,占领了这一高价值的付费场景。Harness的本质并非提升模型性能,而是让廉价的token变得更有价值。
当前AI Agent普遍面临高昂的token消耗问题,一次复杂的任务可能耗费数千万token和数小时。在Harness的优化下,即使是中小模型也能展现出媲美甚至超越大模型的执行效果。研究表明,相同的模型在不同Harness下,性能差异可达数十个百分点。因此,模型已经过了“能不能写代码”的阶段,现在的关键在于能否在真实复杂的代码环境中稳定运行。Harness负责组织代码库、上下文摘要、控制迭代、重试策略,并将模型的决策转化为实际的shell命令、文件编辑和测试,再将反馈循环至模型,形成“思考-行动-反馈-修正”的闭环。
此外,DeepSeek仍面临一些挑战。尽管其网页和APP端用户活跃,但在模型调用和Agent产品方面,缺乏有效的信息反馈机制。量化交易中,交易日志和风险控制记录是策略优化的关键。同理,AI Agent的失败日志——如代码修改失败、工具调用出错、环境配置问题等——是DeepSeek提升Harness性能不可或缺的数据来源。目前,DeepSeek尚未建立起类似Claude Code那样的完整反馈循环系统,这将影响其产品迭代速度。
AI Agent的“滑点”问题也亟待解决。如同量化交易中订单执行价格与预期价格的偏差,AI Agent在理解项目结构、执行命令、验证补丁等方面也可能出现预期与实际结果的落差。Harness的价值就在于逐步缩小这些滑点。同时,Agent的“失控”风险不容忽视。例如,曾经有AI Agent在执行任务时意外删除了公司的生产数据库。而在量化交易中,风控系统防止策略失控是重中之重。崔添翼的经验,将帮助DeepSeek构建起有效的风险控制机制,设定指令执行边界,确保Agent在安全可控的范围内运作。
DeepSeek的稳定性也需进一步加强。对于编程Agent这类对实时性和可靠性要求极高的应用,几秒的延迟或服务崩溃都可能导致任务失败,用户容忍度极低。此外,工具生态的建设同样重要。Claude Code的成功离不开其MCP协议、插件系统和丰富的Skills。这些功能在真实场景中不断演化,为用户提供了强大的支持。DeepSeek需要补足的,不仅是Harness本身,更是一套能收集反馈、快速迭代的生态系统,以应对未来愈发激烈的AI Agent市场竞争。
总而言之,DeepSeek引入量化专家崔添翼负责Harness研发,是其从单纯追求模型参数和效率,转向更高价值的AI Agent工作流和执行能力的战略选择。这预示着AI Agent的竞争焦点,正从“谁的模型更聪明”转向“谁离用户的工作流更近”,以及谁能将模型包装进更高价值的场景,实现从卖“模型调用”到卖“工作流结果”的转变。
