近年来,人工智能的强大潜力日益凸显,促使各行业与个人都渴望将其应用于实际场景,而非仅停留在理论层面。个体希望AI能提升工作效率,企业则寄望AI带来商业价值。即使是习惯了在AI中自由探索的极客们,也开始思考如何将创新成果转化为实用产品。
一位开发者在寻求项目投资时提到,过去几年AI就像是他手中的“飞天扫帚”,虽然初期带来了无尽的冲动与兴奋,但回过头来,却缺乏实质性的成果,让他感到一种空虚感。他希望能像“龙虾OpenClaw”那样,开发出真正能融入人们日常生活的产品。
尽管这种落地需求日益强烈,并伴随着诸多尝试,但实践过程并非一帆风顺。算力作为AI发展的基石,在国内一直处于相对紧张的状态。许多在2024至2025年间启动的初创团队,曾普遍抱怨有限的算力资源多集中于大型企业,且生态系统不够完善和开放,导致他们不得不投入大量精力进行算子编写和生态补齐。
然而,当前形势已发生显著转变。开发者们发现,他们现在也能接触到与大型公司同等级别的算力资源。以鲲鹏昇腾技术为核心的中国算力生态,正变得越来越实用和便捷,并加速走向开放与开源。一度被视为“贫瘠”的土壤,如今已转化成“肥沃”的黑土地。在这种环境下,AI应用的落地似乎变得不再困难,那些历经磨砺的极客们,正准备在这里掀起一场真正的创新浪潮。
AIGCode(蔻町智能)团队最初在探索国产算力时,面对的景象犹如一片“荒漠”。这家成立于2024年1月的初创公司,由一群来自微软、华为及国内互联网巨头的极客组成,他们致力于将氛围编程(vibe coding)这一前沿的AI编程范式,转化为实用产品。他们的目标是让不懂代码的用户,仅凭文字描述就能生成自己的网站和应用程序。公司联合创始人兼CTO陈秋武介绍说,团队虽仅有二三十人,但在传统大厂评价体系中不以综合能力见长,但技术能力却都非常出色,达到80、90分以上。
这群极客从一开始就怀有远大抱负,他们希望通过自研基础模型打破Anthropic模型的垄断,实现“一句话生成网站和应用”的氛围编程产品。但在实际落地过程中,尤其在算力方面,他们遭遇了巨大的挑战。
当时国内AI领域普遍存在GPU短缺的困境。利用国产芯片训练大型模型,不仅成功案例稀少,更重要的是,当时的国产算力生态与英伟达以CUDA为核心的强大生态相比,存在明显差距。业内专家指出,虽然芯片硬件决定了算力的理论上限,但实际表现则取决于软件生态。换言之,没有完善生态支持的算力,如同空中楼阁,徒有其表。
陈秋武回忆道,AIGCode最初选择华为昇腾芯片,部分原因是“囊中羞涩”,作为初创公司,无法负担昂贵的英伟达GPU。然而,团队很快发现,这片国产算力“土地”比他们想象中更为“荒凉”。华为对标英伟达CUDA的CANN生态,在2024年初,用陈秋武的话来说,许多功能和工具还处于缺失状态。团队在进行7B模型预训练时,20台机器并行运行,却频频遭遇算子和工具链的不足,只能“一边踩坑,一边填坑”。
以“较真”著称的极客们,由此与华为展开了一场“极限拉扯”。他们不断向华为提出各类问题和需求,促使华为提供解决方案。陈秋武曾严厉地向华为团队指出CANN生态的不足之处,甚至直接向高层反映,强调必须正视问题,不能回避,否则永远无法赶上CUDA。
然而,这种“质变”的到来,却比预想中要快。半年之后,CANN生态变得“越用越顺手”。到2025年,CANN的覆盖率已达到百分之八九十,连陈秋武本人都感到“吃惊”。回顾“走出荒漠”的历程,陈秋武认为CANN生态之所以能取得如此快速的进步,除了昇腾硬件自身的扎实和创新能力,高效的沟通和人才因素也至关重要。他举例说,团队在进行汇编层面的底层优化时,若在英伟达CUDA生态中,这类深度定制很难找到对口的技术支持,也查不到相关资料。但在与华为团队的沟通中,他们能便捷地联系到专家,并获得密切的技术协作,共同解决问题。
这种“拉扯”实际上是一种双向互动。对开发者和算力产业而言,发现问题并及时反馈是生态建设的基础;而收到反馈后能解决问题,则是生态发展的核心。尤其在AI时代,个性化的真实数据和反馈,是宝贵的资产和养料,也是AIGCode团队见证“荒漠”转变为“黑土地”的关键所在。如今,这支极客团队已深度参与到昇腾CANN生态的共创中,并成功交付了多个项目。他们还将MoE(混合专家模型)预训练的MFU(算力利用率)提升至65%,达到行业平均水平的两倍,实现了昇腾平台上“一张卡可以当两张卡用”的效果。
陈秋武认为,从可控性和发展速度角度看,CANN在某些方面已超越CUDA。业内也普遍认为,鲲鹏昇腾生态已跨过发展拐点,正在加速崛起。陈秋武表示,他仍然会频繁参与华为的技术闭门会议,并持续提出各种问题和建议,而华为的回应也一如既往地迅速。显然,这种“拉扯”远未画上句号。
AIGCode并非唯一一个“死磕”华为生态的团队。清华大学团队联合多家合作单位,利用鲲鹏服务器构建了“地球系统模拟器”。这些科学家极客将AI技术引入传统地球系统模拟中依赖经验公式估算的环节,成功将全球模拟分辨率提升至公里级,仅需一天计算,就能完成约一年模式时间的天气-气候演化模拟。中科大团队则基于鲲鹏平台进行算法创新,优化求解器,充分发挥鲲鹏张量运算部件和高带宽内存的优势,相比传统方法效率提升约40倍。
更引人注目的是,DeepSeek于今年4月底发布的V4模型,将中国算力生态与中国大模型的深度融合推向全球焦点。DeepSeek当时预告,“预计下半年昇腾950超节点批量上市后,V4 Pro的价格会大幅下调。” 5月22日晚,DeepSeek宣布其Pro版自6月起正式降至原价的四分之一,许多人猜测中国算力在此中发挥了关键作用。金融、能源、教育、交通等行业,正越来越多地在鲲鹏昇腾生态上落地AI能力,涵盖证券交易、水力发电、反诈拦截等广泛应用。
极客开发者们似乎找到了AI技术落地生根的沃土。有的开发者“戒断英伟达,用上国产卡”,惊喜地发现这片新天地带来的意外之喜;也有团队率先转向基于中国本土的生态,将其视作“秘密武器”。业内人士透露,在DeepSeek与昇腾深度适配之后,全球许多大型企业和机构都在“深入挖掘其中的奥秘”。
这其中,必然包含硬核的技术突破。例如,昇腾950芯片在HiF8新型数据格式、底层架构等方面的创新;鲲鹏CPU面向Agentic AI时代,在多核数、高性能、低时延等方面的针对性设计,尤其是让芯片能“集群作战”的超节点,为中国的算力发展注入了更多可能性。但另一方面,常被忽视的生态构建,同样举足轻重。
生态的“奥秘”看似繁复,实则核心在于两点:好用、易用。要实现“好用”,除了在硬件、软件以及软硬结合方面持续创新并提升性能外,更要充分考虑开发者的需求、偏好和实际使用体验。与华为有深度合作的中科大先进计算机系统结构实验室副研究员陈俊仕评价道,鲲鹏在高性能计算领域没有选择CPU+GPU异构路线,而是“另辟蹊径”走出一条独特的鲲鹏架构路线,其本质是“把复杂留给自己,把简单留给开发者”。
而“易用”,则意味着降低学习成本和迁移门槛,提高兼容性和便捷性。华为强调“硬件开放,软件开源”。CANN生态在2025年底全面开源开放后,短短五个月内,社区开源项目从零增至65个,开源代码量从827万行激增至1244万行,平均每天新增3万行,下载量突破千万。这意味着开发者在遇到问题时,大多能找到现成的解决方案,不必从头“造轮子”。清华大学团队的王一鸣提到,鲲鹏昇腾生态的代码迁移成本低,社区反馈及时丰富,“让科研人员的精力可以回归科研本身,而无需在适配和优化上反复耗时费力”。
好用、易用的特性,自然会吸引更多用户。而用户越多,AI的应用就会越完善。在技术革新、国际竞争和商业博弈充满不确定性的时代,对于那些致力于将自身热情、创意与价值落地的开发者而言,一个能够汇聚众智、持续滋养创造力的生态,无疑是一种确定性的保障。
生态的深远意义,还在于能成就超越个体能力和预期的成就。DeepSeek的高性价比让更多资金有限的团队也能接触AI;层出不穷的Agent技术,正在将数字员工和AI助理带入现实生活。AIGCode的氛围编程产品,让非技术背景的人群也能通过AI快速实现创意;清华大学团队的“地球系统模拟器”,则致力于为普通民众预警气候灾害。
鲲鹏、昇腾的生态建设中,频繁提到“使能”这一概念,即赋能合作伙伴。在AI高速发展的时代,智能技术可能引发“能力垄断”和“能力鸿沟”的担忧。唯有解决好智能的普惠问题,才能真正实现技术平权。那些致力于“降低AI价格”、让普通人也能编程应用、为社区居民预警灾害的极客们,正将自己的能量与生态的“使能”能力汇聚,传递给更多人。随着AI的落地和智能的普及,最终的繁荣才能属于所有人。
找到沃土的极客们,对未来抱有更大信心,他们都渴望“干一番大事业”。DeepSeek专注于实现通用人工智能(AGI);清华大学团队则致力于攻克气候建模领域的国际前沿难题;AIGCode则计划将AI编程推进到L5级别,在实现“一句话生成前端、后端、数据库”后,进一步探索更高复杂度的软件自动化生成。陈秋武也期望继续与华为“拉扯”,打通国内算力与自研模型的完整链路,让千行百业都能用上全栈自主创新的大模型。
华为自身也在“鲲鹏昇腾开发者大会2026”上透露,将在Agentic AI时代继续深耕超节点架构,打造易用高效的算力底座,共建繁荣共生的智能体时代算力新生态。可以预见,在这片充满活力的土地上,还将涌现更多令人瞩目的重大事件。
