← 返回新闻列表

“千衍”项目揭示AI时代关键瓶颈:存储能力成高性能计算核心

“千衍”超大规模宇宙学模拟项目成功完成后,引发了业界对高性能计算与AI领域技术瓶颈的深入探讨。专家指出,存储正从辅助角色跃升为决定系统性能的关键要素,尤其在算力飞速增长的背景下,数据处理与传输效率已成为制约整体效能的现实挑战,预示着存算一体化将成为未来发展的核心方向。

文 / 编辑部 · 2026/05/28 · 阅读约 7 分钟

分享:
“千衍”项目揭示AI时代关键瓶颈:存储能力成高性能计算核心

“千衍”超大规模宇宙学模拟项目自完成至今已逾一月,其引发的技术讨论持续发酵。核心观点聚焦于一个重要的技术命题:在高性能计算与人工智能领域,存储正逐步从辅助地位转变为决定系统性能的瓶颈与关键支柱。

“千衍”项目于今年4月正式公布,其本质在于利用超级计算机模拟宇宙演化。该项目追踪了多达4.2万亿个暗物质粒子,在120亿光年的广阔空间尺度上,成功再现了宇宙长达百亿年的演变历程,旨在深化科学家对暗物质与暗能量的理解。

针对此项目,我们与负责人王乔研究员以及中科曙光高级副总裁李斌进行了深入交流。他们的观点不谋而合,强调存算一体化已非单纯的理论构想,而是当前突破算力限制所必须面对的现实课题。

存储能力是否已无法匹配计算的强大?在“千衍”项目中,研究团队曾进行一项计算实验:生成13PB的数据,模拟120亿光年宇宙尺度下4.2万亿暗物质质点长达百亿年的演化过程。

项目负责人王乔回忆,团队最初曾尝试利用国际成熟软件在超级计算机上运行,但长达两年的测试却未能使其成功启动。究其原因,支撑该项目不仅需要极致的算力,更需与之匹配的高性能存储系统,以承载模拟过程中产生的天文数字般的数据。

作为“千衍”项目从零到一的亲历者,王乔分享了项目发展历程中的艰辛。他表示,团队起初倾向于使用国际成熟软件在超算上运行,认为“找个成熟的软件拿过来放心”。然而,经过两年测试,发现“根本就跑不起来,整个事情就走不下去了。”王乔坦言,从其他超算转换到曙光架构的背后,是无数次通宵达旦的问题排查、调试及代码重构。

为何其他超算最终未能承担“千衍”项目的重任?关键并非算力规模,而是架构匹配度。项目初期使用的超算采用主从核架构,其优势在于规模宏大、算力强劲,但致命弱点在于内存偏小——这与“千衍”项目对内存的巨大需求形成了尖锐矛盾。“我们的模拟需要同时处理海量演化数据,这些数据首先要能‘装得下’,才能‘算得动’。”王乔指出。而曙光的大内存架构恰好契合了天文模拟的要求。最终,“千衍”项目在中科院网络中心的东方超算上,通过亿级CPU核时与千万加速卡时的协同,顺利完成了模拟计算。

“千衍”项目的经验揭示了高性能计算领域的当前技术趋势:在当今的AI与科学计算中,性能瓶颈正从计算单元本身转向存储与数据搬运环节。这种转变并非渐进式,而是结构性的。王乔团队遇到的直接障碍是,尽管GPU和CPU的计算能力持续提升,但数据的读取、写入及传输效率却阻碍了整个计算链条的顺畅运行。“在存储这一块、数据这一块是一个非常重要的事儿,之前大家关注得并没有那么多,”王乔坦言,“但它必须是在一个高速存储上面,否则就处理不完了,我们实际上需要一个非常快的处理方式才能解决。”

这仅仅是行业现状的一个缩影。当前,无论是高性能计算还是智算领域,普遍面临一个困境,即“计算核心越来越强大,但数据搬不动了”。美国德克萨斯大学奥斯丁分校教授Mike Boylan-Kolchin称赞“千衍”为一项“计算奇迹”,德国马克斯·普朗克天体物理研究所所长Volker Springel则认为它“刷新了当前数值宇宙学的发展极限”。在这些赞誉的背后,真正支撑起这一奇迹的,正是一套能够将存储性能推至极限的高端全闪存储系统。

为何存储能力有望成为终极制高点?像天文研究这样对计算有极端要求的案例并非孤例。当中国分布式存储市场规模预计在2025年首次超越集中式存储,达到198.2亿元,同比增长43.7%时,全闪存存储的占比已提升至24.1%,成为市场增长的核心驱动力。全球超算市场也将于2026年突破186.7亿美元,以19.3%的年复合增长率扩张。这个高速增长的市场,正在催生一种全新的技术理念——存算一体化不再局限于实验室的纸上谈兵,而是成为决定产业落地的核心命题。

在AI产业的另一面,同样的存储与计算张力正以更为激进的姿态上演。当大型模型服务需要每日处理数百TB甚至PB级的KV缓存数据时,数据搬运本身产生的能耗和延迟已使得传统架构捉襟见肘。郑纬民院士在吉林大学的讲座中明确指出,每个token对应的KV-Cache可达数十KB,大规模服务中每日需要处理数百TB甚至PB级的缓存数据,这对存储系统和传输速度提出了极高的要求。

在这种背景下,“以存储换计算”的思路开始进入主流视野:将KV cache从GPU显存卸载到存储介质,通过存储系统的卓越性能来提升计算效率。这与“千衍”项目中王乔团队对存储性能的极致追求,实则是在技术层面体现了同一个命题的两面——数据搬运困难时,存储必须承担重任。

这正是近年来众多存储厂商积极布局“存算一体”的根本原因。存算一体的核心要义在于打破计算与存储间的藩篱,实现数据“就近计算、高效流转”,从而解决传统高性能计算架构中“算力闲置、存储拥堵”的痛点。如果将算力比作AI时代的引擎,那么存储能力便是驱动这颗引擎的燃油系统。引擎马力再强劲,若燃油无法有效供给,一切都将是徒劳。

对于“千衍”这类超大规模科研项目而言,存算协同不仅是提高运算效率的关键,更是实现项目目标的前提。

与此同时,中科曙光高级副总裁李斌提出了一个引人深思的判断:“现在人工智能兴起之后,对存储系统本身提出了极高要求,但另一方面也可能重塑未来存储的一些发展技术方向。”这句话的潜台词是:AI对存储所带来的变革,不仅仅是锦上添花,更是从根本上改变了其定位与需求。

存储行业价值的跃升,在更宏观的产业层面体现得更为直观。从2025年第二季度开始,全球存储芯片价格开启了一轮罕见的超级周期。TrendForce数据显示,2025年第四季度DRAM合约价较去年同期已上涨逾75%。进入2026年,涨价势头未见缓解——到2026年,全球生产的DRAM中高达70%将被数据中心消耗,到2028年的产能已被预订完毕。支撑这场超级周期的,不仅仅是产能不足的传统逻辑,更是AI训练和推理对内存和存储的结构性需求。存储正从一个由产能周期驱动的周期性行业,转变为一个由AI需求增长驱动的长期成长型行业。

更深层次的变革源于存储“角色升级”。在传统计算架构中,存储是被动的数据容器,CPU一旦发出“给我数据”的指令,它便取出数据并传递过去。但在AI驱动的计算范式中,存储正从“容器”升级为“数据引擎”。这意味着,在未来的AI推理架构中,存储将不仅仅是数据的守护者,更将作为计算过程的积极参与者,需要具备主动理解数据语义、主动优化数据布局、主动配合算力调度的能力。

这正是存算一体的本质所在。它并非在芯片层面将计算与存储合二为一,而是在系统架构层面,实现计算与存储两个环节从前端到后端深度协同。在“千衍”项目中,这种协同以另一种形式展现:计算系统负责模拟数万亿个粒子的引力演化,而存储系统则保障海量数据的高效写入与读取,两者之间的数据传输被优化到了极致。

高性能存储已成为必备品。“千衍”项目的成功,不仅标志着一个科研项目的突破,更预示着高性能计算领域已迈入高性能存储时代。

高性能计算领域对存算一体的需求,已从“基础协同”升级至“深度融合”。传统的存算协同更多是实现存储与算力的硬件适配,而未来的存算一体将实现软件与硬件的深度融合,存储系统不仅能提供数据存储和读写服务,还能承担部分计算任务,实现“存储即计算”。“千衍”项目的实践,已为这种深度融合提供了很好的范例——曙光的存储系统通过支持KV cache远端卸载、原生KV语义等技术,承担了部分AI推理过程中的计算任务,减轻了GPU的显存压力,提升了整个系统的运算效率。

对此,李斌表示:“AI时代的高性能计算,是一个算力、存储能力、网络高度紧耦合的系统。存算一体的核心,就是打破原有技术边界,实现有机协同。”

从趋势上看,国内存储行业主要呈现三大趋势:一是高性能化,随着科研场景的不断升级,存储系统的读写速度和容量上限将持续提升,以满足PB级、EB级数据的存储与处理需求;二是智能化,存储系统将引入AI技术,实现数据的智能管理、智能调度和智能优化,从而提高系统的运行效率和可靠性;三是国产化,随着国产替代进程的加速推进,高性能存储的核心部件和软件系统将逐步实现自主可控,构建完整的国产生态。

“千衍”项目的下一步发展也符合这一方向。王乔介绍,丰富模拟的物理内容,并引入AI优化算法、挖掘数据将成为“千衍”未来的发展方向,“AI4S是未来科研的重要方向”。

如果说“千衍”是对存算极限的一次极端测试,那么AI产业对存储能力的渴求则是更广泛的压力测试。存储,正从算力竞赛的“后勤部门”升级为“战略前线”。

广告位 · 文末横幅