铠侠超高 IOPS SSD,为 AI 发展注入强劲动力!

现代 AI 已进入以生成式 AI 为核心的发展阶段,这类应用依托大语言模型,将原本由人类完成的智能决策与信息处理流程自动化。在 AI 与 GPU 协同的典型场景中,高带宽存储器(HBM)为 GPU 与高频访问数据提供高速连接通道,包括模型权重、LLM 键值(KV)缓存以及其他对实时性要求严苛的核心数据。在实际部署环境下,HBM 可用容量直接决定系统能否满足多任务需求,例如可支持的模型规模上限、模型可处理的上下文窗口长度,或是可同时支持的用户数。随着 GPU 与 AI 应用在未来持续高速增长,加之 HBM 在现代 AI/GPU 工作流中的核心地位,对 HBM 容量的需求必将持续攀升。但现阶段 HBM 在直接扩容与宽带升级上面临成本与可扩展性双重瓶颈,因此亟需通过技术创新来化解这些困局。

AI 服务器现状与挑战

铠侠创新:面向 GPU 及 AI 应用的下一代 SSD 解决方案

铠侠敏锐洞察到,SSD 在缓解 GPU 与 AI 应用面临的 HBM 容量压力方面蕴藏巨大潜力。大加速器内存,即 Big Accelerator Memory(BaM)等开源项目已开辟出一条全新的扩展路径,支持 GPU 与 SSD 之间直接进行数据访问,为 GPU 级速率的数据传输奠定了基础。从存储层面来看,要想紧跟 GPU 发展节奏,充分利用这一创新能力,亟需一款专为极致 IOPS 打造的 SSD,尤其需要在极小数据块场景下实现单盘性能的突破性提升。每秒输入/输出操作次数(IOPS)反映了存储设备的随机读写效率,是衡量其性能表现的核心基准。

超高 IOPS SSD 震撼亮相 FMS 2025

在加利福尼亚州圣克拉拉举办的 2025 未来内存与存储峰会主题演讲中,铠侠正式发布重磅预告:一款超高 IOPS SSD 即将面世,其 512B 小数据块随机读取性能可突破 1 亿 IOPS。铠侠现场展示了该款超高 IOPS SSD 在模拟环境下的基准测试数据,验证了其基于 BaM 架构实现 1 亿 IOPS 性能目标的可行性,为后续产品化奠定了坚实基础。这一性能突破使 SSD 得以有效分担原本仅由 HBM 承载的高频访问负载,从而构建起可依托大容量、高性能 GPU 直连存储池的全新架构。与此同时,行业正协同推动 BaM 技术持续演进。一项名为"NVIDIA  Storage-Next™"、旨在将 NVMe™ SSD 深度集成至 GPU I/O 链路的解决方案也在加速落地。铠侠正全力推进 SSD 研发,使其全面适配 NVIDIA  Storage-Next 技术规划。

铠侠通往 1 亿 IOPS 之路

因市场对灵活且价格实惠的存储级内存(Storage Class Memory, SCM)解决方案的需求日益增长,铠侠开发了一种具有极低延迟、高性能特性的闪存 XL-FLASH。XL-FLASH 设计用于填补易失性存储器(如 DRAM)和当前闪存之间存在的性能缺口。

解读 1 亿 IOPS 的惊人数字

面向消费级市场的主流高性能 NVMe™ SSD,其 IOPS 水平通常在数十万级别。即便是用于数据中心的顶尖企业级 SSD,峰值性能也仅能达到约 600 万 IOPS,两相对比之下,“1 亿”这个数字更显震撼与非凡。

而当下为何迫切需要如此极致的存储性能? 答案正是 AI,尤其是 AI 推理阶段所产生的工作负载。在这一阶段,系统需利用已训练模型执行图像识别、文本生成等任务。这就要求存储设备能够以随机无序的方式,从海量数据集中极速读取并处理海量微小数据块。

数据存储与存储技术,已经对生成式 AI 发展愈发关键。铠侠长期投入高容量存储,如 SSD、闪存,AI系统核心组件,与创新开源技术,如 KIOXIA AiSAQ™ 的研发,以推动 AI 发展。

缓解 GPU 饥饿困境

解决这一问题的核心并非大文件的顺序读取性能,而是随机访问速度。换言之,IOPS 直接决定了系统的响应灵敏度。现代 AI 服务器虽配备大量昂贵的 GPU,可一旦负责数据传输的存储设备性能不足,GPU 算力便无法充分释放。这种情形称为“GPU 饥饿”现象,会严重拖累整个 AI 基础设施的运行效率。而铠侠推出的 1 亿 IOPS 级 SSD,正是破解 GPU 饥饿困境、充分释放 AI 系统潜能的关键解决方案。

交付极致性能的下一代 SSD

KIOXIA GP 系列

铠侠将这款超高 IOPS SSD 产品命名为“KIOXIA GP 系列”。该系列初代产品基于 PCIe® 6.0 标准研发,第二代产品则瞄准 PCIe® 7.0 标准布局,以实现 1 亿 IOPS 的性能里程碑为目标。 

KIOXIA GP 系列

塑造未来 AI 的创新力量

铠侠已在这场备受瞩目的产品研发进程中,成功实现首个里程碑——推出 1 亿 IOPS 仿真器。该仿真器界面实时呈现了当前 GPU I/O 的运行表现:左侧传统 SSD 的性能约为 1300 万 IOPS,而模拟的超高 IOPS SSD(左起第三张图)性能则一举突破 1.07 亿 IOPS。凭借该技术,开发者可提前接触这款下一代存储设备,提前完成软件栈适配与优化,从而充分释放超高 IOPS SSD 带来的前所未有的速度潜力。铠侠计划于 2026 年末启动 KIOXIA GP 系列初代产品的样品交付,并于 2027 年内推出第二代产品。

模拟器实测结果验证了超高 IOPS SSD 的性能优势
  • 产品图片可能代表一种设计模型。
  • 产品发布计划基于截至 2026 年 4 月的信息,产品规格及日程如有更改,恕不另行通知。
  • 实际读写速度可能因主机设备、读写条件和文件大小的不同而不同。
  • NVMe是NVM Express, Inc.在美国和其他国家的注册或未注册商标。
  • NVIDIA  Storage-Next 是 NVIDIA Corporation 在美国及其他国家/地区的商标和/或注册商标。
  • PCIe是PCI-SIG公司的注册商标。
  • 其他公司名称、产品名称和服务名称可能是第三方公司的商标。