PCIe Gen6相较Gen5带宽翻倍,并非单纯提升频率,而是引入两项关键技术:
PAM4(四电平脉冲幅度调制)
FLIT(Flow Control Unit)传输机制
Gen5采用NRZ编码,每周期传输1bit;Gen6通过PAM4在相同周期内传输2bit,在频率基本不变的情况下实现吞吐翻倍。这意味着技术重心从“频率提升”转向“编码效率提升”。
但PAM4信号容错空间更小,因此Gen6同步引入:
前向纠错(FEC)
更复杂的链路训练与误码控制
结果是:接口更快,但控制器与PHY设计难度显著提高。
PCIe Gen6单通道速率为64GT/s,x4通道合计256GT/s,理论双向带宽可达128GB/s。
然而,SSD实际性能受限于:
NAND并行度
控制器调度能力
缓存架构
协议栈开销
美光9650实现28GB/s顺序读取,已经逼近当前闪存阵列架构的物理极限。这说明接口带宽不再是唯一瓶颈,性能天花板开始转向闪存内部结构与调度算法。
9650采用NVMe 2.0协议,其核心价值在于高并发调度能力:
更高队列数量与深度
多路径优化
命名空间扩展
支持ZNS等高级特性
5.5M IOPS随机读取性能,在4K读场景下意味着每秒可完成550万次访问请求。这种能力对于以下场景尤为关键:
分布式数据库
KV存储系统
AI数据预处理
高频交易系统
高IOPS背后依赖的不是接口带宽,而是:
FTL映射算法优化
DRAM缓存管理
读写合并策略
内部通道调度能力
协议优化与硬件并行协同,才是IOPS突破的根本。
美光9650搭载第九代G9 NAND,采用六平面(Six-Plane)架构。
传统NAND常见2或4 plane设计,而六平面意味着:
单Die内部并行度显著提升
IO速率达到3.6GB/s(当前市售最高水平)
性能模型可理解为:
SSD吞吐 ≈ 通道数量 × Die数量 × 单Die IO速率
六平面设计提高内部交叉访问效率,使顺序与随机性能同时提升。这也是28GB/s能够实现的重要底层支撑。
美光采用垂直整合模式,涵盖:
NAND制造
控制器优化
固件算法开发
优势体现在:
降低协议转换开销
精准控制写放大
优化垃圾回收
提高耐久度管理能力
尤其在MAX版本支持3 DWPD(每日3次全盘写入)场景下,写放大控制与寿命管理至关重要。垂直整合使性能、寿命与稳定性形成协同优化,而非单点突破。
在AI训练中,GPU计算效率高度依赖数据供给速度。
若存储侧吞吐不足,会导致:
GPU空闲等待
集群利用率下降
单位训练成本上升
理论关系可表达为:
GPU利用率 ≈ 数据供给速率 / 模型计算需求
当SSD吞吐提升至28GB/s级别,可显著降低I/O等待时间,提高GPU整体利用率。
因此,Gen6 SSD并非“锦上添花”,而是AI集群的效率保障。
9650在能效方面最高提升2倍,这在数据中心具有重要意义。
数据中心成本构成中,电力与散热占比极高。若单位性能功耗降低,可带来:
更低PUE压力
更低冷却成本
更高机架密度部署能力
E1.S规格支持液冷方案,意味着其设计目标面向高密度AI服务器集群,而非传统通用服务器。
性能与能效并举,是新一代存储架构的核心趋势。
这一现象体现技术演进的分层节奏:
消费级需求尚未饱和Gen5
AI与HPC已逼近Gen5上限
技术升级的驱动力来自算力需求,而非消费者日常应用。
数据中心通常领先消费市场1–2代接口标准。Gen6率先量产,是算力驱动逻辑的自然结果。
尽管9650实现量产,但Gen6生态仍面临挑战:
CPU与主板支持尚未全面成熟
控制器复杂度与成本较高
信号完整性设计难度增加
服务器整机平台适配需要时间
短期内Gen6主要面向:
AI超算集群
云计算核心节点
高端数据库场景
长期来看,随着平台升级与成本下降,Gen6将逐步扩展至更广泛企业级市场。
美光9650的核心意义在于:
接口编码机制革新(PAM4)
协议层并发优化(NVMe 2.0)
闪存微结构升级(G9六平面)
系统级能效提升
AI负载深度适配
它标志着SSD从“容量扩张时代”进入“带宽竞争时代”。
在算力文明的演进过程中,存储已不再是沉默的后台,而是决定效率与成本的关键枢纽。当数据流动速度决定算力释放程度时,每一次I/O架构升级,都是基础设施的再一次重构。
PCIe Gen6的量产,不仅是行业纪录的刷新,更是算力时代底层秩序的一次重塑。