定制 SSD 以提高性能、耐用性和功耗

作者 | 2022 年 4 月 18 日 | 全部, 企业

随着企业寻求提高当今数据中心的性能、效率和可靠性,他们越来越多地转向固态驱动器 (SSD),而不是硬盘驱动器 (HDD)。然而,找到适合其独特需求的 SSD 并不像某些人想象的那么简单。 SSD 有多种外形尺寸和配置,并且可以高度定制。

为特定应用定制 SSD 需要考虑很多因素。对于 SSD 方面最重要的方面,每家公司都有不同的优先级。一些企业需要最高水平的性能和最短的延迟,例如实时银行交易或处理大量机器学习数据集等应用程序。其他人优先考虑低功耗以节省能源,高耐用性以延长生命周期或成本效率以符合严格的预算。

由于 SSD 的硬件和软件设计选项多种多样,企业应首先确定其存储和服务器需求,然后寻找能够根据其具体要求提供 SSD 的供应商。

 

 

定制 SSD 以提高性能和耐用性

闪存类型、块分配和连接接口等因素会对 SSD 的性能产生很大影响。

提高性能而不产生任何负面副作用或对耐用性影响的最直接方法之一就是选择可用的最佳 NAND。并非所有 NAND 都是一样的,闪存供应商正在不断改进和升级其 NAND 产品以击败竞争对手。在购买之前做一些研究是值得的。 群联工程 团队与领先的 NAND 晶圆制造商合作。它在新的 NAND 技术发货前对其进行评估,然后验证 NAND 在存储产品中的使用。群联电子在 NAND 领域的专业知识可帮助客户选择最适合其存储应用的 NAND。

 

NVMe 与 SATA

SSD 连接到服务器主板的方式可以提高吞吐量,从而提高性能。当每个企业在数据中心使用硬盘时,最常见的连接接口是串行 ATA,即 SATA。该接口的最新版本 SATA III 的最大带宽吞吐量为每秒 600 兆字节 (MB/s)。 SAS 也很流行,但它也依赖于 SATA 物理接口。尽管 SAS 接口的速度是 SATA 的两倍,但物理盘片容量与 SATA 大致相同。

2011 年,随着 SSD 的普及,一种新的存储协议应运而生,称为非易失性内存 Express (NVMe)。它很快成为将 SSD 连接到主板的行业标准,因为它使用 PCI Express (PCIe) 3.0 总线,大约比 SATA 快六倍。这是因为 SSD 通常使用 x4 PCIe 通道,并且它们实现了 3500 MB/s 的吞吐量,而 2011 年为 600 MB/s。如今,相同的 x4 通道使用 Gen5 信号提供 14 GB/s 的吞吐量。与旋转盘片不同,数字 NAND 闪存可以支持完整的接口带宽。除了超快之外,NVMe PCIe SSD 还可以实现更短的数据访问和命令排队延迟。 NVMe SSD还具有出色的多任务处理能力。所有这些改进都会带来更高的性能。

 

 

记忆细胞类型

SSD 主要由闪存控制器和存储数据的 NAND 闪存单元组成。这些存储单元有多种配置,这些配置决定了它们的速度以及单元可以接受的数据位数。

    • 单层单元 (SLC) SSD 是最基本的配置。每个单元接受一位数据。 SLC SSD 的优势在于速度:它们是目前最快的 SSD。它们也是最可靠、最耐用的 SSD,而且毫不奇怪,也是最昂贵的。如今,全 SLC 配置专门用于电影行业、医学成像、高频交易和天基传感器平台等专业应用。
    • 多级单元 (MLC) SSD 每个单元接受两位数据。它们比 SLC SSD 慢,因为在一个单元中写入两位比写入一位需要更长的时间。它们的可靠性和耐用性也较差,因为更多的数据被写入单元上,并且随着时间的推移,存储单元会随着重复使用而退化。现在,这种配置已基本被弃用,取而代之的是 TLC 和 QLC。
    • 三级单元 (TLC) SSD 每个单元接受三位数据。作为当今最常见的企业级 SSD 类型,它们以比 SLC 更低的价格提供更大的容量。然而,其代价是速度、可靠性和耐用性降低。尽管 TLC 得到应有的重视,但它是所有企业存储的基准。 SLC 被认为是一种专用 NAND,而 QLC 用于成本优化或读取密集型应用。
    • 四级单元 (QLC) SSD 每个单元接受四位数据。虽然QLC NAND的价格定位低于TLC,但当前各代QLC的性能和耐用性均低于TLC。当前几代 QLC NAND 非常适合用于写入 I/O 极少的读取密集型应用。
    • 五级单元 (PLC) SSD 每个单元编码五位数据。虽然尚未投入商用,但 PLC SSD 将为每个 NAND 芯片提供更大的存储容量,并在零售层面提供更低的每 GB 成本,但与 QLC 或 TLC NAND 相比,性能和耐用性有所下降。 PLC NAND的实际应用是不常用的USB闪存驱动器或闪存卡,其性能与HDD大致一致。

所有这些存储单元类型面临的挑战是如何平衡客户应用对性能、可靠性和耐用性的需求。读取速度、写入速度、编程/擦除 (P/E) 循环、数据保留和有功功率等特性对其中每一项质量都有直接影响。

例如,当今主流企业存储主要使用 TLC NAND。相比之下,全 SLC NAND SSD 的制造成本要高出三倍,但可提供出色的低延迟性能。目标应用包括高频股票市场交易或写入量大的应用,例如用于录制好莱坞动作场景的 8K 视频无人机。 QLC NAND 的定价通常低于 TLC NAND,并且在同一 NAND 芯片中比 TLC 多提供 33% 的存储空间。 QLC NAND 非常适合数据密集型应用,例如石油勘探、开发新型喷气涡轮机或进行基因组研究。将 NAND 与应用相匹配只是必须考虑的因素之一,我们将在下面看到。

 

 

过度配置

NAND闪存不能像磁介质一样直接覆盖——必须先将仍然有效的旧数据移动到新块,然后才能擦除旧块并重新写入。收集仍然有效的数据的过程称为“垃圾收集”,尽管在这种情况下,它指的是清除旧的无效过时数据并收集有效的使用数据。与读取或写入操作相比,擦除块相当慢。如果处理不当,擦除操作会降低性能并显着延长延迟分布。通过提供用户无法直接寻址的备用容量来过度配置 (OP) SSD,可以让数据在写入新数据时有更多时间自然失效。这减少了垃圾收集开销和驱动器磨损,同时显着收紧了延迟分布曲线。拥有额外的 OP 允许系统执行编程/擦除周期,而不会中断或降低系统性能。

增加 OP 还可以提高稳态性能,降低写入放大系数 (WAF),并实际上提高 SSD 的耐用性。 OP 会降低用户容量,但这可以通过添加更多 NAND 来抵消,但不幸的是,这会增加成本和有功功率。

 

并行处理

HDD 仅具有一个或两个扫描臂,用于管理相对于介质的读/写头位置。尽管每个磁盘面都有一个专用磁头,但同一臂上的所有磁头必须查看每个磁盘面上的同一扇区,这极大地限制了随机性能。相比之下,4 TB SSD 有 64 个独立的 NAND 芯片,每个芯片有两到六个独立的平面。这意味着企业级 SSD 每 60 到 80 微秒可以同时处理多达 384 个 I/O 命令。这就是企业级 SSD 能够实现每秒 100 万到 200 万次 I/O (IOPS) 的原因,而 HDD 的每秒 IOPS 限制为 150 到 400 个。从这些数字来看,眨眼大约是 1/3 秒。

当考虑存储控制器设计时,还可以进行其他改进。典型的企业控制器将拥有六到八个大型处理核心,而群联设计则专注于 32 到 48 个微核心。尽管设计更复杂的处理器需要付出额外的努力,但它带来了一些好处,包括:额外的并行性、减少的延迟和提高的功率。

 

 

定制 SSD 的电源使用

当企业试图减少碳足迹时,数据中心提供了多种节省能源和降低成本的机会。一种选择是用更高效的 SSD 替换耗电的 HDD,尽管有些 SSD 比其他 SSD 更高效。除了简单地将旋转媒体替换为数字媒体之外,SSD 还可以通过多种其他方式进行定制以降低功耗。

基于 Phison E18 的客户端 SSD 具有积极的电源管理功能,可在笔记本电脑上玩高端游戏时提供高达 20% 的额外电池寿命。 Phison Enterprise X1 控制器使 SSD 具有业界领先的性能,同时降低了 30% 的功耗。

管理存储控制器功耗的一种策略是迁移到更小的处理节点。例如,将工艺节点尺寸从 28 纳米减小到 12 纳米,使节点能够以更低的电压工作在更高的频率下。通过使用更少的能量通过总线传输数据或切换晶体管,可以减少 SSD 的能耗。使用更少的功率意味着 SSD 产生更少的热量,从而减少晶体管漏电流。

降低功耗的另一种方法是减少 SSD 使用的 NAND 通道数。该功能是通过改进的 ONFI 总线速度实现的,该总线速度用于将数据从 NAND 移动到 SSD 控制器。现在,您不需要 8 或 16 个通道来使 Gen4 甚至 Gen5 PCIe 接口饱和。仅使用四个 NAND 通道就有可能使主机接口饱和。减少后端通道数会使 SSD 总功率降低 20 至 30%。

 

群联是SSD定制合作伙伴的首选

开发定制闪存解决方案(例如 SSD)需要大量的专业知识。聪明的企业会寻找拥有知识和专业知识的合作伙伴来创建定制组件。

自20年前生产出世界上第一个单芯片USB闪存控制器以来, 群联 不断发展和扩大其知识库。群联为其合作伙伴提供按需工程服务,并内部拥有 NAND 闪存控制器的所有关键 IP。凭借如此高水平的经验,该公司在为 OEM 客户和企业定制产品时提供了更大的灵活性。

 

加速创新的基础™

zh_CN简体中文