视频:SSD 控制器技术的未来 – PCIe Gen5 及更高版本概览

微星与群联CTO直播对话

作者 | 2022 年 1 月 17 日 | 全部, 消费者, 游戏, PCIe 第 5 代, 视频

2021年11月,微星采访了群联科技首席技术官Sebastien Jean,以了解更多关于SSD的未来 赌博 特别是关于群联在其新的 M.2 PCIe Gen5 卡上所做的工作。热烈的对话涵盖了从 SSD 控制器设计、性能改进和热管理到供应链挑战以及 Gen5、Gen6 及更高版本的最佳用例等方方面面。

我们整理了以下一些亮点。享受。

 

MSI:让我们从基础开始。什么是存储控制器以及它在 SSD 中的功能是什么?

塞巴斯蒂安: SSD 通常由三个主要部分组成:控制器、高速缓存(速度非常快的内存)以及 3D NAND 闪存本身(所有数据最终存储在其中)。

SSD 控制器有多个组件。第一个是处理元件(Phison 通常使用 ARM Cortex-R5)。如果你仔细想想,SSD 本质上是一个管道处理单元。这就像一条装配线。当你收到命令时,你首先必须对其进行解码,了解它是什么,然后开始做出决定。该装配线的每个部分都会在非常短的时间内(几分之一微秒)查看命令。根据 SSD 中 NAND 的数量,您可以拥有 20 到 3 或 400 个并行点。当您使用真正先进的企业级 SSD 驱动器时,您需要深度队列来让它们保持忙碌,以充分发挥 1、2 或 300 万 IOPS 的潜力。

控制器的下一个组件称为 ECC(纠错码)引擎,用于纠正 NAND 上的错误。 NAND 会受到热量和时间的影响,因此位可能会开始翻转。群联已经开发出非常强大的 EEC发动机 纠正所有这些自然发生的错误,这是任何 SSD 驱动器的基本要求。

 

MSI:那么,ECC 不在闪存本身上吗?

塞巴斯蒂安: 编码并附加到数据的 ECC 位位于闪存上,但闪存本身不具备处理它们的能力,这会使闪存过于昂贵。因此,ECC 单元内置于存储控制器中。存储控制器具有 SRAM(一个或多个 CPU 微核)以及 ECC、密码学等加速器以及其他类似功能。

 

MSI:您提到使用 ARM R5 处理器。如果您升级到更快的速度,这会对性能有所帮助吗?

塞巴斯蒂安: 用更大的内核替换内核并不一定会提高性能。更大的核心具有更大的硅面积,这使得芯片和 SSD 整体上更加昂贵。因此,从根本上来说,当您构建 SSD 时,您希望将其视为基于其所服务的工作负载或应用程序的平衡行为。例如,您可以制作具有四个非常大的核心的 SSD,也可以构建具有许多较小核心的 SSD。在 SSD 中拥有多个处理器的优点是,您不必用自己的一小部分时间来运行每个进程并进行大量调度。对于 PC 上的 CPU 来说这可能没问题,但对于 SSD 来说就浪费了开销。因此,正如我之前所说,我们有 20 个核心的多个并行点,每个核心执行一项小工作,从而推动为命令提供服务的工作。

 

MSI:我们今天讨论的是你们的旗舰型号之一,PCIe Gen4,速度可达 7 GB/s。您的控制器采用 12 纳米制成。如果采用 10 纳米甚至 7 纳米,能否获得更高的吞吐量?

塞巴斯蒂安: 是和不是。 Phison 针对特定带宽和 IOPS 目标生产 SSD 控制器,因此我们的一些中级控制器可能设计为 5 GB/s,而更高级的控制器则设计为 7 GB/s。采用更新、更快的工艺节点并不一定是正确的选择。同样,这取决于应用程序和我们想要做什么。从根本上来说,归结为以合理的价格提供最好的技术的平衡。

但要回答您的问题,切换流程节点将为您做一些事情。芯片会变得更小,但是在这种特殊情况下我们没有尺寸限制。它允许您将内部频率设置得更快一些,但我们不需要更快地满足当前的性能节点。它确实减少了泄漏。所有硅晶体管都会泄漏一点电流,即使您没有切换,因此采用更小的工艺节点会对此有很大帮助。相反,如果您跳上最新的工艺节点,而您并不真正需要它,那么您所做的只是购买成本,这会使您的 SSD 更加昂贵,而没有任何额外好处。如果您要制造运行频率为 2 GHz 的 CPU(使用少量大/快速内核时通常会出现这种情况),那么您需要最新的工艺节点。对于 SSD,进步并不总是与最新的工艺节点有关。这是关于智能设计,例如通过并行性来解决问题并降低频率。您可能会过早地跳到最新的工艺节点,而无法推进您的技术。

 

微星:如果使用DDR4或DDR5内存,M.2 SSD性能会提高吗?

塞巴斯蒂安: 群联生产 DRAM 和无 DRAM 的 SSD,但使用 DRAM 的 SSD 极力不使用 DDR 内存。快速路径实际上并不经过 DDR;它先经过 SRAM,然后经过数据路径。 DDR用于逻辑到物理地址转换,因此实际的表带宽要求小于SSD带宽,因此DDR4或DDR5没有太大区别。很长一段时间以来,我们都对 DDR3 感到满意。我们当前的型号使用 DDR4,我们正在开发的型号正在转向 DDR5。在某种程度上,为了降低成本,采用主导工艺节点是有意义的。如果你在旧节点上停留太久并且供应量下降,价格就会上涨。

 

MSI:E16,您的第一个 PCIe Gen4 控制器,是向前迈出的一大步。然后你介绍了E18。这是计划还是 E18 控制器的引入是为了解决技术挑战,以真正从 SSD 中获得这些速度?

塞巴斯蒂安: 这是一个有趣的问题。这俩 E16E18 被计划了。我们当时试图做的是满足上市时间要求。 Gen4当时还是一个很大的问号。我们在产品上市之前很久就与 CPU 供应商进行了交谈,他们总是在启用新技术,这些新技术可能会或可能不会在他们的下一个产品中启用,即使它可能在芯片中。所以,业内对于是否开启Gen4存在很多疑问。当我们得到 AMD(第一个将 Gen4 推向市场的产品)已致力于 Gen4 的积极确认时,我们承诺并将 E16 推向市场,以与平台发布同时进行。我们不仅是第一个向市场推出 Gen4 SSD 的公司,而且在大约 18 个月的时间里,我们是客户端领域市场上唯一的 Gen4 SSD。当我们的竞争对手推出第一代 Gen4 产品时,我们已经发布了第二代产品。所以,是的,E18 正在使接口饱和,这在很大程度上要归功于我们从 E16 中学到的所有经验教训,E16 是我们在该领域的第一个 ASIC。

 

MSI:你几乎已经触及了 Gen4 的能力极限。是否有任何改进的空间,例如,您是否正在研究 IOPS 性能等领域?

塞巴斯蒂安: 您始终可以提高 IOPS,但这会直接影响 ASIC 成本。在 E18 所在的客户领域,当前一代正是它所需要的。我们可以将 IOPS 加倍,但我不确定平台是否可以利用它。我们几乎已经接近 Gen4 的原始速度限制,但还有其他方法可以优化,也许仍然可以从中获得更多。

 

MSI:这是否意味着将会有E19?

塞巴斯蒂安: 有 E19,但它的目标是无 DRAM 的空间,该空间更注重价值而不是性能。从游戏玩家的角度来看,我想你想问的是会有E18 plus还是super Turbo?简而言之,答案是否定的——第四代技术的可能性已经饱和。但是,我们将继续利用 E18 和 Gen4 将该技术渗透到其他泳道中。由于 E19 的目标是降低成本,因此它不会使接口饱和。因此,刷新将增加更多 GB/s 并提高 IOPS。因此,随着我们继续从 12 纳米过渡到下一个工艺节点(7 纳米),在该领域仍有发展空间。

 

MSI:您认为直接存储会加速 Gen4 市场的发展吗?

塞巴斯蒂安: 我认为它总体上加速了计算,尤其是在客户端领域。从根本上来说,直接存储是一种绕过 NTFS 层的只读接口。 NTFS 是 Windows 的标准文件系统,注重可靠性,并且已经存在很长时间了。它内部有很多层,每一层都会增加一点延迟。直接存储的作用是为您提供通往 SSD 的直接管道,并尽可能少地进行处理。操作系统增加了尽可能少的延迟,并且它是一个只读接口。因此,需要快速 I/O 的只读工作负载(主要是客户端空间中的游戏)将受益于直接存储。这种低延迟管道本质上是游戏、手机、平板电脑和个人电脑的计算所在。

 

MSI:群联科技在这些新技术上的研发工作提前了多久?

塞巴斯蒂安: SSD 本身需要六到十八个月的时间,具体取决于我们对其内部进行的更改程度。但是,在 ASIC 真正成为产品之前,实现下一个硅工艺节点的技术通常需要两到三年的时间。因此,我们非常了解 Gen6,并且已经开始设计支持 Gen6 SSD 的低级组件,但让我谈谈为什么从计算角度来看 Gen5 如此有趣。

DDR4 2133 每个通道大约为 14 GB/s,游戏 PC 有四到六个通道。现在,有了 Gen5x4,我们就有了 14 GB SSD。确实,下一代主板上现在有更快的 DDR4 和 DDR5,但这并不是重点。我们现在可以将 SSD 存储和 DRAM 相提并论,在同一空间中运行。 SSD 永远不会取代 DRAM,因为 DRAM 针对 64 位 I/O 进行了优化 – 它具有超低延迟。但是,如果从缓存的角度来看,CPU 具有 L1、L2、L3 RAM 缓存,而 Gen5 SSD 可以以与 DDR 相同的速度作为 L4 缓存运行。因此,现在 SSD 的自然粒度与 CPU 的缓存架构相一致,这就是开始改变计算机总体工作方式的地方。

 

MSI:太棒了。您认为这些新产品未来面临的最大挑战是什么?

塞巴斯蒂安: 随着每一代产品的速度不断提高,我们的挑战将继续是控制热量。但如果你看看 PC 的发展方向这一更大的问题,客户端领域的一种认识是,M.2 PCIe Gen5 正在达到其发展方向的极限,实际接口或连接器将成为 PC 发展的瓶颈。未来的速度。因此,新的连接器正在开发中,并将在未来几年内上市,这将大大提高 SSD 通过传导到主板的信号完整性和散热能力。

 

MSI:供应链问题呢?我们尤其看到显卡的短缺,但许多其他组件和材料也出现短缺。这对群联和你们产品的一致性有何影响?

塞巴斯蒂安: 全球供应链的各种短缺并没有真正影响群联电子。 SSD 有一些特别独特的组件。其中包括控制器,可能包括 DRAM、NAND 和电源管理 IC (PMIC)。其他一切都是分立的——电容器和电阻器——而且不乏这些。对于NAND和DRAM,群联有长期供应协议,我们预先采购它们以始终有库存。 PMIC供应短缺实际上是许多制造商的问题,但我们自己制造。当群联开发新的SSD控制器时,我们也同时设计PMIC并制造两者。

我们从大量交易中受益。大约 20 年前,群联刚成立时,我们只是一家普及 USB 拇指驱动器的小公司。如今,我们提供各种类型的存储,从医疗、工业、运输、航空航天、游戏、工作站和企业解决方案到手机、汽车和物联网中的嵌入式存储。正因为如此,我们的交易量非常大。因此,只要我们继续提前做好预测并管理关键组件的库存,就不会出现问题。

 

MSI:它会始终保持平衡,还是您认为存储的未来会更加关注容量而不是速度和容量?

塞巴斯蒂安: 行业中的一切都在朝着更高密度、更高速度的方向发展。客户空间可能会保持平衡,优质产品的速度和密度都会提高,这有点沿着我们过去几年看到的技术曲线。但群联为各种市场的各种不同专业应用生产 SSD。我们拥有超高密度 16 TB QLC SSD,在高性能计算市场(从事数据库分析、人工智能/机器学习、基因组学和其他大数据科学研究工作的人们)中非常受欢迎。然后,我们拥有全 SLC SSD,对于执行写入密集型工作负载或需要稳态性能的人来说非常有用,以便您可以爆发和维持相同的性能。在消费领域,我们将专注于平衡,偏向于游戏的密度和性能。对于价值市场和中等市场,需要在成本和特定工作负载需求之间进行权衡,因为如果您使用的只是浏览器,则不需要疯狂的性能。

 

MSI:对于游戏来说,似乎大多数 SSD 都选择了带有 SLC 缓存的 TLC 内存。但如果您想在相同的物理芯片尺寸内获得更大的容量,是否必须采用 QLC?

塞巴斯蒂安: 不好了。我们现在可以制作最大8TB的M.2格式的TLC SSD和最大16TB的U.2格式的SSD,但是16TB的SSD相当昂贵。

 

MSI:游戏的尺寸不断增加,您需要下载大量的高清纹理和其他数据。我们开始看到 8 TB 和 16 TB TLC M.2 变得更便宜只是时间问题吗?

塞巴斯蒂安: 是的,它们肯定会变得更加便宜,因为 NAND 供应商总是在增加芯片的密度以降低成本。所以,TLC还会继续有生命力。但 QLC 在非游戏应用中变得非常有趣。你可以在QLC SSD上玩游戏,因为流量主要是读,而QLC擅长读。它只是不擅长写入,速度要慢得多。但我想说,密度将继续上升。价格将继续下降。成本与密度的最佳点正在上升:上一代是 1 TB。下一代将是 2 TB,再往后的三四代将是 4 TB。因此,对于除游戏之外的任何应用程序,您可能会看到更多的 QLC,因为大多数人使用驱动器所做的就是读取数据 - 您编写一次 Windows 操作系统,然后从它启动无数次。当然,有补丁并且它们会进入,但速度没有那么高。

加速创新的基础™

zh_CN简体中文