存儲審查 最近與群聯首席技術官 Sebastien Jean 坐下來討論 PCIe Gen5。雖然完整的討論範圍從最近的 NAND 發展到供應鏈挑戰,再到管理熱量、ZNS 的優勢以及內部開發 PHY,以下是經過編輯的摘錄,重點介紹 Gen5 SSD 控制器的優勢以及如何 群聯 作為一家公司,發展成為 SSD 性能的主要參與者。
StorageReview:群聯不僅僅是一家控制公司,對嗎?
塞巴斯蒂安: 實際上,群聯電子 (Phison) 是在大約 20 年前成立的,是最早生產 USB 驅動器的公司之一,從那時起我們就不斷發展壯大,並擴展到存儲設備市場的幾乎每個領域。這包括 USB、SATA 或 NVMe,以及現有的各種卡格式:SD、Micro SD 等。我們還生產工業設備,並在醫療、航空航天和汽車領域提供解決方案。但我們最初是一家生產控制器和我們所說的模塊(即功能齊全的 SSD)的小公司。
直到 E16,我們的客戶正在推動 SSD 的要求,而我們則按照規格進行設計。但當我們過渡到 E16 時,我們意識到我們要么可以生產模仿產品,要么可以成為一家科技公司。這就是拐點發生的地方。我們決定,作為一家公司,我們希望成為領導者。這是我們的首席執行官和總裁有意識的決定。他們確定了我們要脫穎而出並繼續發展的方法是觀察趨勢,然後達到那個高標準,並努力按時、按成本達到目標。這是觀念上的微妙轉變,卻在整個公司掀起了波瀾。
現在我們已經成長為一家$16億的科技公司。所以我們不再認為自己是一家控制器公司,也不再認為自己是一家SSD公司。我們認為自己是一家專注於擁有下一代尖端 NAND 存儲技術的公司。我們仍然根據客戶的規格進行設計,但我們需要準備好技術來幫助他們將產品按時推向市場。
StorageReview:有時您會與三星、西部數據 (WD)、英特爾等其他大家都知道的大品牌相提並論。然後,勇敢的群聯推出了這款 E18 控制器,並在市場上推出了一款 SSD,這可以說是目前高端客戶端計算領域最好的 SSD 之一。我的意思是,這非常強大。 E18是怎麼來的?
塞巴斯蒂安: 是的,但請記住,我們並不小。這些大公司中的大多數可能有兩到三個從事 SSD 的工程團隊。我們有 20 個。我們規模很大。只是沒有人知道我們是誰,因為我們通過技術合作夥伴進行銷售。
我們的第一個 Gen4 產品是 E16,運行速度約為 5 GB/s。這是我們與 AMD 合作開發的一款備受矚目的產品。我們與他們一起進行了大量的現場測試,並且我們實現了非常短的開發週期。雖然只達到了5GB/s,但在當時已經非常成功了。它是市場上大約 18 個月內唯一的 Gen4 客戶端,而下一個更快的驅動器僅達到 3.4 GB/s。
當我們開始開發 E18,我們知道我們必須做得更好。我們收集了有關 E16 的反饋,並研究了其他驅動器的性能。我們聽取了評論者社區的意見並尋找總體趨勢。我們還查看了我們在人們進行的各種測試中的排名。當然,我們也進行自己的測試。因此,有關性能和延遲的反饋並不令人意外,我們已將這些列入了改進的待辦事項列表中。其中一項重要任務是改進我們的低隊列深度處理。這需要對整個前端命令處理管道進行大規模審查,以找到每一個小的空閒延遲,然後將其擠出。找到這些微秒和皮秒延遲,然後重新設計硬件以消除它們,是一項巨大的工程工作。
這基本上就是 E18 誕生的原因。我們將它與當時最快的 NAND 結合起來,我認為是美光 B27、美光 B47 或 B48。對細節的認真關注使我們的 E18 取得了真正的成功。
StorageReview:對於使用 E18 這樣的控制器組的客戶來說,除了散熱器等美學以及客戶端驅動器世界中的此類事物之外,他們還能在哪裡脫穎而出?
塞巴斯蒂安: 我們可以做一些事情,比如改變 過度配置。您可以使用一些旋鈕來打開 SSD,這些旋鈕會權衡功能以滿足客戶需求。例如,您可以增加預留空間或更改緩存策略,即刷新緩存之前等待的時間。
另一種選擇是在緩存中保留多少殘留數據,以減少寫入放大並改善延遲,但代價是減少突髮長度。一種策略是保留最後寫入的 100 MB 數據寫入驅動器,因為最近寫入的數據也最有可能失效。因此,如果您只是將其保留在 SLC 緩存中並且不將其刷新到 TLC 或 QLC,那麼您可以通過增加塊失效來潛在地減少寫入放大器並提高持續性能。
減少寫入放大可延長驅動器壽命。但是,如果您獲得突發活動,則您已預先消耗了 100 MB,因此您的突發活動可能會比其他設計更快到達緩存末尾。因此,我們可以在驅動器上做很多權衡,這實際上取決於我們的客戶想要什麼。
我們還可以針對完全不同的工作負載進行優化,就像我們已經開始開發一個固件 遊戲2.0 以及隨後出現的產品,例如 Microsoft Direct Storage。您將看到的工作負載之一是所謂的 64K 紋理流,儘管它不應該與 4K 電視之類的東西混淆,它實際上只是文件大小。大多數遊戲卡上紋理文件的自然粒度是 64K,因此遊戲開始及時提取紋理,而不是通過 CPU 存儲和 DRAM 堆棧。 GPU 將開始將 SSD 視為一個巨大的緩存。這就是 Gen4 和 Gen5 的用武之地。
StorageReview:作為 Gen5 的一部分,您能談談 E26 是如何誕生的嗎?
塞巴斯蒂安: 最初,我們的企業故事專注於升級高端客戶端控制器。因此E12成為E12 DC,用於數據中心,這是企業的最底層。此類驅動器適用於基本上需要穩態性能和一致延遲,但並不真正關心任何其他企業功能的人。
但從大約兩年前開始,我們決定投入並將所有精力投入到下一個增長領域。因此我們設計了 X1 控制器,這是一款非常高端的企業控制器。它支持 Gen4x8,這意味著整個數據路徑可擴展至 14 GB/s。例如,它非常適合 EDSFF。這種外形規格最多可支持 8 個通道,但今天的重點是 Gen4x4。在我們開始設計時,並不知道市場的走向,因此我們對 X1 設定了很高的目標。
這是群聯首個專用企業 ASIC。該架構現在已成為我們所有高端控制器的基礎。即將推出的 E26 就屬於這一類。它的內部設計與X1非常相似,不同之處在於前端有Gen5接口,後端有8個NAND通道,而不是16個。
當我們想出 E26 我們問自己,如果我們只專注於企業架構,Gen5 是否有足夠的市場?我們的結論是,企業市場仍在興起。我們還研究了客戶端市場,並考慮了基於 E18 但帶有 Gen5 的產品。考慮到預期的初始市場規模,這也很難證明是合理的。因此,我們決定使用企業架構,但關閉對客戶端世界沒有意義的功能,並將芯片應用到盡可能多的細分市場。這就是 E26 的由來。
StorageReview:讓我們進入 Gen5。從 Gen4 到 Gen5,E26 產品能為您帶來什麼?實現這一目標面臨哪些挑戰?
塞巴斯蒂安: 首先我要說的是 Gen5 的運行速度與 DDR4 相同。我的意思是,DDR4 有一系列速度,但如果你看看 DDR4 的低端,那就是 Gen5。它們大致相同。因此,這是您第一次擁有能夠以與 DDR 相同的速度或相同的速度範圍與 CPU 交互的 SSD。現在,SSD永遠不會取代DDR,因為DDR具有超低延遲,並且可以以非常小的粒度進行尋址。而從功能上來說,無論 LBA 大小是多少,SSD 都以 4K 粒度工作,並且可以更好地處理較大的命令或較深的命令隊列。
但 Gen5 對客戶端和企業領域的意義在於,SSD 正在迅速變得類似於三級或四級緩存,具體取決於您正在考慮的架構。它與 CPU 相距相當遠,但仍然處於 CPU 期望 DRAM 達到的瘋狂速度範圍內。然而,四年前,SSD 的速度可能為 2 到 3 GB/s,而且這是假設您使用的是 NVMe SSD。如果您有 SATA SSD,則速度為 600 MB/s。但現在我們談論的是運行速度為 14 GB/s 的 SSD。
通過將 SSD 視為四級緩存,CPU 架構自然希望能夠使用更長的緩存線。隨著 CPU 將數據從四級緩存一直遷移到一級,其緩存線會變得越來越短,直到與 DRAM 粒度保持一致。這意味著您不再需要在系統中放置大量 DRAM 來運行 AI 和機器學習應用程序。
如果您要購買 8 TB DDR,並實際將其安裝到可用的 DIMM 插槽中,則需要花費 $64,000。如果你現在想要一個 8 TB SSD,價格大約是 $1400。這就是你所看到的。您可以使用 8 TB DRAM 做很多事情。如果您的計算空間確實需要 8 TB DRAM,那麼這就是您需要放入系統中的空間。但在大多數情況下,您的活動數據集要小得多,並且您使用 DRAM 來避免存儲延遲。如果您現在可以以接近 DRAM 的速度從四級緩存獲取數據,那麼現在可以用 $64,000 的 DRAM 換取 $1400 的 SSD。而這只是一塊 SSD。大多數企業系統可以容納許多 SSD。 24 並不罕見,因此您可以擁有 PB 級的數據,並且可以以幾乎 DRAM 的速度進行訪問。然後只需將您需要的數據子集動態加載到大小合理的 DRAM 池中即可。這極大地增加了人工智能可以通過機器學習和其他類型的模型使用的功能數據集。
如果您將 SSD 視為四級緩存,則無需受到 XL 或 Z-NAND 之類的阻礙。您可以使用以 Gen5 速度運行的傳統 SSD,並在降低成本方面獲得巨大優勢。我相信 TLC 甚至 QLC 在這個領域的到來將會擊中人們一直在尋找的內存涅槃,它有點像 DRAM,但便宜得多。如果流程主要是讀取密集型,就像許多數據分析工作負載一樣,那麼 QLC 將工作得很好。特別是在那些高密度下。因為有如此多的 NAND 芯片可以並行激活,所以你不會看到 QLC 延遲,這將使驅動器更便宜。它不會是 $1400。會比這個少。
StorageReview:群聯如何管理客戶端 SSD 需求和關注點與企業級 SSD 之間的雙重性,因為它們是如此不同?很難想像未來 18 個月內會有很多客戶端系統真正需要 Gen5 SSD。
塞巴斯蒂安: 我的看法是,至少,您的加載時間將會得到改善。他們會更快。所以那裡有一個直接的好處。隨著遊戲、操作系統和大型應用程序技術公司(例如 Adobe 或其他大型公司)調整其應用程序以使用這種速度,剩下的部分將會實現。
這又回到了我之前所說的,SSD 現在變成了 DRAM 輔助模塊,就像四級緩存一樣。從操作系統的角度來看,這意味著您不必在開始執行實際工作之前將所有內容加載到 DRAM 中。因此,您的啟動時間將會更快,並且一切都將轉向即時加載。
系統中 DRAM 的數量可能會減少,這有助於降低成本、降低功耗並延長電池的使用壽命。電池供電設備上三個最大的電量消耗者是屏幕、DDR 和 CPU。因此,減少 DRAM 的數量可以減少發熱量、減少冷卻,使設備變得更小,並使電池的使用壽命更長。通過非常快速的 SSD 及時加載所有內容意味著您的 PC 體驗將與手機上的體驗更加相似。
Gen5 的另一個預期好處將是遊戲紋理流。可能還需要幾年的時間。但這有點像“先有雞還是先有蛋”的問題。該技術必須先實現,然後才能設計成更高級的上游產品。這就是我們正在做的事情。未來普通消費者是否需要 Gen5 SSD?不,可能不會。但超級玩家會想要一個嗎?絕對地。