Video: PCIe Gen5 ist fast da – Was Sie wissen müssen

Interview von StorageReview mit Sebastien Jean

Author | 31. Januar 2022 | Alle, Verbraucher, PCIe Gen 5, Video

Speicherbewertung hat sich kürzlich mit Sebastien Jean, Chief Technology Officer von Phison, zusammengesetzt, um über PCIe Gen5 zu sprechen. Während die gesamte Diskussion von den jüngsten NAND-Entwicklungen über Herausforderungen in der Lieferkette und das Wärmemanagement bis hin zu den Vorteilen von ZNS und der internen Entwicklung von PHY reichte, folgt ein bearbeiteter Auszug, der sich auf die Vorteile von Gen5-SSD-Controllern und deren Funktionsweise konzentriert Phison hat sich als Unternehmen zu einem wichtigen Akteur im Bereich der SSD-Leistung entwickelt.

 

StorageReview: Phison ist mehr als nur ein Controller-Unternehmen, oder?

Sebastian: Phison begann tatsächlich vor etwa 20 Jahren als eines der ersten Unternehmen, das USB-Laufwerke herstellte, und seitdem sind wir gewachsen und haben in nahezu alle Segmente des Speichergerätemarkts expandiert. Dazu gehören USB, SATA oder NVMe und alle Arten von Kartenformaten, die es gibt: SD, Micro SD und so weiter. Wir stellen auch Industriegeräte her und bieten Lösungen in den Bereichen Medizin, Luft- und Raumfahrt sowie Automobil. Aber wir haben als kleines Unternehmen angefangen, das Controller und das, was wir Module nennen, also voll funktionsfähige SSDs, herstellte.

Bis zum E16Unsere Kunden legten fest, welche Anforderungen an die SSD gestellt wurden, und wir entwickelten sie entsprechend einer Spezifikation. Aber als wir auf E16 umstiegen, wurde uns klar, dass wir entweder Me-Too-Produkte herstellen oder ein Technologieunternehmen werden können. Und hier geschah der Wendepunkt. Wir haben beschlossen, dass wir als Unternehmen führend sein wollen. Das war eine bewusste Entscheidung unseres CEO und unseres Präsidenten. Sie legten fest, dass wir uns von anderen abheben und weiter wachsen wollen, indem wir die Trends beobachten, dann nach der hohen Messlatte greifen und versuchen, diese pünktlich und kostengünstig zu erreichen. Es war eine subtile Änderung der Denkweise, die jedoch im gesamten Unternehmen Wellen schlug.

Und jetzt sind wir zu einem Technologieunternehmen mit einem Umsatz von $1,6 Milliarden herangewachsen. Wir betrachten uns also nicht mehr als Controller-Unternehmen und wir betrachten uns nicht mehr als SSD-Unternehmen. Wir verstehen uns als ein Unternehmen, das sich auf die hochmoderne NAND-Speichertechnologie der nächsten Generation konzentriert. Wir entwerfen immer noch nach den Vorgaben unserer Kunden, müssen aber über die Technologie verfügen, die ihnen hilft, Produkte rechtzeitig auf den Markt zu bringen.

 

StorageReview: Manchmal wird man in einem Atemzug mit Samsung, Western Digital (WD), Intel genannt – all diesen anderen großen Marken, die jeder kennt. Und dann kommt der kleine tapfere Phison mit diesem E18-Controller daher und bringt eine SSD auf den Markt, die derzeit wohl zu den besten für High-End-Client-Computing zählt. Ich meine, das ist ziemlich stark. Wie ist der E18 entstanden?

Sebastian: Ja, aber denken Sie daran, wir sind nicht klein. Die meisten dieser großen Unternehmen verfügen möglicherweise über zwei oder drei Ingenieurteams, die an SSDs arbeiten. Wir haben 20. Wir sind riesig. Es ist nur so, dass niemand weiß, wer wir sind, weil wir über Technologiepartner verkaufen.

Unser erstes Gen4-Produkt war das E16, das mit etwa 5 GB/s lief. Und das war ein hochkarätiges Produkt, das wir in Zusammenarbeit mit AMD entwickelt haben. Wir haben mit ihnen viele Tests vor Ort durchgeführt und einen sehr kurzen Entwicklungszyklus erreicht. Obwohl es nur 5 GB/s erreichte, war es damals sehr erfolgreich. Es war etwa 18 Monate lang der einzige Client Gen4 auf dem Markt und das nächst schnellere Laufwerk erreichte nur 3,4 GB/s.

Als wir mit der Entwicklung begannen E18Wir wussten, dass wir es besser machen mussten. Wir haben das Feedback, das wir zum E16 erhalten haben, berücksichtigt und uns die Leistung anderer Antriebe angesehen. Wir haben der Rezensenten-Community zugehört und nach allgemeinen Trends gesucht. Wir haben uns auch unsere Platzierungen in den verschiedenen Tests angesehen, die von Menschen durchgeführt werden. Und natürlich führen wir auch unsere eigenen Tests durch. Daher war keines der Rückmeldungen zu Leistung und Latenz eine Überraschung, und wir hatten diese auf unserer To-Do-Liste der Verbesserungen. Ein großes Problem bestand darin, die Handhabung bei geringer Warteschlangentiefe zu verbessern. Das erforderte eine umfassende Überprüfung der gesamten Front-End-Befehlsverarbeitungspipeline, um jede kleine Leerlaufverzögerung zu finden und sie dann zu beseitigen. Es war ein großer technischer Aufwand, diese Mikrosekunden- und Pikosekundenverzögerungen zu finden und dann die Hardware neu zu entwerfen, um sie zu beseitigen.

Das ist im Wesentlichen der Grund, warum E18 möglich wurde. Das, und wir haben es im Grunde mit dem damals schnellsten NAND gekoppelt, das meiner Meinung nach Micron B27, Micron B47 oder B48 war. Diese Liebe zum Detail hat es uns ermöglicht, mit dem E18 wirklich erfolgreich zu sein.

 

StorageReview: Wo können sich Ihre Kunden, die ein Controller-Set wie den E18 verwenden, unterscheiden, abgesehen von ästhetischen Aspekten wie Kühlkörpern und ähnlichen Dingen in der Welt der Client-Laufwerke?

Sebastian: Wir können Dinge tun wie das ändern Überversorgung. Es gibt Knöpfe, mit denen Sie die SSD einschalten können, um die Funktionen entsprechend den Kundenbedürfnissen anzupassen. Sie können beispielsweise die Überbereitstellung erhöhen oder die Cache-Richtlinie ändern – das heißt, wie lange Sie warten, bevor Sie den Cache leeren.

Eine weitere Option besteht darin, wie viele Restdaten im Cache gespeichert werden, um die Schreibverstärkung zu reduzieren und die Latenz auf Kosten einer reduzierten Burst-Länge zu verbessern. Eine Strategie besteht darin, die zuletzt geschriebenen 100 MB Daten auf dem Laufwerk zu behalten, da die zuletzt geschriebenen Daten auch am wahrscheinlichsten ungültig werden. Wenn Sie es also einfach im SLC-Cache behalten und es nicht an TLC weiterleiten oder QLC, dann können Sie möglicherweise den Schreibverstärker reduzieren und die nachhaltige Leistung verbessern, indem Sie die Blockungültigmachung erhöhen.

Durch die Reduzierung der Schreibverstärkung wird die Lebensdauer des Laufwerks verlängert. Wenn Sie jedoch einen Aktivitätsschub erhalten, haben Sie bereits 100 MB verbraucht, sodass Ihr Aktivitätsschub möglicherweise früher das Ende des Caches erreicht als bei einem anderen Design. Es gibt also viele Kompromisse, die wir bei der Fahrt eingehen können, und es kommt wirklich darauf an, was unsere Kunden wollen.

Wir können auch für völlig andere Arbeitslasten optimieren, indem wir beispielsweise mit der Entwicklung einer Firmware begonnen haben, die darauf ausgerichtet ist Gaming 2.0 und was danach kommt, zum Beispiel Microsoft Direct Storage. Eine der Workloads, die Sie sehen werden, ist das sogenannte 64K-Textur-Streaming. Das sollte jedoch nicht mit so etwas wie 4K-TV verwechselt werden, es geht eigentlich nur um die Dateigröße. Die natürliche Granularität der Texturdateien auf den meisten Gaming-Karten beträgt 64 KB. Was also passiert, ist, dass die Spiele gerade rechtzeitig damit beginnen, Texturen abzurufen, anstatt den CPU-Speicher und die DRAM-Stacks zu durchlaufen. Die GPU beginnt, die SSD wie einen großen Cache zu behandeln. Und hier kommen Gen4 und Gen5 ins Spiel.

 

StorageReview: Können Sie als Übergang zu Gen5 darüber sprechen, wie der E26 entstanden ist?

Sebastian: Ursprünglich konzentrierte sich unsere Unternehmensgeschichte auf die Weiterentwicklung eines High-End-Client-Controllers. So wurde der E12 zum E12 DC für Rechenzentren, der untersten Unternehmensebene. Diese Laufwerksklasse ist für Leute gedacht, die grundsätzlich eine stabile Leistung und konsistente Latenz benötigen, sich aber nicht wirklich für andere Unternehmensfunktionen interessieren.

Aber vor etwa zwei Jahren beschlossen wir, einzusteigen und unsere ganze Energie in unser nächstes Wachstumssegment zu stecken. Deshalb haben wir den sogenannten X1-Controller entworfen, einen sehr hochwertigen Enterprise-Controller. Es ist Gen4x8-fähig, was bedeutet, dass der gesamte Datenpfad auf 14 GB/s skaliert ist. Es eignet sich beispielsweise gut für EDSFF. Dieser Formfaktor kann bis zu acht Lanes unterstützen, heute liegt der Schwerpunkt jedoch auf Gen4x4. Als wir mit dem Design begannen, war noch nicht klar, in welche Richtung sich der Markt entwickeln würde, also haben wir uns mit dem X1 hohe Ziele gesetzt.

Das war der erste dedizierte Unternehmens-ASIC für Phison. Und diese Architektur ist mittlerweile die Grundlage für alle unsere High-End-Controller. Der kommende E26 fällt in diese Kategorie. Sein internes Design ist dem X1 sehr ähnlich, mit dem Unterschied, dass es am Frontend über eine Gen5-Schnittstelle und am Backend über acht statt 16 NAND-Kanäle verfügt.

Als wir uns das ausgedacht haben E26 Wir fragten uns: Gibt es einen ausreichenden Markt für die Gen5-Architektur, wenn wir uns nur auf Unternehmen konzentrieren? Wir kamen zu dem Schluss, dass der Unternehmensmarkt noch im Entstehen begriffen ist. Wir haben uns auch den Kundenmarkt angesehen und über etwas nachgedacht, das auf dem E18 basiert, aber mit Gen5 ausgestattet ist. Auch dies war angesichts der erwarteten anfänglichen Marktgröße kaum zu rechtfertigen. Deshalb haben wir uns entschieden, die Unternehmensarchitektur zu verwenden, aber die Funktionen zu deaktivieren, die für die Kundenwelt keinen Sinn ergeben, und den Chip in so viele Segmente wie möglich zu integrieren. Und daher kam das E26.

 

StorageReview: Kommen wir zur Gen5. Was bringt Ihnen das E26-Produkt, von Gen4 bis Gen5, und was waren einige der Herausforderungen, um dorthin zu gelangen?

Sebastian: Lassen Sie mich zunächst sagen, dass Gen5 mit der gleichen Geschwindigkeit wie DDR4 läuft. Ich meine, DDR4 hat eine Reihe von Geschwindigkeiten, aber wenn man sich das untere Ende von DDR4 ansieht, ist das Gen5. Sie sind ungefähr gleich. Dies ist also das erste Mal, dass Sie über eine SSD verfügen, die mit der CPU mit der gleichen Geschwindigkeit oder im gleichen Geschwindigkeitsbereich wie DDR interagieren kann. Nun wird eine SSD niemals DDR ersetzen, da DDR eine extrem niedrige Latenzzeit aufweist und in sehr kleinen Granularitäten angesprochen werden kann. Funktionell hingegen arbeitet eine SSD unabhängig von der LBA-Größe mit einer 4K-Granularität und funktioniert besser mit größeren Befehlen oder tiefen Befehlswarteschlangen.

Was Gen5 jedoch sowohl für den Kunden als auch für den Unternehmensbereich bedeutet, ist, dass die SSD schnell zu einem Level-3- oder Level-4-Cache wird, je nachdem, welche Architektur man betrachtet. Es ist ein ganzes Stück von der CPU entfernt, aber es liegt immer noch in dem verrückten Geschwindigkeitsbereich, den die CPU vom DRAM erwartet. Wissen Sie, vor vier Jahren hatten SSDs vielleicht 2 bis 3 GB/s, und das setzt voraus, dass Sie eine NVMe-SSD verwendet haben. Wenn Sie eine SATA-SSD hatten, waren es 600 MB/s. Aber jetzt sprechen wir von einer SSD, die mit 14 GB/s läuft.

Durch die Behandlung der SSD als Level-4-Cache geht die CPU-Architektur natürlich davon aus, mit längeren Cache-Zeilen zu arbeiten. Und während die CPU Daten vom Level-4-Cache bis zum Level-1-Cache migriert, werden ihre Cache-Zeilen immer kürzer, bis sie mit der DRAM-Granularität übereinstimmen. Das bedeutet, dass Sie nicht mehr Unmengen an DRAM in ein System stecken müssen, um KI- und maschinelle Lernanwendungen auszuführen.

Wenn Sie 8 TB DDR kaufen würden – und dass dieser tatsächlich in die verfügbaren DIMM-Steckplätze passt – würde das $64.000 kosten. Wenn Sie heute eine 8-TB-SSD möchten, kostet diese etwa $1400. Das ist es also, was Sie sehen. Mit 8 TB DRAM kann man viel machen. Und wenn Ihr Rechenraum tatsächlich 8 TB DRAM benötigt, dann müssen Sie diesen in Ihr System einbauen. In den meisten Fällen ist Ihr aktiver Datensatz jedoch um einiges kleiner und Sie verwenden DRAM, um Speicherlatenz zu vermeiden. Wenn Sie diese Daten jetzt mit nahezu DRAM-Geschwindigkeit aus Ihrem Level-4-Cache abrufen können, ist es jetzt möglich, DRAM im Wert von $64.000 gegen SSD im Wert von $1400 einzutauschen. Und das ist nur eine SSD. Die meisten Unternehmenssysteme können viele SSDs aufnehmen. 24 sind keine Seltenheit, Sie könnten also über ein Petabyte an Daten verfügen, auf die mit nahezu DRAM-Geschwindigkeit zugegriffen werden kann. Laden Sie dann einfach die Teilmenge der Daten, die Sie benötigen, im Handumdrehen in einen DRAM-Pool angemessener Größe. Dadurch wird der Funktionsdatensatz, mit dem eine KI durch maschinelles Lernen und andere Arten von Modellen arbeiten kann, erheblich erweitert.

Wenn Sie die SSD wie einen Level-4-Cache behandeln, müssen Sie nicht durch etwas wie XL oder Z-NAND belastet werden. Sie können mit einer herkömmlichen SSD arbeiten, die mit den Gen5-Geschwindigkeiten läuft, und profitieren von enormen Kosteneinsparungen. Ich glaube, dass die Einführung von TLC und sogar QLC in diesem Bereich das Speicher-Nirvana erreichen wird, nach dem die Leute gesucht haben, etwas, das ein bisschen wie DRAM ist, aber viel billiger. Und wenn der Fluss hauptsächlich leseintensiv ist, wie es bei vielen Datenanalyse-Workloads der Fall ist, funktioniert QLC recht gut. Besonders bei diesen hohen Dichten. Denn es gibt so viele NAND-Chips, die parallel aktiviert werden könnten, dass man die QLC-Latenz einfach nicht sieht und das Laufwerk dadurch noch günstiger wird. Es wird nicht $1400 sein. Es wird weniger sein.

 

StorageReview: Wie bewältigt Phison die Dualität zwischen SSD-Anforderungen und -Bedenken von Kunden und Unternehmen, weil sie so unterschiedlich sind? Es ist schwer vorstellbar, dass viele Client-Systeme in den nächsten 18 Monaten wirklich Gen5-SSDs benötigen.

Sebastian: Meiner Meinung nach werden Sie zumindest eine Verbesserung Ihrer Ladezeiten erzielen. Sie werden schneller sein. Es gibt also genau dort einen Drop-in-Vorteil. Der Rest wird sich ergeben, wenn die Spiele-, Betriebssystem- und Großanwendungstechnologieunternehmen – wie zum Beispiel Adobe oder andere große Unternehmen – ihre Anwendungen an diese Geschwindigkeit anpassen.

Es geht zurück auf das, was ich zuvor gesagt habe, dass die SSD jetzt zu einem DRAM-Unterstützungsmodul wird, wie ein Level-4-Cache. Aus Sicht des Betriebssystems bedeutet das, dass Sie nicht alles in den DRAM laden müssen, bevor Sie mit der eigentlichen Arbeit beginnen können. Ihre Boot-Zeit wird also schneller sein und alles wird sich in Richtung Just-in-Time-Laden verlagern.

Die Menge an DRAM im System wird wahrscheinlich sinken, was dazu beiträgt, die Kosten zu senken, den Stromverbrauch zu reduzieren und die Lebensdauer Ihres Akkus zu verlängern. Die drei größten Stromverbraucher eines batteriebetriebenen Geräts sind Ihr Bildschirm, Ihr DDR und Ihre CPU. Durch die Reduzierung der DRAM-Menge wird also die Wärmemenge reduziert, die Kühlung verringert, Geräte können kleiner werden und die Akkus halten länger. Und wenn alles pünktlich von einer sehr schnellen SSD geladen wird, wird Ihr PC-Erlebnis viel mehr dem auf Ihrem Telefon ähneln.

Und dann wird der andere erwartete Vorteil von Gen5 das Streamen von Spieltexturen sein. Es wird wahrscheinlich noch ein paar Jahre dauern. Aber es ist so etwas wie eine „Henne oder das Ei“-Sache. Die Technologie muss kommen, bevor sie in höherwertige Produkte integriert werden kann. Und genau das tun wir. Braucht ein Durchschnittsverbraucher morgen eine Gen5-SSD? Nein wahrscheinlich nicht. Aber würde ein Super-Gamer einen wollen? Absolut.

 

Die Stiftung, die Innovation beschleunigt™

de_DEDeutsch