2021 年 11 月、MSI は Phison の最高技術責任者 Sebastien Jean にインタビューし、SSD の将来について詳しく学びました。 ゲーム 特に、Phison が新しい M.2 PCIe Gen5 カードで行っている作業について説明します。活発な会話では、SSD コントローラーの設計、パフォーマンスの向上、熱管理から、サプライ チェーンの課題、第 5 世代、第 6 世代、およびそれ以降のベスト ユース ケースまで、あらゆることが取り上げられました。
いくつかのハイライトを以下にまとめました。楽しむ。
MSI: 基本的なことから始めましょう。ストレージ コントローラーとは何ですか?また、SSD 内のその機能は何ですか?
セバスチャン: SSD は通常、コントローラー、キャッシュ (非常に高速なメモリー)、およびすべてのデータが最終的に保存される 3D NAND フラッシュ自体の 3 つの主要な部分で構成されます。
SSD コントローラーにはいくつかのコンポーネントがあります。 1 つ目は処理要素です (Phison は通常、ARM Cortex-R5 を使用します)。考えてみれば、SSD は基本的にパイプライン処理ユニットです。組み立てラインのようなものです。コマンドを受信したら、まずそれを解読し、それが何であるかを理解し、それから意思決定を開始する必要があります。この組み立てラインの各部分は、マイクロ秒の何分の 1 かの非常に短い時間コマンドを調べます。 SSD に搭載されている NAND の数に応じて、20 ポイントから 3 ポイント、または 400 ポイントの並列処理を行うことができます。本当に高度なエンタープライズ SSD ドライブを使用する場合は、100 万、200 万、または 300 万 IOPS の潜在能力を最大限に発揮するために、深いキューを用意してビジー状態を維持する必要があります。
コントローラーの次のコンポーネントは、NAND 上のエラーを訂正するための ECC (エラー訂正コード) エンジンと呼ばれます。 NAND は熱と時間の両方の影響を受けるため、ビットが反転し始める可能性があります。ファイソンは非常に強力な機能を開発しました EECエンジン これらの自然に発生するエラーをすべて修正することは、SSD ドライブの基本的な要件です。
MSI: つまり、ECC はフラッシュ メモリ自体には搭載されていないということですか?
セバスチャン: エンコードされてデータに付加された ECC ビットはフラッシュ メモリ上にありますが、フラッシュ自体にはそれらを処理する機能がありません。そのため、フラッシュのコストが高くなりすぎます。そこで、ストレージコントローラーにはECCユニットが組み込まれています。ストレージ コントローラーには、SRAM (1 つ以上の CPU マイクロ コア)、および ECC、暗号化などのアクセラレータ、およびこれらに沿った機能が搭載されています。
MSI: ARM R5 プロセッサの使用について言及しました。より高速なものにアップグレードした場合、パフォーマンスは向上しますか?
セバスチャン: コアを大幅に大きいものに交換しても、必ずしもパフォーマンスが向上するとは限りません。コアが大きくなるとシリコン面積も大きくなり、チップと SSD 全体の価格が高くなります。したがって、基本的に SSD を構築するときは、SSD が提供するワークロードやアプリケーションに基づいてバランスをとる必要があると考えます。たとえば、4 つの非常に大きなコアを備えた SSD を作成することも、多数の小さなコアを備えた SSD を構築することもできます。 SSD に複数のプロセッサを搭載する利点は、各プロセスをわずかな時間で実行したり、大量のスケジューリングを実行したりする必要がないことです。 PC の CPU ではこれで問題ないかもしれませんが、SSD では無駄なオーバーヘッドになります。したがって、前に述べたように、20 個のコアによる複数の並列処理ポイントがあり、それぞれが 1 つの小さなジョブを実行することで、コマンドのサービス処理を前進させます。
MSI: 今日は、御社の主力モデルの 1 つである PCIe Gen4 が 7 GB/秒になることについて話しています。コントローラーは 12 ナノメートルで作られています。 10 ナノメートル、さらには 7 ナノメートルにすると、より多くのスループットを得ることができるでしょうか?
セバスチャン: はいといいえ。 Phison は特定の帯域幅と IOPS ターゲットに合わせた SSD コントローラーを製造しているため、中レベルのコントローラーの一部は 5 GB/s 向けに設計されており、より高度なコントローラーは 7 GB/s 向けに設計されています。より新しく高速なプロセス ノードに移行することが、必ずしも最善の方法であるとは限りません。繰り返しますが、それはアプリケーションと私たちが何をしようとしているかによって異なります。基本的には、最高のテクノロジーを手頃な価格で提供するバランスが重要です。
しかし、あなたの質問に答えると、プロセス ノードを切り替えるといくつかのことが起こります。チップは小さくなりますが、この特定の状況ではサイズの制約はありません。これにより、内部周波数のクロックを少し速くすることができますが、現在のノードのパフォーマンスを満たすために高速化する必要はありません。それはあなたの漏れを減らします。すべてのシリコン トランジスタは、トグルしていないときでもわずかな電流をリークするため、プロセス ノードを小さくすると、それが大幅に改善されます。逆に、本当に必要のない最新のプロセス ノードに飛びついた場合、コストを購入するだけになり、追加のメリットがないのに SSD が高価になってしまいます。 2 GHz で動作する CPU を作成している場合 (少数の大規模/高速コアを使用する場合によくあること)、最新のプロセス ノードが必要です。 SSD の進歩は、必ずしも最新のプロセス ノードに関するものではありません。並列処理を通じて問題に取り組み、周波数を下げるなど、賢明な設計が重要です。最新のプロセス ノードに時期尚早にジャンプしてしまい、テクノロジが進歩しない可能性があります。
MSI: DDR4 または DDR5 メモリを使用すると、M.2 SSD のパフォーマンスは向上しますか?
セバスチャン: Phison は DRAM と DRAM レス SSD の両方を製造していますが、DRAM を使用する SSD は DDR メモリを使用しないように非常に努めています。高速パスは実際には DDR を経由しません。それは SRAM を通過し、次にデータ パスを通過します。 DDR は論理アドレスから物理アドレスへの変換に使用されるため、実際のテーブル帯域幅要件は SSD 帯域幅よりも小さいため、DDR4 または DDR5 に大きな違いはありません。長い間、DDR3 で問題はありませんでした。現在のモデルは DDR4 を使用しており、開発中のモデルは DDR5 に移行しています。ある時点では、コストを抑えるためにドミナント プロセス ノードを使用することが理にかなっています。古いノードに長く留まりすぎて供給が減少すると、価格が上昇します。
MSI: 最初の PCIe Gen4 コントローラーである E16 は、大きな前進でした。次にE18を導入しました。それは計画だったのでしょうか、それとも SSD から実際に速度を引き出すための技術的課題に対処するために E18 コントローラーが導入されたのでしょうか?
セバスチャン: 興味深い質問ですね。どちらも E16 そして E18 が計画されていました。当時私たちがやろうとしていたのは、市場投入までの時間の要件を満たすことでした。当時、Gen4 は非常に疑問符でした。私たちは製品が市場に投入されるずっと前から CPU ベンダーと話し合っており、彼らは常に、たとえそれがシリコン内にある可能性があるとしても、次の製品で有効になるかどうかわからない新しいテクノロジーを有効にしています。そのため、業界内では Gen4 がオンになるかどうかについて多くの疑問がありました。 AMD (最初に Gen4 で市場投入) が Gen4 にコミットしているという肯定的な確認を得たとき、私たちはプラットフォームのリリースに合わせて E16 をコミットして市場に投入しました。当社は初めて Gen4 SSD を市場に投入しただけでなく、約 18 か月間、クライアント分野で市場に出ていた唯一の Gen4 SSD でした。競合他社が第 1 世代の Gen4 製品を発売する頃には、当社は第 2 世代をリリースしていました。そうです、E18 は主に、その分野での最初の ASIC である E16 から学んだすべての教訓のおかげで、インターフェイスを飽和させています。
MSI: Gen4 ができることの限界にかなり近づいていますね。たとえば、IOPS パフォーマンスなどの分野に取り組んでいるなど、改善の余地はありますか?
セバスチャン: IOPS はいつでも改善できますが、それは ASIC コストに直接影響します。 E18 が置かれているクライアント領域では、現行世代が必要な場所にあります。 IOPS を 2 倍にすることはできますが、プラットフォームがそれを活用できるかどうかはわかりません。 Gen4 が実行できる速度制限にはほぼ近づいていますが、最適化する方法は他にもあり、おそらくそれをさらに活用できる可能性があります。
MSI: それは、E19 が存在するという意味ですか?
セバスチャン: E19 もありますが、DRAM のない領域をターゲットにしており、パフォーマンスよりも価値を重視しています。ゲーマーの観点からすると、あなたが知りたいのは、E18 プラスやスーパー ターボは登場するのかということだと思います。簡単に言うと、答えはノーです。Gen4 は、このテクノロジーで可能なことに関して飽和状態にあります。しかし、私たちが E18 と Gen4 で今後も続けていくのは、そのテクノロジーを他のスイム レーンに浸透させることです。 E19 はより低コストのポイントをターゲットにしているため、インターフェイスが飽和状態になることはありません。したがって、更新によりさらに数 GB/秒が追加され、IOPS が向上します。したがって、12 ナノメートルから次のプロセス ノードである 7 ナノメートルに移行し続けるため、この分野では現在のテクノロジーで成長する余地がまだあります。
MSI: ダイレクト ストレージが Gen4 市場を加速すると思いますか?
セバスチャン: これにより、コンピューティング全般、特にクライアント領域が高速化されると思います。基本的に、ダイレクト ストレージは NTFS のレイヤーをバイパスする読み取り専用インターフェイスです。 NTFS は、信頼性を重視した Windows の標準ファイル システムであり、非常に長い間使用されてきました。内部には多くのレイヤーがあり、各レイヤーで少しの遅延が追加されます。ダイレクト ストレージの機能は、できるだけ少ない処理で SSD への直接パイプラインを提供することです。 OS は追加する遅延をできる限り少なくしており、読み取り専用インターフェイスです。したがって、高速 I/O を必要とする読み取り専用のワークロード (主にクライアント空間のゲーム) は、直接ストレージの恩恵を受けます。この低遅延パイプラインは、基本的に、ゲームだけでなく、携帯電話、タブレット、PC のコンピューティングにも使用されます。
MSI: Phison はどれくらい前からこれらの新しいテクノロジーに取り組んでいますか?
セバスチャン: SSD 自体は、内部の変更の程度に応じて 6 ~ 18 か月かかります。しかし、次のシリコン プロセス ノードを実現するためのテクノロジーは、ASIC が実際に製品になるまでに通常 2 ~ 3 年かかります。したがって、私たちは Gen6 については十分に認識しており、Gen6 SSD を有効にする低レベル コンポーネントの設計に取り組み始めていますが、なぜ Gen5 が計算の観点から非常に興味深いのかについてお話したいと思います。
DDR4 2133 はチャネルあたり約 14 GB/秒で、ゲーム PC には 4 ~ 6 チャネルが搭載されています。 Gen5x4 では 14 GB SSD を搭載しています。より高速な DDR4 があり、次世代ボードでは DDR5 が利用できるようになったのは事実ですが、それが本当の意味ではありません。それは、SSD ストレージと DRAM が同じスペースで動作し、同じ息で言えるようになったということです。 DRAM は 64 ビット I/O 用に最適化されており、遅延が非常に低いため、SSD が DRAM を置き換えることはありません。しかし、これをキャッシュの観点から見ると、CPU には L1、L2、L3 RAM キャッシュがあり、Gen5 SSD は DDR と同じ速度で L4 キャッシュとして動作できます。したがって、SSD の自然な粒度が CPU のキャッシュ アーキテクチャと一致するようになり、そこから一般的なコンピューターの動作方法が変わり始めることになります。
MSI: それはすごいですね。これらの新製品の今後の最大の課題は何だと思いますか?
セバスチャン: 世代が変わるごとに速度は上がり続けるため、私たちの課題は引き続き熱を管理することです。しかし、PC がどこに向かうのかというより大きな問題に目を向けると、クライアント領域では、M.2 PCIe Gen5 が利用できる限界に達しつつあり、実際のインターフェイスやコネクタがボトルネックになるという理解があります。未来のスピード。そのため、新しいコネクタが開発されており、今後数年以内に利用可能になる予定です。これにより、マザーボードへの伝導を通じて、信号の完全性と SSD の放熱能力の両方が大幅に向上します。
MSI: サプライチェーンの問題についてはどうですか?特にグラフィックス カードだけでなく、他の多くのコンポーネントや材料も不足しています。それはPhisonと製品の一貫性にどのような影響を与えていますか?
セバスチャン: サプライチェーンにおける世界的なさまざまな不足は、Phison に大きな影響を与えていません。 SSD には、特にユニークなコンポーネントがいくつかあります。コントローラー、おそらく DRAM、NAND、および電源管理 IC (PMIC) があります。コンデンサーや抵抗器など、他のものはすべてディスクリートであり、不足することはありません。 NAND と DRAM については、Phison は長期供給契約を結んでおり、常に在庫を確保するために事前購入を行っています。 PMIC の供給不足は実際に多くのメーカーで問題になっていますが、当社は自社で製造しています。 Phison では SSD 用の新しいコントローラーを開発する際に、PMIC も同時に設計し、両方を製造します。
私たちは大量の取引から恩恵を受けています。 Phison が約 20 年前に設立されたとき、私たちは USB メモリを普及させる小さな会社でした。現在、医療、産業、輸送、航空宇宙、ゲーム、ワークステーション、エンタープライズ ソリューションから、電話、自動車、IoT の組み込みストレージに至るまで、あらゆる種類のストレージを利用できるようにしています。そのため、私たちは非常に大量の商品を扱っています。したがって、事前に予測を続け、重要なコンポーネントの在庫を管理している限り、問題はありません。
MSI: それは常にバランスを取る行為であり続けるのでしょうか、それともストレージの将来は速度と容量ではなく容量を重視する方向に傾くと思いますか?
セバスチャン: 業界のあらゆるものが高密度化と高速化に向かって進んでいます。顧客スペースは、過去数年間に見てきたテクノロジー曲線に沿って、プレミアム製品の速度と密度の両方が向上し、バランスが保たれる可能性があります。しかし、Phison は、さまざまな市場のあらゆる種類の特殊なアプリケーション向けに SSD を製造しています。当社には超高密度 16 テラバイト QLC SSD があり、データベース分析、AI/機械学習、ゲノミクス、その他のビッグ データ サイエンスの作業を行うハイ パフォーマンス コンピューティング市場で非常に人気があります。さらに、書き込み集中型のワークロードを実行する人や、バーストと持続性が同じになる定常状態のパフォーマンスを必要とする人にとって非常に便利なオール SLC SSD があります。消費者向けの分野では、ゲームの密度とパフォーマンスに重点を置き、バランスに重点を置きます。バリュー市場と中程度のセグメントでは、ブラウザだけを使用する場合は驚異的なパフォーマンスは必要ないため、コストとその特定のワークロードに必要なものとの間でトレードオフが発生します。
MSI: ゲームの場合、ほとんどの SSD は SLC のキャッシュを備えた TLC メモリに落ち着いているようです。しかし、同じ物理ダイ サイズ内でより多くの容量が必要な場合は、QLC に行かなければなりませんか?
セバスチャン: なんてこった。現在、M.2 フォーマットで最大 8 テラバイト、U.2 フォーマットで 16 テラバイトの TLC SSD を作成できますが、16 テラバイトの SSD は非常に高価です。
MSI: ゲームのサイズは増大し続けており、膨大な量の HD テクスチャやその他のデータをダウンロードする必要があります。 8 テラバイトと 16 テラバイトの TLC M.2 がより手頃な価格になるのは時間の問題でしょうか?
セバスチャン: NAND ベンダーはコストを下げるためにダイの密度を常に高めているため、NAND は間違いなくより手頃な価格になるでしょう。つまり、TLCは今後も存続します。しかし、QLC はゲーム以外の用途でも非常に興味深いものになりつつあります。フローは主に読み取りであり、QLC は読み取りに優れているため、QLC SSD でゲームを行うことができます。ただ書き込みがあまり得意ではなく、かなり遅いです。しかし、密度は今後も上昇し続けると思います。価格は今後も下がり続けるでしょう。そして、コストと密度のスイート スポットは向上しています。前世代は 1 テラバイトでした。次の世代は 2 テラバイトになり、3 ~ 4 世代進むと 4 テラバイトになります。したがって、ゲーム以外のアプリケーションでは、おそらく QLC がさらに多く使用されることになるでしょう。ほとんどの人がドライブで行うことはデータの読み取りであり、Windows OS を 1 回書き込むと、そこから何十億回も起動するからです。確かにパッチはあり、それらは入ってきますが、それほど高い割合ではありません。