ビデオ: PCIe Gen5 がもうすぐ登場 – 知っておくべきこと

StorageReview による Sebastien Jean へのインタビュー

Author | 2022 年 1 月 31 日 | 全て, 消費者, PCIe 第 5 世代, ビデオ

ストレージレビュー 最近、Phison の最高技術責任者である Sebastien Jean 氏に PCIe Gen5 について話を聞きました。議論の内容は、最近の NAND 開発からサプライ チェーンの課題、熱管理、ZNS の利点、社内での PHY 開発まで多岐にわたりましたが、以下は Gen5 SSD コントローラの利点とその方法に焦点を当てた編集された抜粋です。 ファイソン 企業として進化し、SSD パフォーマンスの主要プレーヤーに成長しました。

 

StorageReview: Phison は単なるコントローラー会社ではありませんね。

セバスチャン: Phison は、実際には約 20 年前に USB ドライブを製造する最初の企業の 1 つとしてスタートし、それ以来成長を続け、ストレージ デバイス市場のほぼすべてのセグメントに拡大しました。これには、USB、SATA、または NVMe、および存在するあらゆる種類のカード フォーマット (SD、Micro SD など) が含まれます。当社は産業用機器も製造しており、医療、航空宇宙、自動車分野のソリューションも提供しています。しかし、私たちはコントローラーと、完全に機能する SSD を意味するモジュールと呼ばれるものを製造する小さな会社としてスタートしました。

まで E16、お客様は SSD の要件に合わせて運転しており、私たちは仕様に合わせて設計しました。しかし、E16 に移行するにつれて、me-too 製品を生産することも、テクノロジー企業になることもできることに気づきました。そして、そこに変曲点が起こりました。私たちは会社としてリーダーでありたいと決意しました。それは当社の CEO と社長による意識的な決定でした。彼らは、当社が差別化を図り、成長を続ける方法は、トレンドを見て高いハードルに到達し、期限とコストを抑えてそこに到達するよう努めることであると判断しました。それは微妙な考え方の変化でしたが、会社全体に波紋を呼び起こしました。

そして今、当社は $16 億のテクノロジー企業に成長しました。したがって、私たちは自分たちをコントローラー会社であるとはもう考えていませんし、SSD 会社であるとも考えていません。私たちは、自らを次世代の最先端の NAND ストレージ テクノロジーの開発に注力する企業であると考えています。私たちは依然としてお客様の仕様に合わせて設計を行っていますが、お客様が予定通りに製品を市場に投入できるよう、テクノロジーを準備する必要があります。

 

StorageReview: あなたは、Samsung、Western Digital (WD)、Intel など、誰もが知っている他の大手ブランドと同じように言及されることがあります。そして、少し勇敢な Phison がこの E18 コントローラーを携えて登場し、ハイエンド クライアント コンピューティングにとって現時点でおそらく最高の 1 つである SSD を市場に投入しました。というか、かなり強いですね。 E18はどのようにして生まれたのですか?

セバスチャン: はい、でも覚えておいてください、私たちは小さくありません。これらの大企業のほとんどは、SSD に取り組んでいる 2 つまたは 3 つのエンジニアリング チームを抱えている場合があります。私たちは20人います。私たちは巨大です。ただ、私たちはテクノロジーパートナーを通じて販売しているため、私たちが何者であるかを誰も知りません。

当社の最初の Gen4 製品は E16 で、約 5 GB/秒で動作しました。それは私たちが AMD と協力して開発した注目の製品でした。私たちは彼らと一緒に多くのオンサイトテストを行い、非常に短い開発サイクルを完了しました。 5 GB/秒しか達成できませんでしたが、当時は非常に成功しました。これは、約 18 か月間市場に出回った唯一のクライアント Gen4 であり、次に高速なドライブは 3.4 GB/秒しか達成できませんでした。

私たちが開発を始めた頃には、 E18、もっと改善しなければならないことはわかっていました。私たちは E16 に関して得たフィードバックを取り入れ、他のドライブのパフォーマンスを調べました。私たちはレビュアーコミュニティの意見に耳を傾け、一般的な傾向を探しました。また、人々が実施したさまざまなテストにおけるランキングも調べました。もちろん、独自のテストも行っています。したがって、パフォーマンスと遅延に関するフィードバックはどれも驚くべきものではなく、改善の To-Do リストにそれらのフィードバックが含まれていました。大きな点の 1 つは、キュー深度の低い処理を改善することでした。そのためには、フロントエンドのコマンド処理パイプライン全体を大規模に見直して、あらゆる小さなアイドル遅延を見つけ出し、それを解消する必要がありました。これらのマイクロ秒やピコ秒の遅延を見つけて、それらを排除するためにハードウェアを再設計するのは、エンジニアリングにとって多大な努力でした。

それが本質的に E18 の実現を可能にしたのです。それを、基本的に当時入手可能な最速の NAND (Micron B27、Micron B47、または B48 だったと思います) と組み合わせました。細部にまで細心の注意を払ったおかげで、私たちは E18 で大きな成功を収めることができました。

 

StorageReview: E18 のようなコントローラー セットを使用している顧客にとって、ヒートシンクやクライアント ドライブの世界におけるそのようなもののような外観以外に、どこで差別化できますか?

セバスチャン: を変更するなどのことができます。 オーバープロビジョニング。 SSD をオンにできるノブがあり、顧客のニーズに合わせて機能をトレードオフできます。たとえば、オーバープロビジョニングを増やしたり、キャッシュ ポリシー、つまりキャッシュをフラッシュするまでの待機時間を変更したりできます。

もう 1 つのオプションは、バースト長の短縮を犠牲にして書き込み増幅を削減し、レイテンシーを改善するためにキャッシュにどのくらいの残存データを保持するかです。 1 つの戦略は、最後に書き込まれた 100 MB のデータをドライブに書き込んだままにすることです。これは、最後に書き込まれたデータも無効になる可能性が最も高いためです。したがって、SLC キャッシュに保持するだけで、TLC または QLCの場合、ブロックの無効化を増やすことで、書き込みアンプを削減し、持続的なパフォーマンスを向上させることができる可能性があります。

書き込み増幅を減らすと、ドライブの寿命が長くなります。ただし、アクティビティのバーストが発生した場合は、100 MB が事前に消費されているため、アクティビティのバーストが他のデザインよりも早くキャッシュの終わりに達する可能性があります。したがって、運転中に実行できるトレードオフは数多くありますが、最終的には顧客が何を望んでいるかによって決まります。

に向けたファームウェアの開発を開始したように、まったく異なるワークロードを最適化することもできます。 ゲーム 2.0 そしてその後に続くのが、たとえば Microsoft Direct Storage です。表示されるワークロードの 1 つは 64K テクスチャ ストリーミングと呼ばれるものですが、これを 4K TV などと混同しないでください。実際には単なるファイル サイズです。ほとんどのゲーム カードのテクスチャ ファイルの自然な粒度は 64K であるため、ゲームは CPU ストレージや DRAM スタックを経由するのではなく、ちょうどいいタイミングでテクスチャの取得を開始します。 GPU は SSD を大きなキャッシュのように扱い始めます。そこで登場するのが Gen4 と Gen5 です。

 

StorageReview: Gen5 への続きとして、E26 がどのように誕生したかについて話してもらえますか?

セバスチャン: 当初、私たちのエンタープライズ ストーリーはハイエンド クライアント コントローラーのレベルアップに焦点を当てていました。したがって、E12 は、エンタープライズの最下層であるデータセンター向けの E12 DC になりました。このクラスのドライブは、基本的に定常状態のパフォーマンスと一貫した遅延を必要とするが、他のエンタープライズ機能はあまり気にしない人向けです。

しかし、約 2 年前から、私たちは次の成長分野に全力を注ぐことに決めました。そこで私たちは、非常にハイエンドのエンタープライズ コントローラーである X1 コントローラーと呼ぶものを設計しました。 Gen4x8 に対応しているため、データ パス全体が 14 GB/秒に拡張されます。たとえば、EDSFF に適しています。このフォームファクターは最大 8 レーンをサポートできますが、現在は Gen4x4 に重点が置かれています。設計を始めた当時は市場がどのような方向に向かうか分からなかったので、X1 では高みを目指しました。

これは Phison にとって初めての専用エンタープライズ ASIC でした。そしてそのアーキテクチャは、現在当社のすべてのハイエンド コントローラーの基礎となっています。次期 E26 はそのカテゴリーに分類されます。内部設計は X1 と非常に似ていますが、フロントエンドに Gen5 インターフェイスがあり、バックエンドに 16 個ではなく 8 個の NAND チャネルがある点が異なります。

を思いついたとき、 E26 アーキテクチャでは、エンタープライズだけに焦点を当てた場合、Gen5 の市場は十分にあるだろうかと自問しました。私たちは、エンタープライズ市場はまだ発展途上であると結論付けました。私たちはクライアント市場にも目を向け、E18 をベースにして Gen5 を搭載したものを検討しました。これも、予想される初期の市場規模を考慮すると、正当化するのが困難でした。そこで私たちはエンタープライズ アーキテクチャを使用することにしましたが、クライアントの世界にとって意味のない機能はオフにして、チップをできるだけ多くのセグメントに配置することにしました。そしてそこからE26が生まれました。

 

StorageReview: Gen5 に入ってみましょう。 Gen4 から Gen5 まで、E26 製品によって何が得られますか?また、そこに到達するまでのいくつかの課題は何でしたか?

セバスチャン: まず、Gen5 は DDR4 と同じ速度で動作するということから始めましょう。つまり、DDR4 にはさまざまな速度がありますが、DDR4 のローエンドに注目すると、それが Gen5 になります。それらはほぼ同じです。したがって、DDR と同じ速度または同じ速度範囲で CPU と通信できる SSD が初めて登場しました。 DDR は超低遅延であり、非常に細かい粒度で処理できるため、SSD が DDR に取って代わることはありません。一方、機能的には、LBA サイズに関係なく、SSD は 4K 粒度で動作し、より大きなコマンドや深いコマンド キューでより適切に動作します。

しかし、クライアントと企業スペースの両方にとって Gen5 が意味するのは、どのアーキテクチャに注目しているかに応じて、SSD が急速にレベル 3 またはレベル 4 のキャッシュに似てきているということです。 CPU からはかなり離れていますが、それでも CPU が DRAM に期待する驚異的な速度の範囲内にあります。一方、4 年前、SSD はおそらく 2 ~ 3 GB/秒でした。これは NVMe SSD を使用していることを前提としています。 SATA SSD を使用している場合は、600 MB/秒でした。しかし今、私たちは 14 GB/秒で動作する SSD について話しています。

SSD をレベル 4 キャッシュとして扱うことにより、CPU アーキテクチャは自然に長いキャッシュ ラインで動作することを期待します。そして、CPU がレベル 4 のキャッシュからレベル 1 までデータを移行するにつれて、そのキャッシュ ラインは DRAM の粒度に一致するまでどんどん短くなります。これは、AI や機械学習アプリケーションを実行するためにシステムに大量の DRAM を搭載する必要がなくなったことを意味します。

8 TB の DDR を購入し、それを実際に利用可能な DIMM スロットに取り付けるとすると、$64,000 の費用がかかります。現在 8 TB SSD が必要な場合、価格は約 $1400 です。それがあなたが見ているものです。 8 TB の DRAM を使用すると、さまざまなことができます。そして、計算スペースに本当に 8 TB の DRAM が必要な場合は、それをシステムに搭載する必要があります。ただし、ほとんどの場合、アクティブなデータ セットはかなり小さく、ストレージの遅延を避けるために DRAM を使用しています。レベル 4 キャッシュからほぼ DRAM 速度でデータをフェッチできるようになった場合、$64,000 相当の DRAM と $1400 相当の SSD をトレードオフすることが可能になります。そしてそれは 1 つの SSD だけです。ほとんどのエンタープライズ システムは多数の SSD に対応できます。 24 は珍しいことではないため、ほぼ DRAM の速度でアクセスできるペタバイトのデータが存在する可能性があります。次に、必要なデータのサブセットを適切なサイズの DRAM プールにオンザフライでロードするだけです。これにより、AI が機械学習や他の種類のモデルを通じて使用できる機能データセットが大幅に増加します。

SSD をレベル 4 キャッシュのように扱う場合、XL や Z-NAND などによって邪魔される必要はありません。 Gen5 の速度で動作する従来の SSD を使用でき、コスト削減で大きなメリットが得られます。私は、この分野に TLC 、さらには QLC が登場することで、人々が探し求めていたメモリの至福の瞬間、つまり DRAM に似たものでありながらはるかに安価なメモリが実現すると信じています。また、多くのデータ分析ワークロードのように、フローが主に読み取り中心である場合、QLC は非常にうまく機能します。特にそれらの高密度では。並行してアクティブ化できる NAND ダイが非常に多くあるため、QLC 遅延が発生せず、ドライブがさらに安くなるからです。 $1400にはなりません。それ以下になりますよ。

 

StorageReview: クライアントの SSD のニーズと懸念事項とエンタープライズ向けの SSD のニーズと懸念事項は大きく異なるため、Phison はこの二重性をどのように管理していますか?今後 18 か月以内に、多くのクライアント システムが本当に Gen5 SSD を必要とするとは考えにくいです。

セバスチャン: 私の見方では、少なくともロード時間は改善されるでしょう。彼らはより速くなります。つまり、そこにはドロップインのメリットがあります。残りの部分は、ゲーム、OS、大規模アプリケーションのテクノロジ企業 (Adobe やその他の大手企業など) が自社のアプリケーションをこの速度を利用できるように適応させることで実現します。

先ほどの話に戻りますが、SSD はレベル 4 キャッシュのような DRAM アシスト モジュールになります。 OS の観点から見ると、これは、実際の作業を開始する前に、DRAM にすべてをロードする必要がないことを意味します。そのため、起動時間が短縮され、すべてがジャストインタイム読み込みに移行することになります。

システム内の DRAM の量はおそらく減少するため、コストが削減され、消費電力が削減され、バッテリーの寿命が長くなります。バッテリー駆動のデバイスで電力を最も多く消費するのは、画面、DDR、CPU の 3 つです。したがって、DRAM の量を減らすと、熱の量が減り、冷却が減り、デバイスが小型化され、バッテリーが長持ちするようになります。そして、非常に高速な SSD からすべてを即座にロードできるということは、PC でのエクスペリエンスが携帯電話でのエクスペリエンスにさらに似たものになることを意味します。

そして、Gen5 で期待されるもう 1 つの利点は、ゲーム テクスチャ ストリーミングです。おそらくそれは数年先のことだろう。しかし、それは「鶏が先か卵が先か」のようなものです。このテクノロジーは、より上位の製品に組み込まれる前に開発される必要があります。それが私たちがやっていることなのです。平均的な消費者は明日、Gen5 SSD を必要とするでしょうか?いいえ、おそらくそうではありません。しかし、スーパーゲーマーがそれを欲しがるでしょうか?絶対に。

 

イノベーションを加速する財団™

ja日本語