AI と機械学習における SSD の役割

Pengarang アンディ・ヒギンボサム | 2023 年 7 月 17 日 | AI, 全て, 企業, 特徴

規約人工知能 (AI) コンピューティング業界では、機械学習 (ML) がますます使用されていますが、経験豊富な IT 実務者でも、2 つのテクノロジをサポートするために必要なコンピューティングおよびストレージインフラストラクチャを十分に認識していない可能性があります。この記事では、この問題を検証し、ソリッドステートドライブ (SSD) が AI と ML の最良の結果を実現する方法についての洞察を提供します。

AI と ML とは何ですか?

AI と ML の本質を理解するための最初のステップは、それらが同じものではないことを理解することです。 AI とは、人間のように考えることができるソフトウェアを作成することです。 ML には、ソフトウェアに新しい概念を学習させ、その後、これらの概念をより良く習得し続けることが含まれます。これらは別個のものですが、関連しており、重複するテクノロジーです。

AI や ML も新しいアイデアではありません。コンピューターの先見者であるアランチューリングは、1950 年に機械に人間と同じように思考させることができると主張しました。1959 年までに、AI の先駆者マービンミンスキーは、非常に初期の AI プログラムに対して MIT の新入生微積分試験を実施していました。合格しました。映画は私たちに殺人的に知的な HAL 9000 を与えてくれました。 2001年宇宙の旅 そして同様に致命的なスカイネット ターミネータ。これらの例は言及する価値があります。なぜなら、フィクションは AI と ML についての私たちの考え方に情報を与えてきた一方で、途中で混乱を引き起こしているからです。

幸いなことに、私たちはまだスカイネットの時代には達していませんが、私たちの世界には AI と ML が機能する印象的な例がたくさんあります。これらのほとんどは大規模なものでも派手なものでもありませんが、ビジネスや私たちの日常生活に少なからず影響を与えます。たとえば、ロボティックプロセスオートメーション (RPA) の「ボット」は AI を使用して、電子メールメッセージを読んだり、フォームに記入したりするなどのタスクを実行できます。 ML は、法執行機関における顔認識や医療分野におけるがん診断などのプロセスを推進します。

AI と ML はどのように機能するのでしょうか?

AI および ML プログラミングにはさまざまな種類がありますが、どちらのテクノロジーも基本的にはパターン認識に基づいています。 RPA の電子メール読み取りの例では、ボットは電子メールメッセージ内の内容を説明するフレーズを認識するようにトレーニングされています。「支払い」または「期限超過」という言葉が含まれるメッセージは、経理部門向けです。

また、ボットは電子メールの署名を解析し、パターン認識を使用して、メッセージがベンダー (買掛金) から送信されたのか、顧客 (売掛金) から送信されたのかを判断することもできます。このタイプの機能はサイバーセキュリティでも役立ち、AI ソフトウェアはセキュリティログからの数百万のデータポイントを検査し、攻撃が進行中であることを示す異常な動作を特定できます。

ML も同様に、特定の知識領域をよりよく理解するためにパターン認識を利用します。 ML システムは、プログラムされたコードや特定のルールに従うことなく、データについて学習し、継続的に「賢くなる」ことができます。たとえば、ML アルゴリズムは、樹木や植物の 100 万枚の画像を「見る」ことができます。ある時点で、アルゴリズムは木と植物の違いを自ら学習します。したがって、AI と ML の本質的な違いは、AI はパターンを発見するように教えられてきたのに対し、ML はまだパターンを発見することを学習し、より良くなっているということです。

これらすべてを行うには、膨大な量のデータを処理する必要があります。ある意味、AI と ML はビッグデータパラダイムの単なる拡張です。ビッグデータとデータ分析により、大規模で多様なデータセットを解釈し、視覚的な傾向を発見し、新しい洞察を得ることが可能になります。 AI と ML は、このプロセスをさらに一歩進めます。データマイニング、統計分析、予測モデリングなどの既存のビッグデータ分析とデータサイエンスプロセスを活用して、ビッグデータに基づいた推論、意思決定、アクションステップを可能にします。

実際には、AI と ML は 4 つの個別のプロセスで構成されており、それぞれのプロセスにはデータ管理が含まれます。

データの取り込み - 複数のソースから AI および ML ワークロードの基盤である Spark、Hadoop、NoSQL データベースなどのビッグデータプラットフォームにデータを取り込みます。
準備 - データを AI および ML トレーニングで使用できるようにする
トレーニング - AI および ML ソフトウェアプログラムのトレーニングアルゴリズムの実行
推論 - AI および ML ソフトウェアに推論ワークフローを実行させる

NAND フラッシュストレージが AI と ML に不可欠な理由

AI と ML におけるビッグデータの中心的な役割により、ストレージはこれらのワークロードの重要な成功要因となります。効果的で柔軟な高性能ストレージがなければ、AI および ML ソフトウェアは適切にパフォーマンスを発揮できません。少なくとも、ワークロードはコンピューティングインフラストラクチャとストレージインフラストラクチャを十分に活用できません。

これらの理由から、NAND フラッシュストレージは、AI と ML をサポートするストレージにとって理想的なメディアです。その理由を理解するには、AI と ML の 4 つの各段階でのストレージ要件を考慮してください。

データの取り込み時に、AI は構造化データ形式と非構造化データ形式を含む、大規模で非常に多様なデータセットを取り込みます。データは潜在的に広範囲のソースから取得される可能性があります。取り込みを成功させるには、おそらくペタバイト、さらにはエクサバイト単位で測定される大量のストレージが必要ですが、リアルタイム分析用の高速層も必要です。他の 3 つのステージと同様に、ここでも信頼性が重要です。 NAND フラッシュは、信頼性と処理速度の最適な組み合わせを提供します。

AI および ML のデータ準備段階とは、取り込まれた生のデータを変換し、トレーニングおよび推論段階で AI および ML ソフトウェアのニューラルネットワークで使用できるようにフォーマットすることを意味します。データの準備段階では、ファイルの入出力 (I/O) 速度が重要です。この使用例では、NAND フラッシュが適切にパフォーマンスを発揮します。

AI と ML のトレーニングと推論の段階では、大量の計算が行われる傾向があります。ソフトウェアのトレーニングモデルへのデータの高速ストリーミングが必要です。これは多くの停止と開始を伴う反復的なプロセスであり、そのすべてがタスクに適さない場合、ストレージリソースに負担をかける可能性があります。

SSD が AI と ML の成功を可能にする仕組み

の規模データストレージ AI および ML プロジェクトに必要なストレージソリューションは、一般に、組み合わせて使用する必要があります。多くの場合、階層化アプローチが最適であり、パフォーマンスが低く、コストが低いストレージに関連性の低いデータを保持します。ただし、パフォーマンスの高い層も必要です。これは、ビッグデータエコシステムで通常見られるものよりも比例して大きくなる可能性があります。

これは、AI/ML ストレージ環境の重要な層全体に SSD を導入することを意味します。トレーニング段階で AI および ML ソフトウェアに供給される大量のデータの迅速な移動をサポートするために必要なパフォーマンスとレイテンシを提供できるのは SSD だけです。プロセスが推論に移行するにつれて、特に別のワークフローで AI/ML システムの応答時間に何らかの重大性がある場合、パフォーマンスとレイテンシーの重要性がさらに高まります。人々や他のシステムが、動作が遅い AI または ML システムが作業を完了するのを待っていると、全員が苦しみます。

Phison がどのように役立つか

Phison のカスタマイズ可能な SSD ソリューション AI および ML ワークロードの成功に必要な優れたパフォーマンスと柔軟性を提供します。 AI/ML ストレージは書き込み集中型よりも読み取り集中型である傾向があることを考慮すると、Phison は読み取り集中型アプリケーション向けに最適化された 2.5 インチ 15.36 TB 7mm SATA SSD ドライブを手頃な価格で提供する唯一のプロバイダーとして際立っています。

で実現したように、ファイソン ESR1710シリーズ、最高のラックストレージ密度と低消費電力を提供します。これらはどちらも、AI と ML に必要な経済的でありながら高性能のストレージに不可欠な要素です。 Phison の 2.5 インチ SATA SSD は、このサイズの SSD としては世界最大の容量を誇る独自の寸法により、AI および ML アプリケーション用の最大 13 PB のデータを 1 つの 48U ラックに保存できます。この種の密度は、AI と ML にとって有利なストレージ経済性につながります。

絶対的な要件を必要とする AI/ML アプリケーション向け最速の PCIe Gen4x4 Phison は現在、読み取りおよび書き込み速度と業界最低の消費電力を備えた製品を出荷しています。 X1 SSD U.3 フォームファクタのシリーズで、U.2 スロットと下位互換性があり、最大 15.36 TB の容量があります。

よくある質問（FAQ）：

NAND フラッシュはデータの取り込みと準備段階をどのように改善するのでしょうか?

NANDフラッシュは、高速な入出力操作を可能にし、ペタバイト規模の構造化データと非構造化データを扱う際の信頼性を確保します。生データをニューラルネットワークで利用可能な形式に変換することをサポートします。ネットワークを効率的に.

AI モデルのトレーニングにおいて SSD が HDD よりも効果的な理由は何ですか?

SSDはランダムおよびシーケンシャルなデータアクセスを高速に処理します。これは機械学習でよく使われる反復的なトレーニングループに不可欠です。維持する I/O 集約型プロセス中のパフォーマンスが向上し、トレーニング時間が大幅に短縮されます。

Phison の aiDAPTIV+ はクラウドベースの AI プラットフォームとどう違うのでしょうか?

aiDAPTIV+ ローカライズされたオンプレミスの AI モデルトレーニングをサポートし、コンピューティングとストレージの使用料がかかるパブリッククラウドプラットフォームと比較して、制御性が向上し、データのプライバシーが確保され、総所有コストが低くなります。

すべての AI/ML システムに階層型ストレージモデルは必要ですか?

はい、ハイブリッドモデルは、重要度の低いデータを低コストのストレージにオフロードし、SSDをリアルタイム処理や優先度の高いAI処理に確保することで、コスト効率を確保します。パフォーマンスと予算.

Phison は LLM (大規模言語モデル) トレーニングをどのようにサポートしますか?

フィソンの Pascari AI SSDは特に最適化されたのために高スループット LLM トレーニングの要求を満たし、反復学習サイクル全体を通じて一貫したパフォーマンスと高速データ処理を保証します。

私たちに従ってください

イノベーションを加速する財団™

お問い合わせ