「ファイソンのエンジニアは、GPUのパフォーマンスはメモリサイズに比例すると推論しました。つまり、高帯域幅メモリ(HBM)DRAMと、このメモリの適切な管理、そして安価なNANDフラッシュの使用によって、通常よりも少ないGPU数で大規模モデルをサポートできるということです。ファイソンはこの問題に対し、ハードウェアとソフトウェアを組み合わせたアプローチを採用しています。 吹き替え 「aiDAPTIV+」は、複数のGPUを搭載したシステムよりも多少パフォーマンスは劣るものの、単一のGPUでLLMをサポートすることを可能にし、コストを大幅に削減します。」- techtarget.com
ソース: テックターゲット.com