SSD의 미래 - 2부

NVMe, SCM 제품, 3.5인치 베이와 전산 스토리지에 맞는 SSD

작가 | 2021년 6월 28일 | 모두, 기술

나는 당신이 내 글을 읽을 기회가 있기를 바랍니다. 부분 I 블로그 게시물 스토리지 클래스 메모리, MRAM, 대용량 솔리드 스테이트 드라이브. 2부에서는 스토리지 환경을 변화시키는 다른 SSD 기술에 대해 계속 설명합니다. 언제나 그렇듯이 Phison이 도와드리겠습니다!


 

 

NVMe가 언제 SATA를 대체할 것이며 Gen4가 지배적이 될 것이라고 생각하십니까?

여러 측면에서 이러한 두 가지 변경 사항은 이미 클라이언트 측에서 이루어졌습니다. HDD 및 HDD에 초점을 맞춘 가치 구성은 SATA 인터페이스에서만 사용할 수 있었기 때문에 SATA 인터페이스는 수년 동안 지속되었습니다. 300-600MB/s HDD가 Gen3x2 PCIe 인터페이스를 채택하는 것을 막는 기술적인 이유는 없습니다. SSD 가격은 2019년 75% 이상의 노트북에 SSD가 장착될 정도로 하락했습니다. 무게 감소, 배터리 수명 향상, 기계적 보증 문제 등의 이점이 저렴한 HDD로 인한 비용 절감보다 더 큽니다. 가치 계층은 몇 년 동안 PCIe Gen3x4에 유지될 가능성이 높지만 메인스트림 및 프리미엄 계층은 Gen4x4를 광범위하게 채택하고 있습니다.

이제 기업 부문에서는 SATA SSD보다 PCIe SSD 판매량이 더 많지만 현시점에서 SATA는 앞으로 4~8년 더 지속될 가능성이 높습니다. 기업의 교체 주기는 일반적으로 4년이며 이미 SATA 설치 기반이 매우 넓습니다. 더 빠른 속도가 필요한 조직은 이미 Gen3 NVMe로 전환했습니다. 시간이 지남에 따라 SATA 및 SCSI 기반 장비는 덜 보편화될 것입니다. 엔터프라이즈 Gen3 설치 기반은 올해 Gen4로의 대규모 마이그레이션을 시작할 것으로 예상되지만 마이그레이션은 점진적일 것입니다. 우리는 이 분야에서 앞으로 4년간 Gen3의 견고한 판매를 기대합니다. 이것이 바로 우리가 인기 있는 E12 컨트롤러를 시장에서 가장 낮은 IOPS/와트를 갖는 새로운 FX 컨트롤러로 새롭게 단장한 이유입니다.

 

 

Phison은 스토리지 클래스 메모리를 어떻게 보나요?

SSD는 기존 인프라와 100% 호환이 가능하기 때문에 PC와 데이터센터 스토리지에 쉽게 통합할 수 있었습니다. 이는 서버 섀시, PC 케이스, 노트북, BIOS, OS 및 애플리케이션에 적용됩니다. 초기 배포에서는 SSD 특성을 최대한 활용할 수 없었지만 사용자는 전환할 때 더 낮은 전력, 더 빠른 순차 속도 및 더 높은 견고성으로 인해 즉각적인 이점을 얻었습니다.

반면 SCM은 일반적으로 DDR 버스에서 NVDIMM으로 구현됩니다. 기존 애플리케이션은 DDR을 휘발성으로 처리하도록 설계되었기 때문에 큰 변경 없이는 비휘발성 측면을 활용할 수 없습니다. 이로 인해 SCM은 채택이 쉬운 경로에서 벗어나게 됩니다. NVMe 인터페이스 뒤에 SCM을 배치하면 이전 버전과의 호환성 문제가 해결되지만 현재 SSD는 이미 PCIe 버스를 포화 상태로 만들 수 있습니다. SCM을 스토리지로 사용하는 유일한 이점은 개별 명령 대기 시간이 더 낮다는 것입니다. SSD가 이미 제공하는 것 이상의 지연 시간 이득을 활용할 수 있는 애플리케이션은 거의 없는 것으로 나타났습니다. 따라서 결국 훨씬 더 비싸고 대부분의 애플리케이션에 실질적인 이점을 제공하지 않는 SSD를 사용하게 됩니다. 우리는 SCM이 SSD에 자리를 잡을 것이라고 믿지만 기본 스토리지는 아닙니다.

 

 

컴퓨팅 스토리지와 관련하여 Phison은 무엇을 하고 있나요?

우리는 이미 매우 성공적인 컴퓨팅 하이브리드 장치 유형인 Smart NIC를 보유하고 있습니다. 이 제품은 고속 NIC(일반적으로 10GB/s)와 강력한 CPU 또는 FPGA를 결합합니다. 이 조합은 NIC에서는 작동하지만 스토리지에서는 작동하지 않습니다. 그 이유는 매우 간단합니다. NIC의 스마트 부분은 이미 NIC를 통해 호스트로 전달되는 데이터를 처리합니다. Smart NIC는 스트리밍되는 데이터를 처리할 수 있거나 Smart NIC가 호스트 CPU를 우회하면서 섀시 내의 리소스에 직접 액세스하여 요청을 처리할 수 있을 때 잘 작동합니다.

컴퓨팅 스토리지의 일반적인 가치 제안은 다음과 같습니다. SSD는 데이터에 더 가깝습니다. 즉, 버스 대역폭을 확보하고 호스트 CPU의 부담을 덜어줍니다. 액면 그대로 계산 스토리지는 쉽게 판매되는 것처럼 보이지만 실제로는 그렇지 않습니다.

1. 첫째, 오늘날 SSD는 이미 주요 기능을 수행하기 위해 리소스와 전력 예산의 100%를 사용하고 있습니다. 많은 경우, 고밀도 기업용 SSD는 전력 또는 냉각 예산을 초과하지 않도록 성능을 제한해야 합니다.

2. 둘째, SSD는 일반적으로 호스트 CPU나 GPU가 수행할 수 있는 기능에 전혀 미치지 못하는 작은 CPU 코어를 사용합니다. 셋째, 이 실험은 컴퓨팅 스토리지가 유행어가 되기 전에 이미 시도되었습니다. 한 회사는 GPU와 SSD를 결합하려고 시도했지만, 그 솔루션은 결국 두 기술을 모두 저하시키는 결과를 낳았습니다. GPU 요구 사항을 충족하려면 SSD가 매우 빠르게 실행되어야 하고 GPU에 상당한 열 부하를 추가해야 했습니다. GPU는 SSD보다 훨씬 더 뜨겁고 NAND에 상당한 유지 스트레스를 발생시켰습니다.

3. 마지막으로 SSD는 쓰기 대역폭이 제한된 소모품인 반면, GPU는 더 이상 사용되지 않을 때까지 무기한 실행될 수 있습니다. 이 마지막 사항으로 인해 해결하기 어려운 보증 문제가 발생했습니다.

 

 

다른 접근 방식을 사용하면 SSD에 직접 더 강력한 CPU를 추가할 수 있지만 RAM 제한이 발생합니다. 오늘날 대부분의 기업용 SSD는 1000:1의 NAND 대 DDR 비율을 유지합니다. SSD는 모든 4K LBA 변환에 대해 몇 바이트만 가져오면 되므로 DDR 대역폭 요구 사항은 상대적으로 낮습니다. 이는 SSD가 더 느린 등급의 DRAM을 사용하여 전체 모듈 비용을 낮출 수 있음을 의미합니다. 애플리케이션을 위한 더 많은 DDR과 함께 SSD에 더 큰 게스트 CPU를 추가하면 기본 호스트에 IO를 제공하는 SSD의 기본 역할에 사용 가능한 전력이 감소합니다. SSD 비용도 증가하지만 컴퓨팅 성능에 비례적인 이득을 제공하지는 않습니다. SSD PCB도 매우 작기 때문에 더 많은 부품을 추가한다는 것은 NAND를 위한 공간이 줄어든다는 것을 의미합니다.

그렇다면 데이터 신뢰성의 일반적인 문제가 있습니다. 모든 하드웨어는 결국 실패하지만 대부분의 조직은 데이터 손실을 용납할 수 없습니다(예: 계좌 잔액이 있는 은행 데이터베이스를 생각해 보세요). 이러한 유형의 오류로부터 보호하기 위해 데이터는 일반적으로 다중 장치 RAID 세트에 걸쳐 스트라이프되므로 어느 SSD도 전체 데이터 세트를 볼 수 없습니다. 스토리지가 사용되는 방식을 변경하여 각 SSD가 항상 완전한 데이터 요소를 확인하고 전체 복제를 사용하여 중복성을 보장하도록 할 수 있습니다. 단 하나의 SSD에만 현재 필요한 데이터가 포함되어 있는 경우 이 모델은 스토리지 대역폭 공유 작업을 제대로 수행하지 못하기 때문에 이 접근 방식은 성공할 가능성이 없습니다. RAID 스트라이프는 각 후속 클라이언트가 현재 클라이언트 바로 다음에 시작되도록 액세스를 시차를 두어 이 문제를 해결합니다. 여러 장치에 걸쳐 복제를 구현하여 각 SSD에 데이터 세트의 전체 복사본이 있는 모델을 확장할 수 있지만 그런 다음 조회 및 로드 공유 메커니즘을 추가해야 합니다. 또한 복제는 단순 RAID5 또는 RAID6보다 스토리지 공간이 훨씬 더 높습니다. 간단히 말해서 오늘날 우리가 스토리지를 사용하는 방식은 비용 효율적이고 배포가 쉬우며 대부분의 시나리오에 적합합니다. 몇 개의 서버 CPU를 추가하는 만큼 스토리지 인프라를 완전히 바꾸는 것은 정당화하기 어렵습니다.

범용 컴퓨팅 스토리지의 단점에도 불구하고 이것이 의미가 있는 특정 사례가 있습니다. 이는 스토리지 사용 사례가 Smart NIC의 승리 사례를 반영할 때 발생합니다. 즉, SSD는 장치를 통해 이동할 때 데이터를 한 번만 처리하면 됩니다. 암호화 및 압축을 컴퓨팅 스토리지와 연관시킬 수 있지만 이는 무리입니다. 매우 간단한 알고리즘을 사용하여 이 두 가지 사용 사례를 인라인 또는 스트리밍 데이터 처리로 정의하는 것이 더 정확합니다.

Phison과 우리 고객 중 한 명이 SSD에 매우 적합한 컴퓨팅 스토리지 애플리케이션을 찾은 제품을 개발했습니다. 많은 양의 메모리나 CPU 전력을 필요로 하지 않으며 SSD의 주된 목적인 스토리지 IO를 방해하지 않습니다. 우리는 머신러닝을 사용해 데이터가 공격받고 있다는 징후를 찾는 보안 제품을 개발하고 있습니다. SSD 성능에 측정 가능한 영향을 주지 않고 랜섬웨어 및 기타 무단 활동을 식별할 수 있습니다.

 

실시간 암호화/압축/중복 제거 등 다른 유형의 컴퓨팅 스토리지 워크로드는 어떻습니까?

이 세 가지 워크로드는 전문 용어보다 수십 년 앞서 있지만 컴퓨팅 스토리지와 연관될 수 있습니다. 위에서 언급했듯이 스트리밍 워크로드는 SSD가 처리하기 쉽지만 검색 및 사후 처리는 덜 효과적입니다.

암호화 및 압축은 스트리밍 범주에 속합니다. Phison은 Opal 및 FIPS 140-2 SSD 제품에 즉각적인 암호화를 제공합니다. 압축은 SSD에서 쉽게 수용할 수 있고 스트리밍 모델 개념과 일치하지만 대부분의 대량 데이터(사진, 비디오 또는 음악)가 이미 완전히 압축되어 있다는 점을 고려하면 제한적인 이점을 제공합니다. 압축의 이점을 누릴 수 있는 대규모 데이터 세트가 있지만 사용 사례가 상대적으로 드물기 때문에 전용 서버 어플라이언스로 분류되는 경향이 있습니다.

중복 제거 사례는 다음과 같은 여러 가지 이유로 스트리밍 모델을 깨뜨립니다.

1. 각 섹터의 해시를 추적하려면 엄청난 양의 메모리가 필요하지만 SSD PCB에는 더 많은 DRAM을 수용할 공간이 없습니다.

2. SSD는 이미 데이터 센터 환경에서 완전한 작업을 수행하므로 검색에 소요되는 모든 작업은 호스트 IO를 위해 소요됩니다.

 

 

SSD가 검색을 수행할 때 얻을 수 있는 유일한 실질적인 이점은 PCIe 버스 전송 시간이 약간 줄어들고 호스트 CPU의 부하가 줄어든다는 것입니다. 반대로 SSD는 더 높은 컴퓨팅 요구 사항과 추가 DRAM으로 인해 비용이 높아져야 합니다. 활동력도 반드시 높아져야 합니다. 중복 제거가 필요한 조직의 경우 SSD 비용에 10-20%를 추가하는 대신 특히 사람들이 자고 있는 밤에 여분의 시스템 리소스를 사용하여 문제를 더 잘 구현합니다.

 

Phison은 브랜드 고객이 제품을 차별화하는 데 어떻게 도움을 줍니까?

Phison은 파트너를 위한 주문형 엔지니어링 서비스 역할을 합니다. 회사마다 SSD의 우선 순위를 정하는 측면이 다릅니다. 우리는 고객의 요구 사항에 맞게 제품을 구성합니다. 일부 고객은 가격에 초점을 맞추고, 다른 고객은 저전력을 원하며, 다른 고객은 여전히 최고 수준의 성능을 추구합니다. Phison은 엔지니어링에 집중할 수 있고 고객은 드라이브 판매에 집중할 수 있으므로 이는 양측 모두에게 윈윈입니다. 이러한 분업은 개발 비용을 여러 영업 조직에 분산시켜 Phison의 비즈니스 위험을 낮춥니다. 우리 파트너는 대규모 엔지니어 팀을 유지하는 데 드는 지속적인 운영 비용 없이 사용 중인 엔지니어링 서비스에 대해서만 비용을 지불함으로써 전반적인 위험을 낮춥니다. 판매되지 않는 제품을 시장에 제공하는 경우 다른 구성을 주문하여 빠르게 적응할 수 있습니다.

 

 

Phison은 MRAM을 갖춘 엔터프라이즈 컨트롤러를 발표했지만 어디에 있습니까?

엔터프라이즈 ASIC은 클라이언트 ASIC보다 개발 주기가 더 깁니다. Phison의 차세대 고급 엔터프라이즈 컨트롤러는 현재 엔지니어링 샘플 단계에 있으며 2021년 하반기에 제품이 출시될 것으로 예상됩니다. 주류 솔루션이 대량 생산되면 MRAM 활성화를 시작할 것입니다. 우리는 2022년 2분기 또는 3분기에 MRAM 기반 솔루션을 발표할 예정입니다.

다른 솔리드 스테이트 기술에 대해 질문이 있거나 정보를 원하시면 문의하기.

혁신을 가속화하는 기반™

ko_KR한국어