비디오: PCIe Gen5가 거의 출시되었습니다 – 알아야 할 사항

StorageReview의 Sebastien Jean과의 인터뷰

작가 | 2022년 1월 31일 | 모두, 소비자, PCIe 5세대, 동영상

스토리지 검토 최근 Phison CTO Sebastien Jean과 함께 PCIe Gen5에 대해 이야기했습니다. 전체 논의는 최근 NAND 개발부터 공급망 문제, 열 관리, ZNS의 이점, 사내 PHY 개발에 이르기까지 다양했지만, 다음은 Gen5 SSD 컨트롤러의 이점과 방법에 초점을 맞춘 편집된 발췌문입니다. 피손 SSD 성능의 주역이 되기 위해 회사로 발전했습니다.

 

StorageReview: Phison은 단순한 컨트롤러 회사가 아닙니다.

세바스티앙: Phison은 실제로 약 20년 전에 USB 드라이브를 만드는 최초의 회사 중 하나로 시작했으며 그 이후로 우리는 성장했으며 저장 장치 시장의 거의 모든 부문으로 확장했습니다. 여기에는 USB, SATA 또는 NVMe와 존재하는 모든 종류의 카드 형식(SD, Micro SD 등)이 포함됩니다. 우리는 또한 산업용 장치를 만들고 의료, 항공 우주 및 자동차 분야의 솔루션을 보유하고 있습니다. 그러나 우리는 컨트롤러와 완전히 작동하는 SSD를 의미하는 모듈을 만드는 작은 회사로 시작했습니다.

까지 E16, 우리 고객은 SSD의 요구 사항을 구동하고 있었고 우리는 사양에 맞게 설계했습니다. 하지만 E16으로 전환하면서 미투 제품을 생산하거나 기술 회사가 될 수 있다는 것을 깨달았습니다. 그리고 그것이 변곡점이 발생한 곳입니다. 우리는 회사로서 리더가 되고 싶다고 결정했습니다. 그것은 CEO와 사장의 의식적인 결정이었습니다. 그들은 우리가 스스로를 차별화하고 계속해서 성장할 수 있는 방법은 트렌드를 살펴본 다음 높은 기준에 도달하고 제 시간에 비용을 들여 도달하려고 노력하는 것이라고 결정했습니다. 사고 방식의 미묘한 변화 였지만 회사 전체에 파장을 일으켰습니다.

그리고 이제 우리는 $16억 기술 회사로 성장했습니다. 그래서 우리는 더 이상 우리 자신을 컨트롤러 회사로 생각하지 않고, 더 이상 우리 자신을 SSD 회사로 생각하지 않습니다. 우리는 차세대 최첨단 NAND 스토리지 기술을 보유하는 데 중점을 둔 회사라고 생각합니다. 우리는 여전히 고객의 사양에 맞게 설계하지만 고객이 제 시간에 제품을 시장에 출시할 수 있도록 기술을 준비해야 합니다.

 

StorageReview: 삼성, WD(Western Digital), Intel 등 모두가 알고 있는 다른 모든 대형 브랜드와 같은 맥락에서 언급되는 경우가 있습니다. 그리고 약간 용감한 Phison이 이 E18 컨트롤러와 함께 출시되어 현재 고급 클라이언트 컴퓨팅을 위한 최고 중 하나인 SSD를 시장에 출시했습니다. 내 말은, 그것은 꽤 강하다. E18은 어떻게 탄생하게 되었나요?

세바스티앙: 그래, 하지만 기억해, 우리는 작지 않아. 이러한 대기업의 대부분은 SSD에 대해 작업하는 2~3개의 엔지니어링 팀을 보유하고 있을 수 있습니다. 우리는 20개를 가지고 있습니다. 우리는 거대합니다. 기술 파트너를 통해 판매하기 때문에 아무도 우리가 누구인지 모릅니다.

첫 번째 Gen4 제품은 약 5GB/s로 실행되는 E16이었습니다. 그리고 그것은 우리가 AMD와 공동으로 개발한 주목할만한 제품이었습니다. 우리는 그들과 많은 현장 테스트를 수행했으며 매우 짧은 개발 주기를 달성했습니다. 5GB/s에 불과했지만 당시에는 매우 성공적이었습니다. 약 18개월 동안 시장에 출시된 유일한 클라이언트 Gen4였으며 그 다음으로 더 빠른 드라이브는 3.4GB/s에 불과했습니다.

우리가 개발을 시작했을 때 E18, 우리는 더 잘해야 한다는 것을 알았습니다. 우리는 E16에 대한 피드백을 받고 다른 드라이브의 성능을 살펴보았습니다. 우리는 리뷰어 커뮤니티의 의견을 듣고 일반적인 경향을 찾았습니다. 우리는 또한 사람들이 실행하는 다양한 테스트에서 순위를 살펴보았습니다. 물론 자체 테스트도 수행합니다. 따라서 성능 및 대기 시간에 대한 피드백 중 어느 것도 놀라운 것이 아니었고 개선해야 할 작업 목록에 포함되어 있었습니다. 한 가지 중요한 것은 낮은 대기열 깊이 처리를 개선하는 것이었습니다. 이를 위해서는 전체 프런트 엔드 명령 처리 파이프라인을 대대적으로 검토하여 모든 작은 유휴 지연을 찾은 다음 짜내야 했습니다. 이러한 마이크로초 및 피코초 지연을 찾은 다음 이를 제거하기 위해 하드웨어를 재설계하는 것은 엄청난 엔지니어링 노력이었습니다.

그것이 본질적으로 E18을 가능하게 한 것입니다. 그리고 기본적으로 당시 사용 가능한 가장 빠른 NAND와 결합했습니다. Micron B27, Micron B47 또는 B48이라고 생각합니다. 세부 사항에 대한 세심한 주의 덕분에 E18을 성공적으로 사용할 수 있었습니다.

 

StorageReview: E18과 같은 컨트롤러 세트를 사용하는 고객의 경우, 히트싱크와 같은 미학 외에 클라이언트 드라이브 세계에서 그런 종류의 것들을 차별화할 수 있는 곳은 어디입니까?

세바스티앙: 우리는 변경과 같은 일을 할 수 있습니다 오버프로비저닝. SSD를 켤 수 있는 노브가 있어 고객의 요구에 맞게 기능을 절충합니다. 예를 들어 오버프로비저닝을 늘리거나 캐시 정책을 변경할 수 있습니다. 즉, 캐시를 플러시하기 전에 대기하는 시간입니다.

또 다른 옵션은 버스트 길이를 줄이는 대신 쓰기 증폭을 줄이고 대기 시간을 개선하기 위해 캐시에 보관되는 잔여 데이터의 양입니다. 한 가지 전략은 드라이브에 마지막으로 쓴 100MB의 데이터를 유지하는 것입니다. 가장 최근에 쓴 데이터가 무효화될 가능성이 가장 높기 때문입니다. 따라서 SLC 캐시에 보관하고 TLC로 플러시하지 않거나 QLC그러면 잠재적으로 쓰기 증폭기를 줄이고 블록 무효화를 늘려 지속적인 성능을 향상시킬 수 있습니다.

쓰기 증폭을 줄이면 드라이브 수명이 늘어납니다. 그러나 활동이 급증하면 100MB를 사전에 사용했기 때문에 활동이 급증하면 다른 디자인보다 더 빨리 캐시가 종료될 수 있습니다. 따라서 드라이브에서 할 수 있는 절충안이 많이 있으며 고객이 원하는 것이 무엇인지 결정됩니다.

우리는 또한 우리가 펌웨어를 개발하기 시작한 것처럼 완전히 다른 워크로드에 대해 최적화할 수 있습니다. 게이밍 2.0 예를 들어 Microsoft Direct Storage 다음에 오는 것. 보게 될 워크로드 중 하나는 64K 텍스처 스트리밍이라는 것인데, 4K TV와 혼동해서는 안 되며 실제로는 파일 크기일 뿐입니다. 대부분의 게임 카드에 있는 텍스처 파일의 자연스러운 세분성은 64K이므로 게임에서 CPU 스토리지와 DRAM 스택을 거치지 않고 적시에 텍스처를 가져오기 시작합니다. GPU는 SSD를 거대한 캐시처럼 취급하기 시작합니다. 그리고 그것이 Gen4와 Gen5가 들어오는 곳입니다.

 

StorageReview: Gen5에 이어 E26이 어떻게 탄생하게 되었는지 말씀해 주시겠습니까?

세바스티앙: 처음에 우리의 엔터프라이즈 스토리는 하이엔드 클라이언트 컨트롤러의 레벨을 높이는 데 중점을 두었습니다. 그래서 E12는 엔터프라이즈의 최하위 계층인 데이터 센터를 위한 E12 DC가 되었습니다. 이 등급의 드라이브는 기본적으로 안정된 상태의 성능과 일관된 대기 시간이 필요하지만 다른 엔터프라이즈 기능에는 별로 관심이 없는 사람들을 위한 것입니다.

그러나 약 2년 전부터 우리는 다음 성장 부문에 뛰어들어 우리의 모든 에너지를 투입하기로 결정했습니다. 그래서 우리는 매우 고급 엔터프라이즈 컨트롤러인 X1 컨트롤러라고 부르는 것을 설계했습니다. Gen4x8이 가능하므로 전체 데이터 경로가 14GB/s로 확장됩니다. 예를 들어 EDSFF에 적합합니다. 이 폼 팩터는 최대 8개의 레인을 지원할 수 있지만 현재는 Gen4x4에 초점이 맞춰져 있습니다. 디자인을 시작할 당시에는 시장이 어떤 방향으로 흘러갈지 알 수 없었기 때문에 우리는 X1을 높게 겨냥했습니다.

그것은 Phison을 위한 최초의 전용 엔터프라이즈 ASIC였습니다. 그리고 그 아키텍처는 이제 모든 하이엔드 컨트롤러의 기반이 되었습니다. 다가오는 E26은 그 범주에 속합니다. 내부 디자인은 X1과 매우 유사하지만 프런트 엔드에 Gen5 인터페이스가 있고 백엔드에 16개가 아닌 8개의 NAND 채널이 있다는 차이점이 있습니다.

우리가 생각해냈을 때 E26 우리는 기업에만 집중한다면 Gen5를 위한 시장이 충분할까요? 우리는 엔터프라이즈 시장이 여전히 부상하고 있다는 결론을 내렸습니다. 우리는 또한 클라이언트 시장을 살펴보고 E18을 기반으로 하지만 Gen5가 포함된 것을 고려했습니다. 이것 역시 예상되는 초기 시장 규모를 감안할 때 정당화하기 어려웠습니다. 그래서 우리는 엔터프라이즈 아키텍처를 사용하기로 결정했지만 클라이언트 세계에 적합하지 않은 기능을 끄고 가능한 한 많은 세그먼트에 칩을 넣습니다. 그리고 그것이 E26이 나온 곳입니다.

 

StorageReview: Gen5에 대해 살펴보겠습니다. Gen4에서 Gen5에 이르기까지 E26 제품은 무엇을 얻었으며 거기에 도달하기까지 어떤 어려움이 있었습니까?

세바스티앙: Gen5가 DDR4와 동일한 속도로 실행된다는 점부터 시작하겠습니다. 내 말은, DDR4는 다양한 속도를 가지고 있지만 DDR4의 로우엔드를 보면 Gen5입니다. 그들은 거의 동일합니다. 따라서 DDR과 동일한 속도 또는 동일한 속도 범위에서 CPU와 상호 작용할 수 있는 SSD를 보유한 것은 이번이 처음입니다. 이제 DDR은 대기 시간이 매우 짧고 매우 작은 단위로 처리할 수 있기 때문에 SSD는 DDR을 대체하지 못할 것입니다. 반면 기능적으로는 LBA 크기에 관계없이 SSD는 4K 세분성에서 작동하며 더 큰 명령이나 깊은 명령 대기열에서 더 잘 작동합니다.

그러나 Gen5가 클라이언트와 엔터프라이즈 공간 모두에 의미하는 바는 SSD가 보고 있는 아키텍처에 따라 빠르게 레벨 3 또는 레벨 4 캐시와 유사해지고 있다는 것입니다. CPU에서 몇 단계 떨어져 있지만 여전히 CPU가 DRAM에서 기대하는 미친 속도 범위에 있습니다. 반면에 4년 전에는 SSD가 2~3GB/s 정도였고 이는 NVMe SSD를 사용한다고 가정했을 때입니다. SATA SSD를 사용했다면 600MB/s였습니다. 그러나 이제 우리는 14GB/s에서 실행되는 SSD에 대해 이야기하고 있습니다.

SSD를 레벨 4 캐시로 취급함으로써 CPU 아키텍처는 자연스럽게 더 긴 캐시 라인에서 작동할 것으로 예상합니다. 그리고 CPU가 레벨 4 캐시에서 레벨 1까지 데이터를 마이그레이션함에 따라 캐시 라인은 DRAM 세분성에 맞춰질 때까지 점점 더 짧아집니다. 즉, AI 및 기계 학습 애플리케이션을 실행하기 위해 더 이상 시스템에 엄청난 양의 DRAM을 넣을 필요가 없습니다.

8TB의 DDR을 구입하고 사용 가능한 DIMM 슬롯에 실제로 맞추려면 $64,000의 비용이 듭니다. 현재 8TB SSD를 원한다면 약 $1400의 비용이 듭니다. 그래서 그것이 당신이 보고 있는 것입니다. 8TB의 DRAM으로 많은 일을 할 수 있습니다. 계산 공간에 실제로 8TB의 DRAM이 필요한 경우 시스템에 넣어야 하는 것입니다. 그러나 대부분의 경우 활성 데이터 세트는 상당히 작으며 저장 대기 시간을 피하기 위해 DRAM을 사용하고 있습니다. 이제 레벨 4 캐시에서 거의 DRAM 속도로 해당 데이터를 가져올 수 있다면 $64,000 상당의 DRAM을 $1400 상당의 SSD와 교환하는 것이 가능합니다. 그리고 그것은 단 하나의 SSD입니다. 대부분의 엔터프라이즈 시스템은 많은 SSD를 수용할 수 있습니다. 24는 드문 일이 아니므로 거의 DRAM 속도로 액세스할 수 있는 페타바이트의 데이터를 가질 수 있습니다. 그런 다음 적절한 크기의 DRAM 풀에 즉시 필요한 데이터 하위 집합을 로드하기만 하면 됩니다. 이것은 AI가 기계 학습 및 기타 유형의 모델을 통해 작업할 수 있는 기능 데이터 세트를 크게 증가시킵니다.

SSD를 레벨 4 캐시처럼 취급하면 XL 또는 Z-NAND와 같은 것에 의해 방해받을 필요가 없습니다. Gen5 속도로 실행되는 기존 SSD로 작업할 수 있으며 비용 절감 측면에서 큰 이점을 얻을 수 있습니다. 나는 이 공간에 TLC와 심지어 QLC가 도래하면 사람들이 찾고 있는 DRAM과 비슷하지만 훨씬 저렴한 메모리 열반에 도달할 것이라고 믿습니다. 그리고 많은 데이터 분석 워크로드와 같이 흐름이 주로 읽기 집약적인 경우 QLC가 상당히 잘 작동합니다. 특히 그 고밀도에서. 병렬로 활성화할 수 있는 NAND 다이가 너무 많기 때문에 QLC 대기 시간이 표시되지 않고 드라이브가 훨씬 저렴해집니다. $1400이 아닙니다. 그 이하일 겁니다.

 

StorageReview: Phison은 클라이언트 SSD 요구 사항과 기업에 대한 우려 사이의 이중성을 어떻게 관리합니까? 향후 18개월 동안 Gen5 SSD가 실제로 필요한 많은 클라이언트 시스템을 상상하기는 어렵습니다.

세바스티앙: 내가 보는 방식은 최소한 로드 시간이 개선될 것이라는 것입니다. 그들은 더 빠를 것입니다. 바로 거기에 드롭 인 혜택이 있습니다. 나머지는 게임, OS 및 대형 응용 프로그램 기술 회사(예: Adobe 또는 기타 대기업)가 이 속도를 사용하도록 응용 프로그램을 조정함에 따라 통과될 것입니다.

이전에 SSD가 이제 레벨 4 캐시와 같은 DRAM 지원 모듈이 되었다고 말한 것으로 되돌아갑니다. OS 관점에서 이는 실제 작업을 시작하기 전에 DRAM에 모든 것을 로드할 필요가 없다는 것을 의미합니다. 따라서 부팅 시간이 빨라지고 모든 것이 적시 로딩으로 전환될 것입니다.

시스템의 DRAM 양이 감소할 가능성이 높으므로 비용 절감, 전력 절감, 배터리 수명 연장에 도움이 됩니다. 배터리 구동 장치에서 전력을 가장 많이 소비하는 세 가지 요소는 화면, DDR 및 CPU입니다. 따라서 DRAM의 양을 줄이면 열의 양이 줄어들고 냉각이 줄어들며 장치가 더 작아지고 배터리가 더 오래 지속됩니다. 그리고 매우 빠른 SSD에서 적시에 모든 것을 로드할 수 있다는 것은 PC 경험이 휴대폰의 경험과 훨씬 더 비슷해질 것임을 의미합니다.

그리고 Gen5의 또 다른 기대되는 이점은 게임 텍스처 스트리밍과 함께 제공될 것입니다. 아마도 몇 년 후일 것입니다. 그러나 그것은 일종의 "닭이냐 달걀이냐" 같은 것입니다. 이 기술은 상위 업스트림 제품으로 설계되기 전에 와야 합니다. 이것이 바로 우리가 하는 일입니다. 일반 소비자가 내일 Gen5 SSD를 필요로 합니까? 아니, 아마 아닐거야. 하지만 슈퍼 게이머가 원할까요? 전적으로.

 

혁신을 가속화하는 기반™

ko_KR한국어