2021년 11월 MSI는 Phison CTO Sebastien Jean과 인터뷰하여 SSD의 미래에 대해 자세히 알아보았습니다. 노름 특히 Phison이 새로운 M.2 PCIe Gen5 카드에서 수행하는 작업에 대해 설명합니다. 활발한 대화는 SSD 컨트롤러 설계, 성능 개선 및 열 관리에서 공급망 문제 및 Gen5, Gen6 및 그 이상에 대한 최상의 사용 사례에 이르기까지 모든 것을 다루었습니다.
다음을 제외하고 일부 하이라이트를 편집했습니다. 즐기다.
MSI: 기본부터 시작하겠습니다. 스토리지 컨트롤러란 무엇이며 SSD 내부에서 그 기능은 무엇입니까?
세바스티앙: SSD는 일반적으로 컨트롤러, 매우 빠른 메모리인 캐시, 모든 데이터가 궁극적으로 저장되는 3D NAND 플래시 자체의 세 가지 주요 부분으로 구성됩니다.
SSD 컨트롤러에는 여러 구성 요소가 있습니다. 첫 번째는 처리 요소입니다(Phison은 일반적으로 ARM Cortex-R5를 사용함). 생각해 보면 SSD는 기본적으로 파이프라인 처리 장치입니다. 조립 라인과 같습니다. 명령을 받으면 먼저 해독하고 그것이 무엇인지 이해한 다음 결정을 내리기 시작해야 합니다. 이 조립 라인의 각 부분은 매우 짧은 시간(마이크로초의 일부) 동안 명령을 확인합니다. SSD에 있는 NAND의 수에 따라 20~300개 또는 400개의 병렬 지점이 있을 수 있습니다. 진정한 고급 엔터프라이즈 SSD 드라이브에 도달하면 1백만, 2백만 또는 3백만 IOPS 잠재력에 도달하기 위해 계속 사용하려면 깊은 대기열이 필요합니다.
컨트롤러의 다음 구성 요소는 NAND의 오류를 수정하기 위한 ECC(오류 수정 코드) 엔진입니다. NAND는 열과 시간의 영향을 모두 받기 때문에 비트가 뒤집힐 수 있습니다. Phison은 매우 강력한 EEC 엔진 모든 SSD 드라이브의 기본 요구 사항인 이러한 자연적으로 발생하는 모든 오류를 수정합니다.
MSI: 그렇다면 ECC는 플래시 메모리 자체에 있지 않습니까?
세바스티앙: 인코딩되어 데이터에 첨부된 ECC 비트는 플래시 메모리에 있지만 플래시 자체에는 ECC 비트를 처리할 수 있는 기능이 없으므로 플래시 비용이 너무 비쌉니다. 따라서 ECC 장치는 스토리지 컨트롤러에 내장되어 있습니다. 스토리지 컨트롤러에는 하나 이상의 CPU 마이크로 코어와 ECC, 암호화 및 기타 항목과 같은 가속기인 SRAM이 있습니다.
MSI: ARM R5 프로세서 사용에 대해 언급하셨습니다. 더 빠른 것으로 업그레이드하면 성능에 도움이 될까요?
세바스티앙: 코어를 훨씬 더 큰 것으로 교체한다고 해서 반드시 성능이 향상되는 것은 아닙니다. 더 큰 코어는 더 큰 실리콘 영역을 가지므로 칩과 SSD 전체가 더 비쌉니다. 따라서 기본적으로 SSD를 구축할 때 SSD가 제공하는 워크로드 또는 애플리케이션에 따라 균형을 잡는 행위로 보아야 합니다. 예를 들어 매우 큰 코어 4개로 SSD를 만들거나 작은 코어 여러 개로 SSD를 만들 수 있습니다. SSD에 여러 개의 프로세서가 있을 때의 이점은 각 프로세스를 자체 시간에 따라 실행하지 않고 많은 일정을 수행하지 않는다는 것입니다. PC의 CPU에는 괜찮을 수 있지만 SSD에서는 오버헤드가 낭비됩니다. 그래서 앞서 말했듯이 우리는 20개의 코어가 있는 여러 병렬 처리 지점을 가지고 있으며 각각 작은 작업을 수행하므로 명령 서비스 작업을 앞으로 이동시킵니다.
MSI: 오늘 우리는 귀사의 주력 모델 중 하나인 PCIe Gen4가 7GB/s로 가는 것에 대해 이야기하고 있습니다. 컨트롤러는 12나노미터로 만들어집니다. 10나노미터나 7나노미터로 가면 더 많은 처리량을 얻을 수 있습니까?
세바스티앙: 예, 아니오. Phison은 특정 대역폭 및 IOPS 목표를 위한 SSD 컨트롤러를 제작하므로 당사의 중간 수준 컨트롤러 중 일부는 5GB/s용으로 설계되고 고급 컨트롤러는 7GB/s용으로 설계될 수 있습니다. 더 새롭고 더 빠른 프로세스 노드로 이동하는 것이 반드시 좋은 방법은 아닙니다. 다시 말하지만, 응용 프로그램과 우리가 하려는 작업에 따라 다릅니다. 기본적으로 최고의 기술을 합리적인 가격에 전달하는 것은 균형으로 귀결됩니다.
그러나 귀하의 질문에 답하기 위해 프로세스 노드를 전환하면 몇 가지 작업을 수행할 수 있습니다. 칩은 더 작아질 것이지만 이 특정 상황에서는 크기 제약이 없습니다. 이를 통해 내부 주파수를 조금 더 빠르게 기록할 수 있지만 현재 성능 노드를 충족하기 위해 더 빨리 갈 필요는 없습니다. 누출을 줄입니다. 모든 실리콘 트랜지스터는 토글하지 않을 때에도 약간의 전류가 누출되므로 더 작은 프로세스 노드로 이동하면 상당한 도움이 됩니다. 그 반대는 최신 프로세스 노드에 뛰어들고 실제로 필요하지 않은 경우 구매 비용만 들기 때문에 추가 이점 없이 SSD를 더 비싸게 만듭니다. 소수의 크고 빠른 코어를 사용하는 경우가 종종 있는 2GHz에서 실행되는 CPU를 만드는 경우 예, 최신 프로세스 노드가 필요합니다. SSD의 발전은 항상 최신 프로세스 노드에 관한 것이 아닙니다. 병렬 처리를 통해 문제를 해결하고 빈도를 낮추는 것과 같은 스마트한 설계에 관한 것입니다. 최신 프로세스 노드로 조기에 이동하여 기술을 발전시키지 못할 수 있습니다.
MSI: DDR4 또는 DDR5 메모리를 사용하면 M.2 SSD 성능이 향상됩니까?
세바스티앙: Phison은 DRAM과 DRAM이 없는 SSD를 모두 만들지만 DRAM을 사용하는 SSD는 DDR 메모리를 사용하지 않으려고 매우 노력합니다. 빠른 경로는 실제로 DDR을 통과하지 않습니다. SRAM을 통과한 다음 데이터 경로를 통과합니다. DDR은 논리-물리 주소 변환에 사용되므로 실제 테이블 대역폭 요구 사항은 SSD 대역폭보다 작으므로 DDR4 또는 DDR5는 큰 차이를 만들지 않습니다. 오랫동안 우리는 DDR3로 괜찮았습니다. 현재 모델은 DDR4를 사용하고 있으며 개발 중인 모델은 DDR5로 이동하고 있습니다. 특정 시점에서 비용을 낮추기 위해 지배적인 프로세스 노드를 사용하는 것이 합리적입니다. 이전 노드에 너무 오래 머무르고 공급이 줄어들면 가격이 올라갑니다.
MSI: 첫 번째 PCIe Gen4 컨트롤러인 E16은 큰 발전이었습니다. 그런 다음 E18을 소개했습니다. 이것이 계획이었습니까, 아니면 SSD에서 실제로 이러한 속도를 얻기 위한 기술적 문제를 해결하기 위해 E18 컨트롤러가 도입되었습니까?
세바스티앙: 흥미로운 질문입니다. 둘 다 E16 그리고 E18 계획되었다. 당시 우리가 하려고 했던 것은 시장 출시 요구 사항을 충족하는 것이었습니다. 당시 Gen4는 물음표였습니다. 우리는 제품이 시장에 출시되기 오래 전에 CPU 공급업체와 이야기하고 있으며, 잠재적으로 실리콘에 포함되어 있더라도 다음 제품에서 적용되거나 적용되지 않을 수 있는 새로운 기술을 항상 활성화하고 있습니다. 그래서 Gen4를 켤지 여부에 대해 업계 내부에서 많은 질문이 있었습니다. AMD(Gen4로 시장에 처음 출시)가 Gen4에 전념했다는 긍정적인 확인을 받았을 때 우리는 플랫폼 릴리스와 일치하도록 E16을 약속하고 시장에 출시했습니다. 우리는 Gen4 SSD를 최초로 시장에 출시했을 뿐만 아니라 약 18개월 동안 클라이언트 공간에서 시장에 출시된 유일한 Gen4 SSD였습니다. 경쟁사가 1세대 Gen4 제품을 출시했을 때 우리는 2세대를 출시하고 있었습니다. E18은 우리가 해당 분야의 첫 번째 ASIC인 E16에서 배운 모든 교훈 덕분에 인터페이스를 포화 상태로 만들고 있습니다.
MSI: Gen4가 할 수 있는 것의 한계에 거의 도달하고 있습니다. 예를 들어 IOPS 성능과 같은 영역에서 작업하고 있습니까?
세바스티앙: 언제든지 IOPS를 개선할 수 있지만 이는 ASIC 비용에 직접적인 영향을 미칩니다. E18이 있는 클라이언트 공간에서 현재 세대는 필요한 곳입니다. 우리는 IOPS를 두 배로 늘릴 수 있지만 플랫폼이 이를 활용할 수 있을지 확신할 수 없습니다. 우리는 Gen4가 할 수 있는 원시 속도 제한에 거의 근접하고 있지만 최적화하고 더 많은 것을 얻을 수 있는 다른 방법이 있습니다.
MSI: E19가 있다는 뜻인가요?
세바스티앙: E19가 있지만 성능보다 가치에 더 중점을 둔 DRAM 없는 공간을 목표로 하고 있습니다. 게이머의 관점에서 당신이 요구하는 것은 E18 플러스 또는 슈퍼 터보가 있을 것인가 하는 것입니다. 짧은 대답은 '아니오'입니다. Gen4는 기술로 가능한 것 측면에서 포화 상태입니다. 그러나 우리가 E18 및 Gen4로 계속해서 할 일은 해당 기술을 다른 스윔 레인으로 스며들게 하는 것입니다. E19는 더 낮은 비용을 목표로 하기 때문에 인터페이스를 포화시키지 않습니다. 따라서 새로 고침으로 몇 GB/s가 더 추가되고 IOPS가 향상됩니다. 따라서 그 공간에는 12나노미터에서 다음 프로세스 노드인 7나노미터로 계속 이동함에 따라 현재 기술로 성장할 여지가 여전히 있습니다.
MSI: Gen4 시장을 가속화하는 다이렉트 스토리지를 보십니까?
세바스티앙: 특히 클라이언트 공간에서 일반적으로 컴퓨팅을 가속화한다고 생각합니다. 기본적으로 다이렉트 스토리지는 NTFS 계층을 우회하는 읽기 전용 인터페이스입니다. NTFS는 안정성에 중점을 둔 Windows용 표준 파일 시스템으로 오랫동안 사용되어 왔습니다. 내부에 많은 레이어가 있으며 각 레이어는 약간의 대기 시간을 추가합니다. 다이렉트 스토리지는 가능한 한 적은 처리로 SSD에 대한 다이렉트 파이프라인을 제공합니다. OS는 가능한 한 적은 대기 시간을 추가하고 있으며 읽기 전용 인터페이스입니다. 따라서 주로 클라이언트 공간의 게임인 빠른 I/O가 필요한 읽기 전용 워크로드는 직접 스토리지의 이점을 얻을 수 있습니다. 지연 시간이 짧은 이 파이프라인은 기본적으로 휴대폰, 태블릿 및 PC뿐만 아니라 게임에 컴퓨팅이 사용되는 곳입니다.
MSI: Phison은 이러한 신기술에 대해 얼마나 앞서 작업하고 있습니까?
세바스티앙: SSD 자체는 내부에서 얼마나 변경하는지에 따라 6개월에서 18개월이 걸립니다. 그러나 차세대 실리콘 프로세스 노드를 가능하게 하는 기술은 ASIC이 실제로 제품이 되기까지 일반적으로 2~3년이 걸립니다. 따라서 우리는 Gen6에 대해 잘 알고 있으며 Gen6 SSD를 가능하게 하는 하위 수준 구성 요소를 설계하는 작업을 시작했지만 컴퓨팅 관점에서 Gen5가 왜 그렇게 흥미로운지에 대해 이야기하겠습니다.
DDR4 2133은 채널당 약 14GB/s이며 게임용 PC에는 4~6개의 채널이 있습니다. 이제 Gen5x4에는 14GB SSD가 있습니다. 더 빠른 DDR4가 있고 이제 차세대 보드에서 DDR5를 사용할 수 있다는 것은 사실이지만 그게 요점은 아닙니다. 이제 SSD 스토리지와 DRAM을 같은 공간에서 작동하며 같은 호흡으로 말할 수 있다는 것입니다. DRAM은 대기 시간이 매우 짧은 64비트 I/O에 최적화되어 있기 때문에 SSD는 결코 DRAM을 대체하지 않습니다. 하지만 이를 캐싱 관점에서 보면 CPU에는 L1, L2, L3 RAM 캐시가 있는 반면 Gen5 SSD는 DDR과 동일한 속도로 L4 캐시로 작동할 수 있습니다. 따라서 이제 SSD의 자연스러운 세분성은 CPU의 캐싱 아키텍처와 일치하며 여기에서 컴퓨터가 일반적으로 작동하는 방식이 변경되기 시작합니다.
MSI: 놀랍군요. 이 신제품에 대해 앞으로 가장 큰 도전 과제는 무엇이라고 생각하십니까?
세바스티앙: 새로운 세대가 거듭될 때마다 속도가 계속해서 증가함에 따라 우리의 과제는 계속해서 더위를 관리하는 것입니다. 그러나 PC가 어디로 가고 있는지에 대한 더 큰 질문을 본다면 클라이언트 공간에서 M.2 PCIe Gen5가 갈 수 있는 한계에 도달하고 실제 인터페이스나 커넥터가 병목 현상이 될 것이라는 이해가 있습니다. 미래의 속도. 따라서 새로운 커넥터가 개발 중이며 향후 몇 년 내에 출시될 예정입니다. 이 커넥터는 마더보드로의 전도를 통해 SSD의 신호 무결성과 열 발산 기능을 모두 크게 향상시킵니다.
MSI: 공급망 문제는 어떻습니까? 우리는 특히 그래픽 카드의 부족을 보고 있지만 다른 많은 구성 요소와 재료도 마찬가지입니다. 이것이 Phison과 제품의 일관성에 어떤 영향을 미치나요?
세바스티앙: 공급망의 다양한 글로벌 부족은 실제로 Phison에 영향을 미치지 않습니다. SSD에는 특히 고유한 몇 가지 구성 요소가 있습니다. DRAM, NAND 및 전력 관리 IC(PMIC)와 같은 컨트롤러가 있습니다. 다른 모든 것(커패시터와 저항기)은 개별적이며 부족함이 없습니다. NAND와 DRAM의 경우 Phison은 장기 공급 계약을 맺고 있으며 항상 재고를 보유하기 위해 사전 구매합니다. PMIC 공급 부족은 실제로 많은 제조업체의 문제이지만 우리는 자체적으로 만듭니다. Phison은 SSD용 새 컨트롤러를 개발할 때 동시에 PMIC를 설계하고 둘 다 제조합니다.
우리는 대량 거래를 통해 이익을 얻습니다. Phison이 약 20년 전에 시작했을 때 우리는 USB 썸 드라이브를 대중화한 작은 회사였습니다. 오늘날 우리는 의료, 산업, 운송, 항공 우주, 게임, 워크스테이션 및 엔터프라이즈 솔루션에서 전화, 자동차 및 IoT의 내장 스토리지에 이르기까지 모든 유형의 스토리지를 제공합니다. 그 때문에 우리는 정말 많은 양을 다루고 있습니다. 따라서 미리 잘 예측하고 중요한 구성 요소의 재고를 관리하는 한 괜찮을 것입니다.
MSI: 항상 균형을 유지해야 합니까, 아니면 스토리지의 미래가 속도와 용량이 아닌 용량에 초점을 맞추는 방향으로 기울어질 것이라고 보십니까?
세바스티앙: 업계의 모든 것이 더 높은 밀도와 더 빠른 속도로 이동하고 있습니다. 클라이언트 공간은 지난 몇 년 동안 우리가 본 기술 곡선을 따라 속도와 밀도가 모두 증가하는 프리미엄 제품과 균형을 유지할 가능성이 높습니다. 그러나 Phison은 다양한 시장에서 모든 종류의 다양한 특수 애플리케이션을 위한 SSD를 만듭니다. 우리는 데이터베이스 분석, AI/머신 러닝, 유전체학 및 기타 빅 데이터 과학 작업을 수행하는 고성능 컴퓨팅 시장에서 매우 인기 있는 초고밀도 16테라바이트 QLC SSD를 보유하고 있습니다. 그런 다음 매우 쓰기 집약적인 워크로드를 수행하는 사람들에게 정말 유용한 모든 SLC SSD를 보유하고 있습니다. 또는 버스트와 지속성을 동일하게 유지하기 위해 안정적인 상태의 성능이 필요한 사람들에게 유용합니다. 소비자 공간에서 우리는 게임을 위한 밀도와 성능에 치우친 균형에 초점을 맞출 것입니다. 가치 시장 및 중형 부문의 경우 브라우저만 사용하는 경우 엄청난 성능이 필요하지 않기 때문에 비용과 특정 워크로드에 필요한 것 사이에 절충점이 있습니다.
MSI: 게임의 경우 대부분의 SSD가 SLC 캐시가 있는 TLC 메모리에 정착한 것 같습니다. 그러나 동일한 물리적 다이 크기 내에서 더 많은 용량을 원한다면 QLC로 가야 합니까?
세바스티앙: 안 돼. M.2 포맷의 TLC SSD는 현재 최대 8테라바이트, U.2 포맷의 경우 16테라바이트까지 만들 수 있지만 16테라바이트 SSD는 상당히 비쌉니다.
MSI: 게임의 크기는 계속해서 증가하고 있으며 엄청난 양의 HD 텍스처와 기타 데이터를 다운로드해야 합니다. 8테라바이트 및 16테라바이트 TLC M.2가 더 저렴해지는 것을 보기 시작하는 것은 시간 문제일 뿐입니다.
세바스티앙: 예, NAND 공급업체가 비용을 낮추기 위해 항상 다이의 밀도를 높이고 있기 때문에 확실히 더 저렴해질 것입니다. 따라서 TLC는 계속해서 생명을 유지할 것입니다. 그러나 QLC는 게임이 아닌 애플리케이션에서 매우 흥미로워지고 있습니다. 흐름이 주로 읽기이고 QLC는 읽기가 좋기 때문에 QLC SSD에서 게임을 할 수 있습니다. 쓰기에는 그다지 좋지 않으며 상당히 느립니다. 그러나 나는 밀도가 계속 올라갈 것이라고 말할 것입니다. 가격은 계속 하락할 것입니다. 그리고 비용 대 집적도의 최적 지점이 올라가고 있습니다. 이전 세대는 1테라바이트였습니다. 다음 세대는 2테라바이트가 될 것이고 앞으로 3~4세대가 되면 4테라바이트가 될 것입니다. 따라서 게임을 제외한 모든 응용 프로그램의 경우 대부분의 사람들이 드라이브로 데이터 읽기를 수행하기 때문에 더 많은 QLC를 보게 될 것입니다. 물론 패치가 있고 적용되지만 그렇게 높은 속도는 아닙니다.