스토리지 대기 시간 자세히 살펴보기 - 중요한 이유

작가 | 2023년 2월 27일 | 모두, 기술

즉각적인 만족에서와 같이 순간은 얼마나 빠릅니까? 대부분의 소프트웨어 사용자에게 연구에 따르면 0.1초 이하의 지연은 즉각적인 것으로 간주. 1초만에 사용자의 마음이 방황하기 시작합니다. 애플리케이션이 응답하지 않는 경우 5~6초, 사용자가 좌절하거나 앱 사용을 완전히 중단할 가능성이 있습니다. 대부분의 경우 스토리지 인프라가 이러한 지연의 주범이며, 이로 인해 최종 사용자 경험이 저하되고 기타 비즈니스에 부정적인 영향을 미칩니다.

그러나 초과 대기 시간은 조직의 데이터 스토리지 인프라에 있는 여러 가지 다른 요인으로 인해 발생할 수 있습니다. 너무 자주 스토리지 업계는 대기 시간 대신 IOPS(초당 입력/출력 작업) 또는 처리량(MB/s)에 초점을 맞춥니다.

 

 

스토리지 대기 시간이란 무엇입니까?

스토리지 대기 시간은 스토리지 장치가 읽기 또는 쓰기 요청을 보내고 응답하는 데 걸리는 시간을 나타냅니다. 특히 스토리지 대기 시간은 읽기 또는 쓰기 명령이 애플리케이션 요청에서 최종 출력까지 전체 스토리지 생태계를 가로질러 이동하는 데 필요한 시간입니다. 생태계의 네 가지 구성 요소 모두에 의해 영향을 받는 메트릭입니다.

      • 낸드 플래시
      • 스토리지 펌웨어
      • 펌웨어에 전원을 공급하는 SSD 컨트롤러
      • 스토리지 시스템 인프라

대기 시간은 스토리지 펌웨어의 효율성과 입출력 요청을 처리하기 위해 CPU 리소스를 얼마나 빨리 활용할 수 있는지를 고려합니다.

대부분의 컴퓨팅과 마찬가지로 빠를수록 좋습니다. 요청이 스토리지 시스템을 통과하는 데 걸리는 시간이 짧을수록 대기 시간이 짧아지고 요청 처리 속도가 빨라집니다. 대기 시간은 컴퓨팅 워크로드, 특히 트랜잭션이 많은 워크로드의 성능을 평가할 때 고려해야 하는 가장 중요한 요소 중 하나입니다.

 

 

스토리지 대기 시간이 중요한 이유는 무엇입니까?

포브스 기사 저장소에서 지연 시간이 중요한 이유를 설명하기 위해 흥미로운 비유를 사용했습니다.

“당신은 주로 고속도로에서 출퇴근하고 운전합니다. 고속도로에는 대역폭과 유사한 차선 수와 IOPS와 유사한 시간당 총 차량 수의 특정 용량과 같은 특정 특성이 있습니다. 문제는 이 두 가지 가치를 모두 알고 있더라도 가장 중요한 질문에 답할 수 없다는 것입니다. 직장에 도착하는 데 얼마나 걸릴까요?”

계속해서 대기 시간은 최종 측정이며 작업에 걸리는 시간입니다. 출퇴근을 계획할 때 이것이 정말 중요합니다. 고속도로의 수와 시간당 차량 수는 이동 시간에 영향을 주지만 실제로 소요되는 시간은 효율성의 진정한 척도입니다.

대기 시간이 짧으면 컴퓨팅 시스템의 전체 유휴 시간이 줄어듭니다. 리소스 활용이 더 효율적이며 조직은 실제로 기존 스토리지에서 더 많은 가치를 얻을 수 있습니다.

 

플래시 스토리지는 어떤 면에서 대기 시간을 개선했습니다.

하드 디스크 드라이브(HDD)가 저장 매체로 선택되었을 때 지연 시간은 밀리초(1/1000초) 범위였습니다. 오늘과 함께 NAND 플래시 솔리드 스테이트 드라이브(SSD), 그러나 이제 대기 시간을 마이크로초(100만분의 1초) 단위로 측정합니다. 이는 상당히 큰 향상이지만 대기 시간이 때때로 10배로 최고점에 도달할 수 있다는 사실에 놀랄 수도 있습니다.

플래시 미디어는 NAND 플래시 기술의 발전으로 처리량을 높이고 대기 시간을 줄였지만 다른 스토리지 시스템 구성 요소의 대기 시간에는 전혀 영향을 미치지 않았습니다. SSD 공급업체는 스토리지 시스템의 다른 수준에서 대기 시간을 개선하여 차별화할 수 있습니다.

예를 들어 SSD 컨트롤러는 대기 시간을 늘리거나 줄이는 데 매우 중요한 역할을 합니다. 시스템을 통해 읽기 또는 쓰기 요청을 보내는 전체 프로세스를 조정하는 구성 요소입니다. 플래시 스토리지 미디어가 아무리 빠르더라도 컨트롤러가 해당 데이터를 빠르게 보내거나 받을 수 없다면 대기 시간은 여전히 높습니다. 또한 입/출력(I/O) 작업 요청이 이미 I/O 작업을 수행 중인 플래시 칩에 할당되어 결과적으로 대기열에 들어갈 수 있습니다.

SSD의 대기 시간이 더 긴 다른 이유는 다음과 같습니다.

      • 웨어 레벨링 – 웨어 레벨링 메커니즘에는 동적 및 정적의 두 가지 유형이 있습니다. 정적 마모 평준화는 거의 액세스하지 않는 정적/콜드 블록을 주기적으로 이동하여 사용률이 낮은 셀을 다른 데이터에서 사용할 수 있도록 합니다. 이 기술은 장치 수명을 연장할 수 있지만 복잡한 백그라운드 프로세스에는 정적 데이터를 이동하는 여러 작업이 포함되어 지연 시간이 발생하고 SSD의 성능에 영향을 미칩니다.
      • GC(가비지 컬렉션) – GC는 스토리지 시스템에서 롱테일 대기 시간 문제의 주요 원인 중 하나입니다. GC로 인한 롱테일 대기 시간은 99번째 백분위수의 평균 대기 시간보다 100배 이상 큽니다. 이 비하인드 프로세스에서 SSD 컨트롤러는 블록에서 오래된 데이터 페이지를 식별하고 해당 블록의 모든 유용한 데이터를 다른 곳으로 옮긴 후 삭제합니다. 이로 인해 SSD 속도가 느려지고 대기 시간이 늘어날 수 있습니다.
      • 미디어 스캔 – SSD 컨트롤러는 때때로 백그라운드에서 미디어 스캔을 실행하여 읽기/쓰기 작업 중에 실제 문제가 발생하기 전에 미디어 오류를 사전에 찾아 수정합니다. 이로 인해 SSD 대기 시간이 증가할 수 있습니다.

 

 

Phison이 스토리지 대기 시간을 해결하는 방법

업계 최고의 PCIe NVMe SSD 컨트롤러 및 SSD 모듈 공급업체 중 하나인 Phison은 R&D에 막대한 투자를 하고 있습니다.—미래의 기술 솔루션을 개발할 뿐만 아니라 기존 솔루션을 개선합니다.

Phison이 SSD 솔루션의 대기 시간을 줄이는 데 도움이 되는 몇 가지 방법은 다음과 같습니다.

      • 최적화된 펌웨어 설계 – Phison은 다양한 사용 사례 및 고객 요구 사항에 따라 펌웨어를 사용자 지정할 수 있습니다. 예를 들어 일부 펌웨어 작업은 대기 시간 증가를 방지하기 위해 유휴 시간 동안 실행되도록 설계할 수 있습니다. QoS는 고유한 기업 요구 사항을 충족하기 위해 Phison의 사내 기술로 최적화할 수 있습니다. 대부분의 경우 Phison은 초저 지연 시간을 포함하여 특정 요구 사항과 지정된 지연 시간 성능을 위한 맞춤형 SSD 컨트롤러 및 모듈을 설계할 수 있습니다.
      • 독점 CoXProcessor 2.0 – 이 코프로세서에는 원래 CPU의 일부 부하를 오프로드하는 하드웨어 가속기가 포함되어 있어 저장 장치가 읽기/쓰기 명령을 보다 효율적으로 실행할 수 있도록 도와줍니다.
      • 듀얼 CPU 설정 – 각 CPU가 단일 SSD 내에서 독립적으로 작동하므로 드라이브는 읽기/쓰기를 위한 여러 명령을 동시에 처리할 수 있습니다. 서로 다른 작업을 병렬로 처리할 수 있으므로 대기 시간이 줄어듭니다.
      • 가비지 수집 펌웨어 – Phison SSD는 가비지 수집 부하를 작은 조각으로 분할하고 조금씩 처리하여 대기 시간을 줄이고 일관성을 개선합니다.

 

 

혁신을 가속화하는 기반™

ko_KR한국어