조건 인공지능(AI) ML(머신 러닝)은 컴퓨팅 산업에서 점점 더 많이 사용되고 있지만 숙련된 IT 실무자조차도 두 기술을 지원하는 데 필요한 컴퓨팅 및 스토리지 인프라를 완전히 인식하지 못할 수 있습니다. 이 문서에서는 문제를 검토하고 SSD(Solid State Drive)가 최상의 AI 및 ML 결과를 가능하게 하는 방법에 대한 통찰력을 제공합니다.
AI와 ML이란 무엇입니까?
AI와 ML의 진정한 본질을 이해하는 첫 번째 단계는 그들이 같은 것이 아니라는 것을 파악하는 것입니다. AI는 인간처럼 생각할 수 있는 소프트웨어를 만드는 것입니다. ML은 새로운 개념을 학습한 다음 이러한 개념을 계속해서 더 잘 마스터하기 위해 소프트웨어를 얻는 것과 관련이 있습니다. 그것들은 구별되지만 관련이 있고 중복되는 기술입니다.
AI와 ML도 새로운 아이디어가 아닙니다. 컴퓨터 비전가 Alan Turing은 1950년에 기계가 사람처럼 생각하도록 만들 수 있다고 가정했습니다. 1959년까지 AI 개척자 Marvin Minsky는 초기 AI 프로그램에 MIT 신입생 미적분학 시험을 관리했습니다. 통과했습니다. 영화는 우리에게 살인적으로 지능적인 HAL 9000을 제공했습니다. 2001: 스페이스 오디세이 그리고 똑같이 치명적인 Skynet 종결 자. 허구는 우리가 AI와 ML에 대해 생각하는 방식을 알려주면서도 그 과정에서 약간의 혼란을 야기하기 때문에 이러한 예는 언급할 가치가 있습니다.
다행스럽게도 우리는 아직 Skynet의 시대에 도달하지 않았지만 우리 세상은 직장에서 AI와 ML의 인상적인 사례로 가득 차 있습니다. 이들 중 대부분은 크거나 화려하지는 않지만 비즈니스와 일상 생활에 미치는 영향은 적지 않습니다. 예를 들어 로봇 프로세스 자동화(RPA) "봇"은 AI를 사용하여 이메일 메시지 읽기 및 양식 작성과 같은 작업을 수행할 수 있습니다. ML은 법 집행 기관의 안면 인식이나 의료 분야의 암 진단과 같은 프로세스를 주도합니다.
AI와 ML은 어떻게 작동합니까?
AI 및 ML 프로그래밍에는 다양한 종류가 있지만 핵심적으로 두 기술 모두 패턴 인식을 기반으로 합니다. RPA 이메일 읽기 예제에서 봇은 내용을 설명하는 이메일 메시지의 문구를 인식하도록 훈련되었습니다. "결제" 또는 "연체"라는 단어가 포함된 메시지는 회계 부서를 위한 것입니다.
또한 봇은 이메일 서명을 구문 분석하고 패턴 인식을 사용하여 메시지가 공급업체(미지급금) 또는 고객(미수금)에서 온 것인지 판단할 수 있습니다. 이러한 유형의 기능은 사이버 보안에서도 유용합니다. AI 소프트웨어는 보안 로그에서 나오는 수백만 개의 데이터 포인트를 검사하고 공격이 진행 중임을 나타내는 비정상적인 동작을 찾아낼 수 있습니다.
ML은 주어진 지식 영역을 더 잘 이해하기 위해 패턴 인식을 유사하게 활용합니다. ML 시스템은 프로그래밍된 코드나 특정 규칙을 따르지 않고도 데이터에 대해 학습하고 지속적으로 "더 똑똑"해질 수 있습니다. 예를 들어, ML 알고리즘은 백만 개의 나무와 식물 이미지를 "볼" 수 있습니다. 어느 시점에서 알고리즘은 나무와 식물의 차이점을 스스로 학습합니다. 따라서 AI와 ML의 본질적인 차이점은 ML이 여전히 학습하고 패턴을 더 잘 발견하는 동안 AI는 패턴을 발견하도록 학습되었다는 것입니다.
이 모든 작업에는 막대한 양의 데이터 처리가 필요합니다. 어느 정도까지 AI와 ML은 단순히 빅 데이터 패러다임의 확장입니다. 빅 데이터 및 데이터 분석을 통해 크고 다양한 데이터 세트를 해석하고 시각적 추세를 발견하며 새로운 통찰력을 얻을 수 있습니다. AI와 ML은 프로세스를 한 단계 더 발전시킵니다. 데이터 마이닝, 통계 분석 및 예측 모델링과 같은 기존의 빅 데이터 분석 및 데이터 과학 프로세스를 활용하여 빅 데이터를 기반으로 한 추론, 의사 결정 및 조치 단계를 가능하게 합니다.
실제로 AI와 ML은 각각 데이터 관리와 관련된 네 가지 개별 프로세스로 구성됩니다.
- 데이터 수집 - 여러 소스의 데이터를 AI 및 ML 워크로드의 기반인 Spark, Hadoop 및 NoSQL 데이터베이스와 같은 빅 데이터 플랫폼으로 가져옵니다.
- 준비 - AI 및 ML 교육에 사용할 수 있도록 데이터 준비
- 교육 - AI 및 ML 소프트웨어 프로그램의 교육 알고리즘 실행
- 추론 - 추론 워크플로우를 수행하기 위한 AI 및 ML 소프트웨어 가져오기
NAND 플래시 스토리지가 AI 및 ML에 필수적인 이유
AI 및 ML에서 빅 데이터의 중심 역할은 스토리지를 이러한 워크로드의 중요한 성공 요인으로 만듭니다. 효과적이고 유연하며 고성능 스토리지가 없으면 AI 및 ML 소프트웨어가 제대로 작동하지 않습니다. 또는 최소한 워크로드는 컴퓨팅 및 스토리지 인프라를 제대로 사용하지 못하게 합니다.
이러한 이유로 NAND 플래시 스토리지는 AI 및 ML을 지원하는 스토리지에 이상적인 스토리지 매체입니다. 그 이유를 이해하려면 AI 및 ML의 4단계 각각의 스토리지 요구 사항을 고려하십시오.
데이터 수집 시 AI는 정형 및 비정형 데이터 형식을 포함하여 매우 다양한 대규모 데이터 세트를 수집합니다. 데이터는 잠재적으로 광범위한 소스에서 가져올 수 있습니다. 성공적인 수집에는 페타바이트 또는 엑사바이트 단위로 측정되는 대용량 스토리지가 필요하지만 실시간 분석을 위한 빠른 계층이 있어야 합니다. 다른 세 단계와 마찬가지로 여기에서도 안정성이 중요합니다. NAND 플래시는 안정성과 처리 속도의 최상의 조합을 제공합니다.
AI 및 ML의 데이터 준비 단계는 수집된 원시 데이터를 변환하고 훈련 및 추론 단계에서 AI 및 ML 소프트웨어의 신경망에서 사용할 수 있도록 형식을 지정하는 것을 의미합니다. 파일 입/출력(I/O) 속도는 데이터 준비 단계에서 중요합니다. NAND 플래시는 이 사용 사례에서 잘 작동합니다.
AI 및 ML의 교육 및 추론 단계는 컴퓨팅 집약적인 경향이 있습니다. 소프트웨어의 교육 모델로 데이터를 고속 스트리밍해야 합니다. 작업에 적합하지 않은 경우 스토리지 리소스에 부담을 줄 수 있는 중지 및 시작이 많은 반복 프로세스입니다.
SSD가 AI 및 ML 성공을 가능하게 하는 방법
규모 데이터 저장고 AI 및 ML 프로젝트에 필요한 요구 사항은 일반적으로 스토리지 솔루션의 혼합을 주장합니다. 관련성이 낮은 데이터를 보관하는 성능이 낮고 비용이 저렴한 일부 스토리지를 사용하는 계층형 접근 방식이 가장 좋은 경우가 많습니다. 그러나 일반적으로 빅 데이터 생태계에서 발견되는 것보다 비례적으로 더 클 가능성이 높은 고성능 계층도 있어야 합니다.
이는 AI/ML 스토리지 환경의 중요한 계층에 SSD를 배포하는 것을 의미합니다. 교육 단계에서 AI 및 ML 소프트웨어에 입력되는 방대한 양의 데이터의 빠른 이동을 지원하는 데 필요한 성능과 대기 시간을 제공할 수 있는 것은 SSD뿐입니다. 프로세스가 추론으로 이동함에 따라 성능과 대기 시간이 훨씬 더 중요해집니다. 특히 다른 워크플로우에서 AI/ML 시스템의 응답 시간이 어느 정도 중요할 경우 더욱 그렇습니다. 사람과 다른 시스템이 느린 AI 또는 ML 시스템이 작업을 완료하기를 기다리고 있다면 모두가 고통을 겪습니다.
Phison이 도울 수 있는 방법
Phison의 맞춤형 SSD 솔루션 AI 및 ML 워크로드의 성공에 필요한 뛰어난 성능과 유연성을 제공합니다. AI/ML 스토리지가 쓰기 집약적인 것보다 읽기 집약적인 경향이 있다는 점을 감안할 때 Phison은 가치 가격대에서 읽기 집약적인 애플리케이션에 최적화된 2.5인치 15.36TB 7mm SATA SSD 드라이브의 유일한 공급업체로 돋보입니다.
에서 깨달은 바와 같이 파이슨 ESR1710 시리즈, AI 및 ML에 필요한 경제적이면서도 고성능 스토리지의 필수 요소인 최고의 랙 스토리지 밀도와 낮은 전력 소비를 제공합니다. Phison의 2.5” SATA SSD의 고유한 크기는 이 크기의 SSD에 대해 세계 최대 용량을 제공하므로 단일 48U 랙에 AI 및 ML 애플리케이션용 데이터를 최대 13PB까지 저장할 수 있습니다. 이러한 종류의 밀도는 AI 및 ML에 유리한 스토리지 경제성으로 해석됩니다.
절대값이 필요한 AI/ML 애플리케이션용 가장 빠른 PCIe Gen4x4 읽기 및 쓰기 속도와 업계 최저 전력 소비로 Phison은 현재 X1 SSD U.2 슬롯과 역호환되며 최대 15.36TB의 용량을 제공하는 U.3 폼 팩터의 시리즈입니다.