데이터는 연구의 생명선입니다. 항상 그랬지만 오늘날의 첨단 기술을 통해 생명과학, 의료 및 제약 산업의 연구자들은 데이터를 결합하고 연구하여 생명을 구하는(또는 생명을 개선하는) 돌파구를 마련하는 보다 혁신적인 방법을 찾고 있습니다.
조직이 데이터를 더 잘 수집하고 분석할수록 결과는 더 정확하고 유익해질 것입니다. 연구자 간의 경쟁은 상당히 치열할 수 있으며, 데이터에서 가장 효과적으로 가치를 추출할 수 있는 팀이 성공을 거두는 경우가 많습니다. 아마도 그 이유는 2021년 연구 제약 업계 리더 중 절반 이상이 조직의 데이터 및 분석 유창성을 향상하는 것이 내년의 최우선 과제라고 생각하는 것으로 나타났습니다. 그 이후로 데이터 과학 활용 능력과 데이터 사용 방법에 대한 필요성이 더욱 심각해졌습니다.
오늘날 연구에서 통찰력을 제공하는 기술
빅데이터는 의학 연구 결과의 핵심입니다. 유전체학, 생물정보학, 예측 생물학, 화학, 약리학 등의 대규모 프로젝트를 추진하려면 엄청난 양의 정보가 필요할 수 있습니다. 다행스럽게도 연구자들이 해당 데이터를 작업에 적용할 수 있는 고급 기술이 등장했습니다. 여기에는 다음이 포함됩니다.
-
-
- 데이터 분석 – 여기에는 데이터 수집이 포함됩니다. 중복이나 오류 없이 고품질 데이터세트로 정제하기 위해 정리(또는 "스크러빙") 분석을 위한 모델 생성; 패턴과 이상 징후를 식별하기 위한 데이터 마이닝 통찰력을 발견하기 위해 데이터와 결과를 해석합니다.
-
-
-
- AI 및 머신러닝(ML) – AI와 ML은 엄청난 양의 데이터를 매우 빠르게 처리하고 해당 패턴과 관계를 그 어느 때보다 빠르고 효율적으로 찾을 수 있기 때문에 이러한 기술은 데이터 분석을 지원합니다. ML을 사용하면 연구 플랫폼은 본질적으로 더 많은 데이터를 수신하면서 관련성과 관련성이 없는 것을 스스로 학습하고 더 똑똑해질 수 있습니다. 이러한 플랫폼은 팀이 이전에는 결코 알아채지 못했던 통찰력을 얻을 수 있도록 도와줄 수 있습니다.
-
-
-
- 고성능 컴퓨팅(HPC) – 연구에는 너무 많은 데이터와 고성능 AI, ML 및 분석 시스템이 필요하기 때문에 팀은 연구에서 생성되는 집중적인 워크로드를 처리하도록 설계된 HPC 시스템을 사용해야 합니다. 과거에 사용 가능한 유일한 HPC 시스템은 일반적으로 정부나 교육 기관이 소유하는 대규모 슈퍼컴퓨터였습니다. 그러나 오늘날 컴퓨팅 기능은 크게 발전하여 올바른 소프트웨어와 애플리케이션을 사용하면 팀이 상용 서버에서 HPC 수준의 성능을 달성할 수 있습니다.
-
연구자들은 일반적으로 이러한 기술의 조합을 사용하여 데이터에서 필요한 통찰력을 얻습니다. 빅 데이터, 우수한 분석 플랫폼, AI, ML 및 HPC를 통해 오늘날의 연구자들은 보다 안전하고 효과적인 제품을 만들고, 연구 단계를 가속화하고, 질병을 치료할 수 있는 새로운 분자를 식별하고, 제품 효율성을 개선하고, 특정 상태로 인해 위험에 처한 집단을 식별할 수 있습니다. , 발병을 보다 효율적으로 예측 및 대응하고, 수술 후 합병증을 예측하고, 진단을 간소화하고, 의료 장비의 효율성을 향상시키는 등 다양한 작업을 수행합니다.
다음은 빅데이터가 최신 기술과 결합될 때 어떤 결과가 나올 수 있는지에 대한 한 가지 예입니다. 에너지학과 과학실 1990년 미국 국립보건원(National Institutes of Health)과 협력하여 전체 30억 염기쌍의 인간 게놈 서열을 분석했습니다. 이 프로젝트는 10년이 걸렸고 비용은 거의 $40억에 달했습니다. 그러나 오늘날에는 향상된 컴퓨팅 기능과 기타 기술 덕분에 인간 게놈의 서열을 24시간 이내에 분석할 수 있습니다. 최신 아이폰 가격의 절반.
빅데이터는 데이터 스토리지에 대한 기대치를 더욱 높여줍니다.
최근 기사 임상 리더 2012년에 3단계 의학 연구에서 거의 100만 개에 가까운 데이터 포인트를 수집한 것으로 추정되었습니다. 그러나 오늘날 의료 데이터 포인트는 수십억 개로 측정됩니다. 그런 다음 기사에서는 이렇게 말합니다. “이러한 급격한 증가로 인해 이 새로운 규모를 지원하는 데이터의 수집, 처리 및 보관을 개선하기 위한 새로운 전략의 채택이 필요합니다.”
의학 연구 프로젝트를 위한 데이터 스토리지는 성능 저하 없이 엄청난 양의 데이터를 처리할 수 있어야 합니다. AI, ML 및 데이터 분석을 사용하는 시스템은 짧은 대기 시간과 높은 처리량을 제공해야 합니다. 읽기 집약적인 워크로드와 쓰기 집약적인 워크로드를 모두 지원할 수 있어야 합니다. 빠른 확장성을 지원하고 너무 많은 전력을 소비하지 않는 인프라가 필요합니다.
기존의 데이터 스토리지는 더 이상 첨단 의료 및 생명과학 연구의 스토리지 요구 사항을 충족할 수 없습니다. 이러한 시스템은 병목 현상을 일으키고 연구 및 임상 시험 속도를 늦추고 있으며 이는 실제 혁신을 기다리는 데 더 오랜 시간이 걸린다는 것을 의미합니다.
문제 중 하나는 생명 과학 기업이 디지털 혁신을 매우 빠르게 진행하지 않는다는 것입니다. 최근 맥킨지 보고서 2022년에도 생명과학 기업은 "명확한 따라잡을 기미 없이" 여전히 다른 산업의 디지털 성숙도 리더에 비해 2~3배 정도 뒤처져 있는 것으로 나타났습니다.
이러한 조직에는 오늘날의 고급 요구 사항을 지원할 수 있는 데이터 스토리지에 대한 새로운 접근 방식이 필요합니다. 데이터 사일로를 허물고 데이터 공유를 더욱 효율적으로 만들 수 있어야 합니다. 필요에 따라 쉽게 확장 가능 데이터 분석, HPC, AI 및 ML의 고성능 요구를 지원할 수 있습니다.
Phison이 도울 수 있는 방법
빠른 응답 시간과 짧은 대기 시간, 그리고 연구 데이터 세트의 전체 크기 때문에 SSD(Solid State Drive)는 데이터 저장을 위한 현명한 선택입니다. 실제로 조직에서는 점점 더 올플래시 스토리지 어레이로 전환하고 있습니다. SSD는 기존 하드 디스크 드라이브(HDD)보다 전송 속도가 빠르고 대기 시간이 짧으며 전력 소비도 적습니다.
NAND 플래시 SSD 및 기타 데이터 스토리지 솔루션 분야의 세계적인 선두업체인 Phison은 오늘날의 집약적인 스토리지 수요를 충족하도록 설계된 다양한 제품을 보유하고 있습니다. 예를 들어, 회사의 엔터프라이즈 SSD 플랫폼 스토리지 및 성능 요구 사항을 지원합니다. 일체 포함, ML, HPC 및 데이터 분석 플랫폼. 이는 다음과 같은 문제를 해결하는 데 도움이 될 수 있습니다.
-
-
- 초대형 데이터 세트
- CPU 및 GPU를 위한 고성능 및 빠른 데이터 스트리밍이 필요합니다.
- HDD의 기계적 취약성
-
Phison을 사용하면 조직은 의료 연구에 필요한 더 빠르고 스마트한 인프라를 달성할 수 있습니다.