Phison과 MediaTek이 스마트폰에서 차세대 AI를 구현하기 위해 메모리 아키텍처를 어떻게 재구상하고 있는지 알아보세요.
스마트폰은 인공지능의 주요 플랫폼으로 자리 잡고 있습니다. 기기 내 기본 기능으로 시작되었던 인공지능 기술은 이제 대규모 언어 모델, 멀티모달 애플리케이션, 그리고 사용자에게 더욱 가까이에서 작동하는 상시 접속 환경까지 빠르게 발전하고 있습니다.
AI를 로컬에서 실행하면 응답성이 향상되고 클라우드 인프라에 대한 의존도가 줄어들며 민감한 데이터가 기기에 안전하게 보관됩니다. 또한 클라우드 기반 모델만으로는 구현하기 어려운 실시간의 지속적인 상호 작용이 가능해집니다.
모바일 AI는 플랫폼의 근본적인 변화를 가져오고 있습니다.
인공지능은 데이터가 생성되는 곳으로 이동하고 있으며, 이는 점점 더 스마트폰을 의미하게 되었습니다. 기기는 더 이상 인공지능 출력물의 최종 출력물이 아닙니다. 기기는 모델이 실행되고 실시간으로 반응하는 환경으로 변모하고 있습니다.
이러한 변화는 낮은 지연 시간에 대한 요구, 데이터에 대한 더 큰 제어권, 그리고 대규모 클라우드 기반 추론 비용 상승이라는 세 가지 압력에 의해 주도되고 있습니다. 로컬 AI는 더 빠른 성능을 제공하고, 데이터를 기기 내에 유지하며, 외부 서비스에 대한 의존도를 줄임으로써 이 세 가지 문제를 모두 해결합니다.
그 결과, 백그라운드에서 지속적으로 작동하는 상시 접속형 상황 인식 환경이라는 새로운 유형의 경험이 탄생했습니다. 기회는 분명하지만, 모바일 AI가 약속하는 것과 현재 하드웨어가 일관되게 구현할 수 있는 것 사이에는 여전히 격차가 존재합니다.
모바일 생성형 AI의 발전을 저해하는 제약 조건
생성형 AI는 본질적으로 메모리 집약적입니다. AI 모델을 실행하려면 매개변수를 저장하고, 토큰을 관리하고, 추론 과정에서 컨텍스트를 유지하는 데 상당한 리소스가 필요합니다. 스마트폰 환경에서는 이러한 요구 사항이 현실적인 제약에 부딪히기 쉽습니다.
오늘날 스마트폰이나 클라우드 환경에서 가장 흔히 사용되는 AI 학습 및 추론 방식은 여러 측면에서 어려움을 안고 있습니다.
-
-
- 클라우드 기반 AI는 개인정보 보호, 보안 및 지속적인 토큰 비용과 관련된 우려를 불러일으킵니다.
- 연결성에 대한 의존성은 지연 및 가용성 문제를 야기합니다.
- 온디바이스 방식은 제한된 메모리 용량과 DRAM 확장 비용의 높은 부담으로 어려움을 겪습니다.
- 응답 속도가 느리면 사용자 경험이 저하될 수 있습니다.
-
이러한 제약 조건으로 인해 어려운 선택의 기로에 서게 됩니다. 사용자는 클라우드에 의존하여 그 한계를 감수하거나, 온디바이스 AI를 시도하여 성능 및 비용 장벽에 부딪히는 두 가지 선택지 중 하나를 택해야 합니다.
업계가 앞으로 나아가기 위해서는 모바일 시스템에서 메모리를 사용하는 방식에 대한 새로운 접근 방식이 필요합니다.
모바일 AI 아키텍처에 대한 새로운 접근 방식
최근 Phison과 MediaTek은 메모리에 대한 근본적으로 다른 사고방식을 통해 이러한 문제를 해결하기 위해 협력했습니다.
이번 공동 솔루션은 미디어텍 디멘시티 9500 SoC와 피슨의 파스카리 aiDAPTIV™ 솔루션을 결합하여 DRAM의 한계를 뛰어넘는 새로운 스마트폰용 AI 추론 아키텍처를 도입했습니다.
전반적으로 이 접근 방식은 단순하지만 강력합니다. 그 이유는 다음과 같습니다.
-
-
- NAND 플래시 메모리를 DRAM과 함께 통합하여 메모리 계층 구조를 확장합니다.
- 지능형 미들웨어를 사용하여 메모리 계층 전반에 걸쳐 데이터를 동적으로 관리합니다.
- 메모리와 저장 장치를 통합되고 조정된 리소스로 취급합니다.
-
aiDAPTIV는 DRAM에만 의존하는 대신 NAND 플래시를 작업 메모리의 확장으로 활용하여 AI 워크로드에 사용할 수 있는 메모리 풀을 크게 확장합니다.
핵심적인 역할을 하는 것은 SoC, DRAM, UFS 스토리지 간의 조정 계층 역할을 하는 aiDAPTIV 메모리 관리 미들웨어입니다. 이 미들웨어는 필요한 곳에 모델 데이터를 동적으로 스트리밍하여 메모리와 스토리지 간의 경계를 효과적으로 허물어뜨립니다.
이를 통해 자주 액세스하는 AI 데이터는 지능적으로 캐싱되고, 스토리지는 시스템 데이터와 AI 워크로드를 위한 전용 영역으로 분할되며, 데이터는 성능을 최적화하기 위해 동적으로 재사용 및 오프로드될 수 있는 하이브리드 아키텍처가 구축됩니다.
실질적으로 이는 스마트폰이 DRAM을 획기적으로 늘리지 않고도 더 큰 모델, 더 긴 컨텍스트 및 더 복잡한 추론 작업을 처리할 수 있음을 의미합니다.
Phison과 MediaTek을 통해 메모리를 제약 요소가 아닌 이점1으로 전환하세요.
이러한 아키텍처의 변화는 모바일 AI의 핵심 과제를 직접적으로 해결하는 측정 가능한 이점을 제공합니다.
DRAM 요구량 감소
일반적인 모바일 AI 배포 환경에서는 고급 모델이나 다양한 전문가 그룹(MoE) 활용과 같은 사용 사례를 지원하기 위해 16GB 이상의 DRAM이 필요할 수 있습니다. 하지만 aiDAPTIV 방식은 동적 모델 및 MoE 오프로딩과 지능형 메모리 관리를 통해 성능을 유지하면서 필요한 DRAM 용량을 약 12GB까지 줄일 수 있습니다.
시스템 비용 절감 및 효율성 향상
피손-미디어텍 솔루션은 NAND 플래시의 비용 우위를 활용하여 고가의 DRAM 스케일링 필요성을 줄입니다. 이를 통해 AI 기능을 희생하지 않고도 더욱 비용 효율적인 디바이스 설계를 구현할 수 있습니다.
더 큰 모델과 더 긴 컨텍스트 창에 대한 지원
확장된 메모리 용량 덕분에 스마트폰은 더욱 복잡한 모델과 더 긴 시퀀스를 처리할 수 있어 더욱 풍부하고 강력한 AI 경험을 제공합니다.
향상된 개인정보 보호 및 자율성
추론을 로컬에서 실행하면 클라우드 인프라에 대한 의존도가 줄어들어 민감한 데이터를 보호하고 연결 없이도 AI 기능을 사용할 수 있습니다.
차세대 모바일 AI의 기반 구축
이번 협력이 매우 중요한 이유는 성능 향상뿐만 아니라 스마트폰 시스템이 AI를 지원하도록 설계되는 방식의 변화 때문이기도 합니다.
Phison과 MediaTek은 메모리와 스토리지를 통합된 아키텍처로 결합함으로써 다음과 같은 기능을 갖춘 새로운 차원의 스마트폰을 구현하고 있습니다.
-
-
- 고급 AI 모델을 로컬에서 실행하세요
- 더욱 빠르고 반응성이 뛰어난 사용자 경험을 제공하세요
- 성능, 비용 및 전력 효율의 균형을 유지하세요.
- 하드웨어 복잡성을 늘리지 않고 AI 기능을 확장하세요.
-
이는 엣지에서 진정으로 자율적이고 항상 작동하는 AI를 향한 기초적인 단계입니다.
앞으로 나아가며
모바일 AI가 계속 발전함에 따라 메모리는 앞으로의 가능성을 결정짓는 가장 중요한 요소 중 하나로 남을 것입니다. 메모리의 구조와 활용 방식을 재고하는 솔루션이 차세대 혁신을 주도할 것입니다.
피손과 미디어텍의 협력은 명확한 미래 방향을 제시합니다. 메모리를 병목 현상에서 확장 가능한 자원으로 전환함으로써 스마트폰에서 더욱 강력하고 효율적이며 접근성이 뛰어난 AI 경험을 구현할 수 있는 길을 열어줍니다.








