如今,人们依靠大数据应用来拥抱各种服务。以著名的送货机器人Amazon Scout为例。我们现在可以在没有人工参与的情况下接收包裹。
不难想象,我们日常生活中对各种服务的需求不断增加,将会产生更多未经处理的数据。国际数据公司 (IDC) 预测,到 2025 年,全球数据将大幅增长至 175 ZB。 不断增长的数据量 从而成为推动计算存储发展的因素。这是一个最先进的存储系统,可以加快数据处理速度,使实时分析更加高效,并缩短我们等待包裹和数据的时间。
传统存储模型和计算存储模型之间的区别
在传统的计算架构中,数据频繁地在存储系统和应用服务器的内存单元之间移动。 CPU首先向存储系统请求数据,然后将数据传输到CPU进行计算。 CPU处理完成后,将结果发送回存储系统保存。这个过程可以重复数千次。在这些重复步骤中移动数据的高昂成本可能会导致额外的能源消耗并降低大数据应用程序的性能。
与传统存储模型不同,计算存储模型将处理转移到数据系统,并且没有数据发送到CPU。这意味着数据工作负载直接在存储控制器上处理。它旨在分析和处理数据所在的位置。
这就是它的工作原理。 CPU向存储子系统发送请求,但数据不需要离开存储系统。相反,该操作由驱动器本身执行。计算存储消除了需要通过网络来回发送大量数据的复杂和重复步骤,从而显着节省了时间和能源。
计算存储的组成部分
-
-
- 计算存储驱动器 (CSD): CSD 是一种计算存储设备,代表存储设备中嵌入的 ASIC 或微处理器。它可以在存储系统中进行计算并支持数据的持久化存储。
-
-
-
- 计算存储处理器 (CSP): CSP 是定位为 SSD 阵列控制器的处理器。它是一个向关联存储系统提供计算服务和功能的组件,但它不提供持久数据存储
-
-
-
- 计算存储阵列 (CSA): CSA 是 CSD 和 CSP 的集合,其中包含计算和存储以及可选存储设备和控制软件。
-
简而言之,计算存储是一个存储子系统,它组合了位于存储介质、计算存储阵列或其控制器上的多个CPU。
计算存储的三个主要优势
1. 最小带宽和功率: 通过使用计算存储,数据不会频繁地在接口上移动,从而允许用户在驱动器上分配更多数据。通过减少存储和主 CPU 之间的数据移动,只需将最终结果传送到主机。计算存储 提供显着的节能效果和额外的 I/O 带宽.
2. 消除延迟: 由于存储大小通常大大超过内存,因此必须以块的形式读取数据。这会减慢实时数据分析速度并影响高性能计算的效率。然而,计算存储可以打破这些瓶颈。通过将处理放到存储子系统本身上,可以在数据来源处处理大量数据。它缩短了移动、分析和处理数据所需的时间,从而显着提高了延迟和网络带宽利用率。
3.以数据为中心的计算: 与以计算机为中心的架构不同,以数据为中心的架构旨在分析海量数据,强调第一数据概念。通过直接在存储应用程序中安装处理功能,计算存储可以为高级功能和任务释放 CPU 周期,并为特定工作负载启用并行性,从而提高吞吐量和性能。
群联方法
说到以上所有这些好处, 群联作为计算行业的领先公司之一,即将推出一款计算存储一体化解决方案。群联科技实现了这一目标,以便能够广泛、立即部署这项新技术。我们正在与许多当前的服务器制造商合作,为客户提供交钥匙解决方案。新技术不仅可以减少网络流量、并行计算,还可以缓解对计算、I/O、内存和存储的其他限制。群联将为所有数据中心和云服务提供商提供最好的平台和最广泛的解决方案,以充分利用更广泛的数据应用。