自定义同意首选项

我们使用 cookie 来帮助您高效导航并执行某些功能。您将在下面的每个同意类别下找到有关所有 cookie 的详细信息。

被分类为“必要”的 cookie 存储在您的浏览器中,因为它们对于启用网站的基本功能至关重要。 ... 

始终活跃

启用本网站的基本功能需要必要的 cookie,例如提供安全登录或调整您的同意偏好。这些 cookie 不存储任何个人身份数据。

没有可显示的 cookie。

功能性 cookie 有助于执行某些功能,例如在社交媒体平台上分享网站内容、收集反馈和其他第三方功能。

没有可显示的 cookie。

分析 cookie 用于了解访问者如何与网站互动。这些 cookie 有助于提供有关访客数量、跳出率、流量来源等指标的信息。

没有可显示的 cookie。

性能 cookie 用于了解和分析网站的关键性能指标,有助于为访问者提供更好的用户体验。

没有可显示的 cookie。

广告 cookie 用于根据您之前访问的页面向访问者提供定制广告,并分析广告活动的有效性。

没有可显示的 cookie。

减少数据量:重复数据删除的价值

随着数据量的增长,重复数据删除可以帮助保持存储效率

作者 | 2024年5月6日 | 全部, 企业, 精选

当今世界正经历着前所未有的数据爆炸,组织必须找到新的、更有效的方式来存储、管理、保护、访问和使用这些数据。当今生成的数据类型中隐藏着许多有价值的见解,这些见解可以帮助组织识别生产瓶颈、改善客户体验、简化流程以提高敏捷性等等。

在数据量暴涨的同时,存储基础设施和管理工具的成本却在下降。这些因素往往促使组织采用将所有数据长期存储(或永久存储)的策略,无论数据是什么或来自何处。

虽然现在你可以以更低的成本存储更多数据,但这并不意味着你可以不加区分地存储。并非所有数据都是平等的,某些类型的信息比其他类型的信息包含的价值要大得多。

数据存储中也可能存在大量冗余。如果您的信息来自客户关系管理平台、销售、技术支持、人力资源、产品营销等部门,则可能会出现重叠。定期备份、文件共享、数据输入或导入/导出错误、客户输入的数据不准确等也会产生重复数据。

这种冗余会导致存储数据量膨胀,并使得在需要时更难找到所需的信息。此外,它还会推高存储成本。虽然现在的存储比以前便宜,但仍然没有理由为超出实际需要的数据付费。

数据缩减技术 允许组织减少其数据的整体大小,从而减少其存储占用空间和成本并提高存储性能。数据缩减工具包中的一个有价值的工具是重复数据删除。

 

 

什么是重复数据删除以及它是如何工作的?

数据重复数据删除是一种数据压缩技术,可删除文件或子文件级别的冗余信息。例如,在大型跨国企业中,冗余数据会占用公司存储系统的大量空间。通过消除重复信息,企业的系统将只保留该数据的一个副本。

为了删除重复数据,应用程序或服务将在文件或块级别分析整个数据集。它通常与其他数据压缩技术结合使用,以显著减少数据大小,而不会损害其准确性和真实性。

文件级重复数据删除是第一种重复数据删除技术,它涉及删除文件的冗余副本。系统将创建一种数字“指针”来代替那些被删除的文件,该指针指向存储库中保留的原始文件。

然而,文件级重复数据删除有点限制。想想人们今天如何共享文档并进行更改和更新。同一文档的不同版本(仅包含微小差异)不被视为重复。

块级重复数据删除更细粒度。它深入数据,因此更有效地根除文件中的重复数据。它的工作原理是为每个数据块(块是文件中较小的信息块)分配一个“哈希值”,该哈希值充当块的唯一标识符或签名。如果系统检测到两个相同的哈希值,则删除其中一个作为重复项。

因此,对于已更改的文档文件,系统不会再次保存整个文档并进行微小更改,而是仅保存新文档中已更改的部分 - 保留原始内容和微小更改。

根据系统不同,有两种重复数据删除方法:

      • 内联重复数据删除 – 系统在将数据写入存储之前对其进行分析、重复数据删除和压缩。这种方法可以减少存储驱动器的磨损,因为总体上写入的数据较少。
      • 后处理重复数据删除 – 所有数据都写入存储,然后系统设置为根据需要定期执行重复数据删除/压缩任务。当不清楚容量优化将如何影响性能时,通常会参考这种方法。

 

重复数据删除对整个组织都大有裨益,但在某些用例和工作负载中,重复数据删除确实大有裨益。其中之一就是虚拟环境,例如虚拟桌面基础架构 (VDI),因为这些桌面中有大量重复数据。重复数据删除对于销售平台来说也是理想之选,因为销售平台必须提供准确、干净的数据,而信息错误可能会影响客户关系。

 

 

为什么组织应该关心重复数据删除?

数据是任何现代组织成功的关键部分。虽然可以保留比以往更多的数据,但重要的是信息必须干净、准确且可用。只有这样,组织才能提取其隐藏的价值。以下是组织应该对数据进行重复数据删除的其他一些原因。

提高生产力 – 消除膨胀可以让员工更快、更轻松地找到所需的信息。

提高网络性能 – 重复的数据会降低网络和存储应用程序的性能。

降低存储成本 – 释放存储驱动器上的空间并在更小的空间内存储更多重要数据。

减少管理负担 – 较小的数据量更容易更新和管理。

更好的客户体验 – 重复或过时的数据版本可能会导致客户不满或订单错误等。

 

 

选择群联作为数据管理策略的一部分

数据缩减技术(如重复数据删除)可帮助确保业务关键信息准确且最新。然而,它们只是智能数据管理策略的一部分。

最佳数据管理的另一个重要因素是选择正确的存储解决方案和工具。作为 NAND 闪存存储 IP 的行业领导者, 群联固态硬盘 和其他产品是当今存储环境中不可或缺的组件。无论您需要高性能、高容量存储用于 AI/机器学习项目和海量数据分析操作,还是需要低功耗解决方案来节省数据中心的能源成本,群联都可以提供帮助。

加速创新的基础™

zh_CN简体中文