|
宣传5:1,实际只有2:1??你是不是也遇到过这样的 “数据缩减焦虑”? 为什么别人的数据压缩比那么高 自己的却差强人意? 难道是厂商画的“大饼”? 别急!今天我们就来揭开 “数据缩减比”的真相 在部署全闪存储阵列时,数据缩减能力一直是客户关注的一大重点。最近听到有朋友调侃:“宣传里写着5:1,怎么我看到的缩减比只有2:1 ?” 这时候,不少人都会产生疑问:这数据缩减比,到底靠谱吗? 首先,我们需要先厘清两个关键前提。 
满足5:1的缩减比保障的 2个前提 01 数据本身必须是“可压缩”的, 5:1的缩减比保障仅适用于可缩减数据。 也就是说,只有在数据具备可去重、可压缩特性的前提下,缩减机制才能有效发挥作用。而以下类型的数据通常被视为不可缩减数据,不计入保障范围: ● 已经在主机端压缩的数据; ● 经加密的数据; ● 图片、音频、视频、PDF文件等非结构化数据。 换句话说,除去这些特殊类型,绝大多数常见业务数据(如数据库、日志文件、虚拟机数据等)都属于可缩减范畴,才有可能实现甚至超越5:1的效果。 02 设备的使用容量需达到一定水平。 在数据至少写入50%的物理固态硬盘空间时,保障条款才适用。 此外,还需注意:该缩减比保障适用于在一开始就已安装并持续运行PowerStoreOS 4.0及更高版本的新产品。 为什么要有这两个前提? 首先我们需要知道:数据缩减(包括重复数据删除和数据压缩)并不是万能的,尤其是对于图片、音频、视频等类似的这些非结构化数据文件来说,本身就有较强的不可重删和压缩的特性,再智能的重删压缩算法也难以奏效。 这类数据更适合存放在专用存储平台,比如戴尔PowerScale上,其具备出色的非结构化数据管理与访问性能,在视频监控、媒体内容、影像归档等场景中表现尤为出色。 而PowerStore更适合的场景是运行如企业核心数据库、ERP、CRM系统,以及虚拟化环境(如VMware虚拟机和虚拟桌面VDI场景)等,这些业务数据通常是结构化数据,有较高的重复数据比例,因此能实现较好的数据缩减效果。 根据数据特性,将数据与合适的平台匹配,不仅能提升性能表现,也能更充分释放存储系统的价值。 
自诞生五年来,PowerStore已成功部署于全球90余个国家和地区;服务对象覆盖超90%的《财富》500强企业。 其次,为什么一定要数据用量达到50%才能准确评估缩减效果呢? 从技术角度讲,PowerStore的数据缩减服务包括重复数据删除(Data Deduplication)和数据压缩(Data Compression)功能。 其中,重删技术通过数据指纹(Fingerprint)进行识别和比对,PowerStore在阵列内部存储资源之间进行全局指纹比较,随着数据量的增长,阵列能识别出更多重复数据块。 
可以看到,重删技术的原理是识别出重复的数据块。当数据量较小时,重复数据的概率理论上可能会更低,因此数据缩减效果可能不明显、缩减比较低;而当容量使用超过50%时,数据量采样比对的样本增加,重复数据概率理论上可能会更高,由此可能数据缩减效果会得到提升,最终通常能达到甚至超过初始承诺的5:1。 所以,当你看到初期数据缩减不如预期时,无需着急,随着存储数据的不断增加,PowerStore的数据缩减能力也会越用越明显,这是由数据缩减技术的本质所决定的。 实际上,早在2021年戴尔发布PowerStore起,就明确提出了“4:1数据缩减保证”,而且在2024年发布PowerStore 4.0软件微码后,进一步将数据缩减比保证提升到了5:1,这无疑显示了戴尔对自身产品技术实力的强大信心。 
根据ESG发布的《戴尔PowerStore数据效率》报告也显示,在PowerStore 4.0版本之前(承诺4:1缩减比时),通过调查客户现场数据,针对可缩减数据的实际平均缩减率就已经超过了5.2:1,这也充分印证了PowerStore在实际业务中的突出表现。 如果没达到 5:1,会“补偿”吗? 对于少数情况下未达到预期数据缩减比的用户,戴尔的数据缩减承诺绝非“纸上谈兵”。 若未达到约定的数据缩减比,戴尔将会补偿容量,补偿容量为产品报告的可缩减数据逻辑可用容量与满足保障所需容量之差,但不超过产品可用物理容量的50%。 例如,某公司购买PowerStore 500T用于虚拟化环境,当压缩比未达到4:1时,Dell不仅按协议提供了额外的硬盘补偿,由于硬盘插槽不足,戴尔甚至会主动提供扩展柜。这也说明了戴尔对数据缩减承诺的坚定执行态度。 此外,PowerStore的实时数据缩减技术本身有一个巨大优势:性能无损。也就是说,在重删压缩的同时,存储性能并不会因此下降,用户可以放心地使用重删压缩功能,而不必担心会牺牲性能。 所以,理性看待数据缩减效果,需要了解数据类型、使用场景和适用条件,PowerStore所提供的实时数据缩减技术,在绝大多数典型数据环境下,都能实现优异的数据缩减效果,在某些高度标准化的场景,如虚拟桌面(VDI),客户实际可观测到6:1、甚至7:1的缩减效果。 当然,在通用VM混合部署、数据来源复杂、去重压缩性不高的场景中,最终缩减比也会相应变化。因此,理解数据特性、了解系统机制、合理规划部署方式,是充分发挥PowerStore价值的关键一环。 最后提醒一下:购买阵列之前,不清楚的地方直接问戴尔技术顾问,他们会很乐意帮你解答清楚。 希望以上解释,能帮助你更好地理解和使用PowerStore,也能让你在数据缩减这件事上心里更有底、更安心。 附:如何查看可压缩数据 可以在通过PowerStore Manager、CLI或通过REST API查看阵列、卷组或卷级别的报告,以了解以下信息: ● 总体DRR结果; ● 仅可缩减数据的DRR; ● 不可缩减的数据量。 

|