|
戴尔PowerFlex 5.0 标志着软件定义存储 进入全新阶段 从性能到韧性,从效率到规模 一场由架构革新驱动的深层变革 正在上演! 
戴尔PowerFlex是一款高性能、高可扩展性的软件定义存储解决方案,始终致力于为用户提供在任意工作负载下都能稳定运行、无硬件绑定的解决方案。 在最初发布(彼时品牌为ScaleIO)时,PowerFlex采用的是分布式网状镜像架构。镜像在性能和重建效率上具备天然优势,但容量效率却是其短板。尽管如此,凭借卓越的性能和可扩展性,PowerFlex仍在业界获得了广泛成功。 而如今,PowerFlex迎来了一次意义更为重大的飞跃,一次更深层次的变革。PowerFlex团队力求在性能、可扩展性和存储效率三者之间实现全面突破。 这一愿景最终落地为PowerFlex 5.0,即PowerFlex Ultra。该版本历经多年打磨,在各方面实现了根本性革新。 本文将从架构层面出发,全面解析PowerFlex 5.0的技术细节与关键特性,不论你是刚刚接触PowerFlex的新用户,还是经验丰富的老用户,都能在此文中获取理解新版本的重要参考。 
1 SAE:可扩展可用性引擎 重新定义数据弹性 PowerFlex 5.0的核心变革,就是引入了全新的“可扩展可用性引擎”(Scalable Availability Engine,简称SAE)。 
SAE是下一代存储架构,消除了扩展性、性能、效率和可用性之间长期存在的权衡。它的设计结合了分布式纠删码、先进的元数据管理和新的分布式缓存服务,从而构建出一个高度可靠且高效的基础平台。 对企业而言,这意味着操作可预测、系统开销更低,并可在不妥协的情况下扩展基础架构。 首发版本支持的冗余几何包括容量效率优先的8+2模式,以及适用于小型集群的2+2模式。未来还将支持如4+2等更多几何形态,并实现根据集群规模动态调整的能力。 
相较传统镜像架构,8+2纠删码模式可将存储效率从50%提升至80%,并将物理占用空间减少超过50%,有效降低能耗、空间占用和散热需求。 2+2架构虽不具容量优势,但为小型集群带来了远超镜像的弹性表现,适用于测试、开发QA等环境。更重要的是,它为系统“从小做起,持续扩展”的演进路径奠定基础,随着业务增长,企业可平滑迁移至更高效的几何布局。 2 基于节点的分布式冗余架构 PowerFlex作为一款横向扩展的软件定义架构,将继续利用最先进的服务器技术。以服务器作为故障域,是在大规模场景下构建弹性的核心组成部分。 因此,PowerFlex 5.0要求纠删码条带横跨多个节点而非设备。在首发版本中,8+2条带需跨越10个节点,因而最低节点数为条带大小+1,例如8+2模式要求至少11个节点,2+2则要求至少5个节点。 在旧版架构中,数据从主机 (SDC) 发送到主存储控制器 (SDS),主SDS进行处理和存储后,会发送给次SDS生成镜像副本,SDS仅管理本节点内的设备。 而在SAE架构中,数据条带被分散存储至集群中的所有节点,构建出真正意义上的全分布式访问后端。映射器层(包含卷地址元数据)与SAE层(负责将数据放置在驱动器上)完全解耦,使得数据在驱动器之间甚至节点之间的移动无需更改任何映射器元数据,极大地简化了数据管理,并提升了系统扩展灵活性。 3 容量效率跃升,超越传统限制 PowerFlex 5.0在容量效率方面进行了多项革新: 纠删码 首发版本支持8+2结构,仅20%容量开销,这是PowerFlex 5.0最重要的升级之一,未来将支持更多高效几何。 数据缩减 除了现有数据压缩外,新增引用机制,为未来数据去重打下基础,同时具备模式识别与移除能力。 优化重建备用容量 这分为三部分:首先,采用双奇偶校验的EC降低了执行重建的紧迫性。即使单个驱动器或节点发生故障,系统仍然能够保持弹性。 其次,在满足与之前相同可用性的要求下,所需的备用容量大大减少,从而允许用户将更多容量用于数据存储。 第三,由于减少备用容量仍然满足所有弹性要求,因此用户现在可以根据特定需求,更灵活地设置重建备用容量。 
4 可用性升至“10个9” PowerFlex 5.0支持双节点容错,即使两个节点发生故障,也能保证集群的正常运行(而不是仅能防止双硬盘故障),从而显著提升系统最小可用性等级至“6个9”(99.9999%),部分配置更可达“10个9”(99.99999999%)。 此外,由于可用性的提升,每个存储池的设备数量不再受任何与弹性相关的限制。以往,设备数量的限制通常取决于在第一个故障修复(通过重建或硬件更换)之前发生其他故障的概率。 SAE的分布式使PowerFlex能够使用系统物理上可容纳的最大驱动器数量,同时仍能满足所有可用性要求。因此,在此首发版本中,每个存储池支持的最大驱动器数量已从300个增加到4000多个。 在某些配置下,增加节点甚至可以提高系统的弹性,因为重建速度更快,并降低了同时发生三个故障的概率。另一个有助于加快重建速度的设计因素是内部重建优先级排序,它会识别并以最高优先级重建双重降级的数据。 最后一点是,PowerFlex 5.0数据布局包含强制性的数据损坏检测机制,用于识别并内部纠正由故障硬件产生的损坏数据。每次读取数据或元数据都会经过验证,以确保其正确性。 如果读取的数据不正确,则会利用SAE中的冗余来获取正确数据。获取正确数据后,系统会纠正错误数据,使系统恢复到最大冗余状态。一个内部清理程序会在后台运行,以执行此检查并验证冷数据的完整性。 5 性能再定义 PowerFlex一直以性能著称,在开发此次新架构过程中,性能始终是设计核心。涵盖了以下关键创新: ● 单次I/O处理:与镜像需要两次处理不同,冗余开销仅发生在数据存储阶段,而非数据处理阶段,显著降低CPU占用,同时完全保留了所有弹性特性。 ● 快照与复制机制优化:快照设计借鉴XtremIO架构,支持海量快照/克隆,提升创建与查询效率,未来将实现低RPO的异步复制。 ● 多核扩展优化:采用无锁线程模型,适配不同核心数的CPU架构,支持线性扩展。 ● 8KB IOPS表现:相较旧架构开启数据压缩时每节点10万IOPS,5.0实测可达26万IOPS,表现远超预期。且在未来版本仍有巨大提升空间! 
6 可扩展性与简化运维并举 PowerFlex 5.0支持单一保护域包含多达128个存储节点,进一步扩展包括: ● 快照/克隆上限提升至1022(原为126); ● 单节点原始容量上限提升至192TB,FG(细粒度)为128TB,MG(中粒度)为160TB; ● 支持卷容量范围扩大至1GB–8PB(原为8GB–1PB),卷大小粒度提升至1GB(原为8GB)。 同时简化了用户操作体验: ● 无需PMEM(持久内存)即可启用数据缩减功能,此外,即使某些工作负载无法从压缩中获益,PowerFlex 5.0仍然可以利用PMEM来提高性能并减少驱动器磨损; ● 引入可定义的过量配置限制,满足企业内部策略; ● 重建冗余空间不再需手动设定TB数,系统可按“保护级别”自动计算,动态调整。 写在最后 面对不断变化的市场环境,构建灵活、可持续演进的架构才是应对之道。PowerFlex 5.0不仅是一次软件升级,更是一项助力企业应对当下数据爆炸式增长的变革性解决方案。 作为一款能够从架构层满足极致性能、扩展弹性与数据可靠性的企业级存储解决方案,PowerFlex能够为企业提供真正的战略优势,激发面向未来的无限潜能。
|