前言:分布式存储将具有本地存储资源的标准服务器硬件,用高速网络连接,并通过分布式软件,聚合多个物理机上的存储空间并对外提供具有大带宽、并行 I/O、水平扩展、容错以及强一致性的数据存储系统。通过使用分布式存储,可解决传统集中式存储系统在性能、可维护性、可用性以及可扩展性等方面存在的问题。
Ceph与道熵分布式存储的特点
Ceph作为软件定义存储的代表,是当前广泛使用的分布式存储架构之一,Ceph分布式存储通常采用网络三副本数据冗余保护方式,即根据一致性Hash算法,将数据块的三个副本随机分布在三个不同节点的三个磁盘中保存。当磁盘或节点损坏时,通过网络实现数据重建。这种方式的最大缺陷在于网络故障对副本数据的一致性构成的威胁。根据著名的CAP定理,当分布式系统出现网络故障时,我们只能在一致性与高可用性之间二选其一,无法同时兼顾。这意味着,Ceph三副本分布式存储在出现网络故障时,数据副本往往无法保持一致性,从而导致存储系统出现稳定性问题,甚至出现数据丢失的情况。
针对三副本机制的弊端,道熵的分布式存储采用了双重RIAD机制,即节点内RAID与跨节点分布式两副本相结合,将磁盘阵列的本地恢复特性与分布式扩展特性融合,既有磁盘阵列的高可靠、高容错的特点,同时具备分布式横向扩展的优势。
道熵分布式存储与ceph的主要对比如下:
Ceph分布式存储 | 道熵铁力士分布式存储 | |
存储接口 | 支持RBD块、对象、POSIX文件存储协议; 支持iSCSI和NFS网络存储 | 支持RBD块、对象、POSIX文件存储协议; 支持iSCSI和NFS网络存储 支持8/16/32Gb FC存储协议与多路径软件; 支持HDFS以及Samba存储协议 |
可靠性 | 支持多副本和EC纠删码 | 支持多副本和EC纠删码; 支持节点内RAID与跨节点RAID相结合的双重RAID数据保护 |
性能调优 | 支持将OSD元数据通过DB/WAL放置在固态硬盘上 | 支持将OSD元数据通过DB/WAL放置在固态硬盘上; 支持对用户数据实现DRAM+大容量固态盘两级自适应缓存加速功能; 单节点两级智能缓存容量可高达数十TB |
故障检测与故障定位 | 离线磁盘SMART检测; 离线周期性数据校验 | 离线磁盘SMART检测; 离线周期性数据校验; 支持在线磁盘读写错误检测,实现数据自恢复与故障精准定位 |
数据压缩与数据去重 | 默认不开启压缩; | 默认开启LZ4压缩,支持ZSTD算法; 支持基于节点的在线数据去重 |
数据备份 | - | 支持块设备卷全备份与持续性增量备份;可按月、天、小时定义自动备份策略;支持NFS/S3 作为备份 存储;支持备份数据压缩和加密功能 |
总结:道熵双重Raid分布式存储架构,可有效应对Ceph三副本分布式存储在高可用、高安全等方面的应用缺陷,是目前分布式存储领域更可靠、更安全的分布式存储系统。