为什么道熵分布式存储是虚拟化与私有云存储平台的更优选择?

2022-03-07 09:32

前言

道熵分布式存储是采用双重RAID数据保护机制,具备高容错的Fail-in-Place特性,给用户数据与业务更强的可靠性保障能力;通过自适应DRAM+固态硬盘两级缓存加速,将Cache命中率从磁盘阵列中常见的60%提升至90%IOPS性能可相应提升35;道熵分布式存储在业界率先实现了无人值守自动化运维与数据自修复,是虚拟化与私有云存储平台的更优选择。

一、虚拟化与私有云存储平台现状

虚拟化与私有云存储平台必须满足以下三点关键需求:

一、性能。虚拟化与私有云平台具有更高的业务与应用密度,每台服务器上可运行数十甚至上百台虚拟机,因此对存储的性能提出更高要求。传统磁盘阵列在应对日益增长的存储容量与性能需求面临巨大挑战。

二、弹性和高可用性。虚拟化与私有云存储解决方案应提供高可用性,最大限度地减少服务中断,以及防止数据丢失。这需要在存储设置中部署冗余措施,抵御磁盘、服务器、网络等软硬件故障,实现全面的数据保护和容错。

三、自动化运维管理。传统存储如磁盘阵列要求专业人员来管理和监控存储基础架构中的所有组件,不仅难度大人工成本高更面临存储系统规模的日益扩大,导致总拥有成本(TCO)极高。

二、道熵分布式存储在虚拟化与私有云存储平台的应用优势

道熵分布式存储是一种具有Fail-in-Place高容错特性的阵列型分布式存储,每个存储节点构成一个RAID阵列,通过分布式技术将多个存储节点(RAID阵列)融合为统一的存储平台,同时具备磁盘阵列高性能、高稳定性与分布式存储的高扩展性、易管理的特点。

道熵分布式存储相对于传统阵列存储,在大规模在线扩展、百亿级小文件管理、高强度小块数据IOPS读写、高通量数据吞吐、敏捷化运维管理、TCO成本优化等方面具有明显的技术优势,可以有效解决目前虚拟化平台在存储上遇到的性能瓶颈、数据孤岛、运维困难、成本较高等问题,成为虚拟化与私有云存储架构的更优选择。

数据安全性

道熵分布式存储采用双重RAID架构,同时具备节点内RAID保护和节点间副本双重保护机制。而无论是传统磁盘阵列还是三副本分布式存储,都只有单层数据保护,因此数据安全性比同类产品高出一个数量级。

存储硬件错误类型非常多,包括磁盘坏道、Firmware bug、静默错误导致数据损坏无法及时发现、电压不稳定导致数据未写入但返回成功、SSD长时间下线导致数据丢失、网络传输错误导致数据通过网卡后产生bits反转等。

道熵分布式存储通过对每个数据块产生一个256位校验码,作为数据块的元数据分开保存,并在数据读出时进行校验,并利用RAID功能对数据进行自修复。双重RAID机制结合数据自修复功能,可确保虚拟化与私有云存储平台数据安全与业务连续性。

性能提升

道熵分布式存储对虚拟化典型应用场景进行了针对性优化:虚拟机或容器的IO读写大小集中在4KB8KB16KB32KB,因此道熵在存储底层采用32KB块大小来匹配工作流,每次读写只需消耗12次读写操作,使得其性能显著高于传统存储和同类分布式存储。

虚拟化与私有云存储平台数据具有典型的80/20分布特征,即80%以上的读写工作流集中在20%以下的数据上。这些数据体现出显著的时分特性和频分特征,即具有最近多次读写以及高频度读写的特点,成为热数据。道熵分布式存储采用DRAM与大容量固态硬盘(SSD)来保存热数据,通过采用先进的分布式自适应智能缓存算法,实现动态识别并管理热数据,将最热的数据保存在DRAM中,而将次热的数据保存在大容量SSD中。此外,每个存储节点可在线增加SSD缓冲容量。传统磁盘阵列的Cache命中率通常在60%左右,而道熵分布式存储的Cache命中率可高达90%IOPS性能可相应提升35倍。

统一存储平台

道熵分布式存储可同时提供块存储、对象存储、POSIX文件系统以及大数据分析存储等,并实现各种数据存储的统一管理。支持FCiSCSINFSSambaFTPSFTPS3HDFSOpenstack Cinder/Nova/GlanceVMware VAAI等多种存储协议,不仅为虚拟化与私有云提供安全可靠的内在存储服务,还可为大数据分析、AI训练、HPC等应用提供外部的海量文件系统服务。

按需扩容,持续演进

道熵分布式存储采用分布式元数据管理,使扩容变得极为简单:只需要通过加入新的硬盘或者服务器即可实现扩容,支持设备内增加任意数量的硬盘,性能随存储节点数线性提升,数据的迁移通过集群内部高效率的完成,用最少的操作步骤将业务影响程度降到了最低。

道熵分布式存储支持持续性硬件生命周期管理,可在线更换老旧磁盘、老旧服务器等硬件,而不影响业务连续性。新增的服务器品牌、种类可以不同,支持异构扩展。存储硬件的升级换代,只需要通过将新节点上线、旧节点下线、数据自动迁移就能实现,无需人工数据迁移。

运维简化,成本节省

道熵分布式存储实现了无人值守的自动化运维,具有自动化报警、自动化故障诊断和极强的自我修复能力。针对大中型存储系统而言,采购成本通常仅占TCO1/3,更大的支出往往在于后期持续性的运维管理的人员成本上。道熵分布式存储所特有的高容错双重RAID架构,以及自动化运维的特性,可将虚拟化与私有云存储平台的总拥有成本降低50%

总结

道熵分布式存储采用双重RAID数据保护机制,具备高容错的Fail-in-Place特性,给用户数据与业务更强的可靠性保障能力;通过自适应DRAM+固态硬盘两级缓存加速,实现性能的大幅度提升;道熵分布式存储在业界率先实现了无人值守自动化运维与数据自修复,大幅度降低总拥有成本,是虚拟化与私有云存储平台的更优选择。