前
全闪存存储具有极高IOPS性能、低延迟、低能耗的优势,但闪存(固态)硬盘的单位容量成本仍然是机械硬盘的数倍,阻碍了全闪存存储在全应用场景下的推广与使用。
道熵10x倍速行动计划,通过运用双重RAID技术、短码纠删码、在线数据压缩以及数据去重技术,降低固态硬盘采购成本、提升存储空间使用效率,可将IOPS性能提升10倍,同时成本可与混闪存储基本持平。
“
混闪 vs全闪
过去,由于固态硬盘(Solid State Drive, SSD)的寿命问题和高采购成本,SSD大部分时间仅作为性能提速技术出现,如二级缓存、自动分层技术,而机械硬盘(Hard Disk Drive, HDD)作为主要的存储介质,通过SSD与HDD的混合使用,达到提升存储综合性能的目的。
全闪存储是经过软件栈针对SSD进行全面优化,同时使用SSD作为存储介质的存储系统,充分利用SSD的低延迟和高IOPS等优势,为企业业务提供有力的支撑和性能保障。
那么,全闪与混闪存储各自的优劣势主要体现在什么地方呢?
1
性能
从性能上来看,全闪存储由于使用了SSD闪存介质,加之在软件栈上针对闪存介质和整个存储系统进行了算法优化设计,可以带来10x倍甚至更高的IOPS性能以及极低的响应延迟。而混闪存储如果要做到这么高的性能,特别是针对随机的小块数据读写访问需求时,需要配置更多的硬盘来进行并发,从而达到近似的性能值,但这样势必会带来存储空间的浪费,因为客户可能并不需要那么多的存储空间,成本投入也非常巨大,在机房部署时,存储所需的物理空间及能耗需求也会相应增加。
2
稳定性与可靠性
从稳定性与可靠性来看,全闪存储采用晶体管芯片实现的SSD代替了机械臂加磁头的HDD,彻底去除了高速旋转的机械部件,整体运行功耗比混闪存储低30%至50%,且不必担心物理震荡与冲击对存储系统可靠性带来的不利影响。
3
成本
从成本来看,SSD的单位容量成本显著高于HDD,全闪的部署成本也显著高于混闪,这是制约全闪分布式存储被广泛使用的重要原因。
“
10倍速行动
10x倍速行动是道熵在2023年发起的一项倡议行动,旨在帮助企事业客户实现绿色低碳的数字化转型与升级目的,通过建设全闪存分布式存储与全闪存超融合平台,满足客户未来5到10年业务发展的需求,实现包含数据库、云平台、海量文件系统、AI与大数据分析在内的全场景闪存化,提升用户体验、优化能耗、降低TCO。10x倍速行动可实现IOPS性能提升10倍,且总体使用成本与混闪存储基本持平。
以当前市场价格作为比较,8TB 7200转企业级机械硬盘的价格大约是1300元,而4TB SATA固态硬盘(普通级)的市场价格同样在1300元左右,固态硬盘的单位TB成本是机械硬盘的2倍。为了拉低二者之间的成本差距,道熵采用以下四项关键技术来降低成本,从而达到成本与混闪存储成本基本持平。
1
双重RAID技术
普通级SATA固态硬盘与企业级NVMe/SATA/SAS固态硬盘相比,成本为后者的1/2甚至更低,但缺乏受掉电保护的写缓存,直接作为分布式存储中的OSD会导致性能低下。道熵双重RAID技术,采用虚拟OSD技术,为普通级SATA固态硬盘构建一个具备DRAM与高性能NVMe固态盘共同支撑、且具备掉电保护功能的写缓存,大幅度提升普通级SATA固态硬盘的同步写性能,有效地降低全闪存分布式存储的采购成本。
2
短码纠删码技术
由于机械硬盘的IOPS仅有120左右,混闪分布式存储通常采用3副本部署方式,存储使用效率仅为0.33,即存储有效使用空间为系统裸容量的0.33倍。而SATA固态硬盘的IOPS通常在50k上下,远高于机械硬盘,因此可采用短码纠删码来提升存储使用效率,并可同时保证较低延迟与高IOPS性能。道熵推荐采用(k=2, m=2)或(k=4, m=2)纠删码,其对应的存储使用效率分布为0.5和0.66。存储使用效率的提升,可直接降低存储的总使用成本。
3
透明在线数据压缩
道熵全闪分布式存储可选择流行的LZ4,以及压缩率和压缩/解压缩性能突出的ZSTD无损数据压缩算法。其中,LZ4算法具有最高的吞吐率,对CPU消耗极少,其压缩比为1.8~2.0左右;而ZSTD算法可以保持在较高的吞吐率基础上,压缩比可高达2.8,比LZ4提升40%。
4
在线数据去重
道熵全闪分布式存储可在线开启或关闭数据去重功能。数据去重可自动计算数据块的fingerprint,通过对比fingerprint,将节点内重复的数据块仅保存一份数据,从而提升存储空间使用效率。在虚拟化与超融合应用场景中,开启数据去重功能,最大可提升存储使用效率3x至5x倍。
道熵全闪存分布式存储与超融合平台,可实现IOPS性能提升10x倍,且总体使用成本与混闪存储基本持平。通过使用双重RAID、短码纠删码、透明在线数据压缩及数据去重技术,有效地降低采购成本,提升存储空间使用效率,推动包含数据库、云平台、海量文件系统、AI与大数据分析在内的全应用场景闪存化,提升用户体验,优化能耗,并降低TCO。