透明(Transparent)数据迁移

2021-12-08 16:57

前言:

       医疗PACS影像数据生产量在快速增长,对医疗影像存储的海量存储能力和高并发调阅能力提出了挑战。

CT照片.jpg

    医院存储80%-85%的数据量来自于影像数据,其典型特征是大部分文件都是小文件:其中MR文件平均大小为60KB左右;CT文件平均大小为300KB左右。提升小文件性能的最佳方式,是采用性能较高的全闪存存储池。


    然而,PACS系统所收集的B超、X射线、CT、核磁等影像数据量逐年飙升,三甲综合性医院或胸科、肺科、骨科等三甲专科医院,一年的新增拍片量在50TB ~ 60TB。并且,根据国家电子病历保存相关规定,医疗机构保管保存医疗影像数据的时间要求不少于15年。显然,如此巨大的数据总量,如果全部保存在全闪存存储池中,成本将非常昂贵。


   PACS影像数据的使用呈现明显的时效性,即影像数据在产生后的半年或一年内,具有很大概率会被反复读取:如在医生诊断、病人复查、专家会诊、大数据分析等场景,而在一年之后,重复读取这些数据的可能性就急剧下降。因此,一种最佳的实践,是将一年内产生的医疗PACS影像保存在高性能、但成本较高的全闪存存储池,一年后(或特定时间后),透明地将这些老数据迁移到大容量、低成本的机械硬盘存储池。


透明(Transparent)数据迁移


铁力士分布式存储平台是南京道熵出品的新一代阵列型分布式存储产品,它采用双重RAID架构,将磁盘阵列技术与分布式技术相融合,在具备磁盘阵列高稳定、高性能优势的同时,更拥有分布式存储高扩展、易管理的特征。


针对PACS存储和媒资存储的特征,铁力士分布式存储构建并统一管理两个不同存储介质存储池,全闪存(SSD)存储池和机械硬盘(HDD)存储池,提供单一的文件命名空间。新产生的数据被写入到SSD存储池,提供高性能、低延迟的读写性能;根据可配置的数据迁移策略,数据在一定时间后将被自动迁移到大容量的HDD存储池。整个迁移过程对用户及前端应用完全透明,即文件名、目录归属、以及用户ACL、创建时间等文件系统相关的元数据,在迁移过程中保持不变,极大简化了数据管理工作。


SSD存储池与HDD存储池采用瘦供给技术,根据存储池容量的使用情况,可独立在线扩展存储池的存储容量,同时,两种存储池都支持LZ4、ZSTD和GZIP在线数据压缩技术和数据去重技术,进一步提升存储的使用效率,降低使用成本。


用户价值


更强的数据保护能力:双重RAID由节点内RAID与节点间网络RAID实现双重数据保护,即使出现网络故障,网络副本暂时失去保护能力时,节点内RAID仍然能够抵御系统掉电或磁盘损坏等故障,保证数据安全。


更强的性能:全SSD存储池提供高性能、低延迟的读写性能。


更高性价比:HDD存储池提供大容量、低成本海量存储空间。


更强的扩展性:可在线扩展SSD与HDD存储池的容量,无需中断业务。最大容量可达数百PB。


透明数据迁移:简化数据管理,提升工作效率。