持续数据保护(continuous data protection,CDP),也称作持续备份(continuous backup),是一个在任何变化发生时,能备份企业所有的数据的存储系统。
简介
持续数据保护:Continuous Data Protection,简称CDP。
CDP定义:
持续数据保护(CDP)是一种在不影响主要
数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标的无限的任意可变的恢复点。
持续数据保护(CDP)技术是对传统
数据备份技术的一次革命性的重大突破。传统的数据备份解决方案专注在对数据的周期性备份上,因此一直伴随有
备份窗口、
数据一致性以及对生产系统的影响等问题。现在,CDP为用户提供了新的数据保护手段,系统管理者无须关注数据的备份过程(因为CDP系统会不断监测关键数据的变化,从而不断地自动实现数据的保护),而是仅仅当灾难发生后,简单地选择需要恢复到的时间点即可实现数据的快速恢复。
CDP技术通过在操作系统核心层中植入文件过滤
驱动程序,来实时捕获所有文件访问操作。对于需要CDP连续备份保护的文件,当CDP
管理模块经由文件过滤驱动拦截到其改写操作时,则预先将文件数据变化部分连同当前的系统
时间戳(System Time Stamp)一起自动备份到存储设备。从理论上说,任何一次的文件数据变化都会被自动记录,因而称之为持续
数据保护。
优越性
形象比喻:传统备份软件就像是照相机,只在按快门的时候产生照片;CDP软件则是摄像机,打开就不停工作,任何时间的图像都不会错过。
持续数据保护概念的出现使得用户拥有了一个连续备份的梦想,CDP的愿景极具吸引力,用户期待它的早日实现。目前,一些大型存储厂商已经推出类似CDP产品。
传统备份效果有限
传统的备份技术一般为手动备份或定时备份。
典型的手动备份流程是这样的:每天在凌晨进行一次
增量备份,然后每周末凌晨进行
全备份。采用这种方法,一旦出现了数据灾难,用户可以恢复到某天(注意是以天为单位的)的数据,因此在最坏的情况下,可能丢失整整一天的数据。
定时备份技术比手动备份技术有所进步,定时备份属于自动备份的技术范围,一般为若干小时自动备份一次,比如:5小时备份一次。如果出现数据灾难,用户可以恢复到若干小时之前的数据,在最坏的情况下,可能丢失5小时内的数据。
但是对于数据量不断变化增长的用户来说,每一份数据的丢失都会造成利益的损失。
那么,能不能继续缩小备份时间单位呢?比如,可不可以每小时进行一次
增量备份呢?甚至每分钟备份一次?基于传统备份技术的解决是难以实现的。
CDP应运而生
既然传统的磁带备份间隔较长,那么怎样才能够做到连续的数据保护呢?CDP正是为了解决这个问题而出现的。
持续数据保护是一种连续捕获和保存数据变化,并将变化后的数据独立于初始数据进行保存的方法,而且该方法可以实现过去任意一个时间点的
数据恢复。CDP系统可能基于块、文件或应用,并且为数量无限的可变恢复点提供精细的可恢复对象。
因此,所有的CDP解决方案都应当具备以下几个基本的特性:数据的改变受到连续的捕获和跟踪;所有的数据改变都存储在一个与主存储地点不同的独立地点中;恢复点目标是任意的,而且不需要在实际恢复之前事先定义。
所以,CDP可以提供更快的数据检索、更强的数据保护和更高的
业务连续性能力,而与传统的备份解决方案相比,CDP的总体成本和复杂性都要低。
技术分类
CDP持续数据保护技术分为真CDP(True CDP)和准CDP(Near CDP)两类。
CDP的分类是相对于数据保护时间点而言的。准CDP技术是按照一定的时间频率,持续的记录并备份数据变化,每次备份有一定时间窗口,需要
数据恢复时,可以恢复到过去备份的时间点,并不能形成完全意义上的持续保护,因此称为准CDP技术。
而真CDP技术是持续不间断的监控并备份数据变化,可以恢复到过去任意时间点,是真正的实时备份。
真CDP技术为什么实际应用很少?
在实际应用中真CDP技术应用较少,一方面是技术原因,需要解决数据的持续不间断监控和记录的技术难题;另一方面是由于真CDP技术持续备份时产生的大量数据,远大于其他
备份方式产生的数据量,对
数据存储形成巨大压力,也给用户造成费用负担,所以大多数CDP备份产品都采用准CDP技术。
准CDP技术目前在市场宣传中已经突破了原有的限定,被广泛用于代指可以按照一定的周期持续性保护数据的技术,如Symentac、EMC、信核数据、
飞康、爱数等公司采用的大多是
快照技术,但也归入了准CDP技术行列。
采用真CDP技术的国内灾备企业大多是后起之秀,如壹进制公司的UnaCDP系列灾备产品,就是采用真CDP技术,并且采用差量备份和
增量备份相结合的策略,大大降低
存储量。并配合独立研发的
重复数据删除技术,优化
存储空间,彻底解决真CDP技术的应用难题。
国内自主研发且拥有完全自主知识产权的备特佳CDP容灾备份系统也是完全采用真CDP技术的容灾备份软件。备特佳软件在近期成功采用真CDP技术为客户解决了服务器硬件故障引发的数据库灾难故障,保障了客户业务的连续性。
CDP数据备份
CDP技术对数据进行近乎连续不断地保护。并非在夜间进行大型备份,CDP产品的备份全天候执行,每隔几分钟就进行一次。
CDP产品首先将数据以块的方式复制到磁盘备份介质中。当某个块被创建或更改时,该块被备份。CDP有对版本信息进行跟踪的索引,而数据重删技术能够保证只有不重复的块会被存储到备份介质中。
对于CDP或基于镜像的备份产品,业务识别性的确认通常意味着验证某备份产品是否包含一个Microsoft卷影复制服务(VSS),服务器上你所备份业务的运行需要它。
CDP应用
12306铁路购票系统,作为被公认为春运期间中国业务量最大的电子商务网站,考虑到铁路售票的复杂性,其业务难度和系统压力即使与几大互联网巨头相比,也是有过之而无不及。12306为了满足春运不断提高的要求,整个系统每一年都在近乎疯狂地不断扩容、升级甚至大面积更新换代,如今,整个计算平台大部分从自有数据中心转移到了云端,包括所采用的各种软件和硬件系统。但是最关键的容灾系统,却多年来从未改变——一直采用全球领先的
飞康CDP容灾技术作为Oracle RAC核心集群和电子支付交易系统的容灾的保障。
对于中铁总公司来说,很明显,这套系统最大的挑战是需要能够承受极大的性能压力。像春运订票这样的性能压力,是绝大部分容灾系统在设计阶段就无法想象的。这种压力可不是实验室用测试工具虚拟出来的,而是一个一个用户和出票点用键盘鼠标真正跑出来的,一旦出现访问延迟或者中断影响了乘客出行,无数的乘客和吃瓜群众的眼睛可是雪亮的。