备份是为了什么?

名词解释

备份:为了应对文件和数据丢失或损坏等可能发生的意外,将电子计算机存储设备中的数据复制到磁带等大容量存储设备中。以便将单独存储的程序或文件的副本从原始文本中分离出来。(摘自《计算机科学》)

如果系统的硬件或存储介质出现故障,备份工具可以帮助您保护数据免受意外损失。例如,您可以使用备份在硬盘上创建数据的副本,然后将数据存储在其他存储设备上。备份存储媒体可以是逻辑驱动器(如硬盘)、独立的存储设备(如可移动磁盘)或由自动转换器组织和控制的整个磁盘库或磁带库。如果硬盘上的原始数据被意外删除或覆盖,或者由于硬盘故障而无法访问数据,那么您可以轻松地从归档副本中恢复数据。

备份分类

备份可分为系统备份和数据备份。

1.系统备份:指由于磁盘损坏或损毁、计算机病毒或人为误删等原因,导致用户操作系统的系统文件丢失,导致计算机操作系统无法正常启动。所以用系统备份来提前存储操作系统,以备故障后的备份支持。

2.数据备份:指用户存储数据包,包括文件、数据库和应用程序,用于数据恢复。

备份功能

备份的功能是为了备份支持和备份使用。

备份是容灾的基础,是指为了防止系统操作失误或系统故障导致数据丢失,将数据集从应用主机的硬盘或阵列中全部或部分复制到其他存储介质的过程。传统的数据备份主要使用内置或外置磁带机进行冷备份。但这种方法只能防止操作失误等人为失误,其恢复时间也很长。随着技术的不断发展和数据的大量增加,许多企业开始采用网络备份。网络备份一般通过专业的数据存储管理软件结合相应的硬件和存储设备来实现。

备份模式

常见的备份方法有:

定期用磁带备份数据。

远程磁带库和光盘库备份。也就是将数据发送到远程备份中心,制成完整的备份磁带或光盘。?[1]?

远程关键数据+磁带备份。生产机器使用磁带备份数据,将关键数据实时发送到备份机器。

远程数据库备份。在独立于主数据库所在的生产计算机的备份计算机上创建主数据库的副本。

网络数据镜像。这样就对生产系统的数据库数据和要跟踪的重要目标文件的更新进行了监控和跟踪,并将更新日志通过网络实时传输到备份系统,备份系统根据日志对磁盘进行更新。

远程镜像磁盘。镜像磁盘通过高速光纤通道线路和磁盘控制技术扩展到远离生产机器的地方。镜像盘的数据和主盘的数据完全一致,更新方式是同步或者异步。

数据备份必须考虑数据恢复的问题,包括采用?[2]?多种防灾措施,如双机热备、磁盘镜像或容错、异地存储备份磁带、关键部件冗余等。这些措施可以在系统发生故障后恢复系统。但这些措施只能应对计算机单点故障,对区域性、毁灭性的灾难束手无策,不具备灾难恢复能力。

备份技术

系统灾难恢复

(IDR =智能灾难恢复)?

系统容灾是指当系统崩溃时,只需很少的步骤就可以重建系统,包括上述系统补丁、应用软件和数据。这样可以提高恢复的准确性,缩短恢复时间,缩短业务中断时间。

主要是?[3]?灾难恢复技术,有几种恢复方式:

使用一张通用光盘,所有系统都使用这张光盘。这种光盘可以同时启动系统和网络,然后备份服务器将磁带库(或虚拟磁带库)中备份的整个硬盘内容或第一个主分区内容恢复到灾难机上。这样无论容灾机有多少数据,都可以存储在整个备份系统的备份设备中进行统一管理,不需要经常刻光盘,也就是说光盘不需要经常更新。典型代表就是bakbone netvault vault灾难恢复,右图是bakbone netvault灾难备份和恢复的数据流,所有系统使用统一的光盘。

需要为每台电脑单独刻制一张光盘,恢复时使用有针对性的光盘进行恢复。每台机器都需要自己的光盘,而且需要定期更新。这种方法最大的缺点就是经常要刻盘,否则灾难发生时如果没有光盘或者光盘太长,会影响恢复的速度和恢复后的状态。这项技术的典型代表是EMC网络恢复管理器模块。

恢复的时候需要借助网络启动,也就是需要有一台和引导机操作系统相同的主机,然后用备份的内容进行恢复。该技术的典型代表是Symantec NetBackup的裸机恢复模块。

操作系统本身提供的灾难恢复工具。对于大多数Unix小型机,都提供了系统备份工具。借助系统自带的磁带机和一个简单的命令,HP-UX可以使用make_recovery将整个根卷备份到服务器自带的4mm磁带上。恢复的时候,这个磁带可以自己启动系统,一个命令就可以把整个根卷恢复到硬盘上。这种方式的优点是简单经济,特别是对于Unix系统,远比备份软件提供的BMR模块方便、安全、经济,因为备份软件提供的BMR模块往往需要同平台的其他服务器才能启动。

远程数据复制

在另一个地方实时制作可用的数据副本。该副本可以立即使用,无需数据恢复。数据复制最大的好处就是副本数据可以立即使用,没有数据恢复时间,所以RTO非常好。同时因为是实时复制,RPO也很好,几乎不会有数据丢失。缺点是成本远高于数据备份,不仅数据复制系统昂贵,还需要其他硬盘存储空间和主机系统,甚至还要另外建立一个远程机房,考虑网络布线,会带来很大的成本增加,所以数据复制的建设和维护成本远远大于数据备份。

目前,数据复制可以通过以下方式实现:

基于主机。基于主机的数据复制技术可以不考虑存储系统的同构,只要主机是相同的操作系统。有支持异构主机之间数据复制的软件,比如BakBone NetVault Replicator,可以支持异构服务器之间的数据复制,以及跨广域网的远程实时复制。缺点是占用了一点主机资源。

基于存储系统。使用存储系统提供的数据复制软件,复制的数据流可以在存储系统之间传递,而与主机无关。这种方式的优点是数据复制不占用主机资源,缺点是容灾中心的存储系统和生产中心的存储系统有严格的兼容性要求,一般需要同一厂家的存储系统,限制了用户容灾中心存储系统的选择。

基于光纤开关。这项技术正在发展中,利用光纤交换机的新功能,或者利用管理软件控制光纤交换机对存储系统进行虚拟化,然后管理软件对被管理的虚拟存储池进行卷管理、卷复制、卷镜像等技术,实现远程数据复制。典型的有Storag、Falcon等。

基于应用程序的数据复制。这种技术有一定的局限性,而且是针对特定的应用。主要使用数据库本身提供的复制模块,比如OracleDataGuard,Sybase复制等等。

数据保护技术

连续数据保护

CDP技术是目前最流行的数据保护技术。它可以捕获文件级或块级的所有数据写入更改,并可以更详细的粒度恢复备份对象,可以恢复到任何时间点。

CDP技术是一项新技术,逐渐融入到许多传统备份软件中。比如BakBone NetVault Backup 8.0增加了TrueCDP模块,Symantec Backup Exec12.5等等。包括EMC和Symantec在内的其他公司已经收购了一些CDP软件,并且正在与传统备份软件进行集成,他们都在进行集成。

CDP技术包括两种类型:

近CDP就是我们所说的准CDP。它最大的特点是只能恢复指定时间点(FPIT)的部分数据,有点类似于存储系统的逻辑快照,不能恢复固定时间点。赛门铁克、CommVault、凯备份的CDP都属于这种类型。

TrueCDP,我们称之为TrueCDP,可以恢复指定时间段内的任意时间点(APIT),BakBone TrueCDP属于TrueCDP类型。

应用现状

如果灾备方案分布在各个行业,大家会按照一定的梯度使用。

首先采用系统容灾(BMR裸机恢复),因为这种方案成本最低,在搭建数据备份系统时添加一些模块即可完成。没有额外的存储空间,没有额外的存储空间?[4]?容灾室,所以,有条件的用户几乎可以实现。只有部分用户使用操作系统提供的备份工具辅助,部分用户使用备份软件提供的灾难模块完成。这类用户数量最多,分布在各个行业。BakBone的VaultDR被使用BakBone NetVault的备份软件用户广泛使用。很多用户非常喜欢BakBone VaultDR,无论操作系统类型如何,一张标准光盘就可以适用于所有Intel x86服务器进行灾难备份和恢复。

其次,建设容灾系统的用户,数据量大的高端企业一般采用基于存储的数据复制技术,如电信、金融行业。中低端用户一般使用基于主机的数据复制软件,成本低,不需要严格的存储系统采购。特别是BakBone的NetVault Replicator,不仅可以远程复制数据,而且支持异构平台,因此在国内外拥有广泛的用户,一些政府部门、电力公司、证券部门、网站公司等。采用这种方式,并且大多在Windows和Linux平台使用。虽然基于存储交换层的虚拟存储技术也有一部分用户,但由于该技术起步时间有限,技术成熟度有待进一步验证,很多用户只是将其作为试点,并没有大规模的推广。对于基于应用的数据复制,一些高端客户正在采用,也有大量用户。

至于CDP技术,才刚刚起步。这项技术满足了许多关注灾难准备的用户的需求,并且可以在RTO和RPO方面获得高标准。同时,它可以再现任何版本历史,这正在吸引越来越多用户的关注。相信未来会有非常广泛的用户。BakBone的TrueCDP可以随时恢复,是真正的CDP,会比其他准CDP产品有更大的优势,会被更多关心容灾的用户选择。

应用误区

容灾系统因为能带来业务连续性而越来越受到重视,但在使用过程中也要记住一些误区。

没有适合自己的选择。没有仔细分析和定义业务连续性需求,RTO和RPO没有仔细研究,或者没有去做,而是想追求最全面,可能会忽略最需要的建设,无法满足自己的需求。

认为容灾系统是万能的,夸大了容灾系统的功能,忽视了备份系统和高可用系统的建设。其实每个系统都有自己的功能,需要根据实际需要来搭建。

容灾没有一步到位的建设,总想等实际成熟了再全面建设,甚至不先建设数据备份系统就开始建设容灾系统。没有备份系统的建设,就达不到数据安全的底线,关键时刻就会缺少一份完整的数据,而花费大量的财力在容灾系统的建设上,就得不偿失了。

各种容灾技术选择不合理。例如,基于主机的复制软件可以运行主机系统的资源,但选择了基于存储系统的设计,这就需要选择相同类型的存储设备,增加了整体成本。

对于BMR系统的灾难备份,我们总是希望选择备份软件自带的BMR模块。其实备份软件的BMR模块对于Window和Linux来说是方便的,但是并不适合所有的Unix系统。在Unix系统备份方面,Unix的系统备份工具和磁带机非常方便,一个命令就可以完成系统备份,不依赖其他服务器,远胜于一些备份软件的BMR模块,不仅操作方便,而且降低了成本。

未来发展方向

未来的技术发展应该是多种技术并存,能满足客户需求的方式才能吸引客户的注意力。

未来的发展方向之一应该是基于主机的异构复制技术会有更广阔的市场。因为大部分客户都有异构的主机环境,并且支持异构环境下的数据复制技术,所以可以利用现有的环境,互相复制。对于不支持异构环境的复制软件,需要购买相同的存储或相同的操作系统主机进行数据复制,增加了灾难恢复的整体成本。

未来的第二个发展是CDP技术。CDP结合了数据备份和数据复制的优点,既能保护实时数据,又能随时恢复历史数据,将具有更强大的生命力。随着TrueCDP与传统备份软件的无缝连接,越来越多的用户将采用TrueCDP构建容灾系统。右图是BakBone NetVault TureCDP备份系统的流行架构。

备用系统

备份系统的作用

很多系统管理员认为投资管理一个备份任务是一种浪费,相比原来复杂的备份系统,只有恢复时才起作用,而且通常会增加很多管理任务,对企业来说是很大的浪费。

这个问题是个大问题,直接关系到企业信息系统的投资回报率(ROI)。当IT系统的重要性非常高,企业的生活相关数据都在电脑系统里,那么数据的保护就非常重要,这是其一。另外,备份系统的实施并不会带来更多的管理任务,相反,会给系统管理员带来很多维护上的便利,主要表现为:

备份的自动化降低了维护人员操作带来的风险;

在线数据库备份,确保24×7小时业务运营;

文件系统和数据库数据的时间点恢复,版本历史管理;

磁带克隆可以降低磁带出错概率,实现容灾和异地存储;

网络备份、无局域网和无服务器备份方式;

从系统灾难中快速恢复。

因此,如果企业必须实现上述功能,而企业没有实施备份系统,如果人力和设备的投入大于实施备份系统的投入,那么备份系统的投入是可以接受的。

备份系统的功能

用户只需要简单的备份,没有那么复杂。用户在备份系统里买了很多没用的先进技术,没必要在系统里实现太多复杂的功能。

备份系统的功能是备份技术发展到一定阶段的产物,先进技术的出现也是由于用户系统中的需求。当IT系统发展到一定程度,用户对IT系统的依赖性增加,IT系统的数据量越来越大,对系统备份的要求也就越来越高。但是一个好的备份系统应该具有以下特征:

备份系统可以根据应用系统的需要方便地扩展;

满足未来数据量和应用系统升级带来的备份系统压力;

在备份系统方面,尤其是备份软件的升级能力。

总的来说,备份技术经历了几个发展阶段,从传统的磁带备份到网络备份,从SCSI?动态无局域网备份到SAN结构* * *享受无局域网备份,直到无服务器备份的出现。可以预见,未来的备份产品将有以下趋势:

备份光盘

情况

随着SATA磁盘价格的进一步下降,磁盘的备份优势逐渐体现。EMC推出了使用磁盘作为虚拟磁带库的产品,在功能上可以替代磁带库的功能。笔者认为,这款产品的批量上市,会在一定程度上引发备份硬件设备的升级。

ISCSI技术

该技术可以利用现有的TCP/IP网络进行数据传输,用户可以方便地实现数据的远程远程保护。市场上已经出现了很多这样的产品。相信随着产品的成熟,很多远程备份和容灾方案都会选择这项技术。

NDMP议定书

作为标准,NDMP(网络数据管理协议)已经发展到第4版,支持该协议的产品可以轻松实现NAS服务器数据的快速备份和恢复。对于大量的小文件,这种技术有独特的优势。

备份技术

很多磁盘阵列都提供了快照功能,对于磁盘阵列上的快照,我们可以充分利用快照技术对数据进行无服务器备份,这对于大型企业级系统来说意义重大,大大减少了备份时对生产系统的资源占用,并且可以非常快速的恢复。

实现备份介质的生命周期管理

通常,每盘磁带都有一定的使用次数。因此,对于磁带备份系统来说,在使用一定次数后,磁带应该被丢弃,不能用于备份关键数据。

维持

人们投资于全自动备份系统,以减少维护工作量。只要制度落实了,维护工作就可以放松了。一个星期或者一个月检查一下备份状态就可以了。

用户实现备份系统后,备份系统的维护还是很重要的。主要由以下因素决定。

因为很多单位的很多IT系统都有很多主机,很多应用系统,每个应用系统都有相应的管理维护人员,备份就是对各种应用数据备份任务的集中管理。因此,对于具有复杂应用系统的用户,可以设置备份系统管理员或存储备份工程师来维护整体备份系统。

随着数据和应用系统的增加,备份策略应该随着时间的迁移而优化。

备份系统涉及到很多技术,如操作系统、数据库、存储、磁带库等。因此,建议备份系统管理员对各种知识有一定的了解,除了备份系统知识外,还要参加操作系统、数据库等产品的专业培训,以保证应用系统在灾难发生时能尽快恢复数据。

如果关键数据库的日常备份失败,可能会导致数据库暂停。比如,对于?[5]?对于Oracle数据库,如果数据库的“存档日志”没有及时备份,整个数据库都会停止。

如果磁带库备份系统中有“克隆”功能,就需要每天把“克隆”的介质拿出来,存放在不同的地方,方便灾难恢复。

产品

在选择产品时,备份磁带库要尽可能大,磁带机要尽可能快,尽可能使用最先进的技术。

在产品选择的过程中,性价比是最重要的指标之一,但绝不是全部。建议用户在选择产品时考虑以下因素:

类型、数量、备份策略(完整备份、增量备份等。)和关键数据的保留时间决定了磁带库的总容量。

磁带机的最小数量由备份时间窗口和备份数据量的峰值数据量决定;

应用程序系统的类型和数据类型决定了用于备份的技术。

如果使用NAS设备进行备份,尽量选择NDMP备份;SAN架构备份应该基于动态磁带机;磁盘阵列提供镜像或快照功能,可以使用快照备份技术。

在磁带机技术的选择上,建议选择更通用的设备。对于此磁带机,操作系统和备份软件与之兼容。

由于磁带机是机械设备,故障率高于磁盘、光盘等设备,所以在配置磁带机时尽量保持冗余。SATA磁盘技术发展突飞猛进,磁盘备份技术成为发展方向。

对于硬件设备,考虑备件的提供和提供商的服务水平,对于备份软件,提供专业服务和技术支持也是需要考虑的重要因素。

备份软件应该广泛兼容。

数据容灾

企业关键数据的丢失会中断企业的正常业务运营,造成巨大的经济损失。为了保护数据,企业需要备份灾难恢复系统。然而,许多企业认为建立备份系统后就可以高枕无忧了。事实上,他们需要建立一个灾难恢复系统。数据容灾与数据备份的联系主要体现在以下几个方面:

数据备份基础

数据备份是数据高可用性的最后一道防线,其目的是在系统数据崩溃时快速恢复数据。虽然也是容灾方案,但是容灾能力非常有限,因为传统的备份主要是通过内置或者外置数据的磁带机进行?[6]?冷备份,备份磁带也在机房统一管理。一旦整个机房发生灾难,比如火灾、被盗、地震,这些备份磁带就会被破坏,存储的磁带备份就没有任何容灾功能。

容灾和备份

真正的数据容灾是为了避免传统冷备份固有的缺点,在灾难发生时能够全面及时的恢复整个系统。容灾能力根据其容灾能力可以分为几个等级。例如,国际标准SHARE 78定义的容灾系统有七个级别:从最简单的本地磁带备份,到将备份的磁带异地存储,再到建立应用系统实时切换的远程备份系统,恢复时间也可以从几天到几小时,到几分钟、几秒或零数据丢失。

无论采用哪种容灾方案,数据备份仍然是最基本的。没有备份数据,任何灾难恢复方案都没有实际意义。但是光有备份是不够的,容灾也是必不可少的。容灾对于IT来说就是提供一个可以预防各种灾难的计算机信息系统。技术上,衡量容灾系统的指标主要有两个:RPO(恢复点对象)和RTO(恢复时间对象),其中RPO代表灾难发生时允许丢失的数据量;RTO表示系统恢复的时间。

容灾不仅仅是技术。

容灾是一个项目,不仅仅是技术。许多客户仍然关注灾难恢复技术,但不清楚灾难恢复的流程、规范和具体措施。我从来没有评估过容灾方案的可行性,以为只要建立了容灾方案就可以高枕无忧了。其实这是很有风险的。尤其是一些中小企业,认为自己的企业一年到头花了大量的人力财力进行数据备份和灾难恢复,结果几年都没有发生大的灾难,因此放松了警惕。但是一旦灾难发生,后悔都来不及了!在这方面,国外的跨国公司做得非常好。虽然这几年没有发生大的灾难,备份了那么多磁带几乎没有用,但是他们一如既往的非常认真的做好了每一步,基本上每个月都会评估当前灾难恢复计划的可行性,进行实地演练。?[7]?

数据容灾级别

设计一个?[4]?容灾备份系统需要考虑很多因素,如备份/恢复数据的大小、应用数据中心与备份数据中心的距离和数据传输方式、灾难发生时所需的恢复速度、备份中心的管理和投资等。根据这些因素和不同的应用,常见的灾难恢复备份级别如下:

本地冷备份

这个级别的容灾备份其实就是上面说的数据备份。它的容灾能力最弱,只在本地备份数据,备份的数据磁带只在本地保存,不送到外地。

在这种灾难恢复方案中,最常用的设备是什么?[8]?磁带机当然可以手动加载,也可以根据实际需要自动加载。前者主要适用于存储数据容量较小的中小型企业。

参考数据

1.?基于NBU备份系统的磁带库优化扩容方案研究?中国知网[引用日期2017-04-02]

2.?双机热备系统的技术研究和具体实现?中国知网[引用日期2017-04-02]

3.?云计算在电力系统数据容灾业务中的应用研究?中国知网[引用日期2017-04-02]

4.?容灾备份系统中同步策略研究及效率分析?中国知网[引用日期2017-04-02]

5.?Oracle数据库优化?中国知网[引用日期2017-04-02]

6.?如何实现前兆管理系统数据库的冷备份和恢复?中国知网[引用日期2017-04-02]

7.?容灾理论及关键技术分析?中国知网[引用日期2017-04-02]

8.?磁带机控制程序的研究与实现?中国知网[引用日期2017-04-02]

本文引自北京大学姚远教授,来源于百度百科。

附加链接:网页链接