问答闯关 | 灾备基础知识20问,看看你到第几关?
2020-08-03ROUND 1
1、什么是备份,分为哪几种类型?
备份指数据或系统的备份,它是容灾的基础。是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它存储介质的过程。
2、什么是灾备?
容灾和备份的简称,指利用科学的技术手段和方法,提前建立系统化的数据应急方式,以应对灾难的发生。包括数据备份和系统备份、业务连续规划、人员架构、通信保障、危机公关,灾难恢复规划、灾难恢复预案、业务恢复预案、紧急事件响应、第三方合作机构和供应链危机管理等等。
3、灾备系统建设指标:RPO/RTO/灾备TCO含义?
RTO恢复时间目标:指所能容忍的业务停止服务的最长时间,RTO值越小就意味着所要求的恢复能力越强。
RPO恢复点目标:指的是业务系统所能容忍的数据丢失量。如果RPO等于零,意味着要求数据零丢失。RTO针对的是服务丢失,RPO针对的是数据丢失,二者没有必然的关联性。
灾备TCO:灾备规划建设从产品采购到后期使用、维护的总成本。
4、什么是云灾备?
云灾备是传统灾备在云计算领域的延伸,将灾备看作一种服务,按需付费使用。包括本地到云端、云端到云端之间进行数据存储和定时复制,以及数据迁移、数据恢复、应用切换,保证灾备端应急接管业务应用等范畴。
5、具备哪些特性可定义为云灾备?
灾备技术能够利用云的特性“弹性”与 “融合”才能定义为云灾备。
-正常状态时0资源消耗,灾备切换才分配资源;
-云灾备无需关心IT基础架构,可实现各种IT架构的云上融合统一;
-传统架构需要云灾备革新,云架构更需要云灾备。
6、什么是业务连续性?
指在中断事件发生后,组织在预先确定的可接受的水平上连续交付产品或提供服务的能力。它明确一个机构的关键职能以及可能对这些职能构成的威胁,并据此采取相应的技术手段,制定计划和流程,确保这些关键职能在任何环境下都能持续发挥作用。
7、异地容灾的含义及特点?
指在不同地域,构建一套或多套相同的应用或者数据库,起到灾难后立刻接管的作用。
异地容灾对企业应用及数据库起到了安全性、业务连续性等方面的作用,因此它与私有云或者公共云起到的容灾结果是完全不同的。
8、什么是双活容灾?
即灾备系统中使主生产端数据库和备机端数据库同时在线运行,处于可读可查询的状态的技术。
9、什么是高可用HA(High Availability)?
指通过技术手段,尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。假设系统一直能够提供服务,我们说系统的可用性是100%。
10、什么是两地三中心?
采用“同城灾备+异地灾备”的两地三中心整体灾难恢复解决方案,可以满足不同灾难场景下的业务连续性要求。
同城灾备中心主要是用于防范生产中心机房或楼宇发生的灾难,异地灾备中心用于防范大规模区域性灾难。
ROUND 2
11、数腾云灾备是什么?
数腾云灾备原生于云,利用弹性与融合的云特性构建云影灾备技术,大幅提升传统灾备性能,率先实现了OpenStack/KVM云平台镜像级灾备,支持异构环境下的云迁移。全面支持国产云,实现云上备份、云上测试、云上容灾的统一融合。数腾云影灾备技术将生产业务底层和硬件平台解耦并实现云化,能够实现业务整体一键漂移到云,且能在物理机和异构云之间实时漂移。
12、数腾云灾备产品位于国内《信息系统灾难恢复规范》哪一级?
数腾位于最高等级5-6级之间。RPO秒级,RTO分钟级。
13、数腾云灾备优势?
14、数腾云影灾备技术与传统灾备技术的区别?
-颠覆了传统备份和业务连续性技术:传统的定时备份,双机保护,数据复制等,一个产品只能解决一个问题。数腾云灾备一台设备保护数十个业务系统,无须预配置环境,一键云化至数腾云灾备管理平台。
-颠覆传统业务测试方式:传统业务测试需重新搭建环境,而数腾仿真环境业务数据实时同步,保证与生产环境1:1,一键创建一键销毁。
-颠覆了传统业务迁移方案:对业务系统实现X2X方式整机一键迁移,在线迁移不停机,保障业务连续性,统一WEB管控操作。
15、数腾云灾备如何实现应急接管?
应急接管基于数腾云灾备独有的一对多温热灾备功能。采用实时P2V技术,将原主机实时备份成云主机格式文件,追踪记录I/O变化,保存多副本数据。当服务器发生任何类型故障时,可利用内置虚拟化平台瞬间生成接管主机,接管业务系统。
Double Kill
16、如果企业内部已经做了数据备份,还需要做容灾么?为什么?
需要。
-两者的目的有差别。数据备份是为了“数据不丢”,容灾是为了“业务不停”。数据备份是为了在业务故障情况下能够恢复数据;而容灾是为了业务中断时能够快速切换到备用系统上恢复运行。
-两者的手段不同。数据备份是通过定时或实时数据保护,故障后业务恢复需要有时间窗口; 容灾是实时复制,可以在短时间内完成业务切换,保证业务连续性。如果企业无法容忍业务系统长时间停机,除了数据备份还需做应用容灾。
17、企业已经有超融合(云、虚拟化),为什么还要用数腾的云灾备?
无论是虚拟化、超融合还是云技术都是高可用技术范畴,主要为预防出现的硬件物理故障(服务器、存储等)。但是据IDC统计,物理故障只占所有故障类型的44%,如果出现逻辑故障(应用软件故障、数据库故障、病毒损坏、人为错误等)便无法解决。此外,同一个虚拟化平台或云平台出现故障也会引起虚拟机失效,造成用户业务中断。
数腾可以针对并解决业务系统发生的逻辑错误,解决传统容灾难以解决的业务接管的难题。客户可以利用数腾的优势技术资源、丰富的灾备项目经验和成熟的运维管理流程,快速实现在云端的灾备目的,从而降低运维成本和工作强度,也降低灾备TCO。数腾云灾备包括传统的数据存储和实时复制,以及数据的实时传输、系统迁移、应用切换,还有灾备端应急接管业务应用等。
18、企业已经有了数据库容灾或具备存储级别的两地三中心,还需要数腾云灾备吗?
需要。数据库容灾技术只能解决数据库运行中常见的系统故障、介质故障等,无法解决数据丢失、误删除、病毒侵入等逻辑故障。如果客户采用数据库双活技术,由于双活同步机制,会造成备库和主库出现同样的逻辑错误,达不到灾备应急效果。两地三中心的存储复制技术也只能解决本地设备的物理故障和站点级灾难,出现逻辑故障时仍会造成用户数据丢失和业务停顿。
数腾云灾备支持本地及云端的灾难恢复。本地默认生成快照用于业务切换,RTO可达分钟级;如果启用小颗粒存储技术可以实现秒级的I/O记录,RPO趋近于零。本地恢复时间根据恢复业务系统的数量,从几分钟到几小时不等。因此,按照国家灾难恢复指导等级可介于5级到6级之间。
19、从灾备角度,如何应对勒索病毒?
应急接管:快速接管,即时拉起应急业务系统对外服务,瞬时恢复业务及数据;
任意时间点接管:数腾灾备系统可实时记录每个时间段I/O变化,可根据任意时间点的镜像快照还原对应时刻的系统数据和状态,保障数据安全可用;
多重恢复:实时备份、本地应急、异地容灾、仿真测试、云迁移等多需求场景融合统一,快速完成系统重建;
仿真测试:一键构建与业务环境隔离的仿真测试环境,可在其中进行补丁升级、应用和数据库升级,确保当前应用安全可用情况下,再到业务系统进行同样操作,实现业务系统加固和升级。
20、从灾备角度,如何应对删库跑路等事件?
防治结合。
-加强运维管理,完善备份制度,核心系统采用灾备三、二、一模式(至少准备3份副本,数据备份保存在2种不同形式存储介质,至少1套本地应急接管系统,1套异地灾备系统);
-本地应急接管,异地容灾备份,周期性灾难演练。