专栏特辑 | 开发安全铁三角纵横谈(七)

admin 2023年3月9日08:27:25评论24 views字数 2255阅读7分31秒阅读模式

专栏特辑 | 开发安全铁三角纵横谈(七)


专栏特辑 | 开发安全铁三角纵横谈(七)

开发安全铁三角

为了能更好地理解今天所讲,请大家先回顾一下之前“开发安全铁三角纵横谈”内容:专栏特辑 | 开发安全铁三角纵横谈(六)

对于重要的系统,还需要考虑业务连续性。(本章节部分大量引用《2021 中国灾备行业白皮书》内容,在此感谢)

业务连续性(Business Continuity 简称“BC”)是指在中断事件发生后,组织在预先确定的可接受的水平上连续交付产品或提供服务的能力。
一个企业的业务连续性建设绝不是在一个应用项目建设来完成,是一个企业长期建设的结果。高等级的业务连续性,从基础硬件来说,两地三中心,这显然是多个长期高投入建设项目的结果。
一个应用系统的业务连续性能够建设到什么程度,受制于企业的基础设施,它的最好结果是对现有业务连续性设施的充分利用。因此,应用有好的业务连续性设计,它就有可能实现基于现有设施的最佳结果,而没有业务连续性设计,就意味着,即便企业在业务连续性方面有相当的资源支持,应用也无法有效利用。
所以,做一个应用的业务连续性支持,既要考虑应用的需求,又要考虑企业的基础设施支持能力,找到最佳平衡方案。
业务连续性包含两部分内容:

1. 高可用性(High Availability,简称“HA”)

高可用性指通过技术手段,尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。业界的通行做法是采用群集系统 (Cluster) ,将各个主机系统、网络系统、存储设备(部分高可用系统包含存储设备的高可用)等通过各种手段有机地组成一个群体,共同对外提供服务。
通过创建群集系统(采用实现高可用性的软件)将冗余的高可用性的硬件组件和软件组件组合起来,以达到消除单点故障、减少设备意外发生时的宕机时间。一般说,高可用技术通过对网卡、CPU、内存、系统软件设置不同的可用性监测点,在这些节点发生故障时实现冗余切换,持续提供服务。

2. 灾难恢复(Disaster Recovery,简称“DR”)

狭义的恢复 (Recovery) 定义是指重新创建生产系统应用或计算环境的过去操作状态,包含完全恢复和小颗粒恢复两种模式。
广义的灾难恢复 (DR) (国内通常简称为灾备或容灾)则属于业务连续性的技术层面。在用户信息服务中断后,需要快速调动各种资源,在异地重建信息技术服务平台(包括基础架构、通信、系统、应用及数据),灾难恢复也包括本地的恢复与重建。
目前,流行的灾备系统往往包括本地的 HA 集群和异地的 DR 数据中心。从故障角度,HA 主要处理单组件的故障导致负载在集群内的服务器之间的切换, DR 则是应对大规模的故障导致负载在数据中心之间做切换。
评估一个系统可靠性的两个重要指标是 RTO 与。(Recovery Time Objective) 恢复时间目标, 是指灾难发生后,从系统宕机导致业务停顿之刻开始,到系统恢复至可以支持业务部门运作,业务恢复运营之时,此两点之间的时间。RTO 可简单地描述为企业能容忍的恢复时间。RPO (Recovery Point Objective) 恢复点目标, 是指灾难发生后,容灾系统能把数据恢复到灾难发生前时间点的数据,它是衡量企业在灾难发生后会丢失多少生产数据的指标。RPO 可简单地描述为企业能容忍的最大数据丢失量。
RTO 针对的是服务时间的丢失,RPO 针对的是数据的丢失,两者是衡量容灾系统的两个主要指标,但它们没有必然的关联性。RTO 和 RPO 的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定,对于不同企业的同一种业务,RTO 和 RPO 的需求也会有所不同。当然,对于组织而言,最好的情况是 RPO=0 ,RTO=0 ,但显然这种情况对很多中小企业而言是理想状态。
专栏特辑 | 开发安全铁三角纵横谈(七)
先确定RTO和RPO的目标,就可以确定高可用方案,
高可用方案的基础模式是系统中的两台(套)服务器的热备,双机热备按工作中的切换方式分为:主备方式( Active-Standby 方式)和双主机方式(Active-Active方式)。主备方式是一台(套)服务器处于某种业务的激活状态(即 Active 状态),另一台(套)服务器处于该业务的备用状态(即 Standby 状态)。而双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即 Active-Standby 和 Standby-Active 状态)。注:Active-Standby 的状态指的是某种应用或业务的状态,并非指的是服务器状态。
基于这个基础,从电力、网络链路等都要考虑两份甚至多份的冗余,并建立起在一份出问题时,另外一份的切换机制,就完整建立起高可用机制。
当然更重要的系统有更复杂的高可用机制,在基础版的基础上,可以增加多活(多套同时激活,支持业务),多中心(多个机房),多地等因素,其高可用性能就可以越来越高。以两地三中心的多机同时激活为例,该方案是目前最理想的高可用模式,RPO和RTO趋近于0。
到目前为止的结构为:

1. 业务连续性计划

1.2. 确定RPO和RTO

1.2.1. 业务影响分析

1.2.2. RPO和RTO目标

1.3. 高可用方案

1.3.1. 电力

1.3.2. 网络链路

1.3.3. 主机和应用

1.3.4. 数据复制方案(主备之间,可以在上节描述,如果复杂可以单列)

下一章节,我们再聊聊灾难恢复计划。

拓展阅读


国舜股份入选中关村金融科技产业发展联盟专家委员会

国舜情景式开发安全管理平台与麒麟软件完成兼容认证

再度登榜!国舜股份入围《CCSIP 2022中国网络安全产业全景图》25项细分领域

专栏特辑 | 开发安全铁三角纵横谈(七)

原文始发于微信公众号(国舜股份):专栏特辑 | 开发安全铁三角纵横谈(七)

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2023年3月9日08:27:25
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   专栏特辑 | 开发安全铁三角纵横谈(七)https://cn-sec.com/archives/1232961.html

发表评论

匿名网友 填写信息