您的当前位置:首页正文

双机热备方案 ()

2023-05-27 来源:爱go旅游网


双机热备方案

一:需求分析

客户目前采用二台IBM X3850X5服务器加ROSE MIRRO HA软件在实时数据镜像基础上,实现了不需要共享存储的纯软高可用性系统。RoseMirrorHA 通过现有的以太网络基础环境,通过 TCP/IP 协议,在两台主机之间实现了数据的实时镜像,不需要额外的硬件投资。在充分利用已有资源的基础上,通过先进的软件技术,实现纯软的高可用性系统。但ROSE MIRRO HA只是针对高可用性的双机热备,但客户的数据量过大时,如果一台服务器出现故障,另一台服务器在接管数据时将会对庞大的数据进行校验,这将会是一个漫长的过程,而客户的应用将会受到灾难性的问题。考虑到数据量增大的问题,所以建议客户考虑使用存储来实现双机热备份,这样将会在服务器出现故障的情况下,避免需要通过漫长的等待来实现应用的切换,这样将真正实现高可用性和高安全性。

二:双机介绍

双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由客户现用两台X3850X5服务器通过IBM B24光纤交换机和外接共享磁盘阵列柜DS5020来连接,并通过相应的双机热备份软件来实现的双机热备方案。

在这个容错方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证应用服务不间断。

双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳” 信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证应用服务运行不间断。

双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。

双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入(通常各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器。这是目前采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。

双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。配置相对要好。

双机双工模式:是目前cluster(群集)的一种形式,两台服务器均为活动,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份,需要利用磁盘柜存储技术(最好采用San方式)。WEB服务器或FTP服务器等用此种方式比较多。而我们所采用的就是这种模式。

三:方案拓扑图

1、使用单一的DS5020实现的双机热备份,这样做可以实现高可用性和高安全性的双机热备方案,而且成本相对来说会比较少,适合对于应用数据安全较高的企业使用。软件方面使用LifeKeeper来实现,LifeKeeper可以很好的针对应用来进行切换,将切换时间缩短到20秒左右,可以很好的避免在出现故障时花费漫长的时间来进行切换。

四:具体产品

1、 DS5020

IBM DS5020是IBM最新推出的中端新品。从产品定位上来说,DS5020相比DS5000系列原有的两个型号DS5100和DS5300要更低一个档次,完全承接上一代中端DS4700的市场空间,补齐了DS5000系列与DS3000系列中的覆盖空隙。

实际上,DS5100和DS5300更大意义是让一些有高端需求的用户能够以较低的价格实现接近与高端的需求。而DS5020则属于IBM上一代中端产品DS4700的完全升级版,更加适合中小企业存储集中的环境,在设计上也更注重性价比的平衡。

IBM DS5020产品外观,与上一代产品DS4700完全一致

DS5020支持8Gb光纤主机接口和低成本千兆以太网端口,包括4个可选端口和4个8Gb光纤主机接口,支持2G和4G的缓存,支持FC与SATA磁盘驱动器,最大驱动器数量达到112个磁盘。

软件选项包括瞬间复制、远程镜像、灾备的分区等等,与DS5000系列其他产品并没有态多差别。DS5000系列相比DS4000速度提升70%以上。

承接IBM中端产品的优良品质,DS5020拥有一些升级特性。

升级特性一:主机接口升级8Gb FC

实际上这一升级不仅仅局限于DS5020,IBM DS5000系列所有中端产品基本都完成这一升级。

对于磁盘阵列来说,仅仅主机接口的带宽提升并不能代表整体系统的性能提升,对此, DS5000从4Gb光纤到8Gb光纤的升级不仅仅局限于前端的主机接口,后端磁盘通道同样做了大量的改进和优化,提升内部传输速率。

8Gbps SAN光纤端口提供充分的投资保护并简化了基础架构复杂度

此外,8Gb/s的光纤产品在网络部署中减少了光纤交换机端口的需求,例如以前某个业务流量可能需要4个SAN端口,升级到8Gb/s之后则只需要2个,这样减少了光纤线缆的成本和交换机端口成本,大体体现在8Gb/s的光纤产品在达到原来4Gb/s相同的速度和连接效果的同时,可能会节约45%的成本。

内容导航

升级特性二:USB Flash Memory

这一升级选项也是新一代DS5000产品家族同步完成。

IBM给首次给DS5000系统加入了USB Flash Memory的设计,主要是提供更高级

别的数据安全。首先相比缓存,USB Flash Memory对电的要求更低,即使内置电池长时间没有检查,也仍然不会因为突然没有电,导致缓存数据没有保护而发生丢失的情况。

IBM DS5000系列控制器主板,可看到系统缓存和数据缓存完全分开独立,且首次在内部采用USB Flash Memory对缓存数据实现双保险保护机制,进一步提高安全性

此外,USB Memory对环境的适应性更强。例如某些情况下,大楼着火,但机房没有着火,机房的温度同样也会升到很高,这时候机械磁盘的自我保护机制导致磁盘不工作,而实际上,这些数据应该被写入磁盘保存下来。但USB Memory则不会存在这个问题,对环境的适应程度较好,即使在温度较高的情况下,也仍然能完成缓存写入的工作。从而提高系统整体安全性。

用USB Memory保护缓存是新的做法,与此同时,以往采用的电池保护缓存的方式也同样继续沿用。“所以是双保险,既有电池保护,又有USB Memory。”

内容导航

升级特性三:独有磁盘加密功能

此外,DS5020提供了独特的磁盘加密功能。这一点是在同档次市场上,较少厂商提供的功能。

DS5020支持硬件加密,即使磁盘被盗或者意外丢失,其上保存的数据也不会泄露和丢失,因为磁盘上所有的数据需要特定的软件密钥才能读取。这一点是针对一些对数据安全性有特殊需求的用户特别提供。实际上,在数据失窃事件屡屡发生的全球企业市场,这一功能推出后应该会受到较多的对数据安全方面有迫切需求的中小企业用户欢迎。

DS5020的硬件加密不需要服务器的干预,在存储控制器之间和软件加密密钥控制,而且加密过程几乎不消耗多少磁盘系统资源,根据存储性能委员会SPC-1的测试,在加密情况下,它的访问速度完全没有任何的损耗。

现在的加密主要是针对光纤磁盘。

DS5000系列还将持续的升级和更新,下一步4G缓存的产品大概将在10月份推出,下一步的升级项目还将包括万兆iSCSI支持以及SSD固态硬盘支持。

2、 LifeKeeper软件简介

LifeKeeper高可用性集群系统能够通过系统冗余的方法,为用户企业级数据应用、服务器和存储设备的信息处理提供可靠地、及时地、不间断的监控和保护,构造一个连续稳定的、不停顿的计算作业环境,实现对外提供不间断服务。

LifeKeepe高可用性集群系统利用系统内的两台服务器对同一服务或应用进行监测、提供服务。如果一台服务器上的作业处理被不正常的中止,系统将在另一台服务器上激活被终止的作业,此过程不用人为介入,完全实现自动切换,可以保证重要的服务不被中断。重要的操作服务还可以分散在两台服务器上以改善使用效率、提高响应速度和平衡负载。

LifeKeeper提供完整的业务连续性解决方案,为大、中、小型企业提供以下方便的灾难恢复保护管理功能:

灵活的配置 – 除了共享存储和数据复制集群混合配置,还提供支持最高水平的物理和虚拟服务器混合配置的异构服务器集群的配置。

实时·块级数据保护 - 推出完整的跨不同数据存储阵列与局域网(LAN)或广域网(WAN)目标防护,以防止数据丢失的地方或区域的灾害事件。

CDP - 任何时间点回滚,使数据通过回滚到达这一时间点,使应用程序恢复到数据丢失或损坏之前的状态,提供几秒钟内恢复数据点目标(RPO)。

自动故障转移 - 消除了单点故障和维护地理位置分散的群集和混合高可用性及灾难恢复配置,从而能够在应用程序故障或发生其他灾难时,使保护的应用程序自动恢复。

同步和异步复制 - 确保服务器在任何时候都是在全同步,消除问题与使用中的文件,锁定的文件,NTFS权限和丢失的文件,结果是更大的提高应用程序性能,减少系统资源的负担。

控制切换 –通过控制切换进行手动恢复,减少计划内的停机时间,比如更新硬件,

应用程序更新和操作系统更新相关的故障复制到一个或多个目标服务器。

完整的应用程序保护 - 除了对预先定制打包的应用程序的支持,SteelEye公司提供的LifeKeeper Extender,将允许用户,OEM和ISV建立自己的任意的应用恢复工具包,以保护任何应用程序。

一、LifeKeeper基本架构

LifeKeeper的目的在于保证数据永不丢失和系统永不停机,采用智能型磁盘阵列柜可保证数据永不丢失,采用双机容错软件可保证系统永不停机。它的基本架构共分两种模式:双机互备援(Dual Active)模式和双机热备份(Hot Standby)模式。

高可用基本简介

所谓高可用就是一台主机为工作机(Primary Server),另一台主机为备份机(Standy Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机科尽早同志系统管理员解决,确保下一次切换的可靠性)。当工作机出现异常,不能支持信息系统运营时,备份机主动接管工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行(Non-Stop)。宕工作机经过修复正常后,系统管理员通过管理命令或经由以人工或自动的方式将备份机的工作切换回工作机;也可以激活监视程序,监视备份机的运行情况,此时,原来的备份机就成了工作机,而原来的工作机就成了备份机。

切换时机

l 系统软件或应用软件造成服务器宕机

l 服务器没有宕机,但系统软件或应用软件工作不正常

l SCSI卡损坏,造成服务器与磁盘阵列无法存取数据

l 服务器内硬件损坏,造成服务器宕机

l 服务器不正常关机

二、双机容错的实现方法

1)LifeKeeper集群软件 +磁盘阵列柜

优点:

1. 数据保存在磁盘阵列柜上,磁盘阵列的稳定性和可靠性高于服务器

2. 数据独立于服务器,避免因为服务器的损坏,导致数据不可访问

3. 双机切换时间会略短于镜像方式,对于数据实时性要求较高的客户适用

4. 可以实现多对一的热备方式,就是多台应用主机对应一台备机的方式

可以实现双机互备(ACTIVE/ACTIVE模式)的方式,既两台服务器都可以运行各自的应用,并且可以成为对方的备机。

因篇幅问题不能全部显示,请点此查看更多更全内容