服务器双机热备
(第一部分)
ROSE双机热备解决方案
龙加飞
前言
数字化建设是一个庞大而复杂的系统工程~其整体系统由上百个业务子系统组建而成~而这些系统间又有频繁的数据交换和业务联动~数据/信息中心系统的建设和部署是整个数字化系统建设的核心和基础~其架构设计是一项复杂的工作。本方案提出双机热备硬件平台基础架构的概述。
本方案针对数字化基础架构~帮助各个层次上保持正常、健康的运行。具体方案如下:
一、 高可用性评估:
对 IT 可用性
、流程、过程、角色、职责、
、控制和服务水平实现情况进行分析,
通过事后分析、故障成本或组件故障影响分析技术~对可能发生的故障进行分析,
二、 高可用性规划与设计
对高可用性进行规划~包括计划、计划管理、报告和服务水平管理、高可用性流程和过程设计~包括角色和职责。
三、 高可用性实施
各种服务器优化与整合服务规划、设计和实施。
四、 容灾规划与实施服务
数据中心和灾备中心连续性接管服务~灾难恢复演练计划制定与实施。
第 2 页 共 49 页 龙加飞
一(系统环境
1.1 方案业务简述
本方案的核心是统一的高性能的NAS架构~大部分数据都存储在NAS的环境中~通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。为支持越来越高的业务连续性要求。
二(关健业务连续性系统设计
2.1 基础架构
2.2 系统设计说明
1. 服务器、存储和软件系统
本方案的核心是统一的高性能的NAS架构~大部分数据都存储在NAS
第 3 页 共 49 页 龙加飞
的环境中~通过交换机连接不同的数据库服务和应用服务器进行各种业务处
理。
根据我们对业务系统的分析,充分满足对系统数据容量的规划,建议配置
如下:
, 2两台服务器建议选择IBM X3650 M4,每台建议配置如下:
服务器类型 2U机架式
八核至强E5-2650(2.0G主频/20MB三级缓存/最高支持1600MHzCPU 内存频率),可扩展至2个处理器
内存(RAM) 2*8GB 1333MHz RDIMM内存
硬盘 4*300G 2.5"HDD
网络 4口千兆网卡
光驱 DVD光驱
HBA 卡 I BM 6Gb SAS HBA*2
电源 双电源冗余
, 磁盘阵列建议选择IBM DS3512,建议配置如下:
控制器类型 单控制器
硬盘配置 2TB 7.2K 3.5" NL HDD SAS*4
互联线 3m SAS Cable*2
电源 双电源冗余
, 双机软件选择RoseHA 一套,配置如下:
Windows 2000/2003/2008 Server for x86-64 RoseHA for Windows (Standard / Advanced / Datacenter Edition)
第 4 页 共 49 页 龙加飞
操作系统要求选择支持大内存和硬盘RAID功能。
两台IBM X3650M4双机系统为数据库服务器,两台互为备份,这大大提高了系统的可靠性,在任意一台服务器发生故障时整个系统能够继续安全良好的运行。
数据存储方面,根据业务要求,确定了数据集中结构、数据冗余备份写入,服务器通过交换机和DS3512磁盘阵列组网。
为提供存储底层可靠性,我们建议配置1台DS3512阵列柜,阵列各划分划分多外逻辑卷—供不同的应用服务器使用。
数据库文件和控制文件、应用程序文件全部建议放置在磁盘阵列上,在发生双机切换时无需手工同步文件。
2.3 系统方案特点
, 存储使用阵列,即稳定可靠、绝对数据安全而且成本较低,充分节省用
户投资;
, 服务器、网卡、电源模块等关健设备全部使用冗余设计,无单点故障;
, 双机软件快速反映,错误检测时间小于10秒,故障切换及恢复时间一
般在10-20秒;
, 双机软件GUI与Server分离,可随时中断GUI而不影响Server的运行;
, 支持JOB和BRING IN/BRING OUT、在一台SERVER上停止JOB不会
导致FAILOVER
, 在同一块网卡上建立多个活动的IP地址,支持多个JOB的运行
第 5 页 共 49 页 龙加飞
, 自动切换:当系统出现故障时(如:系统宕机、HA进程/应用进程被杀
掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,
并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中
未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干
预。
三(附录
3.1 RoseHA 双机容错系统
RoseHA是利用共享磁盘阵列实现系统高可用性,保证应用系统7*24不间断运行的软件产品。ROSE HA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软件、硬件发生的故障,及时地进行错误隔绝、恢复,以最低成本提供用户几乎不停顿的计算机作业环境。
RoseHA 以其稳定、可靠,在windows2000、windows2003、windows2008服务器的容错软件中占有绝对的优势,同时也成为国内绝大多数的磁盘阵列柜厂家的OEM容错软件。
第 6 页 共 49 页 龙加飞
工作模式
, 主从方式(Active/Standby) 主机工作,从机处于监控准备状态。当主
机宕机时,从机接管从机的工作,待主机恢复正常后,按使用者的预定
以自动或手动的方式将服务切换到主机上运行。
, 双工方式(Active/Active) 两台主机同时运行各自的服务工作,且相
互监测对方的情况。当一台主机宕机时,另外一台主机立即接管它的工
作,保证工作不间断。 譬如:A机运行ORACLE数据库应用,B机运
行IIS网站应用。
第 7 页 共 49 页 龙加飞
特 点
, 自动切换 当系统出现故障时(如:系统宕机、HA进程/应用进程被杀
掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,
并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中
未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干
预。
, 支持多条心跳路径 可以将网线和RS-232串口线作为在RoseHA软件
的心跳路径。配置多条心跳路径可以避免系统的单点故障。两台服务器
的信息交换可通过:RS232、TCP/IP
, 自动检测 在集群系统的每一台服务器内,RoseHA具有两个核心进程,
它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。
第 8 页 共 49 页 龙加飞
, 丰富的附加功能 提供不同的针对特定应用的Agent程序,使服务监控
更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),
使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态
诊断及错误恢复工作的。
, RoseHA 采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时
间并防范错误,提供故障警告;
, RoseHA 可设定故障排除后自动或手动回复(switch back);
, RoseHA 安装时不需要修改操作系统的核心、更改应用软件,也无需特
殊的硬件;
, RoseHA 提供基于GUI的监控中心,管理员能查看ROSE HA的状态、
检查错误信息和警告、修改系统参数及从远程工作站管理ROSE HA系
统;
, RoseHA 支持各种数据库,包括ORACLE、Sybase、Informix、DB2、
MySQL等 。
Private Net 私用网络
两台服务器通过私用网络心跳(HeartBeat)信号,使两台服务器能够相互了解对方的运行情况。为了避免不必要的失效切换,最好建立两条独立的物理路径作为通讯路径。
, RS-232 Socket Private Net:配置服务器空闲的串口作为一条通讯路径。
第 9 页 共 49 页 龙加飞
, TCP/IP Socket Private Net:两台服务器的网卡用反线(back to back)直接或
通过LAN建立一条通讯路径。
如果所有的私用网均失效,服务器仍然可以用公用侦测对方服务器的可用性。如果对方服务器仍然可用,不触发接管动作;如果对方服务器不可用,立即接管动作。
Public Net 公用网络
客户端通过此网络与服务器通信,当两台服务器互为备份。对于不同的服务,可以用不同的公用网连接到两台服务器。ROSE HA支持TCP/IP协议,可以在EthernetFastEthernet、FDDI和ATM网上运行。
管理工具
, 友好、直观、易于操作的GUI界面
, 有关ROSE HA的配置都可以在GUI中完成,支持动态配置和实时同步
, 网卡的状态,磁盘的状态都可在GUI中显示出来
第 10 页 共 49 页 龙加飞
第 11 页 共 49 页 龙加飞
监控的对象资源
, Volume
, IP地址
, 计算机别名
, 共享文件
, NT服务
, 用户自定义
工作原理
系统启动后,ROSE HA首先启动HA Manager管理程序,根据高可靠性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务。HA代理程序用来监控、监测、诊断和管理硬件软件服务。
代理程序检测到该服务器处于活动状态,HA Manager就会认为该服务处于活动状态,HA Manager会定时通知后备服务器上的HA Manager,其每项服务处于正常。
第 12 页 共 49 页 龙加飞
当代理程序检测到某个服务发生故障时,它就通知HA Manager管理程序。HA软件首先会重新启动该服务多次(可由用户设定)。如果启动不能成功,该服务会由HA转移到后备服务器上。
HA周期性地检测系统硬件的状态,如果硬件发生故障,HA会把与该硬件相关的服务转移到后备服务器上。当某项服务发生转移时,HA首先在运行服务器上停止该服务,之后,由备份服务器上的HA在备份服务器上启动该服务。由于停止和启动该服务需要一定的时间,所以,当服务被切换(转移)时,该服务会有短暂的中断,转移完成后,服务自动恢复正常运行。 考虑到一些数据库系统(如ORACLE、SYBASE、INFORMIX等)以及其他一些应用软件(如Domino Server、WWW Server等),ROSE HA在HA管理模块(HA Manager)的基础上,提供了一系列的Agent软件模块。Agent为一个软件监视模块,监控数据库服务或其他应用服务的运行。当运行服务器发生故障时,由Agent向HA主控软件请求,进行相应的处理动作。
总之,ROSE HA软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。
第 13 页 共 49 页 龙加飞
4.2 IBM X3650M4服务器
4.3 IBM DS3512存储
IBM System
StorageDS3500 易捷版
以可承受价格提供性能及灵活性而无需牺牲可扩展性,效
率及易用性 要点 ?? DS3500 ExpressIBM System StorageIBM在中,将一流的研发能 • 6Gbps SAS系统以入门级价格提供中端性
6Gbps力与业界领先的主机接口和驱动器技术相结合。凭借其简 能和可扩展性?DS3500System x单、高效而又灵活的存储方法,成为全面集成 ?• 数据整合可在整个组织内确保数据的可BladeCenterPower Systems?服务器、和存储的经济高效的解决
用性和效率DS3500方案。以适合大多数客户预算的价格带来了大量改进,为
入门级存储用户提供了卓越的性价比、功能、可扩展性和易用性。 • 可在当前和未来实现成本节省的节能实
施DS3500易捷版旨在提供
第 14 页 共 49 页 龙加飞 • 直观而又功能强大的存储管理软件中内• 入门级价格,可升级至中端存储的性能和可扩展性存储方案
置的专业管理技术• 帮助降低客户能耗开支和环境影响的高效方案
支持多达96个驱动器,与上一代系统相比可扩展性节能电源保证的正是“节能”二字。通过高效地将电力
翻倍。通过动态增加驱动器机柜(多达7个EXP3512,设备的交流电源转换为存储系统使用的直流电源,
4个EXP3524扩展机柜或以上两者混合使用)可实DS3500的电源保证了其总体耗电低于其它效率较低
现几乎零停机时间,可快速无缝地对日益增长的容的存储部署方案。同时,低散热使得DS3500足以成
量需求作出应对。通过将服务器的I/O请求分布到大为节能绿色整体解决方案中的一个关键元件。
量的驱动器上,该可扩展性同时也改善了系统整体
性能。 DS3500延续了具有出众磁盘利用率的传统,使IBM
的客户能够实现存储投资的回报最大化。DS系列能
可在当前和未来实现成本节省的节能实施 够提供几乎两倍于主要竞争者的的磁盘利用率,使
随着能源消耗的增加及IT空间的制约,在有限的空得企业能够以较少驱动器及较低能耗实现性能最大
间内,努力减少IT硬件功耗已迅速成为众多企业的化。
IT热点问题。为应对这些挑战,IBM的DS3500系 列在节能实施方面实现了大跨步飞跃,推出新的节直观而又简易的存储管理,无需牺牲控制能力 能特性的同时也不影响性能、可扩展性或功能性。 结合了DS3000 Storage Manager的易用性与直观性, 更小巧的2.5英寸SAS驱动器是DS3500支持的多种以及之前仅在DS5000和DS4000中具有的鲁棒性及 驱动器之一,比3.5英寸驱动器提供多达3倍的每瓦功能性,DS3500带有的新的DS Storage Manager提 能耗的IOPS,使得在相同2U机架空间中可使用驱供了简易的存储管理界面,可提供良好的控制能力, 动器的数量翻倍。2.5英寸驱动器以较小尺寸同样提同时保持了其简易性。DS3500现在提供动态及其它 供了出色的IOPS性能,同时最小化对能耗或散热的高功能性的能力,而这些之前都仅在DS3000 Storage 影响。 Manager的前一代产品经由命令行界面(CLI)才具 有。DS Storage Manager允许管理员对配置进行更改 带有远程镜像的单一的DS Storage Manager 而无停机时间。新的DS Storage Manager图形用户界 DS3500的DS Storage Manager与DS5000和DS4000面(GUI)被设计为既适用于那些想对存储配置进行 系列配有的管理软件相同。现在,任意这些存储相完全控制的经验丰富的全职存储管理员,也适用于
同都可以从单一界面来查看及管理。从而可实现对需要直观界面以确保花最少的精力而能实现最优存
这些不同存储系统的统一管理,并减少学习过程。储的兼职系统管理员。
DS3500也支持经由FC主机端口的增强型远程镜像, 驱动器级别的加密确保了在驱动器遗失,失窃或同时与DS5000及DS4000系列兼容。这使得可以在 退役时的数据安全。FDE引擎执行加密时不会损重要站点使用DS5000和DS4000,在次级站点使用 失性能,使得企业能够在保持最优性能的同时实DS3500,从而实现低成本备份及恢复。 现最高级别的安全。
• DS3500的本地密钥管理作为升级的高级特性被混合主机接口支持可实现DAS和SAN分层 完全整合到DS Storage Manager中,其通过使用管理员现在可以获益于带有多协议主机连接的分层 单一授权方案或锁定密钥,为FDE驱动器提供必DAS和SAN实施。DS3500支持将4个1Gbps iSCSI 要的管理及保护,且可被应用到DS3500内所有或4个8Gbps FC主机端口与其固有的6Gbps SAS接 的FDE驱动器。DS Storage Manager为期望能够口混合使用。这种灵活的多功能双协议方式使得企 更省心地实施、解除及重新实施驱动器的客户保业能够实施单一的存储系统来支持所有共享存储要 持并控制着与FDE驱动器的密钥连接及通信,保求,从而最大化生产力,可靠性及成本节约。 护用户选择的逻辑驱动器组,且为客户提供初始多协议主机连接为系统管理员提供了诸多有利条化实时安全擦除特性。有了本地加密服务,FDE第 15 页 共 49 页 龙加飞 件: 密钥管理对日常存储管理变得透明,使得对FDE• 低成本高速SAS为直接附加存储实施提供了最驱动器的管理如传统驱动器般简单。
高的价值及性能。
高性能SAS驱动器、近线SAS驱动器和SAS FDE
SAN可用性。 而DS3500可经济有效地存储大量数据,且确保
• 从单一控制台提供多阵列的性能报告。 数据得到完全保护。
• 帮助监控一些指标,如吞吐量,输入及输出(I/O)• 集群拓扑:基于SAS的共享存储及FC或iSCSI
和数据率及缓存利用率等。 SAN实施是从DAS实施过渡到诸如MSCS和
• 接收及时警报,使得阀值被超过时可基于用户设Oracle RAC的集群解决方案的理想选择。
置的策略激发相应的事件行动。 • 流媒体:大型I/O应用,例如全球转播,大量的
• 通过协助保持SAN可靠的可信任的运行,以帮媒体存储网络,内容创建,建模及发布都将从
助改善存储投资回报率。 DS3500系列提供的额外带宽中受益。
• 通过帮助简化对复杂的SAN的管理,以减少存• 数据挖掘:有了FC及SAS主机连接,企业可以
储管理成本。 对模拟、虚拟、建模及渲染应用很方便地进行加
速及扩展,以加速大型数据集I/O率,并且经济
关键应用/工作负荷 有效地扩展及共享企业内信息以利于高度协作。 • 整合/虚拟化:均衡的性能,低成本的整合及独一• 备份及恢复:具有经由FC在存储系统间进行数 无二的配置,可非常灵活地使得DS3500能够完据镜像的能力,因而DS3500支持短期备份窗口 美地适用于更小的整合及虚拟化实施,其中单个及恢复时间以实现高生产力。 存储系统可支持多个工作负荷及应用要求。 • 数据复制:在高速FC SAN中复制数据时,数据 • 分部及远程站点:对兼职管理员来说足够简单,可被同步镜像,确保在任何时候远程站点都具有 且价格完全在企业对其分部及远程站点的支持与本地站点相同的数据。 预算内,DS3500带来的是合适的性能、简易性 及功能性,使得这些站点能够自给自足。 更多信息 • 事务性工作负荷:高效的IOPS使得DS3500很欲了解IBM System Storage DS3500易捷版的更多信 适合事务性工作负荷(OLTP,数据库,e-mail),息,请联系您的IBM销售代
或IBM业务合作伙伴,
而这些正是每家企业的要害应用的核心所在。 或访问:ibm.com/systems/storage/disk/ds3500
• 数据仓库:坚实的吞吐量,6Gbps SAS及8Gbps 对于满足信用条件的客户,IBM可提供定制的财务
FC接口使得DS3500非常适合那些单个存储系统解决方案,包括提供优惠价格、灵活的付款计划或
必须处理大量数据的数据仓库环境。 贷款,以满足您特定的IT需求。我们的资产管理服
• 企业要害应用:DS3500具有防弹级可靠性,且务包括认证的旧设备,在线资产管理,回购,资产
支持FDE驱动器及例外运行时间,因而可支持那处置及磁盘重写。更多关于IBM Global
些信息必须被保护且必须可用的企业关键应用。 Financing(IBM全球金融部)的信息,请访问:
• 二级存储:支持RAID 6及NL SAS驱动器,因ibm.com/financing
第 16 页 共 49 页 龙加飞
IBM System Storage DS3500易捷版一览
特性
型号 1746-A2S,1746-A2D(支持3.5英寸驱动器) 1746-A4S,1746A4D(支持2.5英寸驱动器) RAID控制器 一个或者两个活动型热插拔控制器
缓存 每个控制器1GB缓存,可升级至2GB(电池供电)
主机接口 三种选项:
每控制器提供
2个或4个6Gbps SAS端口
4个8Gbps FC 端口和2个6Gbps SAS端口
4个1Gbps iSCSI端口和2个6Gbps SAS端口
驱动器接口 2个6Gb SAS驱动器端口
受支持的驱动器 6Gbps SAS 3.5” 驱动器;
300GB 15k rpm、450GB 15k rpm、600GB 15k rpm
1TB 7.2k rpm近线、2TB 7.2k rpm近线
600GB 15k rpm FDE
6Gbps SAS 2.5”驱动器:
146GB 15k rpm
300GB 10k rpm
500 GB 7.2k rpm近线
300GB 10k rpm FDE
RAID 级别 0, 1, 3, 5, 6, 10
存储分区 支持多达64个存储分区(级别:标配4个,可升级至8、16、32、64个) 支持的最大驱动器数量 多达96个驱动器:高性能SAS驱动器、近线SAS驱动器和FDE SAS驱动器
EXP3512(2U,12个3.5英寸驱动器)和EXP3524(2U,24个2.5英寸驱动器)机柜,可在 DS3500
机柜后方混用
风扇和电源 双冗余热插拔
机架支持 2U,19英寸行业标准机架
管理软件 IBM System Storage DS? Storage Manager
SAN支持 受支持的IBM FC交换机、导向器和IP交换机
保修 3年部件和服务保修,9x5下一工作日处理,可升级为全天候4小时响应 型号 1746-A2S,1746-A2D(支持3.5英寸驱动器) 1746-A4S,1746A4D(支持2.5英寸驱动器) RAID控制器 一个或者两个活动型热插拔控制器
缓存 每个控制器1GB缓存,可升级至2GB(电池供电)
第 17 页 共 49 页 龙加飞
主机接口 三种选项:
每控制器提供
2个或4个6Gbps SAS端口
4个8Gbps FC 端口和2个6Gbps SAS端口
4个1Gbps iSCSI端口和2个6Gbps SAS端口
驱动器接口 2个6Gb SAS驱动器端口
受支持的驱动器 6Gbps SAS 3.5” 驱动器;
300GB 15k rpm、450GB 15k rpm、600GB 15k rpm
1TB 7.2k rpm近线、2TB 7.2k rpm近线
600GB 15k rpm FDE
6Gbps SAS 2.5”驱动器:
146GB 15k rpm
300GB 10k rpm
500 GB 7.2k rpm近线
300GB 10k rpm FDE
RAID 级别 0, 1, 3, 5, 6, 10
存储分区 支持多达64个存储分区(级别:标配4个,可升级至8、16、32、64个) 支持的最大驱动器数量 多达96个驱动器:高性能SAS驱动器、近线SAS驱动器和FDE SAS驱动器
EXP3512(2U,12个3.5英寸驱动器)和EXP3524(2U,24个2.5英寸驱动器)机柜,可在 DS3500
机柜后方混用
风扇和电源 双冗余热插拔
机架支持 2U,19英寸行业标准机架
管理软件 IBM System Storage DS? Storage Manager
SAN支持 受支持的IBM FC交换机、导向器和IP交换机
保修 3年部件和服务保修,9x5下一工作日处理,可升级为全天候4小时响应
第 18 页 共 49 页 龙加飞
IBM System Storage DS3500易捷版一览
物理特性
尺寸 DS3512:高:3.39inch/86.16mm;宽:18.99inch/482.47mm;深度:21.72in./551.60mm
DS3524:高:3.47in/88.07mm;宽:18.98in/482.10mm;深度:19.60in./497.93mm
如需目前支持的服务器、操作系统、主机总线适配器、群集应用程序以及 SAN 交换机和导向器
的清单,请参阅位于以下网址的DS3500易捷版互操作性表: 支持的系统 ibm.com/systems/support/storage/con,g/ssic/ (英文)如需了解上市日期、配置选件和连接功能,请访
问:ibm.com/systems/storage/disk (英文)
型号 型号描述 接口 型号包括 1746-E2A/EXP3512 驱动器机柜 6Gb SAS 内嵌ESM 1746-E4A/EXP3524
相对湿度(无冷凝) EXP3512/EXP3524驱动器机柜
工作范围 20%至80%
存放范围 10%至90%
最大露点 79?F (26?C)
最大湿度梯度 每小时10%
海拔范围
工作 低于海平面100ft(30.5m)到高于海平面10,000ft(3048m) 存放 低于海平面100ft(30.5m)到高于海平面10,000ft(3048m) 运输 低于海平面100ft(30.5m)到高于海平面40,000ft(12,000m)
表格中的功率和散热值是在工作时测量的最高值。
噪音 EXP3512/EXP3524驱动器机柜
声功率 6.5贝尔
声压 65dBA
电源输入 EXP3512/EXP3524驱动器机柜
标称电压范围 90VAC到264VAC
频率范围 50到60Hz
最大工作电流 115VAC时3.90A
230VAC时2.06A
第 19 页 共 49 页 龙加飞
(第二部分)
第 20 页 共 49 页 龙加飞
硬件准备
1.安装前检查
服务器IBM 3650 M4两台(01号、02号表示),阵列柜1台,双机互联线1根,阵列柜电源线2根,服务器电源线2根,SCSI数据连接线2根。
2.阵列柜安装事项
先连接SCSI数据线,一头接阵列柜后方数据接口,一头接服务器上方非集成接口(服务器接口有两个,一个是主板集成,一个是非集成,非集成的在服务器背部上方),再分别将电源线两根接阵列柜后方风扇口一侧,扣好搭扣。
3.网卡连接注意事项
双机互联线,一头插在01服务器非集成网卡上,另一头插在02服务器上。业务用的网线一头插在
服务器集成网卡上,另外一头插在交换机上,01、02都是这样安装。
4.开机顺序
先开阵列柜,直到看到上面出现英文提示“Startup Completed”后再开服务器01,直到出现登录窗口再开服务器02,到服务器02出现登录窗口后,双机开机过程结束。
关机:先关服务器02,直到电源完全关闭。再关服务器01,直到电源完全关闭,最后按阵列柜电源开关,则阵列柜关闭。
切记:
1.不能双机同时读写文件到阵列柜相同分区,否则可能会造成文件或分区损坏。
2.先保证服务器关机后方可关闭阵列柜,不然会造成阵列柜内数据丢失。
3.一定要配置UPS,严防停电事故发生。
软件使用
双机容错的核心是双机热备软件通过互相监控来实现热备的效果。建议采用的软件是美国ROSE数据公司的ROSE HA。ROSE HA可及时地进行错误隔绝、恢复,保证服务器在出现意外及有计划的停机情况下均能为客户提供连续有效的服务。将ROSE HA软件同时安装在两台服务器上,用于监视系统的状态,协调两台服务器的工作,维护系统的可用性。
第 21 页 共 49 页 龙加飞
将软件分别安装在01和02服务器上,并输入正确的授权号。它的安装很简单,一路“Next”即可,安装完成后请注意,要将它的服务改为随系统启动。
注意:双机热备要求双机须超级用户密码相同,因此超级用户密码为都为123。
服务器01为主机,服务器02为从机,当01出现中断或意外不能工作时,双机热备软件会自动切换到另一台服务器即02,直到服务器01恢复,软件会自动切换回01机。
1.状态显示说明
主界面中,两台PC机呈亮色,表示双机开启,中间绿线表示双机心路线(即蓝色网线)通讯正常,
红色表示线路有故障或双机中有一台无响应!双机中屏幕有ZZZ标示的为从机,屏幕中有图标的是主机(图2)。主机工作时能看到阵列柜分区,即G、H盘。从机不能看到这两个分区。
图2
2.资源界面说明
图3所示server01(01机)和server02(02机)两边现在已经建立好了相应的同步资源,它们是IP地址、服务器名、NT服务、共享文件和磁盘卷。现在分别列出相关信息:资源工作状况说明,呈现亮色的为主机资源,绿色的为从机资源,黄色惊叹号的表示该资源有异常(如主机死机,从机就会显示此信息)。灰色表示资源刚建立但未激活。原则上两边的资源名称和数量是相同的,阵列柜资源必须全部包含在内。
第 22 页 共 49 页 龙加飞
图3
其中server表示虚拟服务器,它是由双机热备软件自动产生的PC机。
server的特性基本与主机相同,如输入\server\c$,可以访问的是server01的C盘,但它使用自己的IP地址,共享目录也是自己的,如\server\test能够访问的前提是server01和server02都创建了test目录共享,且两个共享是指向同一个目录,如G:\test,而不能建立在各自的独有盘符中,要建立在公用盘符(一般是阵列柜)上。当双机的共享都建立成功后,再使用双机软件创建一个虚拟共享资源如\server\test即可。
开设用户名为管理用账号“toway”,密码“toway”,如果新账号要求在server01中进行,它是主域控制器。数据库用户名system / twsa2004_comein. (注意后面有小数点)。
出现意外时的处理方法
1.双机配置时
双机热备程序已经备份了注册表文件,分别对应在各自机器的 administrator\我的文档中文件名为01.reg和02.reg,恢复时先停止双机服务,步骤为:进双机软件,点击快捷菜单中的红色图标,依次点?Tools?Restore cluster configur01tion,选中相应的备份文件即可。
2.资源丢失,如阵列柜盘符消失
先停止双机服务,再分别在双机中使用磁盘管理器加入相应盘符,保证双机盘符相同再重启双机服务,点击失效的资源(一般呈灰色),右键选择“bring in cluster”,稍后即会恢复正常。
3.切换服务器的主从顺序
第 23 页 共 49 页 龙加飞
点击需要停止机器名,进入菜单选择resource?server f01ilover。
4.意外停电事故的处理
如果遇到意外停电事故,可能会产生阵列柜分区丢失,双机不能正常工作的情况。请按下面的方式处理:
1)先停止双机服务。
2)使用磁盘管理器加入相应盘符,看此时是哪个盘符丢失,直接点击盘符在右键菜单中选择“更改驱动器名和路径”,分配原来正确的路径即可。
3)重启服务器01,在我的电脑中查看阵列柜盘符是否已经出现,里面的内容是否还有。由于相关的备份内容已经全部拷贝到01机的E、F盘中,主要是mssql、server和toway等3个关键目录。如果损坏严重,可以用备份进行拷贝来恢复。不过最好是重启后仔细观察,不要轻易进行拷贝恢复,因为可能会丢失一些数据!
一般来说,G 盘存放mssql(SQL安装路径)、server(程序共享路径)、towayhis(数据库日志)等文件夹,H 盘放数据库的目录和towayhis (数据库文件)文件夹。
重启服务器01后,将服务器02也重启一遍,查看阵列柜分区是否正常。
4)如果一切正常就可以启动双机程序,把服务恢复。检查资源窗口中的状态是否正常,如果呈现灰色,一般是阵列柜的盘符,可以手工启动它,启动方法是右键点击盘符选择“bring in”即可。
提示:双机程序可以手工切换指定谁为主机,默认是01,如果想改为02,在资源界面中选中01机,再点击快捷菜单中“?”左边的第一个按钮即可。切换后原来的01机资源呈现绿色 ,02机资源呈现亮色,即表示切换成功!
第 24 页 共 49 页 龙加飞
(第三部分)
Linux 下 Rose 软件的安装与测试
软件平台安装
第 25 页 共 49 页 龙加飞
两台机器上安装ROSE
1, 首先将光盘放进光驱
mount 到 /mnt 下。
第 26 页 共 49 页 龙加飞
# cd /mnt (进入 mnt 文件夹)
# ls ( 查看 mnt 下的文件 )
安装 ROSEHA ,进入到 mnt 目录下 运行 # ./install.sh
可检查 /opt/roseha/bin 面是否有文件存在
第 27 页 共 49 页 龙加飞
运行 # ./NewPass 按照下图进行
第 28 页 共 49 页 龙加飞
按照提示首先 User : rose ( 管理员的用户名 ) New password : 密码 Re-enter new password 重新输入密码 (rose)
到这里,Rose HA的安装基本结束。
初始设置Rose软件
在进入系统之前然我们来设置一下系统的相关信息如下图所示: /etc/hosts
第 29 页 共 49 页 龙加飞
设置完毕后重新引导系统确定 starting RoseHA dearm 服务启动正常
在 /opt/roseha/bin 下运行 # ./hacon 运行 ROSEHA 的管理界面
进入控制界面首先敲击回车选择 Connect 进入系统,User 是上面我们设置的用户名 Password 也是我们设置的密码 全部输完 “ OK”
第 30 页 共 49 页 龙加飞
出现如下界面说明连接正常
第 31 页 共 49 页 龙加飞
安装要求输入license
出现下图所示的 License Information success 说明可以了~两边的服务器都需要做相同的设置。
第 32 页 共 49 页 龙加飞
创建 socket 私网
进入 PrivateNet---Create Socket, 选择主机用于私网的地址,输入远程主机用于私网的地址。说明:这是两台机器通讯用的 IP 地址(心跳 IP ),
注:该操作在两台主机上都要做
获取对方主机信息:
进入 Tools---Network, 直接选中 AutoGet , OK 。这样就会得到对方主机信息。
创建服务:
进入 Services---Create ,
Type : FTP
IP Holding NIC :分别选择两台主机所提供外界服务的网卡设备名(如: eth0 ) , 不能与心跳网卡在同一个设备上。
Active IP Address :这是为外界数据库服务的 IP (虚拟 IP )地址。此地址必 须与公网的实际 IP 在同一网段上(也就是与在 IP Holding NIC 中所选择的网卡实际 IP 在同一网段上)。
第 33 页 共 49 页 龙加飞
Active SubnetMask :虚拟 IP 的子网掩码。
Agent Script :相应的监控脚本 vsftpd_status。
Start Script :相应的启动脚本,vsftpd_start。
Stop Script :相应的停止脚本,vsftpd_stop 。
测试:
选择:Service——bring in (启动服务,意思启动两台机器中一台FTP服务)
在一号机器上查看service vsftpd status:running
在二号机器上查看service vsftpd status:stop
在ROSE图形界面下,选择service——fail over (宕机切换) 再次查看一号机器:stop,二号机器:running。
在ROSE图形界面下,选择service——take over (还原切换) 再次查看一号机器:running。二号机器:stop
第 34 页 共 49 页 龙加飞
(第四部分)
Windows 下 Rose 软件的安装与测试
软件平台安装
第 35 页 共 49 页 龙加飞
Rose HA for windows安装操作指南
第一部分:准备工作
1. 确认两台服务器操作系统及相应补丁安装正常;服务器网卡间通讯正常
2. 确认磁盘阵列与主备机连接正常,对应的磁盘阵列上的数据分区在主备机上所分配的盘符一致,并且可以同时进行读写操作。
3. 主备机都是以相同的管理员(administrator)的用户名登陆,并且口令不为空。 4(心跳连接线,包括串口线(如果需要)连接正确。
第二部分:安装步骤
1(放入光盘,执行光盘中Setup.exe
第 36 页 共 49 页 龙加飞
2.选择Next,
3(选择Yes,
第 37 页 共 49 页 龙加飞
4(输入相应的用户名称及公司名称,选择下一步,
5(输入本地机器名称及远程机器名称,
第 38 页 共 49 页 龙加飞
6(选择软件安装路径,默认即可,选择Next,
7(默认即可,选择Next,
第 39 页 共 49 页 龙加飞
8(安装完成,选择Finish。
注:主备机上都需要进行软件安装,步骤相同,只是在输入机器名称时,需要根据实际情况输入。
第三部分:配置步骤
1(选择桌面,执行开始=>程序=>NT Cluster=>Cluster Administration Tool,进入到如下界面,提示软件
第 40 页 共 49 页 龙加飞
可以试用31天,
2(点击菜单栏Tools的License,
第 41 页 共 49 页 龙加飞
3(可以得到如下界面,如果已经申请到Rose HA的正式注册码,可以在这里根据注册码的内容逐项填入Serial No. Data及License,然后点击OK,既可提交License;如果没有申请License,或者试用软件,则直接点击OK即可。
(点击菜单栏Private Net中 TCP/IP Socket,配置心跳连接,建议配置两条TCP/IP的心跳连接,优先选择4
心跳直连网卡的IP地址,其次为连接交换机的网卡地址,如果需要,也可以创建RS232串口心跳连接,点击
RS232 Serial Port进行配置即可。 Private Net中
第 42 页 共 49 页 龙加飞
以上1,4步,在主备机上均需要进行操作,才可以完成心跳连接的建立。
5(点击菜单栏View中Resource Objects,进行资源配置。
6(选中主机,点击菜单栏中Create,可以看到我们可以建立的相应的资源,这里选择IP Address,
第 43 页 共 49 页 龙加飞
7(在Active IP Address 处填入需要绑定的虚拟IP地址,并且在Server处,根据服务器名称,选择对应虚拟IP的本地网卡,然后点击Add,添加到下面的空白处,要确认选择的网卡与虚拟IP属于同一网段,然后点击Create,
可看到建立好IP的相应图示:
第 44 页 共 49 页 龙加飞
8(选中主机,点击菜单栏中Create,选择Company Alias Name,建立虚拟主机名
在Computer Alias Name处输入需要建立的虚拟主机名,点击Create建立即可,
第 45 页 共 49 页 龙加飞
可以看到如下图示:
9(选中主机,点击菜单栏中Create,选择Volume,建立卷资源,
第 46 页 共 49 页 龙加飞
在Basic setup处,在Local Server Volume处和Remote Server Volume处分别选择对应共享磁盘阵列上的磁盘,可以看到在Drive letter 可以看到对应在主备机上的分区,点击create,建立卷资源,
10(选中主机,点击菜单栏中Create,选择NT Service,建立应用服务资源,
第 47 页 共 49 页 龙加飞
在Basic Setup,从右边服务列表中,选择需要保护的服务,点击Select后,添加到左侧的NT Serivce,在界面的右上角,将前面建立好的虚拟IP、卷及虚拟主机名等资源从Available Objects加入到Pre-requisite Objects中去,点击Create,建立好NT Service资源
可以得到如下的图示,所有建立好的资源成为一个资源组,选择主机的资源组,点击鼠标右键,选 择Bring in Cluster,将资源组启动,主机为灰色,备机为绿色,至此,Rose Ha双机配置完成。
第 48 页 共 49 页 龙加飞
第四部分:功能测试
1(在windows服务列表中,停止所保护的服务,主机的资源组应该切换至备机,等切换完成后,在备机上检
查应用服务的工组状态。
2(拔掉主机上绑定虚拟IP的网卡的网线,等到主机资源组切换到备机后,在备机上检查应用服务的工组状
态。
3(关机切换,主机关闭后,备机应该接管主机的应用。
4(主机强行断电,备机应该可以接管主机应用。
第 49 页 共 49 页 龙加飞