RedHat5.4 下配置Sybase 双机热备 文档控制 文档变更记录 日期 版本号 作者 备注 2009-12-30 v1.0 陈浩 创建 2009-12-31 v1.1 陈浩 补充“2.10 集群相关命令”;完善文档格式 2010-01-26 v1.2 陈浩 补充“2.6 修改系统配置”,替换 ASEHAagent.sh 中变量 1 相关概念 集群中(HA or LB)最重要的是保证数据的完整性,通过仲裁盘及隔离设备来实现。 1 .1 集群分类 存储集群(Storage) 存储集群是一个共享的文件系统,提供并发访问功能。RHCS 通过 GFS 提供存储集群。 高可用性集群(High availability,HA) 高可用性集群消除单点故障,提供故障转移,例如:双机热备。 负载均衡集群(Load balancing,LB) 负载均衡集群把请求调度到集群中的多个节点上,例如:Oracle RAC。 高性能集群(High performance,HP) 高性能机群提供并行计算能力,一个计算任务分散到多个节点执行,例如:科学计算 以上是 4 种最基本的集群类型,实际应用中可能是这 4 种类型的组合,如 Oracle RAC是 HA+LB。 1 .2 特殊问题 并发 有些应用需要并发访问相同数据,如 Oracle RAC,这需要由 DLM(分布式锁管理)来进行管理,保证数据完整性。 健忘 多个节点配置文件分开存放,修改了其中一个节点配置文件后,因某些原因没有同步到其他节点,造成配置文件不一致。 脑裂(Split-Brain) 脑裂在HA 中表现为相互重启、同时写文件,LB 中表现为同时拥有控制权,都会破坏数据完整性。 1) 集群中有两个以上节点的情况: 假设有三个节点,节点 A 出现问题无法和其他节点通信,这时集群分裂成两个部分。第一个部分是节点 A,第二个部分是节点 B 和节点 C。两个部分因无法互相通信,都认为对方已经出现故障,自己获得集群的控制权,导致出现灾难性的数据完整性问题。这时需要一个投票算法根据票数决定哪个部分拥有控制权,失去控制权的节点将被隔离。在这里,节点 B 和节点 C 有两票,节点 A 有一票,所以由节点 B 和节点 C 组成的第二部分获得集群控制权,节点 A 被隔离。 2) 集群中有两个节点的情况: 假设集群中有两个节点,这时投票算法便失去作用,需要引入第三个设备 - 仲裁设备(Quorum Device)。仲裁设备通常采用仲裁盘(Quorum Disk),仲裁盘代表一票,先到达仲裁盘的节点赢得仲裁盘的一票,获得集群的控制权。 1.3 IO 隔离(IO F...