内容概要:
1. 准备工作
注:heartbeat3 在centos6.4上不好用,所以我的实验环境时centos5.9,版本为heartbeat2
HA的心跳监测可以通过串口连接监测也可以通过网线监测,前者需要服务器有一个串口,后者需要有一个空闲网卡。
HA架构中需要有一个共享的存储设备
首先需要在两台机器上安装mysql服务,并架设好共享存储资源(NFS), 共享的目录应该是datadir
HA需要两台机器配置一个相同的vip
理论上每台机器要配置三个ip,一个是vip(eth0:0),一个是心跳线监测使用的ip(eth1),还有一个是服务使用的ip(eth0)
我们设定如下环境:
vip(eth0:0): 192.168.0.100
机器1 eth0:192.168.0.21 eth1: 192.168.200.128
机器2 eth0:192.168.0.22 eth1: 192.168.200.129
机器1 我们简称node1, 机器2我们简称node2
配置hosts, 两台机器一样:
192.168.0.21 node1
192.168.0.22 node2
node1 & node2 关闭防火墙,关闭selinux
2. 配置NFS安装mysql
NFS由第三台机器(192.168.0.11)提供
NFS上:vim /etc/exports //内容如下
/data/share 192.168.0.0/24(rw,sync,no_root_squash)
NFS上: /etc/init.d/rpcbind start; /etc/init.d/nfs start
node1 & node2上以下步骤同:
mkdir -p /data/mysql
mount -t nfs 192.168.0.11:/data/share/ /data/mysql/
groupadd -g 27 mysql
useradd -u 27 -g mysql mysql
chown -R mysql:mysql /data/mysql
下载免编译的二进制mysql包
tar zxvf mysql-5.1.40-linux-i686-icc-glibc23.tar.gz; mv mysql-5.1.40-linux-i686-icc-glibc23 /usr/local/mysqlcd /usr/local/mysql
cp support-files/my-large.cnf /etc/my.cnf
cp support-files/mysql.server /etc/init.d/mysqld
vim /etc/init.d/mysqld //更改datadir 以及 basedir
node1上指定,node2 上不用执行这一步
./scripts/mysql_install_db --user=mysql --datadir=/data/mysql
node1 上先启动mysql,node2上暂时先不启动
/etc/init.d/mysqld start
如果想启动node2上的mysql,必须先停掉node1上的mysql,因为这两个mysql共同用一个datadir有共享的资源,会产生冲突,而在heartbeat服务中,如果node1正常则node2默认就停止mysql服务,只有当node1宕机,node2才会自动启动mysql服务
3. 安装配置heartbeat
node1 & node2 : yum install -y heartbeat
yum install -y heartbeat-* libnet
以下配置在node1:
cd /usr/share/doc/heartbeat-2.1.3/; cp authkeys haresources ha.cf /etc/ha.d/
cd /etc/ha.d
vim authkeys// 增加:
auth 3
3 md5 Hello! 保存后更改它的权限:
chmod 600 authkeys
vim haresources //增加一行:
node1 192.168.0.100/24/eth0:0 mysqld
vim ha.cf //更改或增加如下内容
logfile /var/log/ha.log
#bcast eth1 #心跳使用以太网广播方式,eth1为广播地址
ucast eth1 192.168.200.129 #单播形式与对方机器通信,与上者二选一
keepalive 2 #每2秒发一次广播
warntime 10 # 这个时间为警告时间,10s钟内没有收到对方节点的信号,则会发警告信息记录到日志里
deadtime 30 #30s内没有收到对方节点的信号则认为对方节点宕机,然后立即接管对方节点的服务
initdead 120 #这个时间是给重启系统留出来的等待时间,如果系统重启了那么网络服务不会立即正常使用
udpport 694 # 广播通信使用的端口
auto_failback on # 如果是on, 则当主节点故障恢复后,服务还会切换回来
node node1 #主节点主机名
node node2 #从节点主机名
ping 192.168.0.1 #仲裁节点,最好是一个比较强健的设备,比如说交换机
respawn hacluster /usr/lib/heartbeat/ipfail #当heartbeat启动时也会随着一起启动的进程放到这里,ipfail是用来检测网络连通性的工具,hacluster为启动该程序的用户
debugfile /var/log/ha-debug.log
把node1上的三个配置文件拷贝至node2
node1上执行: cd /etc/ha.d; scp ha.cf haresources authkeys node2:/etc/ha.d/
node2上修改 vim /etc/ha.d/ha.cf //把
ucast eth1 192.168.200.129改为 ucast eth1 192.168.200.128
启动heartbeat, node1 & node2 :
service heartbeat start
4. 测试heartbeat
node1 上把icmp禁止:
iptables -I input -p icmp -j DROP
tail -f /var/log/ha-log.log
ifconfig 看,已经没有了 eth0:0
node2 上ifconfig 开启了eth0:0
在node1上解除防火墙
iptables -D input -p icmp -j DROP
tail -f /var/log/ha-log.log
ifconfig 看eth0:0 会开启,而node2上eth0:0会自动关闭
在node1上killall heartbeat, node2上也会自动开启eth0:0