ORACLE 11gR2 RAC更改各类IP及网卡设备名称操作步骤

作者简介:庞旭光,现就职于北京海天起点,高级oracle维护工程师,拥有6年电信,政府,银行等行业核心系统oracle数据库运维经验,获得11g ORACLE OCM认证,Redhat Enterprise 7 RHCE认证,擅长oracle数据库方面的故障诊断及问题处理。

概述

本文主要是基于11gR2 RAC做如下维护实验,以便需要在生产环境中做相应的更改时进行参考:

1、更改私有网卡设备名称,由eth2,改为bond1,并更改私有IP网段及地址,从xxx.16.xxx.0网段改为xxx.168.xxx.0网段。

2、更改PUBLIC网卡设备名称,由eth0改为bond0,并更改PUBLIC IP、

VIP网段及地址,从xxx.0.2.0网段改为xxx.0.3.0网段。

3、更改SCAN IP地址。

本文实验环境如下:

主机名

IP地址

操作系统版本

数据库版本

racdb1

主机IPxxx.0.2.51

VIPxxx.0.2.53

私有IPxxx.16.xxx.51

RHEL 6.5 64

11.2.0.4.0

racdb2

主机IPxxx.0.2.52

VIPxxx.0.2.54

私有IPxxx.16.xxx.52

RHEL 6.5 64 11.2.0.4.0

racdb1/ racdb2

SCAN IP

私有IPxxx.16.xxx.55

说明:由于不同的生产环境,配置千差万别,所需要的操作也不尽相同,所以本文中提到的操作步骤仅供参考。

更改私有网卡设备及私有IP地址

实验计划:

将私有IP网络设备由eth2,改为bond1;

将私有IP地址由xxx.16.xxx.0网段,改为xxx.168.xxx.0网段,具体的IP地址由

xxx.16.xxx.51、52改为xxx.168.xxx.61、62。

操作概要如下:

1、在两个节点CRS均运行的情况,在某个节点上以grid用户执行命令添加新的私有网络:使用新的网卡设备和新的网段。

2、添加成功后,同时停掉并禁用(disable)两个节点的CRS。

3、由主机维护工程师在操作系统上完成网络相关的更改操作。

4、在两个节点上启用(enable)并启动CRS。

5、CRS启动成功,且正常运行后,以grid用户执行命令,删除旧的私有网络设置。

关于停机时间:

在生产环境中,此操作需要停业务,正常情况数据库侧需要不超过30分钟的停机时间,如果加上回退时间,则需要60分钟的停机时间。

注:停机时间仅供参考,具体停机时间视具体情况而定。

具体操作步骤如下:

查看当前设置

查看当前设置,以便保存现有设置。

以grid用户执行:$GRID_HOME/bin/oifcfg getif

备份profile.xml文件

以grid用户执行:

节点1上:

节点2上:

添加新的私有网络信息

以grid用户,在任意节点上执行:

只需要在其中一个节点上执行即可,不需要在所有节点上执行。

查看是否添加成功,在所有RAC节点上检查:

注:执行上面的命令时,新的私有网络设备可以还没有准备好,也就是说,在操作系统上还没有做网卡绑定,还没有配置新的IP地址。

停掉并禁用CRS

在两个节点上以root用户停掉crs,并disable掉crs:

注:此时也可以只停一个节点,但是没有意义,因为如果不停掉另外一个节点,那么即使已经停掉的节点上的所有新配置都正常,由于停掉的节点的新私有网络所在网段和没停掉的节点不在同一个网段,心跳不通,已经停掉的节点的CRS也不能启动成功,所以建议此时将所有节点的CRS都停掉。

在操作系统上完成网络相关更改

由主机维护工程师完成操作系统上相关的网络更改,主要包括:

1、双网卡绑定。

2、IP地址变更。

3、路由变更。

4、/etc/hosts文件变更:

/etc/hosts文件原内容:

修改后:

此小节涉及到的内容属于主机维护操作范围,在此不详述。

在确保主机上已经完成所有的网络相关的更改操作,并且新的私有网络已经运行正常时,启用并启动CRS。

启用并启动CRS

以root用户在两个节点上启用并启动crs:

注:此时,可以分节点执行,在一个节点的CRS启动成功后,再启动另一个节点的CRS。

如果两个节点的CRS均能成功启动的话,则删除旧的私有网络设置。

删除旧的私有网络设置

以GRID用户在任意一个节点上执行:

执行完后,在所有节点上查看,看是否已经没有了旧的私有网络信息:

可以看到,当前两个节点,都已经没有旧的私有网络的信息了。

至此私有网络更改操作成功。

回退方案

如果,在私有网络变更后,由于种种原因,出现只有一个节点的CRS可以启动,另外一个无法启动,且确定是由于心跳网络变动所致,则尝试回退,回退步骤如下:

1、在可以正常启动CRS的节点上,删除新添加的心跳网络信息:

oifcfg setif -global bond1/xxx.168.xxx.0:cluster_interconnect

2、停掉并禁用CRS。

3、由主机工程师,将在操作系统上所做的操作回退,主要包括:

使旧的心跳网络可以正常运行,/etc/hosts文件恢复原状。

4、启用并启动CRS。

更改PUBLIC网卡、IP

更改PUBLIC网卡设备及IP地址,由eth0,改为bond0,IP地址既更改网段又更改具体的IP,由xxx.0.2.51、52改为xxx.0.3.63、64。

更改VIP网段及地址,具体的地址由xxx.0.2.53、54改为xxx.0.3.63、64。

整个操作过程,会重启VIP资源,但是不需要重启CRS,可以分节点操作。

关于停机时间:

在生产环境中,由于涉及到VIP的变更,因此需要停业务,可以分节点操作,但是建议全停,否则,在割接完成后,很可能会出现数据库两个节点会话数不均衡的情况。正常情况数据库侧需要不超过30分钟的停机时间,如果加上回退时间,则需要60分钟的停机时间。停机时间进攻参考,具体停机时间视具体情况而定。

查看当前VIP设置及相关资源online状态

查看当前VIP网段及所使用的网卡设备:

查看VIP资源状态:

停掉监听及VIP资源

在节点1上以grid用户执行:

再次查看vip资源状态:

在操作系统上执行:/sbin/ifconfig -a命令看vip是否已经看不到了。

注:此步可以分节点操作,也可是两个节点同时操作,取决于停机时间。建议两个节点同时操作,否则的话,在最后割接完成后,很可能会出现两个节点连接数不均衡的问题。另外,为了避免引起不必要的麻烦,且停机时间充足的情况下,建议(非必须)停掉数据库:

主机维护工程师在操作系统上完成网络相关的更改

主要包括如下内容:

1、将eth0和eth1绑定成bond0,并将网段从xxx.0.2.x改为xxx.0.3.x。

2、确保网络更改后可以正常运行,且可以和所有应用主机正常通信。

3、针对原网段的路由设置做处理。

4、对/etc/hosts文件做处理:

原内容:

修改后:

在确保主机上已完成所有网络相关的更改操作、并且新的网段已正常运行常后,以root用户修改VIP设置。

修改VIP设置并启动VIP及监听资源

在任意节点上以root用户执行:

在两个节点上进行检查,看是否可以看到新的VIP设置:

节点1:

节点2:

在任意节点上以grid用户启动VIP及监听资源:

如果此前停掉了数据库,则此时也启动数据库,也是以grid用户执行:

查看VIP、监听及实例资源是否正常:

至此VIP更改操作成功完成。

另外,正常情况下,GRID会自动更新ASM和数据库的LOCAL_LISTENER参数,如果GI没有正常更新,可以手动进行更新,我们手动查看一下参数,看参数设置是否正常:

节点1:

节点2:

是正常的,接下来更改SCAN IP。

更改SCAN IP地址

在更改完VIP后,SCAN IP的更改比较简单。

1、先修改两个节点的/etc/hosts文件中的scan ip信息

将:

改成:

此步在更改VIP操作的时候就已经更改。

2、查看当前SCAN配置:

3、停掉SCAN 监听:

在操作系统更改完VIP网段以后,SCAN IP及SCAN LISTENER都会宕掉。

4、停掉SCAN IP资源,也就是停掉SCAN IP:

5、以root用户修改scan设置:

命令执行成功,下面通过命令确认是否更改成功。

6、以grid用户在两个节点上执行命令,看是否修改成功:

更改成功,接下来启动SCAN IP及SCAN监听。

7、启动scan ip资源及scan监听:

8、查看scan ip及scan 监听资源状态:

至此SCAN IP更改完成。

参考资料

(文档 ID 283684.1)

(文档 ID 276434.1)

(文档 ID 972500.1)

(文档 ID 952903.1)

 

未经允许不得转载:Oracle一体机用户组 » ORACLE 11gR2 RAC更改各类IP及网卡设备名称操作步骤

相关推荐