RAC某个节点故障后的删除与重添加

作者简介:聂春,现任职于海天起点南京办事处,具有丰富的oracle以及dataguard管理维护经验。曾致力于联通,医药行业的数据库维护工作,擅长数据库故障处理,性能调优,容灾备份等方面的工作

 

实验主题:此次实验将模拟RAC中的某个节点下的/u01(里面含有grid和oracle软件)目录被误删除或者主机OS坏掉需重装操作系统后节点的删除与重添加

  • 在删除节点2下的/u01目录后数据库出现如下状态

这时我们需要把rac2从集群里踢出来并重新加入到集群中

节点的删除

  • 首先删除该节点的数据库实例,在存活的节点上执行。有图形化界面的也可使用DBCA进行实例的删除

这里我们在删除实例时报错

这是因为我们配置了TAF,修改TAF后正常删除

这里可以看到实例orcl2已经从数据库中删除


  • 从RAC集群中删除节点,CLUSTER_NODES为保留的节点
  • 从grid中删除节点

停止并删除节点2的VIP

  • grid层面删除节点。在删除节点时遇到了如下报错,查询文档说是节点2的CRS没有停掉,但我们已经把节点2上的grid软件删除,所以这里我是通过重启节点2的系统解决的
  • 保留节点上更新节点信息

更新之后可以看到集群里只有节点1了


节点的添加

  • 在添加节点时我们要先把新节点上安装前的环境都准备好,由于我们没有重装系统,所以我们这里只需要把各个文件夹建好就行,否则在copy文件时会报错。如果是新的操作系统,需要把安装之前的配置都做一下。并使用以下命令进行预安装检查,grid用户和oracle用户都需要检查

    Grid添加节点。这里我们要仔细检查上一步中的预安装检查的结果,有些错误可忽略。在存活节点上以grid用户执行以下命令,拷贝grid软件

     最后记得在节点2上以root用户执行/u01/app/11.2.0/grid/root.sh脚本
  • RAC层面添加节点,在存活节点上以oracle用户执行以下命令,拷贝oracle软件

    在这里我遇到了报错


可在此窗口执行以下语句之后再次添加节点(详见mos 2345332.1)

最后在节点2上以root用户执行/u01/app/oracle/product/11.2.0/dbhome_1/root.sh脚本

  • 添加实例,使用oracle用户执行以下命令。有图形化界面的也可以使用DBCA进行实例的添加


  • 至此,节点的删除与添加已完成,可以看到数据库恢复正常状态

未经允许不得转载:Oracle一体机用户组 » RAC某个节点故障后的删除与重添加

相关推荐