EXADATA infiniband交换机固件升级

背景概述

某用户EXADATA一体机上线已经接近3年,在此期间,各组件的软件版本没有进行过大的升级。为了保证系统的稳定性,消除近期Oracle发现的一些EXADATA的软件缺陷,需要对相关的组件进行软件升级。

根据Oracle官方文档:Database Machine and Exadata Storage Server 11g Release 2 (11.2) Supported Versions (文档 ID 888828.1),升级各组件的软件版本时,需要考虑各组件对其他组件的软件或固件版本的要求。为了保证其他组件的正常升级,我们需要最先升级infiniband交换机的固件。

本文档介绍了Infiniband交换机的固件升级过程。

具体过程:

停止数据库及CRS

关闭所有数据库

关闭集群

升级Infiniband固件

准备工作

  • 下载并解压补丁12373676和11891229。
  • 解开补丁中的压缩包:tar -zxvf SUN_DCS_36p_1.3.3.tar.gz
  • 上传sundcs_36p_repository_1.3.3_2.pkg 和 ibswitchcheck.sh 文件到IB交换机的/tmp目录。

备份配置

  • 登录IB交换机的WEB页面。
  • 在”维护”菜单中,选择”备份/回复”,根据提示备份配置。
  • 记录version命令的输出。

升级操作

  • 使用root用户登录IB交换机。
  • 关闭subnet manager:

#disablesm

  • 运行升级前检查:

如果所有检查的结果都是 [SUCCESS],可以继续进行升级。

实际检查过程中发现,3台机器都没有设置NTP服务器,按照客户给的内部NTP服务器地址设置NTP服务器,(修改/etc/ntp.conf ,加入server XX.XX.XX.XX)启动NTPD服务:service ntpd start

再次执行#/tmp/ibswitchcheck.sh pre 通过。

  • 运行spsh 进入 ILOM CLI
  • ->load -source /tmp/sundcs_36p_repository_1.3.3_2.pkg(选择Yes确认升级)
  • 再次关闭subnet manager:

  • 校验/conf/configvalid的内容为1,如果是0,设置成1:

  • 重启IB交换机:

  • 启动subnet manager:

  • 做升级后检查:

  • 骨干(spine)交换机的SM优先级必须为8,升级前可以是5,升级后,如果不设为8,第10步的post检查通不过。设置方法:

启动CRS及数据库

风险

升级IB软件的风险不大,理论上可以在线进行,但是目前的EXADATA各组件的软件版本都相对较低,为了避免遇到bug导致异常down机,建议操作时停止数据库。

如果升级以后网络拓扑校验无法保证成功,又不能及时找到问题的原因,可以回退到原来的软件版本,具体方法见”8 回退操作”。

测试方法

测试Infiniband 网络是否正常:

在任意数据库服务器,执行以下命令:

正确的输出应该类似这样:

如果DB node的node_desc文件内容错误,在执行这个校验是会报错,类似:

按照文档:Verify-Topology may Report Errors (文档 ID 1275503.1)提示做,可以修正错误,一般是因为DB node重启时,因为配置问题,改写了node_desc,所以每次重启DB node后,可能都要按照文档的提示做一遍。

测试数据库是否正常:

  1. 数据库能够正常启动,且alert.log文件中没有错误
  2. srvctl status database –d <dbname>, 状态显示正常
  3. 远程和本地客户端可以使用SQL*PLUS正常连接数据库
  4. 使用system用户,创建测试表:create table testable (col1 number); 测试增、删、改、查操作。
  5. 在不同实例上使用system用户登录,在testtable表上测试增、删、改、查操作。

其他问题

修改ilom-admin口令

在升级后,客户希望修改ilom-admin口令,发现ilom-admin修改后保存不住,经诊断,发现是bug 13494021,根据文档:Unable to change ILOM-ADMIN and ILOM-Operator password on Infiniband Switch (文档 ID 1399792.1) 给出的步骤操作,问题解决,证明IB升级到EXADATA支持的最新版本,依然不能解决这个bug。

Fabric Monitor

在IB升级到1.3.3_2后,在web 界面中新增监控功能:Fabric Monitor,但是注意这个功能不支持IE,只能用firefox,google浏览器打开才能正常显示。

未经允许不得转载:Oracle一体机用户组 » EXADATA infiniband交换机固件升级

相关推荐