XX城D1000硬盘更换步骤方案
签发人 签发日期
作者 参与人 审核人
Utstarcom gechengping
全球服务事业部
(2006年XX月XX日)
XXX系统实施方案
文档修订记录
序号
修订人 XXX 修订内容简述 初稿 修订日期 修订后版本号 批准人 XXXXX 2006年XX月XX日 1.0
XXX系统实施方案
本文的相关约定
本文内容涉及到许多操作命令,为了便于读者阅读,我们对本文进行了如下约定:
输入图标表示以下的内容为输入命令,输入命令使用宋体黑斜体9号
字符,并缩进两个字符。
输出图标表示以下的内容为输出显示,输出显示使用宋体黑斜体9
号字符,并缩进两个字符。
以分析图标的文字内容是对上面输出显示的解释,在分析的文字内
容中如要引用输出显示的内容,则使用双引号。
当一行代码太长以至于超过本文的一行时,它在一个合适的地方断开并在下一行
继续,续行符“\\”出现在上一行的行尾。(在输入含有这个续行符的一行时,应该把它作为没有断开的一个长行)。
本文所有检查命令除特殊申明,都是在主数据库服务器ipasdb执行的。若命令
以”#”开头表示以root用户来执行,若命令以”$”开头表示以Oracle用户来执行。
…… 注意部分的的内容,以注意图标开始,具体内容加黑框表示。注意给出了重要的信息,以帮助读者理解。
…… 警告部分的的内容,以警告图标开始,具体内容加黑框表示。警告提供了有关有害操作或危险错误的信息。对警告信息要特别注意。
XXX系统实施方案
目 录
1 问题描述 ......................................................... 1 2 故障分析 ......................................................... 1 3 实施时间点 ....................................................... 3 4 故障实施步骤 ..................................................... 3
4.1 更换D1000硬盘.......................................................... 3 4.2 停止DB2服务器,更换磁带机。 ........................... 错误!未定义书签。
5 恢复业务 ........................................ 错误!未定义书签。 6 测试业务 ......................................................... 5
全球服务事业部 I
XXX系统实施方案
1 问题描述
巡检中发现一台D1000磁盘阵列故障。并且已经被卷管理软件剔除。需要及时更换。
2 故障分析
XX城市DB服务器,硬件环境是两台sun netra 20 和两台d1000阵列,软件环境为sun
cluster3.0与vxvm 3.2. 其中一台d1000上面出现一块硬盘故障,需要更换,下面截取了部分系统的信息.
#vxprint –th Disk group: ipasdg
DG NAME NCONFIG NLOG MINORS GROUP-ID DM NAME DEVICE TYPE PRIVLEN PUBLEN STATE
RV NAME RLINK_CNT KSTATE STATE PRIMARY DATAVOLS SRL RL NAME RVG KSTATE STATE REM_HOST REM_DG REM_RLNK V NAME RVG KSTATE STATE LENGTH READPOL PREFPLEX UTYPE PL NAME VOLUME KSTATE STATE LENGTH LAYOUT NCOL/WID MODE SD NAME PLEX DISK DISKOFFS LENGTH [COL/]OFF DEVICE MODE SV NAME PLEX VOLNAME NVOLLAYR LENGTH [COL/]OFF AM/NM MODE DC NAME PARENTVOL LOGVOL SP NAME SNAPVOL DCO
dg ipasdg default default 101000 1069948421.1079.sxjc_db2 dm ipasdg01 c3t0d0s2 sliced 2888 71121402 - dm ipasdg02 c3t1d0s2 sliced 2888 71121402 - dm ipasdg03 c3t8d0s2 sliced 2888 71121402 - dm ipasdg04 c3t9d0s2 sliced 2888 71121402 - dm ipasdg05 c5t0d0s2 sliced 2888 71121402 - dm ipasdg06 - - - - NODEVICE dm ipasdg07 c5t8d0s2 sliced 2888 71121402 - dm ipasdg08 c5t9d0s2 sliced 2888 71121402 - #vxdisk list
全球服务事业部 1
XXX系统实施方案
DEVICE TYPE DISK GROUP STATUS c1t0d0s2 sliced - - error c1t0d0s7 simple c1t0d0s7 rootdg online c1t1d0s2 sliced - - error c1t1d0s7 simple c1t1d0s7 rootdg online c3t0d0s2 sliced ipasdg01 ipasdg online c3t1d0s2 sliced ipasdg02 ipasdg online c3t8d0s2 sliced ipasdg03 ipasdg online c3t9d0s2 sliced ipasdg04 ipasdg online c5t0d0s2 sliced ipasdg05 ipasdg online c5t1d0s2 sliced - (ipasdg) online c5t8d0s2 sliced ipasdg07 ipasdg online c5t9d0s2 sliced ipasdg08 ipasdg online
- - ipasdg06 ipasdg failed was:c5t1d0s2
从系统的信息中发现,故障的硬盘为c5t1d0s2 并且该硬盘不是系统的Quorum devices.
#scdidadm –L
1 sxjc_db1:/dev/rdsk/c0t6d0 /dev/did/rdsk/d1 2 sxjc_db1:/dev/rdsk/c1t0d0 /dev/did/rdsk/d2 3 sxjc_db1:/dev/rdsk/c1t1d0 /dev/did/rdsk/d3 4 sxjc_db1:/dev/rdsk/c3t0d0 /dev/did/rdsk/d4 4 sxjc_db2:/dev/rdsk/c3t0d0 /dev/did/rdsk/d4 6 sxjc_db1:/dev/rdsk/c3t8d0 /dev/did/rdsk/d6 6 sxjc_db2:/dev/rdsk/c3t8d0 /dev/did/rdsk/d6 7 sxjc_db1:/dev/rdsk/c3t9d0 /dev/did/rdsk/d7 7 sxjc_db2:/dev/rdsk/c3t9d0 /dev/did/rdsk/d7 8 sxjc_db1:/dev/rdsk/c5t0d0 /dev/did/rdsk/d8 8 sxjc_db2:/dev/rdsk/c5t0d0 /dev/did/rdsk/d8 9 sxjc_db1:/dev/rdsk/c5t1d0 /dev/did/rdsk/d9 9 sxjc_db2:/dev/rdsk/c5t1d0 /dev/did/rdsk/d9
全球服务事业部 2
XXX系统实施方案
10 sxjc_db1:/dev/rdsk/c5t8d0 /dev/did/rdsk/d10 10 sxjc_db2:/dev/rdsk/c5t8d0 /dev/did/rdsk/d10 11 sxjc_db1:/dev/rdsk/c5t9d0 /dev/did/rdsk/d11 11 sxjc_db2:/dev/rdsk/c5t9d0 /dev/did/rdsk/d11 12 sxjc_db2:/dev/rdsk/c0t6d0 /dev/did/rdsk/d12 13 sxjc_db2:/dev/rdsk/c1t1d0 /dev/did/rdsk/d13 14 sxjc_db2:/dev/rdsk/c1t0d0 /dev/did/rdsk/d14 16 sxjc_db1:/dev/rdsk/c3t1d0 /dev/did/rdsk/d16 16 sxjc_db2:/dev/rdsk/c3t1d0 /dev/did/rdsk/d16 8185 sxjc_db2:/dev/rmt/5 /dev/did/rmt/7 8186 sxjc_db2:/dev/rmt/4 /dev/did/rmt/6 8187 sxjc_db2:/dev/rmt/3 /dev/did/rmt/5 8188 sxjc_db2:/dev/rmt/2 /dev/did/rmt/4 8189 sxjc_db2:/dev/rmt/1 /dev/did/rmt/3 8190 sxjc_db2:/dev/rmt/0 /dev/did/rmt/2 8191 sxjc_db1:/dev/rmt/0 /dev/did/rmt/1
此外DB2系统Netra 20服务器的磁带机无法识别,环路报错,需要更换磁带机。
3
序号 1 2 6 实施时间点
开始时间 12月xx日 12月xx日 12月xx日 操 作 备份数据。检查系统。 更换D1000硬盘 业务测试 耗时 - - 90分钟 30分钟 责任人 UT工程师&荣联工程师 荣联工程师 UT工程师
4
4.1
故障实施步骤
更换D1000硬盘
一.更换磁盘c5t1d0s2 / did=d9 1,请用户备份数据,并保证数据可用。
全球服务事业部 3
XXX系统实施方案
2,查看机器配置、状态和磁盘阵列配置 # scconf -p # scstat -v # scdidadm -l # vxprint -ht 3,确认发生错误的磁盘。
# scdidadm -l d9 -----查看报错磁盘
# scstat -q ------确认报错磁盘是否为Quorom Dvice。
4,check the physical DID of the failed disk. We will need that info later. # scdidadm -o diskid -l c5t1d0
5,take the disk out of volume manager for replacement: (on one node) # vxdiskadm (Option 4:Remove a disk for replacement)
6,replace fault disk from D1000 disk array.(一定要注意不要拔错硬盘) unplug fault disk and insert good disk 7,重新配置磁盘。
#devfsadm (both in two node) 8,update DID datebase
# scdidadm -R d33 (both in two node) #scgdevs
9,check that the disk has been successfully replaced by checking its DID # scdidadm -o diskid -l c5t1d0
如果结果和第4步不同的话就说明设备替换成功。
10,On all nodes, upload the new information to the DID driver. # scdidadm -ui
11,update the vxvm configuration # vxdctl enable
12,put the disk back in vxvm configuration
全球服务事业部 4
XXX系统实施方案
# vxdiskadm (Option 5:Replace a failed or removed disk) #vxtask list
5 测试业务
进行业务测试。
全球服务事业部 5
因篇幅问题不能全部显示,请点此查看更多更全内容