昨天去客户那巡检,小鸡上errpt输出大量 P H 错误,错误component location指向存储映射到aix的磁盘,而存储处于黄灯状态。先不多说,连上存储看看神马问题先。
解决问题前,先提下存储工具recovery guru
The Recovery Guru is a component of the Subsystem Management window (SMW) that diagnoses problems and recommends recovery procedures to fix the problems
恢复Guru是子系统管理窗口的组件,它能够诊断问题并推荐恢复步骤以用来修复该错误。
一下图为ds4700 critical log 截图
描述信心:温度超标 Description: nominal temeratre exceeded
事件种类: 失效 event category: failure
组件类型:温度传感器 component type: temperature sensor
从上面信息大致可以判断出:由于温度传感器检测到其周围温度过高而亮起了黄灯。
二 ds4700 recovery guru 截图如下
What caused the problem ?什么导致这个问题呢? 图中提示了如下三种可能
The nominal temperature of the enclosure has been exceed. Ether a fan has failed, an obstruction is blocking the air flow to or from the enclosure, or . The recovery guru details area provides specific information you will need as you follow the recovery steps.
2 an obstruction is blocking the air flow to or from the enclosure 障碍物堵塞了盘柜壳子的通风口
3 the temperature of the root is too high 房间温度太高了
三 recovery guru 给出的恢复步骤如下图
2 如果没有风扇失效的报告,移除任何阻挡通风口的障碍物,如果没障碍物,那就是房间冷却系统的问题。
3处理完相关问题后,重新运行recovery guru检查是否有相关问题
1 检查存储的风扇有没有问题下图为虚拟存储截图真实存储风扇状态也如下图所示。
2 既然风扇没有失效,查看磁盘阵列通风口,也没有被大的障碍物挡住,不排除灰尘问题。
3 关于房间冷却系统,进去后感觉温度还挺低,如果温度高,那不仅仅是存储,估计所有小鸡都会亮起黄灯,所以这个可以排除,不去考虑。
4 等结业后,拆分ds4700 用吹风机吹,瞬间楼道内全是浓烈的灰尘………除尘完毕,组装好存储,通电,远程登录,点击recovery guru 提示故障排除。
五 总结:通过存储管理软件访问存储,b控制器的温度传感器检测周围温度过高,拆分存储的时候,果然b控制器温度明显比a控制器温度高。看来阻挡通风口的不光是障碍物还有灰尘。