还剩3页未读,继续阅读
文本内容:
冷源发生故障应急处理方案
一、目的当发生冷源故障事件时,能迅速、正确、有条不紊地进行处理,保证计算机设备的安全
二、适用范围适用于本中心供冷源设备故障处理
三、职责1)当值人员应严守岗位,加强巡查,发现问题马上通知客户、承建商和项目部主管经理,并无条件服从上级指示2)经理(主管)或事发时现场最高职级人负责组织在场员工进行突发事件的处理,并负责抢险现场指挥及督导
四、工作程序从大学城中心冷站提供二路独立冷源为整个中心大楼供冷,分别是2#冷站(主管DN500)和3#冷站(主管DN700)其中2#冷源供应范围2#智能机组(此系统供应高低压变压器和UPS房的空调,可通过分段阀转至3#冷源)、4#-9#板换(此系统供应二楼计算机房的第3-6行的列间空调冷水,其中4#-6#板换可通过分段阀转至3#冷源)、1#-3#板换(此系统设有容灾蓄冷罐,供应二楼计算机房的第7-11行的列间空调冷水)3#冷源供应范围1#、2#智能机组(此系统供应高低压变压器和UPS房的空调,可通过分段阀供2#智能机组)、1#-3#板换系统(此系统供应二楼计算机房的第7--11行的列间空调冷水)和4#-6#、10#-12#板换系统(此系统供应二楼计算机房的第3-6行的列间空调冷水,可通过分段阀供4#-6#板换)为确保计算机的正常运行,特制订以下的应急处理方案
4.1正在使用中的两路冷冻水源中某一路停供的应急处理1)当发现正在使用中的两路冷冻水源中某一路停供时,立即向上级汇报2)同时呼叫同事并按《超算中心各系统应急流程图》之规定立即打开两路冷源水管之间的旁通阀,并关闭已停供的冷源水阀,以上操作必须在10分钟内完成3)询问中心冷站停供原因及确认恢复时间4)加紧巡查密切留意冷源运行状况两路冷冻水源同时停供的应急处理1)当发现两路冷冻水源同时停供时,立即向上级汇报,此时系统会转由蓄冷罐冷冻水向二楼计算机房中第10列和10区机柜行间精密空调供冷,正常情况下能承担26分钟供冷需求,值班人员需确认各V4-V9阀门状态和1#-4#冷冻泵及1#-3#扳换二次侧电动阀状态(必要时手动打开)2)第3-
9、11列机柜应逐步退出运行,之后停止冷冻系统二设备运行3)当紧急蓄冷罐供冷时值班人员需密切留意蓄冷罐冷冻水温度(回水温度超过17团时停止供冷水),并通知相关部门做好停第10列和10区机柜计算机的准备,根据温度上升情况逐步关闭电子信息设备,如机房温度超过28回则全部关闭计算机4)询问中心冷站停供原因,确认恢复时间行间精密空调突然高温报警的处理当冷冻水源进水温度高于15即致平均送风温度高于设定值解决方法BA监控值班立即呼叫同事到负一层检查,查看系统一二的运行中水泵和板换设备是否都正常如:水泵有无停运、板换一二次侧阀门是否都开启BA监控值班需查看冷冻水系统监控画面1)投入运行的水泵和板换是否都正常;2)一次侧供回水温度是否6-70/11-120;3)二次侧供回水温度是否1O-1W13-150;4)二次侧供回水压力是否380Kpa/300Kpa左右;其中7L1/7L
2、8L1/8L2水管供回水压力是否400-430Kpa/300Kpa左右;5)蓄冷罐系统中的V
4、V9阀是否开启且V5-V8阀都关闭;如BA监控界面无法操作则快速重启软件,如二楼监控不能远程控制负一楼水泵则必须呼叫负一楼同事现场手动开启水泵和板换如不能10分钟内恢复行间精密空调的正常运行则必须立即通知超算值班人员停止受影响计算机的运行当冷冻水源进水温度在10-11瓦但回水温度达到16团以上其原因是:水流量不足、水管内有空气或行间精密空调的供水阀门开启度过小解决方法:立即手动加开1台冷冻泵,并将平均送风温度设低1-2团对水管进行排气当冷冻水源回水管电动阀失灵,导致平均送风温度高于设定值21引其原因是:电动阀故障或电动阀无控制信号解决方法立即手动开启电动阀如不能10分钟内恢复行间精密空调的正常运行则必须立即通知超算值班人员停止该台计算机的运行当翅片脏堵塞使风道不畅无法进行热交换使平均送风温度高于设定值其原因是:翅片积尘解决方法安排适当时间停机清洗翅片并定期执行如不能10分钟内恢复行间精密空调的正常运行则必须立即通知超算值班人员停止该台计算机的运行当部分风机损坏使风量减少从而热交换效果差使平均送风温度高于设定值210o其原因是:风机或线路故障解决方法安排适当时间停机维修并定期检查如不能10分钟内恢复行间精密空调的正常运行则必须立即通知超算值班人员停止该台计算机的运行
五、记录《事件报告》《设备故障记录》。