您当前所在的位置: 首页 -> 规章制度 -> 正文

数据中心机房设备应急预案

发布日期:2023-12-20  来源:   点击量:

数据中心机房设备应急预案

一、紧急状态的界定

1.网络机房发生长时间停电(1小时以上)、火灾、洪水、雷击以及其他外力破坏事件如人员触电事故等。

2.数据中心UPS系统故障(逆变器告警、充电器告警、电池告警、以及旁路电源告警),UPS电池热熔起火,电池泄露。

3.主要网络设备、服务器设备1台或以上严重故障或者被黑客攻击及病毒爆发。

4.重要设备发现被盗。

5.重大政治事件或紧急事件的发生。

上述情况任意一项发生界定为紧急状态,需要根据情况启动应急预案。

二、应急预案处理的组织实施流程

1.紧急状态发生后,值班人员应立即通知部门负责人和专责人员,并做适当的应急处理,部门负责人应该立即通知上级领导。

2.专责人员应立即赶到现场,确定事故处理方案并向部门负责人汇报情况。

3.部门负责人收到通知后应立即赶到现场并组织相关专业维护人员实施应急处理或故障处理。

4.部门负责人和专责人员在事故处理完毕后要向直接领导详细汇报情况,在领导的主持下对应急预案的执行情况进行分析、评估、总结。

5.每年应至少进行一次预案演练,必须保证相关成员参加。

三、应急预案处理的技术实施流程

(一)电源系统

1.中心机房发生长时间停电(1小时以上)时,值班人员或UPS专责人员应及时通知数据中心有关人员关掉UPS所供电的服务器设备,保证在UPS电池供电结束前完成设备关闭。当电池容量告警时,UPS专责人员按操作程序逐一关闭系统

设备,恢复送电时及时启动系统并进行系统及业务使用验证工作,防止系统瘫痪。

2.中心UPS系统故障(逆变器告警、充电器告警、电池告警,以及旁路电源告警)时,UPS专责人员应认真检查设备的告警信息并做好记录。在不能及时维修好时应及时与设备供货商联系尽快修复。

3.UPS系统在旁路工作状态时,应特别引起重视。如此时发生突然停电,将有可能造成系统瘫痪。

4.专责人员要做好UPS的日常检查,并做好记录。发现UPS电池泄露应联系厂家处理。

5.UPS电池出现热熔冒烟,值班人员或UPS专责人员应立即关闭相关电池组供电开关,切断直流供电系统。

(二)火灾事件

1.处置火灾事故的组织:物业管理值班人员,保卫处值班人员,数据中心人员。发现火情后应迅速组织有关人员携带消防器具赶赴现场采取必要的隔离措施隔离火灾并进行扑救,及时关闭应用服务器和网络设备,断开事故部位电源。

2.报警程序:即刻通知部门领导、保卫处及相关部门值班人员,根据火情大小如需报警立即就近用电话或手机报告消防中心(电话119),报告内容为:“××楼栋×××机房发生火灾,请迅速前来扑救”,待对方放下电话后再挂机,派出人员到各路口等待引导消防车辆。

3.扑救方法:

1)扑救固体物品火灾,如木制品,棉织品等,可使用各类灭火器具。

2)扑救液体物品火灾,如汽油、柴油、食用油等,只能使用灭火器、沙土、浸湿的棉被等,绝对不能用水扑救。

3)扑救UPS电池火灾,只能使用1211型灭火器或者干粉灭火器。

4.注意事项:

1)火灾事故首要的一条是保护人员安全,扑救要在确保人员不受伤害的前提下进行。

2) 火灾一发生,管理人员应立即切断电源,备好手电。

3)保证安全通道的畅通,不得堆放易燃易爆物品在安全通道及机房内。

4)在相应的场所备齐安全相关装备,如面罩、灭火器等。

5)机房管理员要加强日常监控及巡查,包括机房温度、湿度、设备的外部情形、各电源开关位置是否正常等,做好当天工作日志,及时处理、消除及上报安全隐患。

6)中心机房发生雷击打火事件时,应先仔细检查设备损坏情况,再进行维修处理。在不能确认有其他设备受到冲击时,不能盲目恢复维修好的设备,以防止事故扩大。

(三)触电处置

1.一旦发生触电事故,机房管理员应迅速安全切断电源,切忌直接接触触电者。

2.即刻通知校医务室,中心负责人及有关人员、保卫处、物业管理等相关部门值班人员,同时开展现场应急救护。

(四)服务器与应用服务故障

1.服务器突发性故障

1)及时报告专责人员处理问题,同时向科室负责人汇报。

2)专责人员认真检查服务器故障信息,并认真记录,查明原因。若需要更换服务器硬件,则立即将备件拿出更换,恢复服务器运行。如果当时没有备件,应立即联系有关厂家或系统集成商申报维护,若已经超出服务期,则联系购买相关配件。同时科室负责人组织人员通过主页发布通告,及时向用户传达信息。

3)因服务器故障而可能引起服务中断的,需要根据《高可用测试方案》进行检查和恢复工作,以保证关键业务和应用的正常使用为主。

4)加强程序和数据的备份工作,网络服务的负责人应该对重要程序/数据至少每周一次完全备份,根据需要做至少一次的增量备份。当服务器设备故障解除时能及时恢复相应的网络服务。

2.应用服务突发性故障

对外服务信息系统一旦发现无法正常提供服务,应执行以下应急处理流程:

1)应立即向系统管理员通告情况,并向科室负责人汇报。

2)系统管理员在接到通知后需做好紧急应对,如重启服务或服务器。如果无法通过简单的重启恢复,应立即赶到现场,若检查是由攻击或病毒引发的服务中断则按照前述相关流程操作。

3)系统如果无法在1小时内恢复的,应立即向中心负责人汇报,由科室负责人协调组织人员制定系统的恢复方案并开展实施。同时在主页等网站发布相关通知信息,告知用户情况。

4)系统恢复后,在主页发布通知消息。

5)总结事件处理情况,并提出防范再度发生的解决方案;

(五)网络服务故障

1.网络服务遭受攻击或病毒爆发出现灾情后值班人员要及时通知科室负责人、中心负责人及相关技术负责人。值班人员根据灾情信息,初步判定灾情程度。能够自身解决,要及时加以解决;如果不能自行解决故障,由科室负责人和教育技术中心负责人现场指挥,协调各部门力量,按照分工负责的原则,组织相关技术人员进入抢险程序。各单位对外服务信息系统一旦发现感染病毒,应执行以下应急处理流程:

1)立即切断感染病毒计算机与网络的联接;

2)对该计算机的重要数据进行数据备份;

3)启用防病毒软件对该计算机进行杀毒处理,同时通过防病毒软件对其他计算机进行病毒扫描和清除工作;

4)如果满足下列情况之一的,应立即向信息安全负责人员通报情况,并在相关主页发布消息告知用户:现行防病毒软件无法清除该病毒的;网站在2小时内无法处理完毕的;业务系统或办公系统在4小时内无法处理完毕的。

5)恢复系统和相关数据,检查数据的完整性;

6)病毒爆发事件处理完毕,将计算机重新接入网络;

7)总结事件处理情况并提出防范病毒再度爆发的解决方案;

8)实施必要的安全加固。

2.网页非法篡改情况

各单位对外服务网站一旦发现网页被非法篡改,应执行以下应急处理流程:

1) 发现网站网页出现非法信息时,值班人员应立即向本部门信息安全员、网络管理员及网站负责人通报情况,并立即向市公安局网监处通告。情况紧急的,应先及时采取断网等处理措施,再按程序报告;

2) 信息安全员及网站负责人应在接到通知后立即赶到现场,做好必要记录,妥善保存有关记录及日志或审计记录;

3)网络管理员在接到报告后2小时内赶到现场,追查非法信息来源。科室负责人做好各种相关的配合工作,必要时协调相关部门或公司来协助解决;

4)网站管理员清理网站非法信息,强化安全防范措施,然后将网站重新投入使用。如情节严重,构成违法犯罪的,由市公安局网监处立案侦查;

5)总结事件处理情况,并提出防范再度发生的解决方案;

6)实施必要的安全加固。

3.非法入侵处理流程

各单位对外服务信息系统一旦发现被远程控制等非法入侵行为,应执行以下应急处理流程:

1)发现系统服务器被远程控制、植入后门程序,或发现有黑客正在进行攻击时,应立即向信息安全人员、系统管理员及网络管理员通报情况并立即向科室负责人及中心领导汇报;

2)如服务器已被入侵,将被攻击的服务器等设备从网络中隔离出来,保护现场;

3)信息安全员及系统管理员应在接到通知后立即赶到现场,做好必要记录,妥善保存有关记录及日志或审计记录;

4)各专责人员对网站事件应在接到报告2小时内赶到现场;对业务系统和办公系统事件应在接到报告4小时内赶到现场,对现场进行分析,追查攻击源,修改防火墙等设备的安全配置阻断黑客继续入侵。相关单位做好相关的配合工作,必要时协调相关部门或公司来协助解决;

5)分析后台数据库操作日志,判断是否发生数据失窃。检查、校验数据的完整性和有效性;

6)信息安全人员在提取相关数据样本后,系统管理员恢复与重建被攻击或破坏的系统。如情节严重,构成违法犯罪的,由公安局网监处立案侦查。重新将恢复后的对外服务系统接入网络;

7)总结事件处理情况,并提出防范再度发生的解决方案;

8)实施必要的安全加固。

4.拒绝服务攻击处理流程

各单位对外服务信息系统一旦发现遭受DDOS等拒绝服务攻击,无法正常访问时应执行以下应急处理流程:

1)发现对外服务系统访问流量异常、无法正常访问,可能遭受拒绝服务攻击时,应立即向信息安全人员及网络管理员通报情况,并立即向科室负责人及中心领导报告;

2)相关技术处理人员在接到通知后立即赶到现场,做好必要记录,妥善保存有关记录及日志或审计记录;

3)信息安全员及网络管理员对网站事件应在接到报告2小时内赶到现场;对业务系统和办公系统事件应在接到报告4小时内赶到现场,对现场进行分析,追查攻击源,修改路由器、防火墙等设备的安全配置,缓解、消除拒绝服务攻击的影响。相关部门做好相关的配合工作,必要时协调专业公司来协助解决;

4)在提取相关数据样本后,恢复对外系统正常运行。如情节严重,构成违法犯罪的,由市公安局网监处立案侦查;

5)总结事件处理情况,并提出防范再度发生的解决方案;

6)实施必要的安全加固。

(六)被盗案件

处理程序:

1.发现案件时应及时向学校保卫处值班室报警。

2.向科室负责人及中心领导报告。

3.根据案情报告分管领导和学校主要领导。

4.经校领导同意后向公安机关报案。

注意事项

1.注意保护现场,以便为侦破案件提供条件。

2.积极协助公安人员勘察现场,为侦破提供条件。

(七)网上突发事件应急预案

当在校园网上发现学校信息泄密情况,擅自公布违法信息或有非法组织违法言论一律作为网上突发事件处理。

处理程序:

1.向科室负责人及中心领导报告。

2.向学校保卫处值班室报告。

3.经领导同意后向学校保卫处值班室以及公安局网监局报告。

处置措施:

由网络管理员及信息安全员协助查封违法者的 IP 地址或网站,防止扩散,并保留相关历史信息,如有需要由科室负责人安排其他人员协助。

注意事项

1.遇事一定要冷静,果断采取措施。

2.网络突发事件处理原则是:先查封违法者的 IP 地址,后上报,及时控制事态的发展。


信息化管理中心


联系我们

学校地址:河南省郑州市中原区建设西路三十里铺

联系热线:0371-56525557

邮箱:[email protected]

Copyright©2020版权所有:今晚看图中一肖一特 豫ICP备2021022293号-2