DCS系统故障紧急处理措施
[热制 011-1 号]
批准:
审定:
审核:
编制:
热工检修分场
2013年5月6日
1 总则
1.1 制定依据:根据集团公司《二十五项反措》第L1.2.1条“已配备DCS的电厂,应根据机组的具体情况,制定在各种情况下DCS失灵后的紧急停机停炉措施”的要求,针对我厂DCS控制系统的实际配置情况,特制定《DCS系统故障紧急处理措施》。
1.2 制定目的:为运行、维护人员在DCS、DEH控制系统异常情况下的处理提供指导,预案的核心思想是确保机组运行的安全,在DCS系统故障已经严重威胁机组安全运行的情况下,应立即停机、停炉处理,决不以侥幸的心理维持运行。
1.3适用范围:本措施适用于大唐略阳发电有限责任公司330MW机组DCS、DEH控制系统。
2具体内容
DCS或DEH异常后,必须立即处理。当热控人员检查确认现象有恶化趋势时,可征得当值值长同意,先进行故障处理,再履行工作票手续,但工作人员必须熟悉工作的危险点及相应的防范措施。
2.1全部DCS操作员站包括工程师站故障 (所有上位机“黑屏”或“死机”,DEH系统正常)。
2.1.1运行人员应立即通知热控检修人员进行处理并汇报值长,值长接到全部操作员站故障的通知后,应立即安排运行巡检人员进行就地设备巡查,如果发现机组运行不稳定,或主要运行设备跳闸,备用设备无法启动时,应立即打闸停机停炉。
2.1.2 如果DCS系统操作员站发生故障后机组运行稳定,运行人员可参照DEH系统的运行参数,维持机组正常稳定运行,不可进行大的操作和调整。同时初步判断是否是操作员站电源失电造成,如电源正常可对值长站或某台操作员站进行重启操作,观察效果。
2.1.3热控人员在接到全部操作员站故障通知后10分钟内必须赶到现场,并迅速排查故障,尽快恢复DCS系统正常运行。
2.1.4热控人员到位后应首先检查上位机电源电压,同时检查主机柜内DPU的运行情况,并把检查结果汇报值长。若DPU全部运行正常,则可暂时维持机组运行。
2.1.5 DCS系统操作员站故障未消除期间,运行人员应就地加强汽包水位、汽包压力、炉四角火焰等重要参数及重要辅机的巡视,同时应加强DEH系统主要参数的监视。一旦发现机组相关参数超标、就地有异常情况或DCS系统在30分钟内没有一台操作员站恢复,则应立即采取紧急停机、停炉措施。
2.2部分操作员站故障。
2.2.1运行人员应立即通知热控检修人员进行处理并汇报值长,同时运行人员可以打开操作控制台下DCS系统工控机仓门,重启故障操作员站。
2.2.2值长在接到部分操作员站故障的报告后,立即合理分配正常的操作员站承担机组监控和操作的任务,同时停止重大的操作,并做好机组事故预想。
2.2.3热控人员在接到部分操作员站故障的通知后,应在10分钟内赶到现场,并迅速排查故障,尽快恢复故障操作员站的正常运行。
2.2.4若故障无法短时期排除,但是机组运行稳定,现有正常的操作员站能够满足机组的监控要求,则维持机组正常运行;若现有正常的操作员站不够,影响机组监控和调整,可根据实际情况将工程师站或监控站操作权限切换为操作员级别,替代操作员站供运行操作使用;若机组运行不稳定,且经以上处理也不能满足机组监控和调整的要求,可能危及机组安全运行时,汇报公司值班领导得到同意后则按正常停机停炉程序停机停炉。
2.3监控网络故障
2.3.1当DCS系统通讯网络发生故障时,造成所有数据不能进行刷新,所有操作无反应,运行人员应按“全部操作员站出现故障”情况处理。
2.3.2 DCS系统通讯网络发生故障后,运行人员立即联系热控检修人员处理,同时运行人员维持机组稳定运行,对机组加强监视,必要时采取就地操作维持参数在正常范围内。若运行参数达到停机停炉值时,应采取紧急停止机组运行的措施。
2.3.3 热控人员到达现场对照2.4.3.1,若现象不符合,则应检查130、131网段交换机。
2.3.4 DEH系统通讯网络发生故障后,应立即联系热控检修人员处理。若DEH遥控工作正常,且机组运行稳定,运行人员可通过DCS系统维持机组运行,但应减少操作,保证维持机组负荷、主汽压力、主汽温度稳定。并做好机组事故预想。如果不能维持负荷稳定运行时,应采取紧急停止机组运行的措施。
2.4 DCS系统服务器异常
2.4.1 单台服务器就地显示屏出现异常报警
2.4.1.1 热工人员发现服务器就地显示屏出现异常报警后,应立即汇报运行值长、热控班组班长及分场主任。值长应将相关情况汇报公司主管领导。
2.4.1.2 热工主任接到通知后应立即组织人员进行处理,同时告知运行人员存在两台服务器均故障的风险,做好紧急停机停炉的措施。
2.4.1.3 如果异常服务器仍然能正常的工作,则故障应在在7日内消除,否则不能超过3个工作日。
2.4.2 两台服务器同时故障
2.4.2.1两台服务器均故障时按“全部DCS操作员站包括工程师站故障”情况处理。
2.4.3 服务器数据传输异常
2.4.3.1服务器数据传输异常时,所有操作员站、工程师站数据刷新周期延长,操作反应迟缓,部分画面中测点、设备显示为编码和灰色。 DCS系统状态图正常,系统负荷率正常,无异常报警,服务器状态正常。
2.4.3.2原因:主服务器网卡发包异常,导致各站网卡接包溢出,数据流拥塞无法正常进行显示和处理。
2.4.3.3当DCS系统出现所述情况且机组能暂时维持正常运行时,运行人员应立即联系热控人员检查处理,同时尽量减少画面切换,参数调整等操作。如果有可能运行人员可对迟缓严重的1到2个操作员站进行重新启动,观察效果。
2.4.3.4热控人员检查确认系统状态是否存在除2.4.3.1所述外的其他异常情况,若不存在其他异常报警,且机组运行不稳定,必需进行运行操作时,热控人员可在征得当值值长同意的情况下,先进行服务器切换操作;若存在其他异常报警且无法消除,应立即告知当值值长,并启动DCS系统失灵的停机停炉紧急预案。如果工程师站已无法操作,可对工程师站进行重启操作。
2.4.3.5如果机组运行平稳,热控人员按正常的服务器切换模式操作。对备用服务器进行重新启动正常后再切换。
2.4.3.6备用服务器重新启动后,热控人员在DCS系统状态图中检查确认备用服务器启动连接是否成功(备用服务器重启后在系统状态图中显示为“黄色”跟踪状态,且上下层连接网线显示“绿色”表明备用服务器启动成功,启动过程大约2~5分钟)。
2.4.3.7备用服务器重启正常后,进行服务器主、备切换操作。
2.4.3.8切换成功后,DCS系统画面刷新及其他操作应恢复正常,此时运行人员应立即对各重要画面的设备状态及参数进行检查,参数检查正常后告知热控人员。
2.4.3.9热控人员在征得当值值长同意后,对异常服务器进行断电重启。
2.4.3.10重启后的服务器在系统状态图中显示显示为“黄色”跟踪状态,且上下层连接网线显示“绿色”,热控人员检查服务器中各服务器软件已全部打开,并正常接受数据运行,表示服务器重启成功并处于正常的热备用跟踪状态。
2.4.3.11热控人员告知当值值长故障处理完毕,处理后服务器主、备方式,并做好事件记录。
2.4.3.12处理过程中出现异常情况的紧急措施
●若现象发生时,机组运行已经处于不稳定或某些重要参数出现恶化趋势(如:汽包水位、炉膛负压等)且此时运行人员已无除DCS外的其他手段对其调整和控制的,应启动停机停炉的预案;同时由值长汇报厂有关领导决定是否停机停炉。
●若备用服务器重启后,切换操作不成功,应启动停机停炉预案,同时热控人员应对备用服务器继续进行重启,再次进行切换操作。
●若备用服务器三次重启或切换不成功,应启动停机停炉预案。同时断开备用服务器,重启主服务器。
●如果所有上位机重启后均无法进行服务器切换操作,则热控人员应对主服务器进行重启,强行切换。
2.5 DCS、DEH系统各功能故障
2.5.1 DEH控制柜失电造成汽轮机跳闸时,应按汽轮机跳闸处理。若DEH控制柜故障未造成汽轮机跳闸时,应立即联系热控检修人员处理。同时做好机组事故预想。
2.5.2 FSSS控制柜或火检控制柜失电时,应按紧急停炉处理,后应立即联系热工人员处理,短时间不能恢复供电时应按正常停机停炉程序停机停炉。若FSSS控制柜或火检控制柜故障未造成MFT,应立即手动停炉。若手动MFT按钮无效,则应立即采取停止给煤和燃油系统运行的措施,同时立即安排人员就地检查给煤和燃油系统停运情况。
2.5.3 SCS和MCS失电后,运行人员立即联系热控检修人员处理,并加强监视稳定机组运行,不能维持机组稳定运行或重要运行设备跳闸,备用设备无法启动时,应采取紧急停止机组运行的措施。
2.5.4单个主控单元故障时,无论哪个控制系统的单主控单元离线或故障后,如相应从控制器自动切换为主控且运行正常,机组可继续运行,不受其影响,但必须立即通知热控人员及时处理。在检修人员做好相关安全措施,运行人员做好相关事故预想后,对原故障主控单元进行在线检查、更换等处理。若主控单元与副控单元没有自动切换则应由热控人员对主、副控单元强制切换,同时运行人员要作好控制单元切换的各种事故预想。如相应副控制单元也出现离线或故障,按一对主控单元同时离线故障处理。
2.6一对控制单元同时故障
2.6.1当SCS系统的一对主、副控制单元离线或故障后,立即联系热控检修维护人员进行处理,同时运行人员维持机组稳定运行,加强监视,并可根据需要安排人员进行就地操作。不能维持设备运行(运行设备跳闸,备用设备无法启动)时,应采取紧急停止机组运行的措施。热控检修人员恢复主控正常运行前,应检查本对主控系统的哪些点被其系统调用,并参与了保护或联锁,对主控下装前,应该将保护或联锁进行暂时解除,有常为“1”的DO开关量点,应手动短接通道使其常为“1”,下装主控完成后,应采取强制相关设备的指令输出与就地设备状态相符的措施,在确认设备状态、参数值无误后将控制权交于主控单元,并恢复相关的保护和联锁。
2.6.2当MCS系统的一对主、副控制单元均发生离线或故障后,运行人员立即联系热控检修人员处理,同时运行人员维持机组稳定运行,加强监视,必要时采取就地操作调整措施维持参数在正常范围内。若运行参数达到停机停炉值时,应采取紧急停止机组运行的措施。热控检修人员恢复主控正常运行前,应检查本对控制系统的AO输出是否与现场设备的实际状况相一致。
2.6.3当FSSS系统控制一对主、副控制单元均发生离线或故障后,应按紧急停炉处理,运行人员立即联系热控检修人员处理,短时间不能恢复时应停机停炉。
2.6.4当DEH系统的一对主、从控制器均发生离线或故障后,如果机组没有跳闸且运行稳定,应立即联系热控检修人员在线处理或更换主控单元,同时运行人员应维持机组稳定运行(维持机组负荷、主汽压力、主汽温度稳定),并做好机组事故预想。如果不能维持负荷稳定运行时,应采取紧急停止机组运行的措施。热控检修人员恢复主控单元正常运行时,应认真作好主控单元投入运行的技术分析和试验工作,保证主控单元投入运行的稳定和安全,同时运行人员要作好主控单元投入运行时的各种事故预想。
2.7加强DCS系统维护的几点要求
2.7.1运行人员每个班应打开DCS系统中系统状态图,检查DCS系统的网络和主要设备状况,发现问题及时通知热控检修人员处理。
2.7.2热控检修人员应加强对DCS系统的巡视检查,当发现CPU、网络、电源等存在故障时,应及时通知运行人员并迅速做好相应对策处理。
2.7.3规范DCS系统软件和应用软件的管理,软件的修改、更新、升级必须履行审批授权及责任人制度。
2.7.4在修改、更新、升级软件前,应对软件进行备份。未经测试确认的各种软件严禁下载到已运行的DCS系统中使用。
2.7.5尽量不要在DCS系统中,使用不确定介质(如光盘、软盘、U盘等),避免病毒感染。
2.7.6在不进行组态和查询时,应关掉组态程序。以降低DPU负荷。
2.7.7严格遵守工程师站管理规定,建立有针对性的DCS系统防病毒措施。不允许任何便携电脑直接连接到DCS网络中,防止病毒感染。
2.7.8热控专业人员在DCS系统的维护管理方面应注意同运行人员沟通情况,严禁非运行人员对操作员站的操作行为和非热控人员对工程师站的操作行为。
2.7.9专业人员和运行人员应对DCS运行的异常状态、异常范围(包括操作员站工控机及DCS控制柜的各种指示灯、光字牌、显示画面、音响及提示的变化等)反应敏捷,并能及时作出正确的判断和采取相应的对策。
2.8 事故善后处理
2.8.1当事故抢救、处理结束后,应按照事故调查处理权限组成事故调查组,按照集团公司《电力生产事故调查规程》进行调查分析处理,总结编写事故异常分析报告。
2.8.2应急处理结束后,有关部门应组织对所发生事故的应急预案进行重新审查,发现问题及时修订或增加相应内容,经厂主管领导批准后,及时下发到有关部门。
3 附件:DCS系统硬件故障处理参照表
3.1故障现象及可能原因表:
序号 | 故障现象 | 可能原因 |
1 | 某站部分监控数据变为坏点、模件状态正常,正常数据刷新及操作正常 | 模件故障、端子板故障、预制电缆故障、接地故障 |
2 | 某控制站的部分监控数据变为坏点、 系统状态图中多个模件离线、模件实际状态异常、站未离线 | 机笼的DP链路故障、机笼异常、机笼电源故障 |
3 | 某控制站的监控数据变为坏点,系统状态图中该站离线 | 如果DPU模件就地状态正常、网络正常,则是该站服务器数据库与下层不一致.否则可能是DPU故障、系统网局部故障、主控机笼故障、主控机笼电源故障 |
4 | 所有监控数据变为坏点,可以登录下层,下层工作正常 | 监控网故障、服务器故障 |
5 | 所有监控数据变为坏点,无法登录下层 | 系统网故障 |
6 | 监控数据正常,无法登录下层 | 工程师站或相关网线及接头故障 |
7 | 部分显示器黑屏 | 显示器故障、电源故障、工控机故障 |
8 | 所有显示器黑屏 | 工控机总电源故障 |
9 | 数据刷新慢、操作响应滞后 | 主服务器异常、监控网主交换机异常 |
10 | 某站DPU的CNET灯显示异常 | 模件的DP通讯卡故障 |
3.2处理方案表
序号 | 故障原因 | DPU中相关AI点状态 | DPU中相关DI点状态 | 相关AO端子输出 | 相关DO端子输出 | 相关的网络变量 | 具体处理办法 |
1 | 机笼双DP链路故障 | 保持事前状态 | 保持事前状态 | 保持事前状态 | 保持事前状态 | 保持事前状态 | 退出相关保、护自动,检查更换DP线缆,无效后检查机笼 |
2 | 双DPU故障 | 保持事前状态 | 保持事前状态 | 保持事前状态 | 该站所辖的所有电动调节门、气动调节门转为就地操作,短接正常工况输出为“1”的DO端子,退出与该站有关的保护、自动,拔掉DO模件、AO模件至端子板的预制电缆。更换128网DPU,登陆DPU,下装组态程序,检查数据及模件状态,无异常后再更换129网DPU,数据均无异常后检查AO、DO端子板的输出值,均正常后逐步恢复措施 | ||
3 | 双系统网故障 | 正常 | 正常 | 正常 | 正常 | 保持事前状态 | 退出和相关网络变量有关的保护和自动,确认不是电源问题,确认属于监控网交换机异常,断电重启无效后则更换交换机。确认新的交换机设置正确,拔掉故障交换机的所有线缆,做好标识。更换新的交换机,接入线缆,投入电源。 |
4 | 双监控网故障 | 正常 | 正常 | 正常 | 正常 | 正常 | 确认不是电源问题,确认属于监控网交换机异常,断电重启无效后则更换交换机。确认新的交换机设置正确,拔掉故障交换机的所有线缆,做好标识。更换新的交换机,接入线缆,投入电源。 |
5 | 单交换机异常 | 正常 | 正常 | 正常 | 正常 | 正常 | 重启异常机,观察 |
6 | 主服务器异常 | 正常 | 正常 | 正常 | 正常 | 正常 | 检查主、备服务器有无报故障,主备跟踪状态,若跟踪正常,切换服务器、重启异常机后观察 |
7 | 主备服务器均异常 | 正常 | 正常 | 正常 | 正常 | 正常 | 检查、更换服务器部件或整机更换 |
8 | 服务器数据库与下层不一致 | 正常 | 正常 | 正常 | 正常 | 正常 | 下装服务器 |
9 | 模件故障 | 异常 | 异常 | 异常 | 异常 | 异常 | 检查电缆绝缘、对地电压.强制相关测点,更换相应模块 |
10 | 端子板故障 | 检查电缆绝缘、对地电压. 强制相关测点,更换相端子板 | |||||
11 | 0号机笼电源失去 | 异常 | 异常 | 异常 | 异常 | 保持事前状态 | 按第2、9项做好措施,检查机笼电源空开、线缆、插头、更换电源模块 |
12 | 其它机笼电源失去 | 异常 | 异常 | 异常 | 异常 | 保持事前状态 | 按第9项做好措施,检查机笼电源空开、线缆、插头、更换电源模块 |
13 | 0号机笼故障 | 异常 | 异常 | 异常 | 异常 | 保持事前状态 | 停电并做好措施(措施同11),更换机笼 |
14 | 其它机笼故障 | 异常 | 异常 | 异常 | 异常 | 保持事前状态 | 停电并做好措施(措施同12),更换机笼 |
15 | 模件的DP通讯卡故障 | 正常 | 正常 | 正常 | 正常 | 正常 | 强制相关测点,更换相应模块 |
¥29.8
¥9.9
¥59.8