哈尔滨工业大学 工程硕士学位论文开题报告论 文 题 目 变电站设备故障预警及辅助决策系统研究
www.zsyy.com.cn 目 录 1 课题来源及研究的背景和意义 2 1.1 课题来源 2 1.2 研究的背景和意义 2 2 国内外研究现状及分析 3 3 本课题的主要研究内容 4 3.1 变电站设备故障预测方法 4 3.1.1 变电站设备的健康度指标 4 3.1.2 故障预警系统设计模型 5 3.1.3 变电站设备的健康度计算及评价 6 3.2 聚类分析算法 6 3.2.1 聚类分析的概念 6 3.2.2 聚类分析算法 7 3.3 基于聚类分析算法的变电站设备辅助决策系统 8 3.3.1 监控信息与设备健康水平的关联规则 8 3.3.2 辅助决策系统 9 4 研究方案及进度安排,预期达到目标 9 4.1 研究方案 9 4.1.1 电网监控信号的存储及建模 10 4.1.2 构建变电站设备运行健康状况评价体系 11 4.1.3 变电站设备辅助决策专家系统研究 11 4.2 进度安排 11 4.3 预期达到的目标 11 5 为完成本课题已具备和所需的条件和经费 12 6 预计研究过程中可能遇到的困难和问题,以及解决的措施 12 7 主要参考文献 12 1课题来源及研究的背景和意义 1.1课题来源公司科技项目。为了对调控中心监控部门提供智能化、自动化的技术支撑,对电网监控信息进行实时监控、信息查询及统计分析,公司建设了监控信息一体化平台,本课题即来源于该项目的研究。 1.2研究的背景和意义随着变电站综合自动化系统的应用和无人值班工作的开展,变电站事故信号的正确性和可靠性关系到电网事故处理的效率。如何确保供电系统稳定可靠的运行,已经成为电力管理部门最主要的任务之一。现代化供电系统中尤其需要保证供电稳定可靠,可想而知供电管理的网络化、数字化以及自动化将是电力系统发展的未来道路,供电系统中变电站将变成无人值守的状态,由此也引发电力系统远程监控的问题。现阶段,我国也已针对供电系统建立起监控系统,如何提高供电安全,以及确保变电站正常工作运行,将是监控信号分析及设备运行评价关键技术将要研究的问题。国家电网公司实行“调控一体化”和变电站无人值班后,当设备发生故障跳闸时,调控中心监控员通过监控系统第一时间发现故障设备,并立即将故障初步情况汇报值班调度员,再通知变电站运维人员对现场设备进行检查。当前电网运行与维护人员对电网监控告警信息的掌握情况大多数仅限于单条告警信息内容的查询以及次数的统计,缺乏对电网网络拓扑及统计管理口径的综合考虑。由于监控信号实时性强,数据量大,关联关系复杂,目前缺少一个有效的手段,对事故、异常、越限、变位、告知信息进行深度挖掘,发现设备的运行规律,找到电网运行风险点,对设备运行情况进行综合的评价,最终能指导监控人员的决策分析。本项目依托Hadoop的分布式文件系统(Hadoop Distributed File System),简称HDFS[1,2]实现对大规模监控信息的存储,基于设备监控五类信号的历史分析技术,实现对变电站设备健康水平的计算,从而达到对变电站设备故障预警的目的。同时研究事故信号与处置办法的关联映射技术,实现设备监控辅助决策专家库,使变电站设备的故障处理从人为经验主导向智能化、自动化发展。目前,电力系统通信网已成为电力系统调度智能化和管理现代化不可或缺的一部分。告警关联分析是网络故障诊断中的重要任务,对通信网络的管理和维护具有十分重要的意义。在监控中心工作站后台建立故障专家库,能够保证在最短时间内收集到与故障相关的所有重要信号,对故障处理和分析有辅助作用,可提高事故异常处理的准确性和快速性。该课题的研究符合电力系统调度智能化和管理现代化的客观需求,有助于维护电网的安全稳定运行。此外,电力设备故障造成的电压波动甚至停电,除本身损失外,还可能造成用户的经济损失及人身伤害。因此,开展变电站设备的故障预警、智能辅助决策有着十分重要的意义。 2国内外研究现状及分析随着调控一体化的不断深入,调控人员面对的电网越来越大,信号量也越来越大,因此,近年来国内外学者和专家围绕设备信号智能告警技术开展了深入的研究和初步实践。从现有的研究成果来看,主要集中在两个方向,一是运用专家系统、遗传算法以及模糊集等人工智能分析算法,对调度端的告警信息进行分析处理,实现设备故障的在线诊断;另一个是结合监控业务的特点,研究告警信息分层分类、推理分析和综合展示[3]。上述研究对于改善调度自动化告警信息处理的智能化水平起到了重要作用,但离支撑大电网运行还有一定的距离。现代电网互联规模和运行复杂性越来越大,运行越来越接近极限,而传统型的研究是建立在网络拓扑结构模型的基础上,根据发生故障时系统结构和参数变化,导致系统潮流的变化,根据潮流计算的变化判断出故障,多采用传统的数学方法,采用单一的集中求解,因系统规模、复杂程度和不确定因素等的限制,很难适应现代电力系统故障判别的要求,系统故障诊断难以达到理想的效果。目前,变电站设备信息智能分析辅助决策系统的研究和开发越来越受到人们的重视,调度决策系统由分析型向智能型转变是一大发展趋势,电力系统故障识别及辅助决策的方法向专家知识库、智能化方向发展。基于专家知识库的信号分析及辅助决策方法,主要包括专家系统故障诊断方法、可拓原理、模糊故障诊断方法等等。主要优点是不依赖于具体的数学模型,具有较为丰富的、灵活的知识表达和问题求解能力,它可以充分发挥人类专家在诊断中根据感觉、知识、经验所进行的推理判断的能力,并可适合于各种场合的故障判别。早在1981年,EPRI就提出了基于复杂推理规则的警报综合分析法,替代了之前基于简单优先级规则的警报筛选法[4]。B.F.Wollenberg上述研究的基础上,将调度员的经验提升为规则[5],运用专家系统方法来处理告警,在一定程度上实现了告警信息与事件的一一对应。葡萄牙调度中心开发了一套告警处理专家系统[6],通过数据分析和推理,结合运行经验,将告警信息重新组合后显示,以达到减轻调度员查看告警信息工作量的目的。但该系统对告警信息的处理较为简单,容错性和灵活性较差。用以弥补EMS缺陷的地区电网告警信息智能处理系统[7]采用了分层分类处理的原则,实现了告警信息的辨识和分类,同时建立了设备异常信息处理子系统和故障诊断预处理子系统,运用告警信息因果关系模型实现了对设备异常信息的简单关联分析及故障信息辨识。但是,该系统没有对实时告警信息进行接收和处理,没有处理规则的不确定性。由于理论和技术条件的限制,智能调度决策支持系统中有关设备异常报警信息的智能处理和电网故障诊断处理的研究大多都停留在理论研究阶段,真正实现在线运行的监控告警信号分析及设备运行评价,变电站设备故障预警以及在线辅助决策专家库功能的系统很少。 3本课题的主要研究内容本项目研究并提出在冀北张家口地调OMS系统中使用监控信号分析及设备运行评价关键技术,并投入实际运行,实现对变电站设备故障预警及辅助决策。主要研究内容如下: 3.1变电站设备故障预测方法为了对变电站设备进行故障预测,首先需要对设备基础信息及设备监控告警信息进行收集和整理。之后在对相关信息进行统计分析和数据挖掘后,对变电站设备的健康水平进行计算,从而达到对变电站设备故障预测的目的。 3.1.1变电站设备的健康度指标变电站设备的健康度指标指的是电网系统中变电站设备对象的关键性监控指标的集合。对于电网系统中运行的某一设备,存在多项受控指标,通常只提取与关注业务相关的关键性监控指标来作为业务指标,便于业务的管理和分析。在本课题的研究中,变电站设备的健康度指标的关键性数据来源主要有以下几个方面:(1)性能数据。电网运行系统的性能监控即是对业务中包含设备的性能监控,通过业务拓扑集中展示相关资产的监控信息。(2)安全事件数据。电网运行系统的安全事件是指业务中包含资产的安全事件的集合。可以通过定制针对业务的关联规则生成关联事件。(3)告警数据。电网运行系统的告警来源是业务内资产的告警,包括性能监控告警和关联分析告警。(4)模拟用户体验数据。用户模拟行为是通过模拟用户发起的交易请求来探测各项业务提供的服务是否可用以及相应的响应速度,从而获取用户感知类的数据,为及时发现系统的可用性、了解用户使用业务的感知指标、改善或优化现有业务系统提供量化的依据。 3.1.2故障预警系统设计模型变电站设备故障预警系统的设计模型如图3-1所示。 图3-1 设备故障预警系统设计模型变电站设备的故障预警是根据变电站设备的状态信息来判断设备异常情况,在设备发生故障前即能预知,达到警示及预处理的目的。故障预警的实质就是建立变电站设备健康水平的诊断分析方法[8,9]。本课题设计的变电站设备健康水平分析模型如图3-1所示,收集设备基础信息、设备历史运行数据、技术监督数据以及设备缺陷信息创建数据仓库,通过对数据库内容进行数据挖掘,得到设备、系统测点的关联参数及相关值,以及设备缺陷的特征值。通过数据挖掘得到的结果对设备实时监测数据进行分析,判断变电站设备的运行状态是否有异常,供监控人员决策。 3.1.3变电站设备的健康度计算及评价变电站设备的健康度来源于电网运行系统中各管理对象的性能数据、安全事件数据、告警数据、模拟体验数据[10]。通过对上述数据进行聚类,分别得出变电站设备可用率指标和运行状态指标,以计算变电站设备的运行健康度。设备可用率的指标计算公式:设备可用率指标=[∑(业务可用时长)/∑(统计周期内总时长)]×100% 业务可用率指标的取值在0~100%之间。电网运行系统运行状态指标是电网运行系统性能参数与安全参数的综合体现,由性能告警统计和安全事件统计加权平均计算,计算公式:运行状态指标=100-[∑(性能异常告警次数×告警级别权重)/∑(性能数据总数)+∑(安全事件次数×安全事件权重)/∑(性能数据总数)]/2×100 系统运行状态指标的取值在0~100 之间。完成可用率指标和运行状态指标聚类计算后,通过合并统计,计算电网运行系统的运行健康度,计算公式:信息健康度指标=可用率指标×运行状态指标电网运行系统的运行健康度的取值在0~100 之间。 3.2聚类分析算法 3.2.1聚类分析的概念聚类分析是数据挖掘中重要的一个分支。聚类分析是根据类内相似性最大化、类间相似性最小化的原则进行聚类,使同一个类的所有对象具有非常高的相似性,而与其他类的对象不相似[11]。聚类后形成的每个类作为一个单独的对象,方便将类似的内容组织在一起进行研究。聚类的严格数学描述为:设所研究的对象集合为E,存在E的一个非空子集C,即 ,且 则聚类为满足以下条件的类C1,C2, ,Ck的集合:(1)C1∪C2∪∪Ck=E (2)Ci∩Cj=(对任意i≠j)由条件(1)可知,研究对象集合E中的每个对象一定属于某一个类。由条件(2)可知,研究对象集合E中的每个对象最多只能属于一个类。 3.2.2聚类分析算法聚类分析的算法有很多,例如划分的聚类算法、层次的聚类算法、基于密度的聚类分析法、基于网格的聚类分析法和具有模型的聚类分析法等[12]。划分的方法是采用目标函数最小化的策略,把数据集分为k个组,每组为一类。该方法需要给定划分的数目k,首先建立一个初始划分,然后在初始划分的基础上,采用迭代的重定位技术,使对象在划分间移动以改进划分,使得最终在同一类中的对象尽可能接近或相关,而在不同类中的对象尽可能远离或不同,即使下列函数最小: (3-1) 其中,为类的均值(或中心点),为数据空间中的空间对象。k-means(k-均值)方法的主要优点是算法简单快速,缺点是不能发现大小差别很大的类或非球状的类,并且对噪点很敏感。k-中心点的方法比k-means均值方法更为稳健,它不容易受极端数据的影响,能有效地处理噪点。层次的算法是对数据对象集进行层次的分解。根据构造层次分解聚类方法的差别,层次聚类算法可分为凝聚的和分裂的两大类。层次聚类算法通常以用户定义的目的类个数或者相邻类之间的距离作为计算停止的标准。单纯的层次聚类算法终止条件模糊且操作不可修正,可能导致聚类结果质量低下且扩展性较差,因此通常把层次的方法与其他方法相结合来提高聚类速度,改善聚类质量。基于密度的聚类算法是用密度来取代相似性,数据空间中的高密度区域作为研究对象被低密度区域划分开,低密度区域视为噪声。该算法可以发现任意形状的类,并且能够有效地去除噪声。基于网格的聚类算法是把对象空间划分为有限数目的单元,从而形成一个网格结构。该算法的主要优点是处理速度快,其处理时间独立于处理对象的总数目,只与单一网格的对象数目有关,但是这种处理方法在提高速度的同时牺牲了聚类结果的精确性。基于模型的聚类算法也称为基于统计学的聚类算法,该算法是假设数据对象的分布服从某种数学分布,通过优化数据对象与数学模型之间的拟合来形成聚类。 3.3基于聚类分析算法的变电站设备辅助决策系统 3.3.1监控信息与设备健康水平的关联规则监控信息与设备健康水平之间的关联规则挖掘工作流程如图3-2所示 图3-2 关联规则挖掘工作流程图关联规则挖掘[13-16]主要研究从大型数据集中发现项目之间的有趣的关联或相互之间的关系。关联规则是目前数据挖掘常用方法之一。关联规则挖掘的思想最早是由Agrawal等人提出的,起源于“购物篮数据”的分析,目的是为了发现交易记录数据库中不同商品之间的联系规则。关联规则挖掘主要用于寻找数据集中不同属性之间的联系,找出可信的、有价值的多个属性域之间的依赖关系,即从数据源中找出事物彼此间的关联规则。本课题基于关联规则挖掘技术,研究变电站设备告警信息与设备健康水平的关联规则,通过反复验证,构建变电站设备辅助决策专家库。本课题使用两个参数来描述监控告警信息与设备健康水平的关联规则:置信度、支持度。以变电站设备缺陷为例,置信度是指监控告警信息集A发生后,设备缺陷B也同时发生的概率。支持度是指在全部数据集C中,监控告警信息集A和设备缺陷B同时发生的概率。通过调整最小支持度来寻找频繁项目集,通过设置最小置信度在各个频繁项目集中寻找数据间的强管理规则。 3.3.2辅助决策系统利用关联规则挖掘工作得到的监控信息规律,本课题结合Hadoop中的Map-Reduce[17]机制,采用基于状态噪点移除聚类的分析算法监视设备缺陷信息。对于区域内变电站设备的重点告警信息或频发缺陷基于变电站设备专家库切割技术[18]研究缺陷处理的同步感知,构建设备缺陷处置与调度管理变电站设备缺陷处置流程服务接口,自动触发方式发起变电站设备缺陷处置流程,并根据设备自动推送设备缺陷及告警等监控信息,并支持在流程中查询该设备缺陷信息及缺陷处置建议,对调度管理流程提供设备类数据及缺陷处置类知识支持。 4研究方案及进度安排,预期达到目标 4.1研究方案搭建设备监控管理统一测试平台,如图4-1所示。 图4-1 设备监控管理统一平台测试环境本文主要实体研究可分为三部分:第一部分为依托分布式文件系统,对电力设备复杂繁多的监控信号进行可靠存储并合理建模;第二部分为对监控信息进行统计分析,结合实时监控告警计算设备健康度;第三部分为对历史库进行数据挖掘,建立辅助决策专家库。具体过程如图4-2所示。 图4-2 课题研究过程图 4.1.1电网监控信号的存储及建模针对复杂结构化数据管理与处理,以及需要解决大数据的可存储、可表示、可处理、可靠性及有效传输等几个关键问题,着重研究在HDFS分布式文件系统上实现合理的存储及数据建模。 4.1.2构建变电站设备运行健康状况评价体系基于各类信号的历史数据,从监控分析和监控统计两方面实现对事故、异常、越限、变位、告知五类信号进行统计分析,并对造成的设备故障、缺陷的原因分析,力求多维度的对监控信号进行统计及数据展示。在图形化展示五类信号数量统计情况的同时,以表格的形式直观展示数据比例,并辅以曲线图、柱状图等图形帮助分析数据。根据大量历史数据及处置经验,构建设备运行健康状况综合评价标准,对设备故障、缺陷原因作出分析评价。 4.1.3变电站设备辅助决策专家系统研究利用关联映射技术,根据各类事故信号发生时间、类型和系统运行状态的信息组合,确定相应的处置方法。系统收集每一时刻的事故信号和系统运行状态,结合以往正确的处置方法,建立映射关系表。再根据长期的历史经验,建立起一套决策专家库,能够为用户提供辅助决策指导。系统可将当前用户的操作行为与决策专家库中的标准行为进行比较,实现操作行为的对比分析,从而有效的判断异常情况,不仅为用户行为操作提供了便利,而且提高了故障信号的操作处置效率,使用户更快速更准确的完成对信号故障的处理。 4.2进度安排 (1) 2017.08-2017.12:搜集、整理和分析相关资料,了解该领域国内外的最新研究进展,明确课题的需求;对毕业设计进行总体规划,制定研究方案。 (2) 2017.12-2018.05:研究关联规则挖掘技术及聚类分析算法,构建设备运行健康状况综合评价标准,研究关联事故信号与处置办法。 (3) 2018.05-2018.10:搭建实验平台及测试环境,完成设备的安装部署和调试,实现设备监控信号统计分析模块,建立设备监控辅助决策专家库。 (4) 2018.10-2018.12:论文撰写,参与答辩。 4.3预期达到的目标 1) 研制和开发设备监控信息管理平台,分析监控五类信号的历史变化趋势,实现对变电站设备健康水平的分析,找到设备运行的风险点,实现对设备故障、缺陷原因的统计分析。 2) 建立和开发设备监控辅助决策专家库,基于告警信号与处置办法的关联映射技术,实现人工决策的辅助指导。 5为完成本课题已具备和所需的条件和经费 1) 应用服务器 1台; 2) 达梦数据库服务器1台; 3) 工作站1台; 4) 相关软件系统,包括:OMS支撑平台、达梦数据库管理系统、Tomcat。经费充足。 6预计研究过程中可能遇到的困难和问题,以及解决的措施 (1) 大量监控信号的存储和建模问题。监控信号数据存储的难点在于如何实现数据建模,将信号数据序列化,合理分配在文件系统中。解决方案:依托HDFS分布式文件系统,将设备监控信号数据进行四个维度的建模,包括时间、空间、电网特性和统计口径四个维度。HDFS是适合运行在通用硬件上的分布式文件系统,它能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 (2) 事故信号与处置办法关联复杂解决方案:认真学习关联映射规则,统计出合适的支持度与置信度。 7主要参考文献 [1]王峰,雷葆华.Hadoop分布式文件系统的模型分析[J].电信科学,2010,26(12):95-99. [2]赵铁柱.分布式文件系统性能建模及应用研究[D].华南理工大学,2011:14-18. [3]万洪梅. 基于电网监控信号智能处理系统的分析[J].电力设备,2016,(19). [4]EPRI. Advanced CRT Concepts for Power System Dispatch Centers[R]. Electric Power Research Institute, 1981. [5]WOLLENBERG B F. Feasibility study for an energy management system intelligent alarm processor [J]. IEEE Transactions on Power Systems, 1986, 1(2):241-246. [6]Zita A, Vale A, Maehado e Moura. An Expert System with Temporal Reasoning for Alarm Processing in Power System Control Centers[J]. IEEE Transactions on Power Systems, 1993,8(3):1307-1314. [7]张兴.地区电网二次报警信息智能处理系统的研究与开发[D].华北电力大学,2011. [8]王晨.基于状态监测的输变电设备状态评估及故障预警[D].华北电力大学,2015. [9]刘勤明.基于状态监测信息的设备在线健康预测及维护优化研究[D].上海交通大学,2014. [10]潘孟春,魏全禄.PSP ICE中模拟行为建模及其在电力电子教学中的应用[J].电气电子教学学报,2005(5):61-64. [11]陈黎飞.高维数据的聚类方法研究与应用[D].厦门大学,2008. [12]段瑞飞.数据挖掘中的聚类方法及其应用[D].厦门大学,2008. [13]楼巍.面向大数据的高维数据挖掘技术研究[D].上海大学,2013. [14]刘亚波.关联规则挖掘方法的研究及应用[D].吉林大学,2005. [15]陈碧云,丁晋,陈绍南.基于关联规则挖掘的电力生产安全事故事件关键诱因筛选[J/OL].电力自动化设备,2018(04):1-6. [16]Cheng-Hsiung Weng, Yen-Liang Chen. Mining fuzzy association rules from uncertain data[J]. Knowledge and Information Systems, 2010(2). [17]徐晓龙,郑永永.MapReduce和HDFS优化现状分析[J].吉林化工学院学报,2016,33(01):23-27. [18]周毓明,徐宝文.切片作用域对基于数据切片类内聚性度量的影响(英文)[J]. Journal of Southeast University (English Edition),2008(02):174-177.