公务员期刊网 论文中心 正文

大数据挖掘理论下的电气工程应用

大数据挖掘理论下的电气工程应用

摘要:论文提出了一种基于大数据挖掘理论的电气工程故障分析方法。在该研究中,将全局信息引入电力系统中,主要采用大数据挖掘理论中的聚类分析技术,快速准确地检测出故障分量和故障区段,最终完成故障分析。将全局信息引入电气工程中,为电气工程故障分析开辟了新的应用领域。运用大数据挖掘从大型数据库信息中自动提取有效的、新颖的、潜在有用的信息,且大数据挖掘理论可为电机工程的研究做出重要贡献。

关键词:故障分析;大数据挖掘;数据分类;电气工程;聚类分析

1引言

大数据挖掘是从大量数据中有效地发现有价值的、不明显的信息,这种涉及从数据中提取信息的过程也是一种探索性数据分析[1]。大数据挖掘是从存储在数据库、数据仓库或其他信息库中的大量数据中发现有趣的信息,如模式、关联、变化、异常和重要结构的过程[2]。大数据挖掘通常用于非常大的数据库,由于数据库的复杂性和容量庞大,使得它通常是不能被解读或分析。大数据挖掘的目的是从这些大型数据库中发现有用的信息,这种过程被称为数据库知识发现(KnowledgeDiscoveryinDatabases,KDD)[3]。大数据挖掘涉及数据库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索等多学科的技术集成[4~5]。大数据挖掘中的一个常见问题是查找数据属性之间的关联。大数据挖掘任务有以下类别[6~8]:分类描述;关联分析;聚类分析;孤立点分析;进化分析。故障是指与观察到的变量或与设备相关联的计算参数在可接受范围内发生了偏离,即故障是一个过程异常或症状。总的来说,故障与设备或仪表的正常行为相背离。它们可能出现在基本设备或其控制仪器中,并代表着性能恶化、部分故障或全部故障。故障分析的目的是通过行为异常识别系统来保证操作成功。由于适当的过程监控,使停机时间最小化,改善了操作的安全性,降低了制造成本。一般来说,故障分析的过程可分为三个主要步骤[9]:报警、识别、评估。电力系统是一个最复杂的人工系统,其安全、稳定、经济可靠运行,在社会经济的发展中起着非常重要的作用。为了解决电力系统故障分析这一难题,必须对电力系统本身及其复杂性不断提高分析、运行和控制水平。当电力系统从正常运行状态到异常运行故障时,其电量可能发生显著变化。继电保护器就是利用电力的突然变化来判别电力系统是否发生故障或运行异常。通过对电力测量与正常系统参数的对比,可以检测出故障类型和故障位置。此外,还可以实现选择性故障排除。在本研究中,全局信息将被引入后备保护系统中。在某些故障后,利用电源管理单元(PhasorMeasurementUnit,PMU)进行实时测量,并对电量变化的特征进行查找。然后对故障分量和故障区段进行快速准确的分析,最终完成故障隔离。基于统计理论,还将对非线性复杂系统进行大量的基础研究,采用大数据挖掘中的聚类分析技术解决电气工程中的故障检测问题。

2电路原理

考虑一个带有电阻器(R)、电感器(L)和电容器(C)的电路。每一个元件在回路中连接电路,包含一个元件的电路部分称为支路。支路连接的点称为节点。在这个最简单的测试中,有三个分支和节点.令iR,iL和iC分别代表经过对应电阻R,电感器L和电容器C的电流,同样地,vR,vL和vC分别代表电路的三个支路上的电压。如果认为水是通过管道流动的,那么电流就像水的流量一样,电压就像水的压力一样。基尔霍夫电流定律指出,流入一个节点的总电流必须等于从该节点流出的电流。这意味着在讨论的电路中电流关系为|iR|=|iL|=|iC|。按图1所示的方向定位分支,则i=iR=iL=iC(1)基尔霍夫电压定律指出,所有回路电压降之和为零。则vR+vL+vC=0(2)对于电路元件的性质和决定变量的规律研究中,电阻器是由电流iR和电压vR之间的关系确定。因此只考虑一个线性电阻,根据欧姆定律,可得vR=R×iR(3)其中,R>0为常数,vR和iR互为非线性函数关系。电感器的特点是电流对时间的导数diL/dt,对于电感器的电压vL,根据法拉第定律,可得LdiRdt=vL(4)其中,常数L>0被称为电感。电感器是通过一个线圈制作构成,线圈中电流变化引起的磁场在线圈上产生电压降。电容器的特点是电压对时间的导数dvC/dt,对于电容器的电流iC为CdvCdt=iC(5)其中,常数C>0被称为电容。

3数据挖掘中的分类

分类是大数据挖掘领域的经典课题之一[10]。聚类是将数据对象分类成一组不相交类的过程,称为簇,因此类中的对象之间具有高度的相似性[11]。聚类是无监督分类的一个分支。“分类”是指将数据对象分配给一组类的过程。“无监督”意味着集群不依赖于预定义的类,而对数据对象进行分类[12]。聚类分析的应用包括以下三个方面[13]:1)识别原始数据中的簇;2)确定原始数据中簇的个数;3)验证原始数据中发现的簇。聚类分析具有很强的数据分析能力,已成功应用于各个领域的研究。假设有n个样本,每个样本有m个指标,观测数据可以表示为αij(i=1nj=1m)。最常用的描述关系程度的测量是距离dij通常表示样本ξ(i)和η(j)之间的距离。常用的距离定义包括:1)Minkovski距离:dij(q)=éëêùûåút=1mα||it-αjtq1q(6)2)Lance距离[14]:dij(L)=1måt=1mα||it-αjt(αit+αjt)(7)3)马氏距离:dij(M)=(ξ(i)-η(j))'S-1(ξ(i)-η(j))(8)其中,S-1是样本协方差矩阵的逆矩阵。4)斜空间距离[15]:为了克服相对论的影响,我们可以定义斜空间的距离:dij=éëêùûú1måk=1mål=1m(αik-αjk)(αil-αjl)ρkl12(9)其中,ρkl是ξ(k)与η(l)的相关系数。

4基于数据挖掘的故障分析

考虑IEEE-9总线系统,在电力网的结构中,总线1出现单相接地故障。通过BPA程序,相应变量的向量值只在每个周期中输出一次。相应变量使用实际测量的数据,可以进行故障和非故障的元件分析(故障和非故障段)。4.1基于节点相电压的故障诊断在计算IEEE-9总线系统后,可以得到五个时刻T-1、T0(故障)、T1、T2和T3的节点相电压.整个聚类分析过程遵循从高到低(从近到远)的相似性原则,顺序是:步骤1:总线C与总线B结合并形成新的总线B;步骤2:总线3与总线2结合并形成新的总线2;步骤3:总线A与总线2结合并形成新的总线2;步骤4:总线2与支路1结合并形成新的支路1;步骤5:支路3与支路2结合并形成新的支路2;步骤6:支路2与支路1结合并形成新的支路1;步骤7:总线B与总线1结合并形成新的总线1;步骤8:总线1与支路1结合并形成新的支路1。总线1与其他总线有着显著的不同,其故障特征是明显的。这些结果与预先设定的故障位置完全相同,因此我们可以通过基于节点相电压的聚类分析来确定故障位置。4.2基于节点负序电压的故障诊断通过BPA程序,可以得到五个时刻T-1、T0(故障)、T1、T2和T3的节点负序电压.整个聚类分析过程仍然按照相似性原则进行,从高到低(从近到远)的相似原则,顺序是:步骤1:总线A与总线2结合并形成新的总线2;步骤2:总线3与总线2结合并形成新的总线2;步骤3:总线C与总线B结合并形成新的总线B;步骤4:总线2与支路1结合并形成新的支路1;步骤5:支路3与支路2结合并形成新的支路2;步骤6:支路2与支路1结合并形成新的支路1;步骤7:总线B与总线1结合并形成新的总线1;步骤8:总线1与支路1结合并形成新的支路1。从整个聚类过程分析中,总线1与其他节点的相似性最低(与其他节点的距离最远)。总线1和其他总线的差异更明显。因此,利用基于节点负序电压的聚类分析也能有效地识别出故障点。这些实例充分证明了大数据挖掘理论可以对故障部分进行分析。

5结语

在电力系统的控制中,特别是在电力系统的广域后备保护中,保护装置的准确、快速、可靠性能的前提是相应的故障类型和故障位置可以快速识别并准确定义。在本研究中,全局信息已经被引入到后备保护系统中。基于大数据挖掘理论,主要利用聚类分析技术来寻找电量的显著变化特征。然后,对故障部件和故障部分进行快速准确的识别,最后完成故障分析。本文的主要技术贡献和创新在于将全局信息引入到电气工程中,为电气工程的故障分析开发新的应用。大数据挖掘被定义为从大型数据库中自动提取有效、新颖、潜在有用且全面的信息挖掘过程。它在学术和应用科学研究中得到了广泛的应用,在这些研究中,数据集是通过实验产生的。大数据挖掘理论的最重要特征是其跨学科性和普遍性。大数据挖掘在很大程度上与机器学习有关,在机器学习中,科学家开发算法和技术来发现和描述数据中的潜在规律。因此,大数据挖掘为信息处理、模式识别和人工智能等许多领域提供了有用的技术。

参考文献

[1]王元卓,贾岩涛,刘大伟,等.基于开放网络知识的信息检索与数据挖掘[J].计算机研究与发展,2015,52(02):456-474.

[2]李涛,曾春秋,周武柏,等.大数据时代的数据挖掘——从应用的角度看大数据挖掘[J].大数据,2015,1(04):57-80.

[3]赵建华.半监督学习在网络入侵分类中的应用研究[J].计算机应用研究,2014,31(06):1874-1876.

[4]马昱欣,曹震东,陈为.可视化驱动的交互式数据挖掘方法综述[J].计算机辅助设计与图形学学报,2016,28(01):1-8.

[5]梁吉业,钱宇华,李德玉,等.大数据挖掘的粒计算理论与方法[J].中国科学:信息科学,2015,45(11):1355-1369.

[6]吉根林,赵斌.面向大数据的时空数据挖掘综述[J].南京师大学报(自然科学版),2014,37(01):1-7.

[7]何清,庄福振,曾立,等,谭庆.PDMiner:基于云计算的并行分布式数据挖掘工具平台[J].中国科学:信息科学,2014,44(07):871-885.

[8]贺瑶,王文庆,薛飞.基于云计算的海量数据挖掘研究[J].计算机技术与发展,2013,23(02):69-72.

[9]许侃,范春菊.不同电压等级部分耦合线路的单回线故障分析[J].电力系统自动化,2015,39(12):81-87.

[10]陈新.数据挖掘分类方法中的决策树算法探究[J].电脑知识与技术,2013,9(35):7904-7905,7910.

[11]邓曦辉.软件工程领域中的异常数据挖掘算法[J].电子技术与软件工程,2016(24):188.

[12]王竞哲.基于聚类分析的数据挖掘算法研究[J].信息化建设,2016(06):36.

[13]李昀昊,王建学,王秀丽.基于混合聚类分析的电力系统网损评估方法[J].电力系统自动化,2016,40(01):60-65.

[14]LiJunguo,ZengYanan,Wang,Jianqiang.SimulationofFlowFieldofOxygenLanceGasJetUtilizedfor50tCon⁃verter[J].JournalofIronandSteelResearch(Interna⁃tional),2011,18(04):11-18.

[15]GenChao,LiuJie,XiKai,etal.MonteCarloevaluationofspatialmultiple-bitupsetsensitivitytoobliqueinci⁃dence[J].ChinesePhysicsB,2013,22(05):661-668.

作者:吴嵘 单位:南京理工大学

相关热门标签