前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的神经网络的实现主题范文,仅供参考,欢迎阅读并收藏。

关键词:Web;神经网络;主成分分析;雅克比;BP
中图分类号:TP311.52 文献标识码:A文章编号:1007-9599 (2011) 17-0000-02
Web-based Indicators of Neural Network Forecasting System Implementation
Tan Weijuan
(Beiqu Informatization Service Center,Shanghai200072,China)
Abstract:In this paper,the status indicators and predict trends in software development,describes the use of neural networks and principal component analysis of indicators forecasting system,based on network technology development and focuses on Web-based indicators of neural network prediction system solutions.Construction of indicators to forecast the establishment of the basic model.System uses the actual project as a learning content information,the results show that this method of construction projects to establish indicators of prediction model is correct and feasible.
Keywords:Web;Neural network;Main component analysis;
Jacobi;BP
一、引言
指标预测系统是一类在实际工作中有非常重要的应用价值的软件,它可以应用在社会生产的各个领域,例如工程造价预测,国民经济发展方向评估和预测等。目前预测软件常用的方法主要是统计方法,采用这种方法进行指标预测所需的周期比较长,而且由于不具有智能性,因此可靠性较低。另外传统的统计预测软件一般都是单机版,不能适应信息系统网络化发展的实际需要,应用范围比较狭窄。笔者结合建筑管理软件的现状在预测方法方面做了一些研究,采用基于web的神经网络指标预测方法,这种方法也传承了传统统计预测方法的基本思想。预测结果表明,采用这种方法进行指标预测,和传统的预测方法相比不但缩短了预测周期,而且扩大了应用范围。
二、神经网络指标预测系统基本原理
BP(Back Propagation反向传播)网络是人工神经网络的一个经典模型[4],它的拓扑结构如上页图所示:
BP网络分为三层,输入层对应于预测系统的各输入指标,输出层对应于各输出指标,另外为了避免网络节点值为零可能引起的振荡,在输入层设置了Threshold节点,对应输入值为1。
BP网络对一些非线性模式有很好的识别能力,适合于解决一些计算方法异常复杂的非线性问题,指标预测就是这类问题。
在进行指标预测时,首先要确定BP网络的输入输出指标体系。输入指标即已知条件,输出指标即要预测的内容。
三、指标预测系统在互联网环境中的实现-基于Web的指标预测系统
随着Internet的不断发展,软件系统的网络化称为一个必然的趋势,预测软件当然也不例外。预测系统的网络化有两种方式。一种是基于客户/服务器模型的实现;另一种是基于B/S模型的网络预测软件。
基于客户/服务器模型的预测软件由客户端和服务器组成。服务器程序具有主成分分析、训练神经网络、处理客户端请求等功能,运行在服务器端。客户端是客户使用指标预测服务的终端,主要具有接受用户的输入指令,将输入指令转换成指标预测请求,然后通过网络发送给服务器,服务器端的服务程序响应这个请求,将预测的结果返回给客户端,再由客户端将结果提供给用户。服务器和客户端的通信可以由多种方式完成,例如使用TCP或者UDP协议,这样基于客户/服务器的预测模型可以扩展到Internet环境下,而不仅仅局限于局域网的环境。这种方式的优点在于支持图形化的输出结果,并且可以集成大量的应用逻辑,可以满足复杂的应用需求。但是,由于应用程序集成了大量应用逻辑,当服务器端数据的逻辑视图改变之后,应用程序的应用逻辑也要有相应的改变,带来了程序维护和更新的不便。
基于B/S模型的预测软件,客户端将基于Microsoft Internet Explorer通用浏览器。服务器则由指标服务程序和Web服务程序组成。指标服务程序完成主成分分析、神经网络训练等功能,它作为标准的应用程序运行在服务器的后台。Web服务程序则完成接受客户的指标预测请求,并且调用指标服务程序训练结果,并把预测结果返回给用户的功能。
服务器端所有的业务应用采用常用的三层架构:表现层、业务逻辑层、数据层。
系统总体应用结构设计图
Web服务程序可以由多种手段来实现,不同的实现手段要求的系统平台也不同。主要有以下三种方法:
(一)基于ASP或JSP的指标服务程序。ASP和JSP都是目前较为成熟的技术,它们可以实现动态的、交互式的网页,执行效率比较高。但是它们只能满足一般的应用,而不能满足需要大量图形输出的要求。因此在指标预测的实现方面有一定的局限性。
(二)基于ActiveX技术的指标服务程序。这种方式主要应用在有大量图形类输出结果的情况,例如预测软件要向用户提供图形化的报表和对比图等,而这样的功能要求对于基于ASP,JSP的方案来说,实现起来有很大的难度。而ActiveX技术在实现基于Web的图形化输出结果方面,就有很大的优势。用户在使用服务器的预测服务时,可以先下载一个ActiveX的插件,然后直接通过浏览器调用ActiveX程序,使用预测服务。
(三)基于技术的指标服务程序。是把基于通用语言的程序在服务器IIS上运行。这种方式主要应用在有大量图形类输出结果的情况,ASP即时解释程序,是是将程序在服务器端首次运行时进行编译,这样的执行效果,比一条一条的解释强很多。
四、Web神经网络指标预测主成分分析方法
在实际工作中,人们经常需要对客观事物从不同的侧面进行客观评价,例如对一个国家和地区的社会经济发展水平做出评价,经济效益状况的综合考核,建设工程各指标综合对整体影响度的评测等等,解决这类问题的方法就是统计学当中的多指标综合评价方法。
在多指标综合评价中,人们往往会遇到这样的问题:选取的评价指标越多,则对事物的描述越准确,但是也带来了数据量异常大、处理异常复杂的问题。而且评价信息可能相互重叠和干扰,从而难以正确的反映出被评价对象的相对地位。实际上,并不是所选取的每个指标都是人们所关心的,人们可能只关心指标体系中的部分指标。因此人们希望使用少数几个没有线性关系的新指标来代替原来的为数较多并且彼此有相互联系的指标,同时这些新的指标又能够尽可能的反映原来被评价对象的相对地位。解决这个问题的一种有力工具就是主成分分析方法[1]。建设工程指标预测的方法和步骤:
(一)确定输入和输出指标体系。根据实际需要确定系统的输入和输出指标。例如在本系统中,要求根据已知建设项目的建筑面积、层高、檐高、层数、建筑结构等信息,来确定工程的总造价、单方造价、土建造价、卫生造价等。在系统中,已知的建筑面积、层高、檐高、层数、建筑结构等即为系统的输入指标,而未知的工程的总造价、单方造价、土建造价、卫生造价即为系统的输出。
(二)主成分分析。根据用户所确定的基本输入输出指标,由系统自动完成主成分分析工作。主成分分析是统计科学中的一种重要方法,目的是分析出给定指标体系中各指标对总体的影响程度,主要通过一些矩阵的运算来实现。在实际应用中,我们为了提高系统的工作效率、通用性、可扩展性,可以分析出用户所给定的指标体系中那些比较重要的指标,即“主成分”。主成分分析大体包括下列步骤:(1)对原始资料进行标准化处理,这样可以提高训练结果的收敛性。(2)计算标准化后各指标的协方差矩阵,即为相关系数矩阵。假设有p个指标(输入指标与输出指标的个数和),则得到的相关系数矩阵是p×p的方阵。(3)计算相关矩阵的特征根。通过雅克比方法(Jacobi)[3]可以计算出协方差矩阵的p个特征根λ1Rλ2R•••RλpR0。此处λi即为第I个主成分的方差,它反映了第I个主成分在描述被评价对象上所起的作用的大小。(4)计算各主成分的方差贡献率及累积方差贡献率。(5)选择主成分的个数。根据实际需要,使前k个主成分的累积方差贡献率达到一定的要求,通常取85%即可。
(三)根据所确定的主成分指标和系统的输入输出要求确定网络的拓扑结构。输入、输出值的个数决定了网络拓扑结构的选择。在本系统的模型中,系统根据用户主成分分析完毕后的指标体系确定网络的输入、输出和隐藏节点数,并且在训练的过程中根据实际需要动态进行调整,这些工作都由系统自动完成,不需要用户的介入。
(四)确定网络的传递规则、输出规则和学习规则。即确定如何将各层的输入输出值与权值矩阵结合起来,根据系统的输入得到系统输出。并且如何在系统训练过程中根据训练数据对权值矩阵进行修改,使系统拥有对确定性输入有正确的输出的能力。
(五)网络训练及指标预测。根据上述各步骤的结果以及所确定的训练算法,结合大量的具体工程实例,对神经网络进行训练,并且将误差控制在用户限定的范围之内。训练结束后,用户就可以使用训练的结果结合工程项目已知数据对未知数据指标进行预测。
五、实例
本例中选取了7条训练资料,用其中6条进行训练,另外一条资料进行自测试。选取的指标分别是:
输入指标:建筑面积、层高、檐高、外墙面积、内墙面积、门窗面积、楼板面积、底层面积。
输出指标:工程总造价、土建造价、采暖造价、照明造价、卫生造价和单方造价。
原始资料矩阵为:
3313.45 2750.00 11.55 3539.00 4776.02 855.720 641.88 3152.88 397.77 342.93 15.78 39.05 15.78 1200.4
2926.00 2700.00 16.20 1458.00 2901.00 3023.00 498.00 2882.00 263.53 222.62 11.52 14.57 10.87 900.67
6218.00 2700.00 16.95 3544.55 6386.43 7364.52 1055.6 6399.82 596.36 483.81 25.10 45.66 29.87 959.10
3680.00 2700.00 10.80 1900.59 3731.31 4097.55 560.71 3749.23 379.38 311.59 15.23 27.03 18.66 1030.9
7205.00 2700.00 16.20 3717.00 7286.00 7516.00 1175.0 7113.00 618.94 498.49 28.20 49.94 31.31 859.05
4485.00 2700.00 11.55 2469.00 5496.00 4687.00 772.00 4157.00 492.77 407.14 21.93 37.70 18.50 1098.7
(其中矩阵的前8列为输入指标,后6列为输出指标,每行为一条工程资料)
在阈值为0.001的条件下训练完毕后,使用最后一条资料进行自测试,最后一条资料为:
输入:5684.00 2700.00 11.55 2847.00 6056.00 5872.00 953.00 5665.00
输出(实际值):547.34 445.66 24.94 40.99 25.87 962.96
得到的测试结果为(系统预测输出值):
541.55 441.77 23.23 43.39 24.29 959.66
比较工程实际值和系统预测输出值,可以发现两者是非常接近的。如果要求误差控制在5%之内的话,则上述模型已经满足了要求。
六、结论
基于人工神经网络的指标预测系统有较强的通用性,并且能够适合多种指标预测的需求。从上述训练的过程和测试结果的正确性可以看出,采用基于人工神经网络和主成分分析方法进行建设工程指标预测是可行的。上述过程使用了7条工程数据,要进一步确定此方法的正确性,还要在大量工程数据的环境下进行进一步的训练以及算法的调整。这也是笔者下一步的工作内容Web新技术的应用,将指标预测服务扩展到了Internet环境下,进一步提高了其应用范围。
参考文献:
[1]张崇甫,陈述云,胡希铃.统计分析方法及其应用[M].重庆大学出版社,1995
[2]吴国富,安万福,刘景海.实用数据分析方法[M].中国统计出版社,1992
关键词: 离散; Hopfield神经网络; 联想记忆; 数字识别
中图法分类号:TP301.6 文献标识码:A 文章编号:1006-8228(2012)03-01-03
On numerical recognition using discrete Hopfield neural network
Jin Can1,2
(1. School of Information Science and Engineering, Central South University, Changsha, Hunan 410083, China
2. Modern Education Technology Center, Hunan University of Arts and Science)
Abstract: The author introduces in this paper the basic concept of discrete Hopfield neural network (DHNN), and then designs a discrete Hopfield neural network model with associative memory function using MATLAB according to the related knowledge of DHNN. Specifically, the author presents the idea of designing, designing procedure and the testing results. The simulation shows that DHNN can correctly recognize the numerical dot matrices with noises. When noise intensity is less than 0.1, the recognition ability is satisfactory.
Key words: Discrete; Hopfield neural network; Associative memory; Numeral recognition
1 离散Hopfield神经网络概述
Hopfield网络作为一种全连接型的神经网络,曾经为人工神经网络的发展开辟了新的研究途径。它利用与阶层性神经网络不同的结构特征和学习方法,模拟生物神经网络的记忆机理,获得了令人满意的结果。这一网络及学习算法最初是由美国物理学家J.J Hopfield于1982年首先提出的,故称为Hopfield神经网络[1]。
Hopfield最早提出的网络是二值神经网络,神经元的输出值只取1或-1,所以,也称离散Hopfield神经网络(DHNN, Discrete Hopfield Neural Network)。在离散Hopfield网络中,所采用的神经元是二值神经元,因此,所输出的离散值1和-1分别表示神经元处于激活和抑制状态[2]。
DHNN是一种单层、输出为二值的反馈网络。假设有一个由三个神经元组成的离散Hopfield神经网络[3],其结构如图1所示[4]。
在图1中,第0层仅仅作为网络的输入,它不是实际神经元,所以无计算功能;第1层是神经元,执行对输入信息与权系数的乘积求累加和,并经非线性函数f 处理后产生输出信息。f是一个简单的阈值函数,如果神经元的输出信息大于阈值θ,那么,神经元的输出取值为1;小于阈值θ,则神经元的输出取值为-1。
图1 离散Hopfield神经网络结构
对于二值神经元,它的计算公式如下:
⑴
式中,xj为外部输入,并且有
⑵
一个DHNN的网络状态是输出神经元信息的集合。对于一个输出层是n个神经元的网络,其t时刻的状态为一个n维变量:
⑶
因为yi(t)(i=1,2,…,n)可以取值为1或-1,故n维向量Y(t)有2n种状态,即网络有2n种状态。
我们考虑DHNN的一般节点状态。用yj(t)表示第j个神经元,即节点j在时刻t的状态,则节点的下一个时刻(t+1)的状态可以求得:
⑷
⑸
如果wij在i-j时等于0,说明一个神经元的输出并不会反馈到其输入,这时,DHNN称为无自反馈的网络。如果wij在i=j时不等于0,说明一个神经元的输出会反馈到其输入端,这时,DHNN称为有自反馈的网络[4]。
2 联想记忆网络
联想记忆是神经网络理论的一个重要组成部分,也是神经网络用于模式识别与人工智能等领域的一个重要功能。Hopfield网络模拟了生物神经网络的记忆功能,也常常被称为联想记忆网络。所谓的联想记忆也成为了一种基于内容的存取方法,信息被分布于生物记忆的内容之中,而不是某个确定的地址。联想记忆可分为自联想与异联想两种。Hopfield网络属于自联想网络。自联想能将网络中输入模式映射到存贮在网络中一种模式。联想记忆网络不仅能将输入模式映射为自己所存贮的模式,而且还能对具有缺省噪音的输入模式有一定的容错能力。
设在学习过程中给联想记忆网络存入M个样本:{Xi}i=1,2,……M。若给联想记忆网络加以输入X'=Xm+V,其中Xm是M个学习样本之一,V是偏差项,则通过自联想联想记忆网络的输出为Xm,即使之复原。
Hopfield联想记忆网络运行步骤为:
第一步:设定记忆模式。将欲存储的模式进行编码,得到取值为1和-1的记忆模式(m
。
第二步:设计网络的权值。
,
其中wij一旦计算完毕,将保持不变。
第三步:初始化网络状态。将欲识别模式设为网络状态的初始状态,为网络中任意神经元i在t=0时刻的状态。
第四步:迭代收敛。随机地更新某一神经元的状态,反复迭代直至网络中所有神经元的状态不变为止。
第五步:网络输出。这时的网络状态(稳定状态)即为网络的输出y=vi(T)。
3 基于Hopfield神经网络的数字识别
根据Hopfield神经网络相关知识,下面设计一个具有联想记忆功能的离散型Hopfield神经网络,要求该网络可以正确识别0~9这10个数字,并且当数字被一定的噪声干扰后,仍具有较好的识别效果。
3.1 设计思路
假设网络由0~9共10个稳态构成,每个稳态用10*10的矩阵表示。该矩阵可直观地描述阿拉伯数字,即把矩阵规分成10*10个单元,有数字轨迹的单元用1表示,空白部分用-1表示,如图2所示。网络对这10个稳态即10个数字(点阵)具有联想记忆的功能,当有带噪声的数字点阵输入到该网络时,网络的输出便可以得到最接近的目标向量(即10个稳态),从而达到正确识别的效果。
图2 数字1和2的点阵图
3.2 设计步骤
按照上述思路,设计Hopfield网络需要经过以下几个步骤,如图3所示。
[设计数字点阵
(0-9)][创建Hopfield
网络][产生带
噪声的
数字点阵] [数字识
别测试][结果
分析]
图3 Hopfield网络设计流程图
3.3 MATLAB实现
利用MATLAB神经网络工具箱提供的函数,可以按照Hopfield网络设计流程图将设计步骤一一在MATLAB环境下实现。
3.3.1 输入输出设计
如图2所示,有数字的部分用1表示,空白部分用-1表示,即可得到0~9的点阵。将数字点阵以图形的形式呈现出来,如图4所示。
图4 数字点阵0~9的实现结果
以数字1、2、3、4为例,利用这四个数字点阵构成训练样本T:
T=[array_one; array_two; array_three; array_four]’
3.3.2 网络建立
利用newhop( )函数可以方便地创建一个离散型Hopfield神经网络。
3.3.3 产生带噪声的数字点阵
常见的模拟产生带噪声数字的方法有两种:固定噪声法和随机噪声法。
固定噪声法指的是人工修改的方法改变数字点阵某些位置的值,从而模拟产生带噪声的数字点阵。如果希望产生不同的带噪声的数字矩阵,需要人工做多次的修改,这无疑是比较麻烦的。
相比较而言,随机噪声产生法可以方便地产生各种类型的带噪声的数字矩阵。
随机噪声产生法是利用产生随机数的方法来确定需要修改的点阵位置,进而对数字点阵进行修改。由于数字点阵中的值只有1和-1两种,所以这里的修改就是将1换成-1,-1换成1。
3.3.4 网络仿真
利用sim()函数可对神经网络进行仿真,其调用格式为:
4 实验结果与分析
将带噪声的数字点阵输入已创建好的Hopfield网络,便可对带噪声的数字点阵进行识别,识别结果仍为数字点阵形式。考虑到仿真结果的直观性和可读性,程序中的数字点阵将以图形的形式呈现,如图5所示。
图5 噪声强度为0.1时数字识别结果
图5所示的是噪声强度为0.1(即10%的数字点阵位置值发生变化)时的识别效果。从图中可以看出,识别效果较好。进一步的研究发现,随着噪声强度的增加识别效果逐渐下降。噪声强度为0.2和0.3时的识别结果分别如图6和图7所示。从图中不难看出,当噪声强度为0.3时,Hopfield已经很难对数字进行识别了。
图6 噪声强度为0.2时的识别结果
图7 噪声强度为0.3时的识别结果
5 结束语
通过对实验结果的分析,可以得出结论:对于带一定噪声的数字点阵,Hopfield网络可以正确地进行数字识别。下一步的工作可以将一些优化算法与离散Hopfield神经网络相结合,使神经网络的联想记忆能力更强,应用效果更为突出。
例如,由于一般离散Hopfield神经网络存在很多伪稳定点[1],网络很难得到真正的稳态,为此可以将遗传算法应用到离散Hopfield神经网络中,利用遗传算法的全局搜索能力,对Hopfield联想记忆稳态进行优化,使待联想的模式跳出伪稳定点,从而使Hopfield网络在较高信噪比的情况下保持较高的联想成功率。
参考文献:
[1] 飞思科产品研发中心.神经网络与MATLAB 7实现[M] .电子工业出版社,2005.
[2] MATLAB神经网络与应用(2版)[M].国防工业出版社,2007.
[3] 张良均,曹晶,蒋世忠.神经网络适用教程[M].机械工业出版社,2008.
[4] 史峰,王小川等.MATLAB神经网络30个案例分析[M].北京航空航天大学出版社,2010.
[5] 边肇祺,张学工等.模式识别[M].清华大学出版社,1999.
[6] 张宏林.数字图像模式识别技术及工程实践[M].人民邮电出版社,2004.
[7] 邓丽华,崔志强,张静.基于人工神经网络的手写体数字识别[J].三峡大学学报,2005.6:255~256
[8] 孙兆林.MATLAB6.x 图像处理[M].清华大学出版社,2002.
[9] 付德胜,张学勇.基于Hopfield神经网络噪声数字的识别[J].通信技术,Vol.43,No. 01,2010:126~129
[10] 孟祥武,程虎.基于任意给定训练集的离散型Hopfield网学习算法[J].软件学报,1998.9(03):213~216
[11] 陈文宇,吴跃.Hopfield神经网络参数设置[J].计算机工程与应用,
2006.31.
[12] TALAVAN.YANEZ P M.Parameter setting of the Hopfield network applied to TSP[J].2002
关键词:前馈神经网络;材质识别;羊毛;粘胶;MIV;图像处理
中图分类号:TP391;TS137
文献标志码:A
Identifying the Materials of Wool/Viscose Blended Yarns Based on Feed-forward Neural Network
Abstract: In order to identify the materials of blended yarns, the article first selected the indicators that can reflect the morphological characteristics of wool and viscose fibers in the cross-section images of blended yarn by using MIV-BP method. Then it used probabilistic neural network/support vector machine/extreme learning machine to identify wool and viscose materials. The identification results show that by using suitable feed-forward neural network, the materials can be quickly identified with accuracy up to about 90% and the method has the potential for practical use.
Key words: feed-forward neural network; material identification; wool; viscose; MIV; image processing
传统的混纺纱线检测多由人工完成,工作量大,易于出错。随着数字图像技术的发展和神经网络的不断完善,通过图像技术提取纤维特征,利用神经网络进行识别,是现今最主要的自动检测方式。但是纤维特征的筛选多由主观确定,且大多利用BP神经网络来构造材质识别的分类器。由于BP神经网络的学习速度慢,难以满足纤维检测的实时性,所以本文尝试将前馈神经网络的多种典型形式结合图像处理技术,进行羊毛/粘胶混纺纱线的特征选取,训练计算机更为客观、准确、迅速的实现毛粘混纺纱线中的材质识别。
1羊毛和粘胶的形态特征
1.1基于图像处理的羊毛/粘胶特征提取
通过配套PC图像采集接口的CU-Ⅱ型纤维细度仪,显微拍摄利用哈氏切片法获取的羊毛/粘胶混纺纱线横截面图片(图1)。其中羊毛和粘胶为待识别目标,需要保留;而火棉胶溶液的作用是固化纱线,可看作为背景,需要去除。经图像灰度化、去噪、增强、二值化、形态学处理之后得到的羊毛和粘胶个体示意图如图2和图3所示。通过观察可以发现,羊毛和粘胶从图像的角度来看,最大的差异在于羊毛个体的形态较饱满,外廓参差较少;粘胶个体形态较干瘪,外廓参差较多。
通过Matlab中用来度量图像区域属性的函数regionprops,获取第一至第六个特征指标,分别为Area、Eccentricity、EquivDiameter、Solidity、Extent、Perimeter;如图4所示,第七个特征指标定义为Bc,即从水平与垂直两个方向获取的目标个体长度,然后将以较小长度Lmin作为直径的圆的面积与以较大长度Lmax作为直径的圆的面积相除(式(1));如图5所示,第八个特征指标定义为SMr,Sh和Sv分别是目标个体从水平方向逐行和垂直方向逐列扫描得到的缺口面积总和,S是目标个体的横截面面积(式(2))。
Bc=L2min/L2max(1)
SMr=1-(Sh+Sv)/S(2)
在本文的研究中总共提取了215个羊毛个体和152个粘胶个体的特征值,部分羊毛和粘胶个体特征值的原始数据见表1。
Abstract: The paper puts forward the optimization method of fractional linear neural network based on genetic algorithm. It firstly optimizes the weight of fractional linear network by using genetic algorithm, and then, on the basis of genetic improved result, trains fractional linear network by fractional linear network back propagation (BP) algorithm, and gets the optimal weights of network. It is applied to build the fractional linear neural network model based on genetic algorithm for predicting the gas-oil ratio of original oil. The Comparative experiments show that the fractional linear neural network optimization method based on genetic algorithm is a kind of new modeling method.
关键词: 遗传算法;分式线性神经网络;预测模型;原油气油比
Key words: genetic algorithm;fractional linear neural network;prediction model;gas-oil ratio of original oil
中图分类号:TP183 文献标识码:A 文章编号:1006-4311(2013)28-0221-02
0 引言
BP网络是一种应用最为广泛的前馈神经网络。但是BP网络收敛速度慢,易陷入局部极小。遗传算法是一种自适应全局优化概率搜索算法,具有较强的鲁棒性,可以与BP网络结合避免其陷入局部最小。一些学者对BP网络进行了优化和改进,如吴清佳等[1]采用VC维方法确定网络结构,再用BP算法和基本遗传算法对暴雨量进行预测分析;张少文等[2]尝试用GA-BP算法建立了黄河上游降雨-径流神经网络预测模型。
由相关数学概念可知,线性函数的倒数是分式线性函数。文献[3]证明了分式线性神经网络具有比常见BP网络更强、更广泛的逼近能力。但是,分式线性网络反向传播(BP)学习算法也有不收敛或易陷入局部极小的可能。本文结合GA和分式线性网络BP算法的特点构建了基于遗传算法的分式线性神经网络模型并用于原油溶解气油比预测。仿真结果表明,这一模型可以用来预测原油气油比,因而基于遗传算法的分式线性网络可行有效。
1 分式线性网络神经网络模型拓扑结构
分式线性网络是具有m(m?叟3)层的前向神经网络,包括1个输入层,1个或1个以上的隐含层和1个输出层。
本文神经网络优化模型采用3层分式线性网络,即1个输入层,1个隐含层和1个输出层,其中隐含层神经元的输入函数是分式线性函数。
根据有关文献和溶解气油比实验结果,压力、温度、气体相对密度、原油重度与原油溶解气油比之间存在一定的非线性函数关系。本文把压力、温度、气体相对密度以及原油重度这4个参量作为网络的输入节点,气油比这个参量作为输出节点。因此,输入层节点个数为4,输出层节点个数为1。决定隐含层的神经元数量的选取多是通过实验不断调整数量和经验公式选取。根据本文设计思想和实验反复计算测试,设计输入层神经元数目为n,输出层神经元数目为1,隐含层神经元数目为(2n+1)=2×4+1=9。
2 基于遗传算法的模型初始权值优化设计
2.1 基本思想 为加快分式线性网络BP算法收敛速度,避免陷入局部极小,本文先对模型初始的权值、阈值编码,构成初始种群,然后借助遗传算子生成下一代种群,对种群中的最优个体解码后得到的权值做出评价,如果满足遗传算法性能指标,则输出此最优权值,否则继续遗传算法操作,直至某一代的种群最优个体满足性能指标,并输出对应的权值、阈值。此时得到的权值阈值是遗传算法优化后的分式网络初始解,再把得到的优化权值再传赋给分式线性网络再做进一步的优化。
2.2 设计方法
2.2.1 编码方法 本文遗传算法采用实数编码方法。将分式线性神经网络的权值和阈值按先后顺序级联为一个长串,串上的每一个位置对应着网络的一个权值和阈值,并用一个向量?孜表示:?孜=[W1,W2,B1,B2](1)
其中,W1为输入层神经元与隐含层神经元连接权值,W2为隐含层神经元与输出层神经元连接权值,B1为隐含层神经元阈值,B2为输出层神经元阈值,
取隐含层传递函数?椎(t)=■,设输入学习样本共有M个,记为Xp=(x■,x■,…,x■),p=1,2,…,M,对应的样本输出为Y■=(y■,y■,…,y■),p=1,2,…M,W■■,是对应第p个样本的输入层与隐含层神经元连接权值,W■■是对应第p个样本的隐含层与输出层神经元连接权值,B■■对应第p个样本的隐含层神经元阈值,B■■对应第p个样本的输出层神经元阈值。网络在学习样本下的实际输出为
■■=W■■■+B■■,p=1,2,…M
(2)
定义适应度函数的形式为:f=■=
1/■Y■-W■■■+B■■(3)
2.2.2 遗传操作 ①选择算子:采用基于正态分布序列选择的选择算子。②交叉算子:采用算术交叉算子。③变异算子:采用基于非均匀变异的变异算子。④进化代数:T=300。
3 模型构建
以东营市利津油田34口油井建立神经网络预报模型,对这些油井的溶解气油比作为分析对象,分别通过遗传算法进化分式线性网络模型和采用L-M训练算法的BP网络模型对比进行训练学习,对34口油井中的28个样本作训练样本建模,训练后的网络预测剩余6口油井的气油比,进而实现从输入段到输出端的非线性形式下的映射,预测6个测试样本的原油溶解气油比。(表1)
4 仿真实验
本文提出结合遗传算法的分式线性网络BP算法模型对滨南采油厂利津油田34个数据进行仿真实验。为构建分式线性函数,固定点取(a1,a2,a3,a4)=-1,由于设定输入层神经元个数为4,则隐含层神经元输入函数(分式线性函数)为I=■W1■(4)
其中W1为输入层神经元与隐含层神经元连接权值,xi为输入变量。
分式线性网络隐含层传递函数为Sigmoid函数?椎(t)=1/(1+e-t),输出层传递函数为线性函数L(t)=t,最终训练目标e=0.001,样本数目M=28,训练次数为1000。遗传算法的初始种群规模N=50,最大进化代数T=300。为对比仿真结果,同时对采用L-M训练算法的三层BP网络做仿真,输入层节点数为4,输出层节点数为1,隐含层节点数为10,训练函数为trainlm,训练目标?着=0.001,训练次数为1000,其余均取默认值。
GA优化结果:最大适应度f=26.2544,得到的权值阈值是矩阵形式:?孜=[W9×4,W4×9,W9×1,W4×1]其中,各个变量的定义同前述。
从表2可以看出,本文优化算法需要213步达到训练误差要求,而改进BP算法需要24步就达到要求,本文算法训练步数较长。
由表3可见,基于本文优化算法的模型可以预测原油气油比,其整体预测气油比的精度与基于改进BP算法的模型效果接近,因而本文优化算法预测数据是可行有效的。
5 结束语
本文将遗传算法和分式线性神经网络相结合用于原油气油比的预测,这对原油物性分析提供了一个借鉴和参考。下一步需要充分考虑其他因素的影响并不断改进模型,同时调整好GA算子和分式线性网络的参数以便提高预测的精确度和时效。
参考文献:
[1]吴清佳,张庆平,万健.遗传神经的智能天气预报系统[J].计算机工程,2005,31(14):176-177,189.
【关键词】静态路由 网络互联 路由器 交换机
随着计算机科学技术的发展和互联网应用的普及,21世纪初互联网逐渐由高校、科研机构普及到了各行各业的各大中小型企业及家庭。互联网在人们的生活、学习、工作各方面都扮演着必不可少的角色,其权重在人们的各项活动中的比重越来越大。因此,互联网的安全建设至关重要。因此,互联网中网络设备的互联工程越来越多,参与此工作的人员也相对增多。本文提出基于神州数码网络互联设备的静态路由实现进行研究。可为一些初学者提供一些参考学习。
一、神州数码网络互联设备实验室
神州数码网络有限公司(简称:DCN)是国内领先的网络设备制造商和解决方案提供商,是神州数码控股旗下拥有自主网络品牌和知识产权的专业公司。DCN是神州数码自有品牌,也是神州数码主品牌下的子品牌之一。DCN将继续专注数据通信市场,为客户提供业界领先的以太网交换机、路由器、网络安全、应用交付、无线网络、IP融合通信、网络管理等产品,致力打造成为全球领先的数据通信设备制造商和服务提供商。我校建立的网络实验室就是以该公司的网络设备布置并建设的。目前我校网络实验室条件如下:三台路由器DCR-2655,三台三层交换机DCRS-5658,三台二层交换机DCS-2111,一个24口集线架,9台台式机,布线简单。每台台式机电脑固定,分别有1-24号编有号码的网线从布线板预留口伸出2米的长度,掩埋网线的另一端分别对应集线架的24口。所有这些网络互联设备都集成固定在一个机架上。对于学生做网络实验来说,我们充分利用现有实验条件进行相关实验,本文是针对学生在网络实验室进行的静态路由实验进行的研究。
二、静态路由
静态路由是指由用户或网络管理员手工配置的路由信息。当网络的拓扑结构或链路的状态发生变化时,网络管理员需要手工去修改路由表中相关的静态路由信息。静态路由信息在缺省情况下是私有的,不会传递给其他的路由器。当然,网管员也可以通过对路由器进行设置使之成为共享的。静态路由一般适用于比较简单的网络环境,在这样的环境中,网络管理员易于清楚地了解网络的拓扑结构,便于设置正确的路由信息[3]。
使用静态路由的另一个好处是网络安全保密性高。动态路由因为需要路由器之间频繁地交换各自的路由表,而对路由表的分析可以揭示网络的拓扑结构和网络地址等信息。因此,网络出于安全方面的考虑也可以采用静态路由。不占用网络带宽,因为静态路由不会产生更新流量。
三、静态路由实现实例
实例基于终端PC操作系统WIN7,通过超级终端程序Hypertrm.exe运行配置路由器。
(1)路由器-路由器配置静态路由实例。通过两台路由器实现静态路由实例,首先用路由器配置线将路由器的console口与台式机的COM1端口相连接,进行路由器A的配置。路由器A的配置代码如下:
Router(config) Hostname RA RA(config)interface f0/0 RA(config-if)ip add 192.168.40.1 255.255.255.0 RA(config-if)no shut RA(config-if)exit RA(config)interface g0/3
RA(config-if)ip add 192.168.30.1 255.255.255.0 RA(config-if)no shut RA(config)exit
路由器B的配置代码如下:
Router(config) Hostname RB RB(config)interface f0/0 RB(config-if)ip add 192.168.40.2 255.255.255.0 RB(config-if)no shut RB(config-if)exit RB(config)interface g0/3
RB(config-if)ip add 192.168.50.1 255.255.255.0 RB(config-if)no shut RB(config)exit
然后,配置两台路由器的静态路由,配置代码如:
RA# ip route 192.168.50.0 255.255.255.0 192.168.40.2
RB# ip route 192.168.30.0 255.255.255.0 192.168.40.1
这样,两台路由器之间的静态路由就配置好了。用网线分别连接两台路由器的f0/0接口,接口g0/3分别接两台终端PC,并分别配置两台PC的IP地址为192.168.30.8/24和192.168.50.8/
24,网关分别配置为192.168.30.1/24和192.168.50.1/24。配置完成以后,两台PC互相ping对方,一共四个数据包都没有丢失,说明两台主机是互通的。这就是说两台路由器f0/0端口相连,另一端口g0/3分别连接两台主机的网络拓扑配置相关的端口ip及主机ip以后,在两台路由器上分别正确的配置静态路由协议以后,两台主机互相能ping通,说明该静态路由协议实验配置成功。
(2)路由器-三层交换机配置静态路由实例。三层交换机就是具有部分路由器功能的交换机,三层交换机的最重要目的是加快大型局域网内部的数据交换,所具有的路由功能也是为这目的服务的,能够做到一次路由,多次转发。对于数据包转发等规律性的过程由硬件高速实现,而像路由信息更新、路由表维护、路由计算、路由确定等功能,由软件实现。三层交换技术就是二层交换技术+三层转发技术。出于安全和管理方便的考虑,主要是为了减小广播风暴的危害,必须把大型局域网按功能或地域等因素划成一个个小的局域网,这就使VLAN技术在网络中得以大量应用,而各个不同VLAN间的通信都要经过路由器来完成转发,随着网间互访的不断增加。单纯使用路由器来实现网间访问,不但由于端口数量有限,而且路由速度较慢,从而限制了网络的规模和访问速度。基于这种情况三层交换机便应运而生,三层交换机是为IP设计的,接口类型简单,拥有很强二层包处理能力,非常适用于大型局域网内的数据路由与交换,它既可以工作在协议第三层替代或部分完成传统路由器的功能,同时又具有几乎第二层交换的速度,且价格相对便宜些。
因为实验室条件限制,两台路由器已经被部分同学占用进行上述静态路由协议配置的实验,另一部学生,利用一台路由器和一台三层交换机进行静态路由协议的配置实验。依据是三层交换机具有简单的路由功能,其中,支撑静态路由协议。基于此,接下来,实验路由器-三层交换机的配置实验,检验其是否能配置成功?
首先用路由器配置线将路由器的console口与台式机的COM1端口相连接,进行路由器A的配置。路由器A的配置代码如下:
Router(config) Hostname RA RA(config)interface f0/0 RA(config-if)ip add 192.168.40.1 255.255.255.0 RA(config-if)no shut RA(config-if)exit RA(config)interface g0/3
RA(config-if)ip add 192.168.30.1 255.255.255.0 RA(config-if)no shut
然后用交换机配置线将交换机的console口与台式机的COM1端口相连接,进行三层交换机的配置。三层交换机Sw的配置代码如下:
DCRS-2655(config)hostname Sw Sw(config)ip option enable Sw(config)vlan 10
Sw(config-vlan)ex Sw(config)vlan 20 Sw(config-vlan)ex Sw(config)int e1/0/2
Sw(config-if)switchport mode access Sw(config-if)swichport access vlan 10 Sw(config-if)ex
Sw(config)int e1/0/6 Sw(config-if)switchport mode access Sw(config-if)swichport access vlan 20 Sw(config)ex Sw(config)int vlan 10 Sw(config-if)ip add 192.168.40.2 255.255.255.0
Sw(config-if)no shut Sw(config-if)ex Sw(config)int vlan 20
Sw(config-if)ip add 192.168.50.1 255.255.255.0 Sw(config-if)no shut
接下来配置静态路由
路由器:ip route 192.168.50.0 255.255.255.0 192.168.
40.2
交换机:ip route 192.168.30.0 255.255.255.0 192.168.
40.1
这样,路由器和三层交换机之间的静态路由就配置好了。用网线分别连接路由器的f0/0接口和三层交换机的 e1/0/2端口,路由器接口g0/3连接一台终端PC1,三层交换机的端口e1/0/6连接另一台终端PC2,并分别配置两台PC的IP地址为192.168.30.
8/24和192.168.50.8/24,网关分别配置为192.168.30.1/24和192.168.50.1/24。配置完成以后,两台PC互相ping对方,结果都是通的。说明该静态路由协议配置成功。异种网络互联设备可以成功配置静态路由协议,并能正确路由,以此在建立的数据链路中传输数据。
四、总结
通过以上配置实例知道,静态路由协议不仅在路由器-路由器配置实验中能够成功配置,并且在具有路由功能的工作于ISO模型第二层数据链路层的网络设备,同样也能配置静态路由协议,与配置静态路由协议的路由器互联,能实现网络的路由。静态路由表在开始选择路由之前就被网络管理员建立,并且只能由网络管理员更改,所以只适于网络传输状态比较简单的环境。静态路由具有更高的安全性。在使用静态路由的网络中,所有要连到网络上的路由器都需在邻接路由器上设置其相应的路由。因此,在某种程度上提高了网络的安全性。但是,大型和复杂的网络环境通常不宜采用静态路由。一方面,网络管理员难以全面地了解整个网络的拓扑结构;另一方面,当网络的拓扑结构和链路状态发生变化时,路由器中的静态路由信息需要大范围地调整,这一工作的难度和复杂程度非常高。当网络发生变化或网络发生故障时,不能重选路由,很可能使路由失败。
参考文献:
本文主要介绍了人工神经网络的概念,并对几种具体的神经网络进行介绍,从它们的提出时间、网络结构和适用范围几个方面来深入讲解。
【关键词】神经网络 感知器网络 径向基网络 反馈神经网络
1 引言
人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新型信息处理体系。它实际上是一个由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统,通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能,利用这一特性,可以设计处具有类似大脑某些功能的智能系统来处理各种信息,解决不同问题。下面对几种具体的神经网络进行介绍。
2 感知器网络
感知器是由美国学者Rosenblatt在1957年首次提出的,感知器可谓是最早的人工神经网络。感知器具有分层结构,信息从输入层进入网络,逐层向前传递到输出层。感知器是神经网络用来进行模式识别的一种最简单模型,属于前向神经网络类型。
2.1 单层感知器
单层感知器是指只有一层处理单元的感知器,它的结构与功能都非常简单,通过读网络权值的训练,可以使感知器对一组输入矢量的响应达到元素为0或1的目标输出,从而实现对输入矢量分类的目的,目前在解决实际问题时很少被采用,但由于它在神经网络研究中具有重要意义,是研究其他网络的基础,而且较易学习和理解,适合于作为学习神经网络的起点。
2.2 多层感知器
多层感知器是对单层感知器的推广,它能够成功解决单层感知器所不能解决的非线性可分问题,在输入层与输出层之间引入隐层作为输入模式的“内部表示”,即可将单层感知器变成多层感知器。
3 线性神经网络
线性神经网络类似于感知器,但是线性
神经网络的激活函数是线性的,而不是硬限转移函数。因此线性神经网络的输出可以使任意值,而感知器的输出不是0就是1。线性神经网络最早的典型代表就是在1963年由美国斯坦福大学教授Berhard Windrow提出的自适应线性元件网络,它是一个由输入层和输出层构成的单层前馈性网络。自适应线性神经网络的学习算法比感知器的学习算法的收敛速度和精度都有较大的提高,自适应线性神经网络主要用于函数逼近、信号预测、系统辨识、模式识别和控制等领域。
4 BP神经网络
BP神经网络是1986年由以Rumelhart和McCelland为首的科学家小组提出的,是一种按误差逆传播算法训练的多层前馈网络,在人工神经网络的实际应用中,80%~90%的人工神经网络模型采用BP网络或者它的变化形式,它也是前向网络的核心部分,体现了人工神经网络最精华的部分,BP神经网络由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经过一步处理后完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者达到预先设定的学习次数为止。
BP网络主要应用于以下方面:
(1)函数逼近:用输入矢量和相应的输出矢量训练一个网络逼近一个函数。
(2)模式识别:用一个特定的输出矢量将它与输入矢量联系起来。
(3)分类:对输入矢量以所定义的合适方式进行分类。
(4)数据压缩:减少输出矢量维数以便于传输或存储。
5 反馈神经网络
美国加州理工学院物理学家J.J.Hopfield教授于1982年发表了对神经网络发展颇具影响的论文,提出一种单层反馈神经网络,后来人们将这种反馈网络称作Hopfield网。在多输入/多输出的动态系统中,控制对象特性复杂,传统方法难以描述复杂的系统。为控制对象建立模型可以减少直接进行实验带来的负面影响,所以模型显得尤为重要。但是,前馈神经网络从结构上说属于一种静态网络,其输入、输出向量之间是简单的非线性函数映射关系。实际应用中系统过程大多是动态的,前馈神经网络辨识就暴露出明显的不足,用前馈神经网络只是非线性对应网络,无反馈记忆环节,因此,利用反馈神经网络的动态特性就可以克服前馈神经网络的缺点,使神经网络更加接近系统的实际过程。
Hopfield神经网络的应用:
(1)在数字识别方面。
(2)高校科研能力评价。
(3)应用于联想记忆的MATLAB程序。
6 径向基神经网络
径向基RBF网络是一个3层的网络,除了输入、输出层之间外仅有一个隐层。隐层中的转换函数是局部响应的高斯函数,而其他前向网络,转换函数一般都是全局响应函数。由于这样的差异,要实现同样的功能,RBF需要更多的神经元,这就是RBF网络不能取代标准前向型络的原因。但是RBF网络的训练时间更短,它对函数的逼近时最优的,可以以任意精度逼近任意连续函数。隐层中的神经元越多,逼近越精确。
径向基网络的应用:
(1)用于曲线拟合的RBF网络。
(2)径向基网络实现非线性函数回归。
7 自组织神经网络
自组织竞争型神经网络是一种无教师监督学习,具有自组织功能的神经网络,网络通过自身的训练。能自动对输入模式进行分类,一般由输入层和竞争层够曾。两层之间各神经元实现双向连接,而且网络没有隐含层。有时竞争层之间还存在着横向连接。
常用自组织网络有一下几种:
(1)自组织特征映射网络。
(2)学习矢量量化网络。
(3)自适应共振理论模型。
(4)对偶传播网络。
参考文献
[1]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.
[2]周品.神经网络设计与应用[M].北京:清华大学出版社,2013.
作者简介
孔令文(1989-),男,黑龙江省齐齐哈尔市人。现为西南林业大学机械与交通学院在读研究生。研究方向为计算机仿真。
[摘要]该文介绍了神经网络的发展、优点及其应用和发展动向,着重论述了神经网络目前的几个研究热点,即神经网络与遗传算法、灰色系统、专家系统、模糊控制、小波分析的结合。
[关键词]遗传算法灰色系统专家系统模糊控制小波分析
一、前言
神经网络最早的研究20世纪40年代心理学家Mcculloch和数学家Pitts合作提出的,他们提出的MP模型拉开了神经网络研究的序幕。神经网络的发展大致经过三个阶段:1947~1969年为初期,在这期间科学家们提出了许多神经元模型和学习规则,如MP模型、HEBB学习规则和感知器等;1970~1986年为过渡期,这个期间神经网络研究经过了一个低潮,继续发展。在此期间,科学家们做了大量的工作,如Hopfield教授对网络引入能量函数的概念,给出了网络的稳定性判据,提出了用于联想记忆和优化计算的途径。1984年,Hiton教授提出Boltzman机模型。1986年Kumelhart等人提出误差反向传播神经网络,简称BP网络。目前,BP网络已成为广泛使用的网络;1987年至今为发展期,在此期间,神经网络受到国际重视,各个国家都展开研究,形成神经网络发展的另一个。神经网络具有以下优点:
(1)具有很强的鲁棒性和容错性,因为信息是分布贮于网络内的神经元中。
(2)并行处理方法,使得计算快速。
(3)自学习、自组织、自适应性,使得网络可以处理不确定或不知道的系统。
(4)可以充分逼近任意复杂的非线性关系。
(5)具有很强的信息综合能力,能同时处理定量和定性的信息,能很好地协调多种输入信息关系,适用于多信息融合和多媒体技术。
二、神经网络应用现状
神经网络以其独特的结构和处理信息的方法,在许多实际应用领域中取得了显著的成效,主要应用如下:
(1)图像处理。对图像进行边缘监测、图像分割、图像压缩和图像恢复。
(2)信号处理。能分别对通讯、语音、心电和脑电信号进行处理分类;可用于海底声纳信号的检测与分类,在反潜、扫雷等方面得到应用。
(3)模式识别。已成功应用于手写字符、汽车牌照、指纹和声音识别,还可用于目标的自动识别和定位、机器人传感器的图像识别以及地震信号的鉴别等。
(4)机器人控制。对机器人眼手系统位置进行协调控制,用于机械手的故障诊断及排除、智能自适应移动机器人的导航。
(5)卫生保健、医疗。比如通过训练自主组合的多层感知器可以区分正常心跳和非正常心跳、基于BP网络的波形分类和特征提取在计算机临床诊断中的应用。
(6)焊接领域。国内外在参数选择、质量检验、质量预测和实时控制方面都有研究,部分成果已得到应用。
(7)经济。能对商品价格、股票价格和企业的可信度等进行短期预测。
(8)另外,在数据挖掘、电力系统、交通、军事、矿业、农业和气象等方面亦有应用。
三、神经网络发展趋势及研究热点
1.神经网络研究动向
神经网络虽已在许多领域应用中取得了广泛的成功,但其发展还不十分成熟,还有一些问题需进一步研究。
(1)神经计算的基础理论框架以及生理层面的研究仍需深入。这方面的工作虽然很困难,但为了神经计算的进一步发展却是非做不可的。
(2)除了传统的多层感知机、径向基函数网络、自组织特征映射网络、自适应谐振理论网络、模糊神经网络、循环神经网络之外,一些新的模型和结构很值得关注,例如最近兴起的脉冲神经网络(spikingneuralnetwork)和支持向量机(supportvectormachine)。
(3)神经计算技术与其他技术尤其是进化计算技术的结合以及由此而来的混合方法和混合系统,正成为一大研究热点。
(4)增强神经网络的可理解性是神经网络界需要解决的一个重要问题。这方面的工作在今后若干年中仍然会是神经计算和机器学习界的一个研究热点。
(5)神经网络的应用领域将不断扩大,在未来的几年中有望在一些领域取得更大的成功,特别是多媒体技术、医疗、金融、电力系统等领域。
2.研究热点
(1)神经网络与遗传算法的结合。遗传算法与神经网络的结合主要体现在以下几个方面:网络连接权重的进化训练;网络结构的进化计算;网络结构和连接权重的同时进化;训练算法的进化设计。基于进化计算的神经网络设计和实现已在众多领域得到应用,如模式识别、机器人控制、财政等,并取得了较传统神经网络更好的性能和结果。但从总体上看,这方面研究还处于初期阶段,理论方法有待于完善规范,应用研究有待于加强提高。神经网络与进化算法相结合的其他方式也有待于进一步研究和挖掘。
(2)神经网络与灰色系统的结合。灰色系统理论是一门极有生命力的系统科学理论,自1982年华中理工大学的邓聚龙教授提出灰色系统后迅速发展,以初步形成以灰色关联空间为基础的分析体系,以灰色模型为主体的模型体系,以灰色过程及其生存空间为基础与内的方法体系,以系统分析、建模、预测、决策、控制、评估为纲的技术体系。目前,国内外对灰色系统的理论和应用研究已经广泛开展,受到学者的普遍关注。灰色系统理论在在处理不确定性问题上有其独到之处,并能以系统的离散时序建立连续的时间模型,适合于解决无法用传统数字精确描述的复杂系统问题。
神经网络与灰色系统的结合方式有:(1)神经网络与灰色系统简单结合;(2)串联型结合;(3)用神经网络增强灰色系统;(4)用灰色网络辅助构造神经网络;(5)神经网络与灰色系统的完全融合。
(3)神经网络与专家系统的结合。基于神经网络与专家系统的混合系统的基本出发点立足于将复杂系统分解成各种功能子系统模块,各功能子系统模块分别由神经网络或专家系统实现。其研究的主要问题包括:混合专家系统的结构框架和选择实现功能子系统方式的准则两方面。由于该混合系统从根本上抛开了神经网络和专家系统的技术限制,是当前研究的热点。把粗集神经网络专家系统用于医学诊断,表明其相对于传统方法的优越性。
(4)神经网络与模糊逻辑的结合
模糊逻辑是一种处理不确定性、非线性问题的有力工具。它比较适合于表达那些模糊或定性的知识,其推理方式比较类似于人的思维方式,这都是模糊逻辑的优点。但它缺乏有效的自学习和自适应能力。
而将模糊逻辑与神经网络结合,则网络中的各个结点及所有参数均有明显的物理意义,因此这些参数的初值可以根据系统的模糊或定性的知识来加以确定,然后利用学习算法可以很快收敛到要求的输入输出关系,这是模糊神经网络比单纯的神经网络的优点所在。同时,由于它具有神经网络的结构,因而参数的学习和调整比较容易,这是它比单纯的模糊逻辑系统的优点所在。模糊神经网络控制已成为一种趋势,它能够提供更加有效的智能行为、学习能力、自适应特点、并行机制和高度灵活性,使其能够更成功地处理各种不确定的、复杂的、不精确的和近似的控制问题。
模糊神经控制的未来研究应集中于以下几个方面:
(1)研究模糊逻辑与神经网络的对应关系,将对模糊
控制器的调整转化为等价的神经网络的学习过程,用等价的模糊逻辑来初始化神经网络;
(2)完善模糊神经控制的学习算法,以提高控制算法的速度与性能,可引入遗传算法、BC算法中的模拟退火算法等,以提高控制性能;
(3)模糊控制规则的在线优化,可提高控制器的实时性与动态性能;(4)需深入研究系统的稳定性、能控性、能观性以及平衡吸引子、混沌现象等非线性动力学特性。
关于神经网络与模糊逻辑相结合的研究已有很多,比如,用于氩弧焊、机器人控制等。
(5)神经网络与小波分析的结合
小波变换是对Fourier分析方法的突破。它不但在时域和频域同时具有良好的局部化性质,而且对低频信号在频域和对高频信号在时域里都有很好的分辨率,从而可以聚集到对象的任意细节。
利用小波变换的思想初始化小波网络,并对学习参数加以有效约束,采用通常的随机梯度法分别对一维分段函数、二维分段函数和实际系统中汽轮机压缩机的数据做了仿真试验,并与神经网络、小波分解的建模做了比较,说明了小波网络在非线性系统黑箱建模中的优越性。小波神经网络用于机器人的控制,表明其具有更快的收敛速度和更好的非线性逼近能力。
四、结论
经过半个多世纪的发展,神经网络理论在模式识别、自动控制、信号处理、辅助决策、人工智能等众多研究领域取得了广泛的成功,但其理论分析方法和设计方法还有待于进一步发展。相信随着神经网络的进一步发展,其将在工程应用中发挥越来越大的作用。
参考文献:
[1]张曾科.模糊数学在自动化技术中的应用[M].清华大学出版社,1997.
[2]李士勇.模糊控制·神经控制和智能控制论[M].哈尔滨工业大学出版,1996.250-387.
[3]谢联峻.模糊控制在列车自动驾驶中的应用[J].自动化与仪器仪表,1999,(4).
[4]CollierWC,Weiland,RJSmartCarts,SmartHighways[J].IEEESpec-trum,1994,31(4):27-33.
[5]HatwalH,MikulcikEC.someInverseSolutionstoanAutomobilePathTrackingProblemwithInputControlofSteeringandBreaks,Ve-hiclesystemDynamics,1986,(15):61-71.
[6]KosugeK,FukudaT,AsadaH.AcquisitionifHumanSkillsforRoboticSystem[C].In:ProcIEEEIntSympOnIntelligenControl,1991.469-489.
[7]王小平,曹立明.遗传算法—理论、应用与软件实现.西安交通大学出版社,2002.
[8]ManiezzoV.Geneticevolutionofthetopologhandweightdistribution
ofneuralnetwork[J].IEEETransonNeuralNetwork,1994,5(1)35-67.
[9]HarraldPG,KamstraM.Evolvingartificialneuralnetworkstocombinefinancialforecase[J].IEEETransonEvolComputer,1997,1(1):39-54.
[10]邓聚龙.灰色系统理论教程.华中理工大学出版社,1990.
[11]吕宏辉,钟珞,夏红霞.灰色系统与神经网络融合技术探索.微机发展,2000,23(4):67-109.
关键词:人工神经网络;金属切削刀具;磨损检测
1.前言:
随着我国的工业飞速发展,对于工件的要求也愈发严格,但是从工厂中制造出的工件或多或少都有些不尽人意,所以必须依靠金属切削技术对工件进行二次加工。但随着时间流逝,金属刀具的磨损逐渐成为了一个问题。而且随着机器的柔性化与机械化愈发提高,人工观测刀具磨损状况的方法也愈发得不可取。无数科学家为此进行了大量研究,讨论出了是数种方法,而人工神经网络运用于金属切削机的技术也应运而生。人工神经网络是一种以模拟动物神经网络而创造的数学模型,人工神经网络有大量简单的处理单元组成,它最大的作用处理信息,并且拥有学习和记忆、归纳的能力。目前,人工神经网络在智能控制、优化计算与信息处理中都有很大的进展,人工神经网络的前景不可估量。
2.人工神经网络在金属切削刀具中的应用
2.1人工神经网络的基础知识
人工神经网络是一种建立在现代医学对于人脑的研究上的一种模拟人脑的数学模型。它是由大量简单的处理单元组成的复杂网络,用以模仿人类大脑的神经活动与规律。所以,人工神经网络拥有人类大脑的基本特征,即:学习、记忆与归纳功能。虽然人工神经网络与人类大脑相比略有不足,但是由于其独特的结构,人工神经网络可以对己输入信息进行分析与归纳,并且拥有简单的决断能力与简单的判断能力,所以人工神经网络在逻辑学推理演算中,比起人类大脑更加有优势。故,人工神经网络在一些比较简单同时需要大量计算的工作上比起人脑更有优势。于是,人工神经网络被广泛用于金属切削技术,并获得了大量的好评。
2.2人工神经网络使金属切削的过程更加智能化
人工神经网络具有自学习、联想存储与优化计算的能力,在金属切削中被大量运用。人工神经网络在金属切削中起着多传感器多信息融合与模式联想器的作用。在对选定的人工神经网络进行训练,通过人工神经网络的学习与记录作用,将人工神经网络训练为模型,并将这个模型运用于金属切削中,使金属切削过程智能化。1992年王卫平博士使用人工神经网络令金属切削机在金属切削的过程中智能化。李旭东利用BP网络与人工神经网络的学习性,实现了金属切削加工的智能化选择。实际上,国内有许许多多的人用人工神经网络实现了金属切削过程的智能化,而随着他们的成功,越来越多的人也将加入金属切削智能化的队伍中来。
并且随着我国技术的逐渐加强,人工神经网络技术的逐渐完善,金属切削智能化的程度只会越来越强。
2.3人工神经网络对于刀具磨损的检测
人工神经系统被运用于金属切削领域的初衷,就是希望借助它的智能化与信息处理的优越性,代替人工来检验刀具的磨损程度。
通过人工神经网络的学习性,可以轻易在网络中建模,使人工神经网络可以轻易地检测出刀具的正常状态与非正常状态――即刀具是否磨损。当刀具处于磨损状态时,人工神经网络可以发出警告。实际上,在刀具磨损状态下发出警报已经不再是现在的研究重点了,在无人参与定情况下,对整个金属切削过程进行识别,当刀具发生磨损,人工神经网络可以进行自主替换,这,才是理想中的智能刀具检验系统,同时也是研究热点。如果要实现上述内容,应该具备这些特点:对于来自多个传感器的信息可以快速处理;在拥有样本数据的情况下可以快速学习;可以根据外界数据的变化,快速调整自身,以适应周遭环境。
2.4通过人工神经网络的计算,预测金属切削加工中的状态.
在人工神经网络运用于金属切削中的一个重要研究,便是通过人工神经网络的计算来预测金属切削加工中的状态。可惜这项技术现在还只是处于理论研究与建模模拟的状态下,跟可以正式使用还有一定的距离。如果这项技术可以得到突破,那么,毋庸置疑得,不止在金属切削领域是一大进步,更加可以推动工厂全智能化、C械化,这无疑是一场重工业的一场大地震与大革命。
1 引言
神经网络是近年来得到广泛关注的一种非线性建模预报技术。它具有自组织、自学习、自适应和非线性处理、并行处理、信息分布存储、容错能力强等特性,对传统方法效果欠佳的预报领域有很强的吸引力。基于神经网络的非线性信息处理方法已应用于军事信息处理及现代武器装备系统的各个方面,并有可能成为未来集成智能化的军事电子信息处理系统的支撑技术。该技术在一些先进国家已部分形成了现实的战斗力。
船舶在波浪中航行,会受到风、浪和流的影响,因而将不可避免地发生摇荡运动。严重的摇荡会使船员工作效率下降、物品损坏、军舰的战斗力下降。如果能够预知未来一段时间船舶的运动情况,不仅有利于尽早采用先进控制算法控制舰载武器平台隔离船舶运动的影响,使其始终稳定瞄准目标,而且还可获得未来一个海浪周期内的船舶运动情况,以研究船载武器上层的控制策略,从而提高火力密度,因此,有必要研究在海浪中具有一定精度的海浪中船舶运动的短期预报。此外,如能有效准确地预报船舶的横摇运动,对于提高船舶的耐波性和适航性也有重要意义。
国内外学者也将神经网络用于船舶运动预报研究,但往往没有考虑实时性等实现问题,因而不能实用化。神经网络实现技术是神经网络研究的一个重要方面。神经网络实现可分为全硬件实现和软件实现两种。目前神经网络的实现还主要以软件模拟为主,由于现行的冯诺曼计算机体系结构不能实现并行计算,因而神经网络软件的实时应用还受到一定限制。
目前,一些著名集成电路制造公司如Intel、Mo-torola、松下、日立、富士通等均已推出自己的模拟或数字神经网络芯片,这些芯片无论在网络规模还是运行速度上都已接近实用化的程度,因而给神经网络应用的发展以极大的推动。由于舰载武器系统,需选用具有在片学习功能的神经网络芯片,即将网络训练所需的反馈电路及权值存储、计算和修正电路都集成在了一个芯片,因而可实现全硬件的、具有自学习能力的神经网络系统,也可以说,这是一种具有自适应能力的神经网络。
2 ZISC78的功能及工作原理
ZISC78是由IBM公司和Sillicon联合研制的一种低成本、在线学习、33MHz主频、CMOS型100脚LQFP封装的VLSI芯片,图1所示是ZISC78的引脚排列图。ZISC78的特点如下:
内含78个神经元;
采用并行结构,运行速度与神经元数量无关;
支持RBF/KNN算法;
内部可分为若干独立子网络;
采用链连接,扩展不受限制;
具有64字节宽度向量;
L1或LSUP范数可用于距离计算;
具有同步/异步工作模式。
2.1 ZISC78神经元结构
ZISC78采用的神经元结构如图2所示,该神经元有以下几种状态:
(1)休眠状态:神经网络初始化时,通常处于这种状态。
(2)准备学习状态:任何时侯,神经网络中的神经元都处于这种状态。
(3)委托状态:一个包含有原型和类型的神经元处于委托状态。
(4)激活状态:一个处于委托状态的神经元,通过评估,其输入矢量处于其影响域时,神经元就被激活而处于激活状态。
(5)退化状态:当一个神经元的原型处于其它神经元类型空间内,而大部分被其他神经元类型空间重叠时,这个神经元被宣布处于退化状态。
2.2 ZISC78神经网络结构
从图3所示的ZISC78神经网络结构可以看出,所有神经元均通过“片内通信总线”进行通信,以实现网络内所有神经元的“真正” 并行操作。“片内通信总线”允许若干个ZISC78芯片进行连接以扩大神经网络的规模,而这种操作不影响网络性能。
ZISC78片内有6 bit地址总线和16 bit数据总线,其中数据总线用于传输矢量数据、矢量类型、距离值和其它数据。
2.3 ZISC78的寄存器组
ZISC78使用两种寄存器:全局寄存器和神经元寄存器。全局寄存器用于存储与所有神经元有关的信息,每片仅有一组全局寄存器。全局寄存器组中的信息可被传送到所有处于准备学习状态和委托状态的神经元。神经元寄存器用于存储所属神经元的信息,该信息在训练学习操作中写入,在识别操作中读出。
2.4 ZISC78的操作
ZISC78的操作包括初始化、矢量数据传播、识别和分类等三部分。
初始化包括复位过程和清除过程。
矢量数据传播包括矢量数据输入过程和神经元距离计算过程。神经元距离就是输入矢量和神经元中存储的原型之间的范数。通常可选L1范数或Lsup范数:
其中,Xi为输入矢量数据,Xs为存贮的原型数据。
对于识别和分类,ZISC78提供有两种可选择的学习算法RBF和KNN。其中RBF是典型的径向基函数神经网络。在该RBF模式下,可输出识别、不确定或不认识的状态;KNN模式是RBF模式的限制形式,即在KNN模式下,新原型的影响域总被设为1,输出的是输入向量和存储原型之间的距离。需要指出的是,ZISC78具有自动增加或减小神经元个数以适应输入信号的分类和识别功能,神经元个数的最大值和最小值在全局寄存器组中设定。
2.5 ZISC78的组网
一个ZISC78芯片内可以通过寄存器操作定义若干个独立的网络。若干个ZISC78芯片通过层叠可以组成一个更大的神经网络,组网芯片数量没有限制,小于10个ZISC78组网时,甚至连电源中继器件也不需要。所以,ZISC78具有最大的灵活性,能够满足不同的需要。
3 仿真实例
为了验证ZISC78用于船舶运动实时预报的精度,本文对径向基函数神经网络预报进行了仿真,图4给出了基于径向基函数神经网络和船舶运动惯导实测信号预报的0.3秒(15步)误差曲线图。
通过以惯导实测数据ZHX_lg.dat为例预报0.3秒(15步)以后的船舶运动,作者运用相空间重构理论已经判断出本数据为非线性信号。
该仿真的最大预报误差方差为6.4666e-004,该数据可以满足战技指标。
4 结束语