公务员期刊网 论文中心 正文

数据挖掘技术的农产品物流配送研究

数据挖掘技术的农产品物流配送研究

摘要:数据挖掘技术已广泛应用于各行各业中,并产生了明显的经济效益,但应用在农产品物流配送方面的研究并不是很多。基于此,以安徽省合肥市农产品物流配送作为研究对象,选取农产品物流配送过程中的影响因素,利用数据挖掘技术中的分类方法分析大量相关历史数据,对农产品物流配送情况进行分析。最终得到农产品物流配送关联分类规则,为农产品物流配送提供新策略,仿真验证农产品物流配送新策略减少了配送时间,提高了配送效率。

关键词:农产品物流配送;数据挖掘;贝叶斯网络;TAN分类器;GRI算法

随着人民物质生活水平的不断提高,对鲜活农产品物流配送的要求也越来越高。国内外学者对此进行了很多研究。针对农产品物流配送问题,何有世等,罗庆等,范立南等构建农产品物流配送路径优化模型并应用遗传算法对其进行求解,以期起到改进优化的作用。[1-3]孙明明等构建农产品物流配送模型以期最终实现配送总成本最小化的目的。[4]张逊逊等建立农产品物流配送路径决策模型以期最终实现区域农产品配送系统的节能减排。[5]P.Amorim等建立农产品物流配送多目标规划模型对农产品易腐性在配送过程中的影响进行研究。[6]Lin,Choy等认为对农产品物流的研究,环境、生态和社会效应与经济成本同等重要,需综合考虑各方面的因素。[7]Kwon等采用禁忌搜索算法对多车型的低碳路径优化模型进行求解。[8]JohanVisser等认为在冷链农产品物流配送过程中需要注重品质服务,适当增加城市配送车辆的出行频率,从而使生鲜农产品保质保量地及时配送到最终客户手中。[9]上述国内外学者对农产品物流配送的研究多数为建立数学优化模型进行研究,数据挖掘技术虽已广泛应用于各行各业中,并产生了明显的经济效益,但相关学者应用此技术在农产品物流配送方面的研究并不是很多,然而对于农产品物流配送而言,以往的大量的农产品物流配送历史数据具有很大的研究价值。因此,笔者将采用数据挖掘技术中的分类方法对农产品物流配送进行分析,以期得到改进后的农产品物流配送策略。

1问题描述

随着经济的飞速发展,加速了人们对农产品的日常需求量,不仅包括对鲜活农产品数量的需求,还包括对鲜活农产品质量的要求,要求在最短的时间内对鲜活农产品进行运输、配送及销售整个完整的过程,最终直接送到消费者手中,因此对农产品物流配送环节的研究也至关重要。针对农产品物流配送研究程度的要求越来越深入,分析鲜活农产品物流配送过程中产生的以往大量的历史数据,采用数据挖掘中的技术对农产品物流配送进行优化,选取农产品物流配送相关影响因素,利用数据挖掘技术中的分类方法对农产品物流配送的以往大量历史数据进行分析,得出农产品物流配送关联分类规则,进而应用于农产品物流配送中,据此得到农产品物流配送新策略,起到改进农产品物流配送经济效益的作用。

2农产品物流配送因素获取

2.1数据选取

笔者选取安徽省合肥市一段时间内的各区域的农产品物流配送情况作为实际研究案例,以此段时期内的农产品产量、农产品产值、非农业人口数、农业中间消耗合计、生产服务支出等数据作为研究对象,数据来源于安徽省合肥市统计年鉴。具体分析合肥市四区(瑶海区、庐阳区、蜀山区、包河区)、四县(长丰县、肥西县、肥东县、庐江县)、一市(巢湖市)在2011年到2015年期间的所有区域农产品物流配送情况,以期得出相应的农产品物流配送规则,应用后起到改进农产品物流配送效益的作用。

2.2因素选取

农产品物流配送需要解决的问题是如何改进农产品物流配送效益,本文中具体为如何提高农产品物流配送过程中产生的社会消费品零售总额。文章先通过贝叶斯网络中的TAN分类器分析农产品物流配送过程中各属性与社会消费品零售总额之间的相互概率,再通过关联规则GRI算法得到农产品物流配送的可能规则加入规则集中,其中选取支持度与置信度均高的规则应用于以后可能的农产品物流配送情况,如此可得到高支持度和高置信度的规则,为未来应用此农产品物流配送规则提供保障性。农产品物流配送关联分类规则本就不具备绝对的准确性,如此应用关联分类规则中的GRI算法中的支持度和置信度,只是尽最大可能提高农产品物流配送关联分类规则的应用可能性。在农产品物流配送众多的影响因素中,有些因素对农产品物流配送是随机性的,并无规律可循,也无直接的意义,所以并不列入因素选取范围,然而针对一些对农产品物流配送过程中起到重要影响的因素要加以分析,确定是否列入选取因素。本文选取的因素介绍如下:年份、区域、谷物产量、蔬菜产量、瓜果类产量、谷物及其他作物总产值、蔬菜(含菜用瓜)总产值、水果(含果用瓜)总产值、非农业人口数、农业中间消耗合计、物质消耗、生产服务支出等。

3农产品物流配送关联分类过程

此次农产品物流配送分析过程应用数据挖掘中的TAN分类器及GRI算法两种方法,对农产品物流配送的以往大量历史数据进行分析。3.1TAN分类器过程TAN分类器过程具体的分类方法如下:(1)通过训练集计算每一对属性之间的条件互信息,IXi,Xj()|C,i≠j,IXi;Xj()|C=∑xi,xj,cPxi,xj()|c•logPxi,xj()|cPxi()|cPxj()|c(2)构造最大加权生成树。遵照选择的边不能构成回路的原则,按照边的权重由大到小的顺序选择边,构成最大权重跨度树。(3)给定任意未知类别的实例xi1,xi2(,…,x)in,根据贝叶斯公式,计算后验概率P(cj|xi1,xi2,…,xin),选择使后验概率最大的类标签c*:c*=argmaxcj∈CP(xi1,xi2,…,xin|cj)×P(cj)P(xi1,xi2,…,xin)=argmaxcj∈CP(xi1,xi2,…,xin|cj)×P(cj)=argmaxcj∈CP(cj)×∏nk=1P(xik|∏xik)3.2GRI算法过程将该过程用程序形式描述会更清晰。程序描述如下:Fori=1tom//循环m个后项Forj=1toC(Yi)//循环第i个后项Yi的C(Yi)个类别Fork=1ton//循环第i个后项Yi的第j个类别的n个前项IfXk类型=分类型ThenS=C(Xk)EndIf//Xk为分类型则分为C(Xk)组IfXk类型=数值型ThenS=2EndIf//Xk为数值型则分为两组Fori=1toSIfJ-值大于相同输出下J-值的最大值,或规则数目小于指定生成的规则数且支持度和置信度均大于阙值Then生成一条推理规则EndIfEndForEndForEndForEndForGRI算法最终生成关联规则。通过应用TAN分类器及GRI算法两种方法后得到农产品物流配送关联分类规则,进而应用于农产品物流配送中,据此得到农产品物流配送新策略,起到改进农产品物流配送经济效益的作用。

4农产品物流配送数据挖掘

4.1初始参数选取合肥市一段时间内的农产品物流配送情况作为实际研究案例,应用数据选取原理于该实际案例中,得到与此次数据挖掘密切相关的信息数据表,其内容包括如下:年份、区域、谷物产量、蔬菜产量、瓜果类产量、谷物及其他作物总产值、蔬菜(含菜用瓜)总产值、水果(含果用瓜)总产值、非农业人口数、农业中间消耗合计、物质消耗、生产服务支出等信息。4.2数据分析应用数据挖掘技术中的贝叶斯网络和GRI算法两种方法,分析表1中的2011年到2015年期间的安徽省合肥市所有区域鲜活农产品物流配送相关数据。完整的Clementine中的农产品物流配送模型如图2所示,具体执行该农产品物流配送模型是通过对各项因素数据类型的确立,进而实现数据流的运行进行数据分析的。

5农产品物流配送仿真验证

结合上述农产品物流配送模型获取得到的关联分类规则,对合肥市四区四县一市中非农业人口数进行分析,得出2011-2015年安徽省合肥市生鲜农产品需求集中在以下四个区:瑶海区、庐阳区、蜀山区和包河区。同理,对合肥市四区四县一市鲜活农产品中涉及的谷物产量、蔬菜产量、瓜果类产量进行分析,得出2011-2015年合肥市鲜活农产品供给庐江县成为谷物供给的主要来源,肥东县成为蔬菜供给的主要来源,长丰县成为瓜果类供给的主要来源。从此可以得出合肥市各区县市鲜活农产品供需的空间布局是不平衡的,说明合肥市整体鲜活农产品物流配送发展水平并不高。即整个配送系统效率不高,配送服务质量较低,说明合肥市鲜活农产品物流配送有优化的必要。

6结论

对合肥市四区四县一市各个区域分别进行鲜活农产品物流配送情况统计分析,原农产品物流配送策略相对效率不高,运用数据挖掘技术中的分类方法进行分析,得到农产品物流配送模型关联分类规则后并加以应用。最终得出结论大致如下:合肥市蜀山区与瑶海区谷物、瓜果的产量远远不能满足自身的需求量,需要分别从庐江县进行谷物配送调度,长丰县进行瓜果配送调度,进而满足各区域的农产品配送调度,最终成为合肥市配送效率相对较高的区域。针对合肥市农产品物流配送问题的研究,发现运用数据挖掘技术后得到的农产品物流配送新策略可以更加便于各区域的谷物、蔬菜、瓜果类产量与销量之间的平衡调度,避免某一区域农产品的产量过剩浪费或需求量不足缺失导致的不利后果,能更有效的进行农产品物流配送调度,可基于此农产品物流配送关联分类规则得出的结论,进一步进行农产品产销平衡问题的深入研究。

参考文献:

[1]何有世,马腾飞.B2C环境下生鲜农产品物流配送路径优化研究[J].商业经济研究,2017(5):93-95.

[2]罗庆,周军.基于混合遗传算法的农产品物流配送路径优化[J].江苏农业科学,2017,45(12):174-177.

[3]范立南,董冬艳,李佳洋,刘闯,丁宇.基于生鲜农产品的冷链物流配送路径优化[J].沈阳大学学报(自然科学版),2017,29(2):125-131.

[4]孙明明,张辰彦,林国龙,丁一.生鲜农产品冷链物流配送问题及其路径优化[J].江苏农业科学,2017,45(1):282-285.

[5]张逊逊,许宏科,于加晴.融合PM2.5排放量和运输路程的区域农产品配送路径决策[J].长安大学学报(自然科学版),2017,37(2):99-106.

[6]PAmorim,BAlmada-Lobo.Theimpactoffoodperishabilityissuesinthevehicleroutingproblem[J].Computers&Indus-trialEngineering.2014,67(1):223-233.

[7]CanhongLin,KL.Choy,G.T.S.HO,S.H.Chung,H.Y.Larn.Surveyofgreenvehicleroutingproblem:pastandfuturetrends[J].ExpertSystemswithApplications,2014,41(4):1118-1138.

[8]Yong-YuKwon,Yong-JaeChoi,DongHoLee.Heterogeneousfixedfleetvehicleroutingconsideringcarbonemission[J].TransportationResearchPartD:TransportandEnvironment,2013,23:81-89.

[9]JohamVisser,ToshiuoriNemoto,MichaneBrownt.Homekeliveryandtheimpactsonurbanfreighttransport:Areview[J].Procedia–SocialandBehavioralSciences,2014,125(6):15-27.

作者:杨露 赵伶珊 庄小云 单位:安徽新华学院物流工程系