公务员期刊网 论文中心 数据挖掘论文范文

数据挖掘论文全文(5篇)

数据挖掘论文

第1篇:数据挖掘论文范文

首先,提高财务信息的利用能力。传统财务数据查询主要面向应用,属于一种支持日常操作的事务处理,没有分析所查询的数据信息的能力,决策者也无法在分析大量历史数据的基础上多维度的比较、分析某个主题的相关数据。而财务分析中应用数据挖掘技术体现出序列导向及多维度的特点,从而有效提高财务信息的应用能力。其次,解决财务信息的噪声问题。网络环境下,企业可以方便、快捷的获取企业内部信息、各关联方及外部信息,这个过程中难免会出现信息过量的问题,如何迅速从海量信息中获取对决策有用的信息成为各决策者及管理者面临的重要问题。这种情况下,数据挖掘技术可以在海量信息中分辨、挖掘出对财务决策有用的信息,最大程度上减少信息噪声的影响。最后,提高财务分析的智能化水平。决策本身体现出动态性、复杂性、多样性的特点,而决策者本身的综合素质也会对决策的准确性产生影响,因此同一种情况可能产生不同的决策结果。随着数据量的不断增加,传统依靠程序人员设计专用程序查询数据的方法已经相对滞后,决策者需要更加智能化的信息分析方法,数据挖掘技术便可满足这一要求,其利用现有数据获取新的、有用的信息,并对信息的查询、存储过程预以优化,体现出强大的自我学习功能,从而最大程度上满足财务信息分析智能化的要求。

二、数据挖掘技术在财务分析中的应用

财务分析的主要目的是改善经营管理,提高企业的经济效益,其主要目的是保证会计信息资料的正确可靠性,以保证企业财产的安全性、完整性。比如某生态园林企业需要投入大量资金完善生产基础设施,并保证现场作业的有序,如有必要还要投资于企业产品周边附属产业的发展,因此财务决策的重要性不言而喻,而在财务决策中应用数据挖掘技术十分必要。财务分析中应用数据挖掘的基本流程包括问题识别、数据准备、数据开采及结果表达与解释等四个步骤,图1可将财务分析数据挖掘的过程直观的表达出来:

(一)问题识别

典型的财务决策包括投资决策、筹资决策、成本决策、销售决策等,企业要进行财务分析前必须识别决策问题,明确需要达到的决策目标等,再将决策目标转换为数据挖掘的目标,最后进行准确的数据定义。如企业需要投资企业产品周边附属产业,则需要利用数据挖掘技术明确以下问题:

(1)企业经营中可随时支配的资金额度,需要财务人员建立数据库模型,将可用于投资的资金情况准确、详细的计算出来;

(2)编制投资方案,即与本企业实际情况相结合,考虑具体投资计划,并对投资方案的可操作性进行分析,比如上述园林生态企业需要投资进口园林机械的项目,就需要在投资前对该项目的大小做出合理评估,了解该品牌园林机械在国际市场的占有份额、品质、成本及销售价格等信息;

(3)投资收益分析,投资的主要目的是获得更高收益,因此在数据挖掘过程中,问题识别时必须做出可靠的收益预算。

(二)数据准备

在完成问题识别后,需要根据不同的需求、从相关数据库信息中选择适用的数据信息,即进行数据准备,该过程需要收集大量与企业财务分析相关的数据信息,以保证数据挖掘的真实性、客观性,比如花卉市场分布信息、装饰装潢市场信息、园林设计与市场销售等信息。通常情况下,数据准备又可分为数据集成、数据选择及数据预处理等三个步骤,其中数据集成是把多数据库运行环境中的数据进行合并处理,去除信息噪声,剔除虚假数据;而数据选择则是分辨需要分析的数据集合,进一步缩小数据处理的范围,提高数据质量,从而保证数据挖掘的有效性;数据预处理的主要目的是解决数据挖掘工具局限性的问题。

(三)数据挖掘

当上述准备工作完成后即可进行深入的数据挖掘处理,挖掘过程中需要注意,必须以财务分析核心思想为指导,明确数据挖掘的目的性,数据挖掘的主要内容包括:选择合适的挖掘工具、具体的挖掘操作及证实发现的知识等,其中选择合适的挖掘工具至关重要,限于篇幅此处对神经网络及决策树两种方法进行简单介绍。神经网络是以自学习数学模型为基础的,利用该方法可以很容易的解决具有上百个参数的问题,为高复杂度的问题提供一种相对简单的方法;视经网络既可以表现为有指导的学习,也可以是无指导聚类,不过输入神经网络中的值均为数值型的。实际应用中通常采用该方法进行财务预警分析。决策树法是现阶段应用最广泛的归纳推理算法之一,其提供了一种展示在何种条件下会获得对应值的规则的方法,是一种简单的知识表示方法,在数据挖掘过程中,决策树法主要用于数据挖掘的分类。

(四)结果表达

结果表达即是在处理数据库信息的基础上客观的表达出数据挖掘的结果,以为企业财务分析提供可靠依据。可以说结果表达是数据挖掘的成果展示,其所表达的是最有价值的信息,如结果表达所提供的信息达不到决策的要求,则可重复挖掘过程,直至决策者满意为止。

三、结语

第2篇:数据挖掘论文范文

1.1数据挖掘技术概述

发现的是用户感兴趣的知识;发现的知识应当能够被接受、理解和运用。也就是发现全部相对的知识,是具有特定前提与条件,面向既定领域的,同时还容易被用户接受。数据挖掘属于一种新型的商业信息处理技术,其特点为抽取、转化、分析商业数据库中的大规模业务数据,从中获得有价值的商业数据。简单来说,其实数据挖掘是一种对数据进行深入分析的方法。因此,可以描述数据挖掘为:根据企业设定的工作目标,探索与分析企业大量数据,充分揭示隐藏的、未知的规律性,并且将其转变为科学的方法。数据挖掘发现的最常见知识包括:

1.1.1广义知识体现相同事物共同性质的知识,是指类别特点的概括描述知识。按照数据的微观特点对其表征的、具有普遍性的、极高概念层次的知识积极发现,是对数据的高度精炼与抽象。发现广义知识的方法与技术有很多,例如数据立方体和归约等。

1.1.2关联知识体现一个事件与其他事件之间形成的关联知识。假如两项或者更多项之间形成关联,则其中一项的属性数值就能够借助其他属性数值实行预测。

1.1.3分类知识体现相同事物共同特点的属性知识与不同事物之间差异特点知识。

1.2数据挖掘过程

1.2.1明确业务对象对业务问题清楚定义,了解数据挖掘的第一步是数据挖掘目的。挖掘结果是无法预测的,但是研究的问题是可预见的,仅为了数据挖掘而数据挖掘一般会体现出盲目性,通常也不会获得成功。基于用户特征的电子商务数据挖掘研究刘芬(惠州商贸旅游高级职业技术学校,广东惠州516025)摘要:随着互联网的出现,全球范围内电子商务正在迅速普及与发展,在这样的环境下,电子商务数据挖掘技术应运而生。电子商务数据挖掘技术是近几年来数据挖掘领域中的研究热点,基于用户特征的电子商务数据挖掘技术研究将会解决大量现实问题,为企业确定目标市场、完善决策、获得最大竞争优势,其应用前景广阔,促使电子商务企业更具有竞争力。主要分析了电子商务内容、数据挖掘技术和过程、用户细分理论,以及基于用户特征的电子商务数据挖掘。

1.2.2数据准备第一选择数据:是按照用户的挖掘目标,对全部业务内外部数据信息积极搜索,从数据源中获取和挖掘有关数据。第二预处理数据:加工选取的数据,具体对数据的完整性和一致性积极检查,并且处理数据中的噪音,找出计算机丢失的数据,清除重复记录,转化数据类型等。假如数据仓库是数据挖掘的对象,则在产生数据库过程中已经形成了数据预处理。

1.2.3变换数据转换数据为一个分析模型。这一分析模型是相对于挖掘算法构建的。构建一个与挖掘算法适合的分析模型是数据挖掘获得成功的重点。可以利用投影数据库的相关操作对数据维度有效降低,进一步减少数据挖掘过程中数据量,提升挖掘算法效率。

1.2.4挖掘数据挖掘获得的经济转化的数据。除了对选择科学挖掘算法积极完善之外,其余全部工作都自行完成。整体挖掘过程都是相互的,也就是用户对某些挖掘参数能够积极控制。

1.2.5评价挖掘结果这个过程划分为两个步骤:表达结果和评价结果。第一表达结果:用户能够理解数据挖掘得到的模式,可以通过可视化数据促使用户对挖掘结果积极理解。第二评价结果:用户与机器对数据挖掘获得的模式有效评价,对冗余或者无关的模式及时删除。假如用户不满意挖掘模式,可以重新挑选数据和挖掘算法对挖掘过程科学执行,直到获得用户满意为止。

2用户细分理论

用户细分是指按照不同用户的属性划分用户集合。目前学术界和企业界一般接受的是基于用户价值的细分理论,其不仅包含了用户为企业贡献历史利润,还包含未来利润,也就是在未来用户为企业可能带来的利润总和。基于用户价值的细分理论选择客户当前价值与客户潜在价值两个因素评价用户。用户当前价值是指截止到目前用户对企业贡献的总体价值;用户潜在价值是指未来用户可能为企业创造的价值总和。每个因素还能够划分为两个高低档次,进一步产生一个二维的矩阵,把用户划分为4组,价值用户、次价值用户、潜在价值用户、低价值用户。企业在推广过程中根据不同用户应当形成对应的方法,投入不同的资源。很明显对于企业来说价值用户最重要,被认为是企业的玉质用户;其次是次价值用户,被认为是金质用户,虽然数量有限,却为企业创造了绝大部分的利润;其他则是低价值用户,对企业来说价值最小,成为铅质用户,另外一类则是潜在价值用户。虽然这两类用户拥有较多的数量,但是为企业创造的价值有限,甚至很小。需要我们注意的是潜在价值用户利用再造用户关系,将来极有可能变成价值用户。从长期分析,潜在价值用户可以是企业的隐形财富,是企业获得利润的基础。将采用数据挖掘方法对这4类用户特点有效挖掘。

3电子商务数据挖掘分析

3.1设计问卷

研究的关键是电子商务用户特征的数据挖掘,具体包含了价值用户特征、次价值用户特征、潜在价值用户特征,对电子商务用户的认知度、用户的需求度分析。问卷内容包括3部分:其一是为被调查者介绍电子商务的概念与背景;其二是具体调查被调查对象的个人信息,包含了性别、年龄、学历、感情情况、职业、工作、生活地点、收入、上网购物经历;其三是问卷主要部分,是对用户对电子商务的了解、需求、使用情况的指标设计。

3.2调查方式

本次调查的问卷主体是电脑上网的人群,采用随机抽象的方式进行网上访问。一方面采用大众聊天工具,利用电子邮件和留言的方式发放问卷,另一方面在大众论坛上邀请其填写问卷。

3.3数据挖掘和结果

(1)选择数据挖掘的算法利用Clementine数据挖掘软件,采用C5.O算法挖掘预处理之后数据。

(2)用户数据分析

1)电子商务用户认知度分析按照调查问卷的问题“您知道电子商务吗?”得到对电子商务用户认知情况的统计,十分了解20.4%,了解30.1%,听过但不了解具体使用方法40.3%,从未听过8.9%。很多人仅听过电子商务,但是并不清楚具体的功能与应用方法,甚至有一小部分人没有听过电子商务。对调查问卷问题“您听过电子商务的渠道是什么?”,大部分用户是利用网了解电子商务的,占40.2%;仅有76人是利用纸质报刊杂志上知道电子商务的并且对其进行应用;这也表明相较于网络宣传纸质媒体推广电子商务的方法缺乏有效性。

2)电子商务用户需求用户希求具体是指使用产品服务人员对应用产品或服务形成的需求或者期望。按照问题“假如你曾经使用电子商务,你觉得其用途怎样,假如没有使用过,你觉得其对自己有用吗?”得到了认为需要和十分需要的数据,觉得电子商务有用的用户为40.7%,不清楚是否对自己有用的用户为56.7%,认为不需要的仅有2.4%。

3)电子商务用户应用意愿应用意愿是指消费者对某一产品服务进行应用或者购买的一种心理欲望。按照问题“假如可以满足你所关心的因素,未来你会继续应用电子商务吗?”获得的数据可知,在满足各种因素时,将来一年之内会应用电子商务的用户为78.2%,一定不会应用电子商务的用户为1.4%。表明用户形成了较为强烈的应用电子商务欲望,电子商务发展前景很好。基于用户特征的电子商务数据研究,电子商务企业通过这一结果能够更好地实行营销和推广,对潜在用户积极定位,提高用户体验,积极挖掘用户价值。分析为企业准确营销和推广企业提供了一个有效的借鉴。

4结语

第3篇:数据挖掘论文范文

(1)确定业务对象:做好业务对象的明确是数据域挖掘的首要步骤,挖掘的最后结构是不可预测的,但是探索的问题必须是有预见的,明确业务对象可以避免数据挖掘的盲目性,从而大大提高成功率。

(2)数据准备:首先,对于业务目标相关的内部和外部数据信息进行查找,从中找出可以用于数据挖掘的信息;其次,要对数据信息的内容进行全面细致分析,确定需要进行挖掘操作的类型;然后,结合相应的挖掘算法,将数据转化称为相应的分析模型,以保证数据挖掘的顺利进行。

(3)数据挖掘:在对数据进行转化后,就可以结合相应的挖掘算法,自动完成相应的数据分析工作。

(4)结果分析:对得到的数据分析结果进行评价,结合数据挖掘操作明确分析方法,一般情况下,会用到可视化技术。

(5)知识同化:对分析得到的数据信息进行整理,统一到业务信息系统的组成结构中。这个步骤不一定能够一次完成,而且其中部分步骤可能需要重复进行。

二、数据挖掘技术在水利工程管理中的实施要点

水利工程在经济和社会发展中是非常重要的基础设施,做好水利工程管理工作,确保其功能的有效发挥,是相关管理人员需要重点考虑的问题。最近几年,随着社会经济的飞速发展,水利工程项目的数量和规模不断扩大,产生的水利科学数据也在不断增加,这些数据虽然繁琐,但是在许多科研生产活动和日常生活中都是不可或缺的。例如,在对洪涝、干旱的预防以及对生态环境问题的处理方面,获取完整的水利科学数据是首要任务。那么,针对日益繁杂的海量水利科学数据,如何对有用的信息知识进行提取呢?数据挖掘技术的应用有效的解决了这个问题,可以从海量的数据信息中,挖掘出潜在的、有利用价值的知识,为相关决策提供必要的支持。

1.强化数据库建设

要想对各类数据进行科学有效的收集和整理,就必须建立合理完善的数据库。对于水利工程而言,应该建立分类数据库,如水文、河道河情、水量调度、防洪、汛情等,确保数据的合理性、全面性和准确性,选择合适的方法,对有用数据进行挖掘。

2.合理选择数据挖掘算法

(1)关联规则挖掘算法:关联规则挖掘问题最早提出于1993年,在当前数据挖掘领域,从事务数据库中发现关联规则,已经成为一个极其重要的研究课题。关联规则挖掘的主要目的,是寻找和挖掘隐藏在各种数据之间的相互关系,通过量化的数据,来描述事务A的出现对于事务B出现可能产生的影响,关联规则挖掘就是给定一组Item以及相应的记录组合,通过对记录组合的分析,推导出Item间存在的相关性。当前对于关联规则的描述,一般是利用支持度和置信度,支出度是指产品集A、B同时出现的概率,置信度则是在事务集A出现的前提下,B出现的概率。通过相应的关联分析,可以得出事务A、B同时出现的简单规则,以及每一条规则的支持度和置信度,支持度高则表明规则被经常使用,置信度高则表明规则相对可靠,通过关联分析,可以明确事务A、B的关联程度,决定两种事务同时出现的情况。

(2)自顶而下频繁项挖掘算法:对于长频繁项,如果采用关联规则挖掘算法,需要进行大量的计算分析,不仅耗时耗力,而且影响计算的精准度,这时,就可以采用自顶而下频繁项挖掘算法,这种算法是一种相对优秀的长频繁项挖掘算法,利用了事务项目关联信息表、项目约简、关键项目以及投影数据库等新概念与投影、约简等新方法,在对候选集进行生成的过程中,应该对重复分支进行及时修剪,提升算法的实际效率,从而有效解决了长频繁项的挖掘问题。结合计算机实验以及算法分析,可以看出,这种方法是相对完善的,同时也是十分有效的。不过需要注意的是,当支持度较大、频繁项相对较短时,利用关联规则挖掘中典型的Apriori方法,可以起到更好的效果。

(3)频繁项双向挖掘算法:这种算法是一种融合了自顶向下以及自底向上的双向挖掘算法,可以较好的解决长频繁项以及段频繁项的挖掘问题,主挖掘方向是利用自顶向下挖掘策略,但是结合自底向上方法生成的非频繁项集,可以对候选集进行及时修剪,提升算法的实际效率。

三、结语

第4篇:数据挖掘论文范文

现有的医院数据挖掘主要是从两个方面进行的,一个是从功能的角度,而另一个是从数据对象的角度进行的。

(一)从功能角度

常用的数据挖掘可以分为统计分析、知识发现、和其他的数据挖掘技术这三类。

1.统计分析

统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。在医疗数据挖掘中的应用中,可对病人的各种医学影像进行自动分析、对在院病人的监护数据进行统计分析、分析中医诊断和方剂、疾病危险成因的研究等。

2.知识发现

它是一种间接地从数据中提取信息的方法,而且这些信息并不是直观展现的。如通过关联分析的方式来分析药物治疗的效果和预测手术术后的情况,可以分析某种疾病的发病因素,从而指导病人如何加强对该疾病的预防。可以通过患者的各项生化结果进行分析,从结果的相互关系中得出比较准确的预防与治疗方案。

3.其他类型

随着互联网、数据库等技术的发展,还出现了一些其他数据挖掘技术。如文本挖掘技术、Web挖掘技术、分类分析技术、分布式数据挖掘技术等。

(二)从数据对象的角度

按照不同的数据类型,数据挖掘通过时间序列、空间、文本、等方面进行挖掘。如从时间的角度,对医院门诊及住院患者的数量进行预测以判断病人的变化量是季节性的还是因为其他原因。

(三)从应用层面的角度

医院的数据挖掘可分为诊疗信息挖掘和管理信息挖掘。

1.诊疗信息挖掘

诊疗信息挖掘主要目的是通过对患者在医院当中的诊疗信息进行分析,从而建立起对患者有针对性的诊疗方案。如通过对慢性病人长期的住院信息,我们可以分析出病人的发病周期,分析其发病规律,从而做出有效的预防诊疗方案。

2.管理信息挖掘:

(1)财务管理

通过对病人费用的分析,我们可以得出病人各项费用的组成比例,从而分析各个科室内各种病人的费用组成,从而能针对性的控制各个科室的费用比例。使医院管理部门能有效的控制医疗费用。通过对不同时期的费用进行对比分析,可以按不同时间对各个科室的各种费用进行对比分析,并通过可视化技术,直观的展现出其变化趋势,从而使得医院的管理者能直观的看到医院的历史变化,帮助其对医院的长期发展做出一定的判断。通过数据挖掘对医院内部的各种物资设备,资产负债进行汇总,从而对医院的盈利、负债状况进行分析,以便医院管理者能真正把握医院的经营状况,能正确的对医院的经营成本进行全面分析。以便把握医院的真实情况,从而提高医院的经济效益。例如:通过对医院资金的运行情况进行分析,可以有效的了解医院资金的流向及医院当前的财务状况,从而规避一些医院的运营风险。通过数据挖掘对各类医保病人的分析,可以有效掌握各类医保病人的构成,及医保资金的运行情况。通过分析病人的收治人数及住院天数,并结合医保资金的使用进度。可以在医保费用定额的情况下,更好的指导医院各个科室,收治各类医保病人,提供更好的医疗服务。

(2)医疗质量管理

如利用数据挖掘技术对住院患者的各项住院数据进行分析,如住院天数、质量费用、诊疗方案等,从而为医院的质量管理通过方案,缩短病人的住院时间,减少病人的住院费用。通过总结灭菌工作与消毒效果的规律,加强对手术室感染工作的管理。通过对手术室及各科室无菌物品及消毒器械的使用进行动态监测从而掌握并加强手术室及各科室的院感管理。通过对医院信息管理系统中各科室的药品用量,用时间序列的方式进行分析,从而得出各科室的药品用量消耗趋势,并进一步指导科室用药,为临床科研提供更多有价值的资料。通过数据挖掘能够有效地对抗生素的使用进行有效的管理,并通过对病人使用过程中相关信息的采集,提前、分析。对抗生素的耐药性、用量及治疗效果能有一个动态的实时监控,从而有效的监测抗生素的使用情况。

(3)医院经营目标管理

通过对住院患者的职业、性别、年龄、地区等分布情况进行分析,可以得到不同类型患者的医疗需求类型,经济状况等信息,掌握患者差异对医院收入的影响。从而能针对行的采取措施来提供服务质量,增加门诊及住院量。再比如通过分析门诊病人的就诊流程的时间及住院患者从入院到出院的各个就医环节的时间分布。分析出患者的就医瓶颈,掌握影响患者诊疗效率的因素,以便能针对这些因素采取措施来帮助医院管理者进行业务流程的更新和改进,提高患者的就诊效率。

(4)经营决策管理

通过对患者的季节性分布进行分析,来预测未来时期门诊及住院的人次。从而使医院管理者能有效的分配医院资源,有针对性的改善医院诊疗服务项目。实现对医院人员、设施的合理配置。

(5)医院资源管理

充分利用数据挖掘技术对医院各个科室的各项数据进行综合分析,从而制定出针对各科室的各种合理指标。并从中分析出各科室的薄弱环节,并采取相应的措施,以提高科室的综合水平。在采购医疗设备并投入使用后,可对其使用情况及效果进行分析,实现对医疗设备从采购到报废的全程决策支持,使医院医疗设备的全部使用周期都能被管理者统筹管理,从而较好的解决医疗设备效益、代价、风险等互相制约的管理难题,充分发挥医疗设备的社会效益和经济效益。

二、结论

第5篇:数据挖掘论文范文

1.1安全技术资金不足

煤炭的持续开采会受到地质条件的直接影响,过去国家投入众多的设施,使用至今均已出现老化,并且维修量非常大。随着矿井的不断延深,矿压极度强化,巷道的维修任务更是不断的增加,矿井的供电以及通风、提升与排水等都不能适应生产的需要。

1.2安全管理模式传统

与西方发达产煤国家相比较,我国的煤矿使用技术研究起步很晚。并且人力、财力非常缺乏,某些重大的安全技术问题,比如冲击地压以及煤和瓦斯的突出、地热以及突水等灾害不能进行有效的预测和控制。且受到以往传统运营思想的直接作用与影响以及各个企业的经济实力的约束,我国的煤矿生产装备和安全监控设施相对落后。井巷的断面设计以及支护强度的确定、支护材料的型号选择较小。生产设施功率以及矿井的供风量等富余参数非常低,极易出现事故。绝大多数的煤炭企业还是利用以往传统的安全管理模式,各种报表计算仍是靠人工劳动并且精确度很低。信息传送的时间较长,且速度较慢,管理者的工作重复性很大,资料查询十分困难,并且工作效率很低。安全检查以及等级鉴定等总是凭借主观意念以及相关的经验。

1.3安全信息管理体制不健全

安全信息可以说是安全管理工作的重要依据,它主要包括事故和职业伤害的有效记录与分析统计,职业的安全卫生设施的相关研究与设计、生产以及检验技术,法律法规以及相应技术标准和其变化的动态,教育培训以及宣传和社会活动,国内的新型技术动态以及隐患评估与技术经济类分析和咨询、决策的体系。信息体制的健全是安全体制工程以及计算机技术的有效结合,可促使安全工作转型为定性和定量的超前预测,不过大多数矿井还是处于起步与摸索阶段,并未呈现出健全的体制,真正的使用还有待进一步的发展。

2空间数据挖掘技术

数据挖掘研究行业的持续进展,开始由起初的关系数据以及事务数据挖掘,发展至对空间数据库的不断挖掘。空间的信息还在逐渐地呈现各类信息体制的主体与基础。空间数据挖掘技术是一项非常关键的数据,具有比普通关系数据库和事务数据库更丰富、复杂的相关语义信息,且蕴含了更丰富的知识。所以,虽说数据的挖掘最初是出现在关系数据挖掘以及事务的数据库,不过因为空间数据库中的发掘知识,这就很快引起了各个研究者的关注与重视。很多的数据挖掘类研究工作都是从关系型以及事务型数据库拓展至空间数据库的。在地学领域中,随着卫星以及遥感技术的不断使用,逐渐丰富的空间以及非空间的数据采集与储存在较大空间数据库中,大量的地理数据已经算是超过了人们的处理能力,并且传统的地学分析很难在这些数据中萃取并发现地学知识,这也就给现阶段的GIS带来了很大的挑战,急切的需要强化GIS相应的分析功能,提升GIS处理地学实际状况的能力。数据挖掘以及知识发现的产生能满足地球空间的数据处理要求,并推进了传统地学空间分析的不断发展。依据地学空间数据挖掘技术的特性,把数据挖掘的方式融进GIS技术中,呈现地学空间数据挖掘技术和知识发展的新地学数据分析理念与依据。

3煤矿安全管理水平的提升

3.1建设评价指标体制库

评价指标体制库是矿井的自然灾害危害存在的具体参数式的知识库。模型的组建务必要根据矿井的瓦斯以及水害等自然灾害危害呈现的不同指标体制和其临界值构建一定的指标体制库,危害的警报识别参数关键是采掘工程的平面图动态开采面以及相应的巷道。各种瓦斯的危害以及水害隐患和通风隐患均呈现一定的评价指标库。

3.2构建专业的分析模型库

依据瓦斯以及水害等诸多不同的矿井自然灾害类别构建相关的专业性模型库,比如瓦斯的灾害预测,应根据矿井的地质条件以及煤层所赋存的状况构建瓦斯的地质区分图,再根据采掘工程的平面图动态呈现的采掘信息以及相应的瓦斯分区构建关联并实行相应的比较分析,确定可以采集区域未来的可采区域是不是高瓦斯区域。

3.3构建以GIS空间分析为基础的方法库

GIS空间分析可以说是矿井自然灾害的隐患高度识别的关键性方式,并且还是安全故障警报的主要路径。比如断层的防水层的有效划分,关键是根据断层的保安煤柱来实行可靠的确定。断层的保安煤柱确定可以利用GIS缓冲区域的分析得到。空间的统计分析以及多源信息有效拟合和数据挖掘亦是瓦斯和水害等安全隐患监测经常使用GIS空间分析方式,如物探水文的异常区域确定以及瓦斯突出相应的危险区域确定。

3.4决策支持体制与煤矿管理水平评价指标

体制库以及模型库、方式库与图形库均是矿井的自然灾害隐患识别和决策的最基础。利用矿井的自然灾害隐患识别决策来支持体系具体的功能呈现矿井的自然灾害隐患识别以及决策分析,在根源处提高煤矿的安全管理水平。分类构建矿井的自然灾害实时监控体系,进行动态跟踪相应的灾害实时数据,并事实呈现矿井的自然灾害数据或是信息和自然灾害的指标体系库以及模型库与知识库、空间数据库的合理化比较,并运用图形库的数据再通过GIS空间分析方式来确定安全隐患的,矿井自然灾害的隐患实时警报并进行决策分析,以提交空间数据的自然灾害隐患识别以及分析处理的决策性报告。

4结语