公务员期刊网 论文中心 正文

数据挖掘关键技术分析

数据挖掘关键技术分析

摘要:本文主要探讨将数据挖掘技术研究,对海量数据进行挖掘和分析,运用数据可视化将数据进行分类整理。运用数据挖掘的算法:C4.5、K-Means、Apriori、EM、PageRank等算法对数据进行整理。并将该算法运用到管理方面,充分利用数据挖掘技术在数据分析方面的强大功能来对管理系统中的海量数据进行分析,发现数据背后的问题和规律从而为管理服务,并不断完善管理信息系统中的数据分析功能。以便对各类数据展开深入分析,从中获取有价值的信息,为改革发展提供数据层面的决策分析支持。

关键词:数据挖掘;大数据;数据聚类;海量数据

一、引言

关于数据挖掘(datamining,DM)的具体定义常常取决定义者的观点、背景以及定义的分析角度。本文主要探讨将数据挖掘技术研究,对海量数据进行挖掘和分析,运用数据可视化将数据进行分类整理。运用数据挖掘的算法:C4.5、K-Means、Apriori、EM、PageRank等算法对数据进行整理。将C4.5、K-Means、Apriori、EM、PageRank等算法运用到管理方面,充分利用数据挖掘技术在数据分析方面的强大功能来对管理系统中的海量数据进行分析,发现数据背后的问题和规律从而为管理服务,并不断完善管理信息系统中的数据分析功能。

二、数据挖掘基本过程

数据挖掘几个阶段如图1所示。

三、数据挖掘的分类

特征加权支持向量机由核函数经特征加权构造的支持向量机。并且特征加权核函数pK定义为:改进支持向量机SVM算法的详细步骤如下:Step2.所得指标参数对其相应的特征属性加权,构造加权的特征向量:()(1)()()(,,),(1,,)inRFGx=gxgxi=n来优化核函数中的原始特征内积。Step3.以p建立特征加权的核函数pK,构造待输入空间的线性变换矩阵()(())ip=diagRFGx。Step4.应用所构造的特征加权的核函数pK在程序设计中替换传统的支持向量机SVM模型中的线性核函数。通常,利用的技术越多,得出的结果精确性就越高,这主要是因为对某种技术不适合的问题,其他方法却可奏效。

四、结论

通过将数据挖掘技术研究,对海量数据进行挖掘和分析,运用数据可视化将数据进行分类整理。运用数据挖掘的算法:C4.5、K-Means、Apriori、EM、PageRank等算法对数据进行整理。并将该算法运用到管理方面,充分利用数据挖掘技术在数据分析方面的强大功能来对管理系统中的海量数据进行分析,发现数据背后的问题和规律从而为管理服务,并不断完善管理信息系统中的数据分析功能。

参考文献

[1]刘敏杰.教务管理系统安全维护策略[J].人力资源管理,2017(5):188-189.

[2]周莹.教务管理系统信息化的对策研究[J].无线互联科技,2017(9):124-125.

作者:李加庆 原士栋 单位:山东女子学院