公务员期刊网 论文中心 正文

软件工程数据挖掘技术应用分析

软件工程数据挖掘技术应用分析

摘要:数据挖掘是90年代初期出现的新型数据库技术,经过多年发展,现阶段,数据挖掘技术已经成为数据库研究主要分支,在软件工程中,利用数据挖掘技术,可以对软件运行轨迹、代码库、bug数据库、修改历史数据进行有效处理。本文首先对数据挖掘技术对于软件工程开发的重要作用做出阐述,然后说明数据挖掘技术运作流程、应用范围,最后结合实际情况,对数据挖掘技术在软件工程中的应用展开分析,希望可以对业内起到一定参考作用。

关键词:数据挖掘技术;软件工程;重要作用;应用分析

随着互联网技术、信息技术的迅速发展,现阶段,计算机数据存储能力、处理能力不断提升,应用计算机与信息技术管理数据信息已经成为各行各业信息管理的主要方式,与此同时,人们所面临的信息数据海洋也在迅速扩张。在信息爆炸时代中,如何在大量数据信息中提取有用信息、真实信息,会直接影响人们的工作效率与企业的生产效率。在此背景下,数据挖掘技术得到了社会各界的广泛关注,数据挖掘技术本身融合了人工智能技术、数据库技术、机器学习技术、知识工程技术、统计学技术以及信息检索技术、数据可计算技术,在软件工程中,通过对数据挖掘技术进行合理应用,可以有效提升数据信息处理效率,以为软件工程高质量开发奠定基础。

1数据挖掘技术对于软件工程开发的重要作用

数据挖掘技术对于软件工程开发的重要作用可以归纳为:(1)增强数据信息理解。在软件工程开发工作开展中,数据挖掘技术应用具有增强数据信息理解的重要作用,对于同一条信息而言,每个人都有着不同理解,如果利用人力方法开展数据采集工作、数据理解工作,那么就会让整体时间成本增加,对数据信息权威性造成不利影响,利用数据挖掘技术,可以对数据信息进行科学分类处理,让数据就权威性、准确性得到保证。(2)提高数据处理质量。应用数据挖掘技术,可以在短时间内多次筛选、处理无效数据、混乱数据,让数据处理质量、处理效率得到保证。和传统技术相比,数据挖掘技术还可以防止数据丢失情况产生,避免企业损失。(3)增强数据利用效率。应用数据挖掘技术,可以从多个角度分类、整理数据信息,让无用数据信息转化为可理解信息资源,以为企业商业决策工作有效开展提供帮助,以增强数据利用效率。

2数据挖掘技术的基本概述

2.1运作流程

数据挖掘,主要指的是从不完全、模糊、大量、随机数据中挖掘潜在、有价值、易被理解信息的过程。数据挖掘技术运作流程主要是利用计算机程序、综合算法进行复杂运算,在预处理数据信息后,开展数据挖掘工作,最后对信息进行收集、整合。在数据选择中,需使用具有强大运算后台的软件,以此来保证信息选择准确性、有效性;在数据预处理中,需要针对选择、收集原始数据信息,采用科学算法转码数据、识别数据,保证用户可以直接得到数据信息;在数据挖掘中,应利用软件智能算法以及计算机快速运算优势,采集处理数据信息,以在海量数据信息中得到真实数据、原始数据,在数据挖掘工作开展中,一方面,需要依照数据信息不同特点,选择科学挖掘算法,另一方面,需要对实际运行系统要求、用户要求,挖掘用户容易理解、描述性知识,或是用户想得到预测性、前瞻性知识;在模式评价和知识表示过程中,根据某种兴趣度量,可以对表示知识真正有趣模式予以识别,以完成模式评价工作,由特定领域用户、专家、领域标准可以得出度量具体数值,利用可视化技术可以转换结果为用户易接受形式,并提交给用户。值得注意的是,数据挖掘流程本身具有反复性特点,例如,在对数据信息进行清洗、准备过程中,就有可能在某数据源中发现挖掘数据不可用,或是数据信息来源于异构数据源,对此,需要开展预处理工作,通过反复挖掘提升数据信息充分性、准确性。

2.2应用范围

数据挖掘技术可以完成概念描述工作、关联分析工作、分类与预测工作、聚类分析工作、异类分析与检测工作、演化分析工作以及数据约简工作。现阶段,数据挖掘技术的应用具有面向实际特点,在电信领域、银行领域、医学领域、保险领域、交通领域中均得到了广泛应用,利用数据挖掘技术,可以完成数据库营销工作、背景分析工作、客户群体分类工作、市场交叉销售工作、客户关系管理工作等。如在银行领域中,利用数据挖掘技术就可以分析客户信誉度情况,避免信用卡欺诈问题产生;如在医学领域中,利用数据挖掘技术就可以完成医疗诊断工作。除此之外,数据挖掘技术还可以应用在农业领域、工业领域、互联网领域以及军事领域。

3数据挖掘技术在软件工程中的应用分析

3.1软件版本信息挖掘

在软件工程中,软件版本信息挖掘管理是关键工作内容,当前,几乎所有企业都会使用版本控制系统维护软件,保证团队成员得到一致代码。在大型软件开发团队中,软件版本信息管理具有复杂性,每次更新都有可能产生代码管理混乱问题。应用数据挖掘技术,可以有效挖掘软件变更历史信息,通过对比分析大量代码,可以对各个版本、模块之间内部联系予以确认,在保证代码融合效率基础上,可以避免漏洞问题产生。

3.2软件执行记录挖掘

利用数据挖掘技术挖掘软件执行记录,可以对程序进行全面分析,利用程序预定安装路径,可以挖掘运行数据信息,利用科学算法,可以对软件运行是否符合预期进行判断。在执行记录挖掘工作开展中,需要全面查询安装路径,逆向建模处理数据结构,以对软件开展维护工作、检测工作,让软件运行存在的漏洞问题得到提前发现,让软件运行稳定性得到保证。与此同时,需要全面分析安装系统,利用系统、软件数据接口访问系统,可以挖掘相应软件信息,并提取运行需要数据信息。

3.3检测漏洞

在软件工程中,利用数据挖掘技术可以对软件漏洞进行有效检测,以提升数据信息稳定性、安全性,在错误造成严重后果之前修复漏洞。通常情况下,在技术应用中,首先,应结合软件特点进行合理调整,在用户基本需求得到满足的前提条件下,可以对软件测评方式进行科学确认;其次,应利用此测评方式,对软件数据错误进行排查、修复,以完成数据加密工作、保护工作。值得注意的是,针对软件所需后台信息,还应开展处理工作,对后台冗余数据进行定期清除,针对长时间运行出现数据,应对其进行过滤处理,针对必要关键信息,应对其予以保留,让软件运行稳定性、安全性得到保证。在建模工作中,应结合数据信息大小情况、特性对数据模型进行合理选择、对比验证,让信息真实性、安全性得到保证。除此之外,应针对软件多种用途,结合项目需要,对数据挖掘方式进行科学选择,对多种数据信息进行比较分析,保证软件可以为用户带来最佳体验。

3.4软件故障检测中的数据挖掘

在软件故障检测工作中,通过科学应用数据挖掘技术,可以对软件故障进行有效检测,并针对故障产生原因、常见类型,开展修复工作、维护工作。

3.4.1故障检测在软件工程中,数据挖掘技术不仅可以提升挖掘任务完成效率、挖掘程序执行记录具体说明,同时还可以完成故障检测工作。在程序挖掘过程中,首先,应设定挖掘主要目标,对信息进行跟踪了解,提升程序熟悉度,为后续工作高质量开展提供保证;其次,应对数据挖掘方式进行合理选择,如利用基于规则和自动化类数据挖掘技术,就可以让抽象处理、抽象挖掘工作得以高质量完成。当前,软件因多种因素影响,可能会产生故障问题,传统定位技术固然可以对故障进行处理,但其具有一定烦琐性、低效性,定位精准度可能存在问题。而利用数据挖掘技术,结合新的定位方法,如使用程序谱抽象定位处理运行轨迹,利用对比方法对故障进行有效排除,就可以让故障源头得以迅速找出,让故障排查效率、检测准确性得以提升。

3.4.2软件维护在数据挖掘技术支持下,通过鉴别该评估软件缺陷程序,可以对软件修复环节缺陷进行分析,对修复优先顺序予以判断,让各个缺陷最佳修复方法得以确定。为保证修复效率,应强化处理检测重复缺陷报告技术,在缺陷报告中融入自然语言、执行语言相似度信息,保证依照定义向量维度可以完成描述软件缺陷工作。最后,可以加权求和处理相似度,以开展缺陷修复工作。

4结语

综上所述,数据挖掘技术的科学应用是信息化时代数据信息处理的关键,在软件工程中,应用数据挖掘技术可以高质量开展软件版本信息挖掘工作、软件执行记录挖掘工作、检测漏洞工作、故障检测工作以及软件维护工作,以提升软件工程开发效率、开发质量,降低软件工程开发成本,提升软件工程开发经济效益。

参考文献:

[1]周鹤.数据挖掘技术在软件工程中的应用探究[J].计算机产品与流通,2020(8):22.

[2]李金召.数据挖掘技术在软件工程中的应用与研究[J].计算机产品与流通,2020(5):30.

[3]余世文,王渝波,刘启明.软件工程数据挖掘研究进展探析[J].农家参谋,2020(7):139.

[4]丰婉伊.数据挖掘技术在软件工程中的应用分析[J].信息通信,2020,33(3):192-193.

[5]黄俊.数据挖掘技术在软件工程中的应用[J].信息通信,2020(02):254-256.

[6]李怡.浅析软件工程中数据挖掘技术的应用[J].中国新通信,2018,20(4):102.

作者:王鹏 胥司禄 陈梦杰 孙晓康 金蔓 单位:大连理工大学城市学院计算机工程学院