公务员期刊网 论文中心 正文

谈数据科学与大数据技术专业课程体系

谈数据科学与大数据技术专业课程体系

摘要:该文阐述了数据科学与大数据专业的设置必要性、专业的培养目标和知识能力结构,最后探索了数据科学与大数据专业的技术性课程体系设置方法。希望该文内容对数据科学与大数据技术专业的培养方案制订和课程体系构造具有一定的指导意义和参考价值。

关键词:数据科学;大数据技术;课程体系

1本专业的背景

数据科学随着人工智能学科发展而产生。自1956年提出人工智能研究以来,人工智能经历过推理研究期、知识表达研究期和机器学习期[1]。机器学习中归纳学习主要从数据归纳出规律,在20世纪80年代末期提出知识发现(Knowl-edgeDiscover,KDD),而20世纪90年代初产生了数据挖掘(DataMining)研究方向,数据挖掘成为20世纪90年代至21世纪初非常热门的研究方向,各种数据挖掘研究问题和成果,形成了数据科学的主要内容。21世纪初,网络技术的广泛运用推动了信息领域的大规模数据产生与积累。从大量数据的统计分析中发现一些规律,成为业界亟须解决的一个技术问题,推动了大规模并行计算以及分布式计算技术的发展,产生了以Hadoop平台为代表的大数据分析计算技术。国家在“十三五”规划纲要中提出:“实施国家大数据战略,推进数据资源开放共享”。党的十八届五中全会公报提出要实施“国家大数据战略”,标志着大数据战略正式上升为国家战略。2015年9月,国务院印发的《促进大数据发展行动纲要》提出,加强专业人才培养,鼓励高校设立数据科学和数据工程相关专业,重点培养专业化数据工程师等大数据专业人才。正是在这种背景下,2016年,我国设立了数据科学与大数据技术本科专业,第一批由北京大学、中南大学和中央财经大学等三所高校设立,第二批为2017年由32所高校设立。

2本专业的培养目标

在国外,数据科学与大数据技术(DataScience)专业是以数据分析学(DataAnalytics)专业为基础发展而来的,在北美大学首先设立数据分析硕士学位,主要是抽象出底层的数据问题,连接计算机基础学科与数据科学之间的空白。2013年,纽约大学等几所美国高校设立了数据科学硕士学位,出现了数据科学专业概念[2]。该专业以数据科学与大数据分析开发为核心内容,并强调学生理解掌握数据领域的知识,具备为数据分析运用服务的技术能力。数据科学与大数据技术专业培养具有多学科交叉能力的大数据人才,其中,重点培养三方面的素质人才:理论型人才,主要应具备对数据科学中模型进行理解和运用的能力;实践型人才,主要应具备处理实际数据的能力;应用型人才,主要应具备利用大数据的方法解决具体行业应用问题的能力。学生毕业后主要从事大数据产品开发或大数据分析,未来职业发展为企事业单位的数据信息高级管理员和分析师,或成为信息技术领域的涉及数据分析方向软件开发工程师或算法分析师。具体目标为:掌握面向数据应用的统计学、数学、计算机科学以及应用领域学科的基础理论和方法、熟练运用各种数据分析技术和手段;掌握数据尤其是大数据的采集、存储、处理、分析与应用等技术,具备数据和大数据应用项目的设计和开发能力;能够利用探索性数据分析技术对数据进行初步建模,并能利用统计推断的基本理论、方法对数据进行分析和产品化开发;在系统的专业技术训练基础上,具备广泛的数据应用视野、能够胜任大数据分析挖掘、大数据系统开发等技术领域以及大数据商务与金融等各类相关应用领域的多层次工作。

3数据科学与大数据技术专业知识能力结构

数据科学与大数据技术专业主要以计算机科学与技术专业为基本知识能力支撑、将人工智能的数据挖掘为拓展性能力,因此其涉及计算机科学与技术、人工智能、统计学等专业知识与能力,即掌握应用先进的计算技术并从大数据当中获取知识与智慧的技术[3]。数据科学与大数据专业要求的知识与能力是计算机传统知识能力、经典数据分析与新型数据分析手段;计算机的信息管理技术提供应用基础技术,数学理论基础和数理统计方法支持,新兴技术平台提供技术支持,通过多支持并以数据为核心所得出的技术。数据科学与大数据技术能力需求可以分为理论性能力和实践性能力[4]。学生要有较强的数理统计基础、数学建模能力、扎实的数据结构和算法基本功,能够很好地理解和掌握各种机器学习和数据挖掘算法,还要掌握处理“大数据”的先进技术,即掌握云计算相关的大数据处理平台及其生态系统。实践性能力指处理实际数据的实践能力,能够掌握基本算法和系统开发能力,并且具备一定实际应用性能力,即利用大数据解决具体行业应用问题的能力。专业技术性能力要求为:具备数学能力,在基本数据技术及其在软件开发中应用数学的能力。具备大数据应用程序开发实践能力,能够根据软件需要设计简单的解决方案,能根据给出的设计方案实现软件开发;具备应用大数据知识将大数据和云计算知识用于分析解决复杂性工程问题的能力;具备能够基于科学原理并采用科学方法对复杂工程问题进行研究的能力,包括设计实验、分析与解释数据,并能通过信息综合得到合理有效的结论[5-6]。

4数据科学与大数据技术专业课程设计原则

专业技术性能力课程体系分为:数学基础课、计算机相关课程、数据科学相关课程、大数据技术相关课程、领域相关课程。各高校可根据各自的专业定位选择设置。数学基础课:传统计算机学科基础数学主要有微积分、线性代数、概论统计学。专业数学基础课可扩展为优化与运筹学课程:时间序列导论、随机过程分析、最优化方法、多元统计分析、运筹学。计算机相关课程:遵照中国工程教育认证的计算机类的通用标准主要有计算机科学导论、高级语言程序设计、算法与数据结构、操作系统、计算机组成原理、操作系统导论、软件工程、数据库原理与应用、计算机网络等相关课程,根据本专业特点,建议增设算法分析与设计。数据科学相关课程:主要是围绕数据挖掘与分析展开课程。根据需要掌握数据采集、数据存储与管理、数据分析方法、数据展示等能力,可开设的课程有数据科学导论、数据挖掘与分析、机器学习、数据可视化、数据采集与爬虫技术、数据的人文与伦理等课程。大数据技术相关课程:须掌握利用相关大数据技术平台和开发方法,实现数据科学理论的分析方法。面向大数据实际应用能力培养,比较典型大数据平台开发课程主要有Spark开发技术、Hadoop编程平台、HBase大数据快速读写、大数据系统应用实验、云计算。领域相关课程:这方面课程主要面向专业方向选修课,其包括两类,一类是通用领域的相关课程,例如自然语言处理、图像分析与处理、语音分析或相关领域的数据分析、大数据案例分析与实验、文本挖掘分析、智能系统推荐等;另一类是与行业相关的领域课程,例如农业大数据分析、电子商务大数据分析、电力数据分析等,可根据各高校的专业特色定位而开设。

参考文献

[1]顾险峰.人工智能的历史回顾和发展现状[J].自然杂志,2016,38(3):157-166.

[2]孙书韬,朱立谷,李春芳.北美知名大学数据科学专业课程体系分析[J].中国教育信息化,2019(24):48-50.

[3]贺文武,刘国买.数据科学与大数据技术专业核心课程建设的探索与研究[J].教育评论,2017(11):31-35.

[4]杨洪,李知遥,张志强.数据科学与大数据技术专业实践能力培养体系的探索与实践[J].成都大学学报(社会科学版),2018(3):106-112.

[5]刘颖,王爱莲,宣齐娜,等.新工科背景下数据科学与大数据技术专业建设探析:以地方财经类高校为例[J].吉林工商学院学报,2019,35(6):106-109.

[6]周四军,熊伟强.如何构建数据科学与大数据技术本科专业课程体系[J].才智,2017(25):60.

作者:刘建华 胡文瑜 唐郑熠 林芳 单位:福建工程学院信息科学与工程学院