公务员期刊网 论文中心 正文

浅谈网络传播的大数据发展

浅谈网络传播的大数据发展

摘要:随着计算机的普及,依托于计算机的网络传播成为了主要的信息传播途径,与此同时,大数据也开始发展,开始急速的衍生和扩散,甚至可以说大数据下的计算机网络已经成为带动国民经济发展的主体。但大数据应该如何理解、网络传播下大数据又将如何发展已成为新的研究趋势。

关键词:网络传播;大数据技术;大数据应用

一、网络传播下的大数据的诞生

自2005年Hadoop项目诞生,大数据就进入了人们的视野当中。大数据无疑是在网络传播的基础上进一步衍生出来的“新产品”,想要系统的认知大数据,就必须要全面而细致的分解它,应着手从三个层面来展开:第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。在这里从大数据的定义、特征、问题等方面进行剖析。第二层面是技术,技术是大数据价值体现的手段和前进的基石。这部分主要是从大数据的开源、存储、分析和展示技术进行详尽的分析。第三层面是实践,实践是大数据的最终价值体现。大数据目前已被广泛采用到生活当中,此部分主要分析网络中的大数据应用。

二、网络传播下的大数据的理论分析

(一)大数据之概念及特点

“大数据”的概念最早由维克托•迈尔•舍恩伯格和肯尼斯•库克耶在编写《大数据时代》中提出,又称为巨量资料,指需要新处理模式才具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。[1]在网络传播时代下,大数据主要呈现了以下四方面的特点:1.数据体量巨大(Volume)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。[2]2.数据类型繁多(Variety)。数据也分为结构化数据和非结构化数据。结构化的数据即以文字呈现的数据结构,非结构化的数据则包括网络日志、音频、视频、图片、地理位置信息等类型。3.价值密度低(Value)。海量数据并不能充足证明其重要性,换句话说就是,数据多并不代表价值高。4.处理速度快(Velocity)。这是大数据区分于传统数据挖掘的最显著特征。

(二)大数据之问题所在

大数据、网络传播看似是一种简单的依附与被依附的关系,二者相互依存、相互发展,但随着这种关系的不断行进和演化,一些问题也开始显露。1.表面化。尽管大数据能够非常好地检测相关性,但是它并不会告诉我们相关性是如何得出的、得出的合理性以及哪一种相关性是有意义的。2.辅助化。尽管大数据搜集的数据是庞大的,有一定的事实证明比例,其可以辅助科学调查,但不可能成功地被完全代替。3.理想化。如今的大数据为世人展现的都是其不可估量的大好前途,但大数据的数据缺失、情况偶然、不准确数据不断地被循环利用导致了更多问题的出现,会引发更多的以偏概全,会导致思维的引向,甚至结论的错误。

三、网络传播下大数据技术的分析

(一)开源框架

HadoopHDFS,即HadoopFileSystem,是一款典型的开源文件系统,其主要面向大文件的文件系统,是分布式数据库的基础。在文件存取方面,HDFS用NameNode存放文件位置信息,用DataNode存放文件数据。[3]当HDFS中存入大量的数据后,需要借助MapReduce完成工作分析。之后再从统计维度列出角度对统计值列出的数据进行排序,最后通过聚合完成统计维度数据项的计算工作。

(二)大数据存储技术

目前数据存储技术主要包括以下两种存储技术:1.分布式集群存储技术。分布式集群存储技术通常以大数据块为单位,将数据切割存储在多个节点,为保证数据的可靠性,需要在不同的存储节点中保存多个数据副本。在分布式数据库设计时,可以根据应用的特点,采用分别处理增加、删除、修改、查询操作的方式进行架构设计,既要保证事务操作的一致性,又要满足海量数据存取的性能要求。2.关系型数据库存储技术。关系型数据库的操作语言是结构化的查询语言,包括数据定义语言和数据操作语言两部分。DDL完成了数据对象和操作过程的定义,包括数据表、视图、存储过程、触发器、主键、外键、索引、区分等,DML则完成了数据的操作功能,包括增加、删除、修改、查询,也就是人们经常听到的数据。

(三)大数据分析技术

对大数据进行建模的目的是便于对数据进行分析和利用,即对数据进行多次ETL,经过多次ETL之后的数据会变得越来越容易理解、使用和个性化,使得分析结果满足特殊岗位甚至单个特定人的需求。

四、网络传播下的大数据应用

实践是检验真理的唯一标准,大数据服务能否帮助企业取得成功,还需要在行业应用实践中得到答案。

(一)大数据在社交网络领域的应用

1.SNS业务应用介绍。SNS体现了Web对于人类社会需求的满足,人们通过Web应用满足了不同的心理需求。SNS不同于支持组织互动和业务流程的传统应用,其主要实现了人与人以及由人创建内容之间的协同与共享。2.大数据技术与SNS应用。不同的社交网络应用的特点也是不同的,除了微博的热点话题,商务人士在SNS上形成的社会关系以及留下的沟通、评论等记录,用户的通信行为也是反映拥护社会关系的重要数据基础。

(二)大数据在电子商务领域的应用

大数据对电子商务的主要作用是发现用户行为,然后有针对性地为用户提供产品和服务。大数据可以反映世界万事万物之间的联系,对于当今的网络十分重要。但如何利用大数据?大数据如何管理网络的业务活动?种种疑问到目前为止还只是简单的分析描述,希望今后能够有更多的仁人志士投身于大数据,挖掘其更大更广的价值,造福于人类和社会。

参考文献:

[1]李金.快速充电站[J].人民公交,2016(3):108-109.

[2]王春研.大数据与计算机信息处理技术[J].黑龙江科技信息,2016(3):156.

[3]王鲁俊,龙翔,吴兴博,王雷.SFFS:低延迟的面向小文件的分布式文件系统[J].计算机科学与探索,2014(4):438-445..

作者:吴德胜 孙恺悦 单位:长春工业大学