公务员期刊网 论文中心 正文

地域文化数字化保护和大数据应用方案

地域文化数字化保护和大数据应用方案

摘要:地域文化的保护、传承、发展与利用,对于一个地区彰显地方魅力,提高知名度与美誉度,发展地方经济和旅游文化产业,乃至凝聚人心力量,增加地方软实力,都有着十分重要的意义。本文以淮安地域文化的实践为例,对地域文化数字化保护和大数据应用的方案进行了研究和设计,阐述了地域文化资源的数字化手段,分析了地域文化数据库的特点,说明了地域文化数据库的大数据处理技术,提出了地域文化数据库共建共享和利用的方法机制。

关键词:地域文化;地域文化数字化;地域文化数据库;大数据

0引言

中华文化源远流长,指出:中华优秀传统文化中很多思想理念和道德规范,不论过去还是现在,都有其永不褪色的价值。在新的时代条件下传承和弘扬中华优秀传统文化,一定要以高度的文化自觉和文化自信推动中华优秀传统文化的创造性转化和创新性发展。地域文化作为中华民族文化不可缺少的一部分,是指一定空间范围内的人们在长期的生产和生活实践中逐渐形成的历史遗存、文化形态、社会习俗、生产生活方式等独具特色、积极向上的文化传统,其反映不同地域人群的品格特点及文化内涵、审美情趣以及价值取向等。地域文化的传承、保护与发展,对于形成良好的地域精神与道德风尚具有重要的导向作用,是一个地区综合竟争力的重要体现。然而长期以来,许多地方对地域文化的保护发展工作重要性的认识还不够,缺乏应时而上保护发展利用地域文化的有效举措,除公共图书馆之外,其他机构的地域文化数据库建设基本上没有开展。因此,设计建设一种地域文化数字化保护和有效利用的方案机制有着极为重要的社会意义。

1总体方案

地域文化数字化保护应用平台的建设,应以数字化手段实现地域文化资源永久保存为前提,以充分利用、创造性转化和创新性发展为目标,坚持开放分享,以多方合作模式构建地域文化资源数据库和共享平台,利用大数据技术保证资源数量和类型的丰富和无限扩容。不同文化机构和用户,运用各种数字化手段将文化资源加工成数字化的资源,并利用平台搭建的接口处理入库,实现对分散无序、相对独立的资源的类聚、重组和融合。为应对数据的海量增长和因资源使用产生的非结构数据对计算机存储和计算能力的挑战,必须采用大数据技术,通过分布式文件系统和分布式数据集市保证存储的可扩展性和数据的高可用性,并实现对非结构数据的有效转换和利用,最终提供统一的数据服务。资源的整合是为了让广大用户发现资源、利用资源,因此必须以地域文化大数据库为中心构建各种软件,为不同类型的用户提供信息服务,如资源存储检索、旅游公司广告、文化产品销售、决策的统计分析等。

2地域文化资源的数字化采集

2.1地域文化资源选取原则

淮安作为国家历史文化名城,坐落于古淮河与京杭大运河的交点,境内有中国第四大淡水湖——洪泽湖,是曾经的南船北马交会之地,大运河沿线四大名都之一,南北文化交融,经济发达、人文昌盛,又是淮扬名菜的发源地,的故乡……,可谓地域文化内涵丰富,独具特色。在淮安浩如烟海的地域文化资源中,我们坚持以下三条选取原则:(1)它必须是积极向上的文化资源,正所谓去其糟粕,取其精华;(2)它必须具有淮安的历史渊源和地域特色,有较为深厚的历史积淀和底蕴;(3)它要有较为宽泛的覆盖面和认同基础,能得到大多数淮安人的认同。

2.2地域文化资源数字化手段和分类选择

综合运用多种手段实现地域文化资源的数字化再现,包括:图书文献扫描加工、全景摄像、虚拟现实、航拍、3D建模、网络爬虫抓取等先进的信息技术集成,实现快速、便捷、科学地加工、分类、整理地域文化资源,极大地扩大地域文化的来源渠道,丰富地域文化资源的形态。淮安地域文化的分类主要包括:(1)水文化(运河文化、淮河文化、洪泽湖文化、水利工程、水上交通等);(2)名人名家(政治名人、经济名人、文化名人等);(3)淮扬美食(历史文化、淮扬名菜、烹饪名师、餐饮名店等);(4)民俗风情(服饰、住居、节日、婚姻、丧葬、宗教等);(5)方言文化(清淮方言、淮剧、淮书等);(6)生态文化(淮安生态、示范基地、政策文件等)。

3地域文化资源的大数据处理

3.1地域文化资源数据的特点分析

淮安地域文化极其丰富,要充分保护和高效利用,其数字化资源必须作为一种社会基础性资源长期建设。根据数据的不同来源,地域文化资源库的数据主要分为三大类:一是政府部门或社会公益组织为了实现地域文化的数字化保存和利用,利用各种技术手段形成数字化资源之后,按照一定的入库标准,有意识地将各类文化资源分类汇集而产生的结构化数据或有序的数据,如媒体资源库、数字出版库等,这类数据有约定俗成的格式规范,可以利用关系数据库将其存储在预定义的表格中,也能方便地进行查询和分析。二是从其他数据库接入或从相关网站搜集下载的数据。包括专业的期刊数据库如知网,电子图书馆如超星,其他相关网站如旅游公司、文化产品公司等,都会有关于淮安地域文化的资源,甚至景点的售票、文化产品的销售数据也应成为我们关注的数据信息。为了给用户提供统一的访问通道,要以“海纳百川,有容乃大”的理念,兼收并蓄,利用信息技术手段实现资源汇聚。三是基于用户对文化资源数据库的访问行为产生的大量数据。搜索、下载、点击、上传等用户行为会随机悄然产生大量的多形态数据:视频、照片、社交媒体评论、网站评述、访问量等,可称为非结构化数据或随机数据。这些数据无法利用传统的关系数据库进行存储,而某些数据又生成速度极快,甚至来不及分析后存储,但这些数据对于分析地域文化的接受度、喜好度,以及文化消费特点具有重要价值。

3.2地域文化数据库大数据处理的必要性

上段所述表明,地域文化资源库的数据已经具备了大数据的特点,一是模态繁多,包括结构化数据和非结构化数据;二是数据量大,生成快速,具有很强的时效性。同时,在互联网+时代,我们要最大限度地发挥地域文化的价值,必然需要对地域文化资源的数据库进行深度挖掘分析。对这些数据进行挖掘分析的目的在于更全面地了解各种文化资源,发掘数据间的内在联系,通过分析用户的线上行为,掌握文化旅游、文化产品、文化活动的市场需求,更有针对性地开发和创作相关内容、形式的旅游文化产品,以满足各类消费者的需要。这对于提高文化产业的生产效率是具有重要意义的。因此为应对地域文化资源对数据存储、数据管理和数据分析的挑战,我们必须采用大数据技术。

3.2地域文化资源数据库大数据处理技术的使用

地域文化数据库作为一个公益的社会基础资源平台,采用开源的技术工具建设是最为合适的选择。Hadoop作为一种成熟的大数据开源框架,其可靠性、扩展性、高效性和容错能力已得到众多案例证明。利用Hadoop生态系统中Sqoop工具,能够将第三方数据高效地导入,实现结构数据和非结构数据的快速转换。HDFS和YARN是Hadoop实现分布式数据存储的组件,使得我们能够充分利用集群的威力,实现淮安地域文化数据库的无限扩容,并带来集群在利用率、资源统一管理和数据共享方面的巨大优势。MapReduce编程模型是处理地域文化数据库中大量半结构化和非结构化数据的利器,任何形式的数据都可以转换成最终的键值对形式。而Hive和Pig提供了数据分析的手段,Hive适合用于对地域文化数据的使用日志的分析,Pig做高级的数据分析处理,比如可以用来发现地域文化资源数据库中多条数据资源之间的深层次联系。

4地域文化资源的大数据利用

作为一种基础性资源的淮安地域文化数据库,要发挥其最大价值,必须贯彻共建共享的理念。共建是数据库保持持久吸引力的保证,首先要汇聚多方资源,接入或导入各方数据,让平台成为访问淮安地域文化的统一入口,然后要集合多方力量参与资源贡献,进行资源的持续更新。共享是数据库建设的目标和动力,只有共享才能让淮安地域文化发挥其最大价值,真正发扬光大。共享面向的用户有三种:一是普通民众,让更多的淮安市民了解淮安文化,接受淮安文化,有利于提高城市的凝聚力和文明程度;二是研究淮安地域文化的专家学者,为其对资源间联系和某个研究方向的研究现状进行分析提供最全面的资源;三是旅游公司和文化产品企业,他们可以获得广告销售服务,也能根据平台的大数据分析并制定更好的销售策略,设计更符合消费者需求的产品;四是相关的政府部门,如旅游局、文化局等,平台能为其提供定制的资源存储空间和访问接口,更为重要是平台的大数据分析功能可以为他们提供决策服务。

参考文献:

[1]姜念云,张松海,谢夏.大数据分析技术在文化资源管理中的应用[J].中国基础科学,2014,16(1):17-20+27.

[2]卢艳艳.基于Hadoop的大数据存储关键技术研究[D].保定:华北电力大学,2016.

[3]付文静.基于HBase的大数据存储查询技术研究[D].成都:电子科技大学,2015.

作者:安宇 郭艾华 单位:淮安信息职业技术学院