公务员期刊网 论文中心 正文

科技信息服务人工智能技术应用研究

科技信息服务人工智能技术应用研究

互联网为我们提供了取之不尽,用之不竭的公开信息资源宝库,现代科技已广泛应用于科技信息服务领域,其中人工智能技术使科技信息工作流程的计算化、智能化特征更为显著,因此,利用人工智能技术助推科技信息事业的发展成为必然选择。本文对大数据下科技信息领域需要解决的主要问题,人工智能技术应用于科技信息领域的研究的意义和主要研究内容进行了剖析和阐述,提出了相应的研究观点和技术路线图,提出基于人工智能技术的科技政策动态分析体系设计方案。并以科技信息的共享和利用为导向,开发和应用科技信息资源,实现数据信息价值的最大化,通过人工智能技术进行科技信息的深度领域数据分析服务,实现科技信息资源的前沿性研究是大数据下科技信息的人工智能技术应用的主要方向之一。大数据时代催生了海量数据的诞生,数据量的剧增一方面提供了更多信息来源,另一方面也给从更大量数据集中获取有用信息制造了困扰。若要基于更全面客观的数据获得其准确的信息,大量的非结构化数据需要结构化处理,才更便于分析,需要更长的时间和更高的人力成本。此外,互联网环境下的信息传递瞬间即达,对信息的即时性、保密性也提出了更高的要求。大数据时代的信息分析需求对传统的信息分析方法提出了巨大的挑战。伴随公开和非公开的科技信息资源的日益增加,其数据已呈现和具备大数据的特点,传统的科技信息搜集和处理方法不足以应付当前的数据现状。面对大数据时代日益增长和积累的庞大数据集,以及科技信息本身具有的学术价值和技术先进性特质,使得面向科技信息领域的应用研究工作必须做出变革,即以科技信息的处理和分析为导向,旨在实现科技信息资源的有效组织、处理和分析,实现需求驱动的科技信息组织和分析方法的创新,为挖掘科技信息的前沿性研究服务。

大数据下科技信息领域需要解决的主要问题

(1)大数据下科技信息处理的标准化体系研究相比传统的科技信息,大数据环境下的科技信息的来源、类型、内容和数据格式更为复杂,制定和完善科技信息的标准化体系和内容是及其必要的。信息资源的标准化体系是保证信息有效存储、处理、分析和利用的基础和前提。本文认为将依据当前科技信息现状,针对具体领域研究和制定大数据下的科技信息处理规范和建议是必要的。(2)大数据下的科技信息资源的建设方法研究借助大数据技术可实现科技信息的大数据处理与大数据存储,实现多源异构的科技信息完成数据的存储、处理、交换等功能。大数据下的科技信息资源的建设方法研究需要从数据本身和数据的组织两个研究视角出发,分析梳理大数据环境下科技信息资源在建设中面临的难点和关键性技术问题,研究和提出科技信息资源的知识组织系统框架和基本构建方法。(3)大数据下的科技信息资源的分析方法研究结合科技大数据特点,主要利用深度学习技术解决科技大数据的高维数据降维处理问题。研究和探索面向科技信息资源的分析方法,提出不同类型科技信息资源的关联分析、重要性分析、主题演化路径等深层次的信息分析方法和技术,通过系列分析方法和技术研发,解决科技信息资源管理工作中存在的问题,研究方法在实践中进行创新和发展。世界的发展、科技的换代、媒介的延伸以及人文的变更,汇聚成一股巨大的洪流,加速了我们所处时代的变换,人工智能技术已经渗透到各个技术领域,以上问题涉及科技信息的组织和分析,需要人工智能技术的融合,即与人工智能技术的深度融合必将推动科技信息进入全新时代。

人工智能应用于科技信息领域的研究意义和主要研究内容

人工智能为解决科技信息的获取和分析提供解决途径(1)人工智能可拓展获取科技信息的来源。从事智能分析的美国Stabilitas公司的首席运营官ChrisHurst认为:“人工智能可以扩大信息工作的范围,不会遗漏那些有价值的细节。”科技信息同样需要通过各种渠道获取世界各国的同类信息,利用分布式网络爬虫等人工智能技术可获取全世界的开源信息,包括文本和音视频数据。(2)人工智能可加快处理科技信息数据的速度。美国中央信息局肯特学校教信息分析的校长JosephGartin认为:“梳理社交媒体来获得信息并不是什么新鲜事,让人耳目一新的是如今我们收集社交媒体数据的数量之大和速度之快。”海量的科技信息通过人工智能技术可以快速处理亿万比特的数据,从而了解世界各国同类信息或事件,将每天接收到的大量数据转变为能够用于政策和战场行动的信息。(3)人工智能使科技信息的分析自动化、智能化。据俄罗斯通讯社报道,俄罗斯总统普京表示:“无论谁在这一领域中处于领先地位,都将成为世界的统治者。”普京认为:人工智能是未来权力的关键。利用自然语言处理技术、语音识别、图像检索等人工智能技术可以极大的提高信息人员检索有用信息的速度。此外,知识图谱作为人工智能的知识库基础,基于知识图谱可实现分析对象的多维多步自动关联分析,利用深度学习模型可大大提高多因素影响的系统分析,获得更好的信息分析效果。主要研究内容(1)基于人工智能技术的科技信息的知识存储和管理大数据下的科技信息具有海量、异构、跨媒体的特点,其知识存储和管理需要对结构化或非结构化的跨模态数据进行语义智能化计算研究,以为统一语义范畴下的数据查询提供便捷的元数据服务;对跨媒体知识统一组织进行研究,为不同关系结构,不同模态数据的统一存储与管理提供结构基础;同时,需要对跨媒体知识的更新进行研究,为动态的数据存储与多变的业务管理提供支撑。最后,对跨媒体知识检索与查询进行研究,从实际的检索和查询业务角度出发,制定规则,优化性能,提升知识数据被获取时的准确性与高效性。(2)基于人工智能技术的科技信息与知识的深度揭示与聚类加强科技信息资源的多源多模态数据整合关联、信息抽取、不确定推理、机器学习、自然语言处理等人工智能技术研发与应用;利用人工智能技术实现科技信息资源的外在层面的资源整合,资源内在特征的深度聚合,实现科技信息与知识的深度揭示与聚类。通过可视化方式实现科技信息知识(研发技术、研发机构、研发人员等)的聚合、揭示与展示。其中重点利用语义分析技术、词表/本体构建技术、知识图谱技术、大数据分析等人工智能技术,通过可视化方式实现科技信息知识的聚合、揭示与展示;实现对格式各异、内容复杂的数字资源进行深层次的揭示,从资源外在层面的资源整合,深入到资源内在特征进行深度聚合,实现信息与知识的深度揭示与聚类,同时将科技信息知识服务嵌入知识交流之中。技术路线图如图1所示。(2)基于人工智能技术的科技信息前沿技术发现与预警研究前沿技术发现与预警旨在有效指导和开展科技研究,国内外已有研究在信息对象和研究方法上比较单一,信息价值和服务效果受限。科技信息前沿技术发现与预警研究应更强调面向信息源的全面收集、处理、分析的一定程度智能化生产过程,更好的感知非完备信息,辅助信息用户把不确定性预测变成更确定性预测。研究将不同类型的信息源进行整合、融合,多维度的分析科技前沿技术特征,从不同角度实现有价值信息的综合叠加和映射,从中发现、分析和描述科技前沿技术问题,为科技领域专家实现科技前沿的准确辨识提供服务,实现有效的技术预警。技术路线图见图2所示。

基于人工智能技术的科技政策动态分析平台设计

科技政策动态分析脱离原有人工分析为主的模式,而借助技术手段进行辅助分析是时展的必然趋势,海量数据的现实对情报分析方法的冲击不可避免。技术参与的目的是提高人工分析的效率和质量,采用技术辅助手段是可以做到事半功倍的。基于人工智能技术的科技政策动态分析平台的目的在于如何利用技术手段提供获取情报数据、情报多维分析能力和自动生成可读性的分析报告的能力,帮助提高人类思维的效率。1)科技政策动态信息监测科技政策动态信息监测主要采用网络信息的监测方式,只有在有效采集网络信息的基础上才能进而实现具体内容分析与信息服务。信息监测是对互联网上共享的科技政策资源进行提取、解析、收集和存储等的过程。科技政策动态信息监测的一般框架可由图3表示。科技政策动态信息监测系统的层次模型:表示层,业务逻辑层和数据访问层。数据访问层:连接数据库,执行插入和查询等操作。主要是用数据集访问。业务逻辑层:调用数据访问层的方法然后返回结果给表示层。表示层:获取表单的数据,然后调用业务逻辑层的方法处理数据,然后根据结果显示相应的数据。科技政策动态信息监测的系统框架:系统分为数据层与应用层两个层次。其中,数据层为整个平台提供数据支撑,包括监测站点、情报、文章、等基础信息数据,以及用户信息、日志信息等数据。应用层主要提供站点管理、信息服务、编辑撰文三大功能模块,为用户使用系统进行信息检索、筛选、浏览、定制、撰文等提供服务,同时也为管理员进行系统管理、任务分配、成果组织等提供相应接口。具体系统框架如图4所示。

结语

在大数据环境下,科技信息的处理和分析涉及的数据更加复杂化,人工智能给科技信息处理和分析带来了机遇和挑战,有效利用最新的人工智能技术能更好的为科技信息建设服务。ChrisHurst认为:“人类的行为是数据,而人工智能是数据模型。所以我们认为人工智能在处理这些数据方面能够比人类做得更好。”本文提出了基于人工智能技术的科技政策动态分析平台设计方案。并有以下几方面未来工作的建议:(1)加强科技信息数据收集能力。充分利用爬虫技术搜集开源情报,并研究存储整合技术,为信息分析打下坚实的数据基础;(2)加强多源多模态大数据整合关联、信息抽取、不确定推理、机器学习、图像识别、自然语言处理等人工智能技术研发与应用;(3)构建科技信息领域知识图谱,加强信息分析、推理和挖掘的能力。

作者:于伟 王忠军 单位:北方科技信息研究所