公务员期刊网 论文中心 正文

数据挖掘技术下数字化油气藏研究

数据挖掘技术下数字化油气藏研究

摘要:油气藏在勘探开发及其研究与决策过程中,形成巨量的成果及数据。为了更加科学开发与管理油气藏,充分运用和发挥好这些巨量数据的信息作用成为关键,数据挖掘作为一种有效的信息处理技术,可以在海量数据中快速找出有用信息,为研究与决策提供强有力的数据支持。长庆油田在油气藏研究与决策支持系统(RDMS)建设中充分利用各专业数据库及多种数据挖掘方法,构建了一个满足勘探、开发、储量管理、评价等综合应用的数据管理、数据操作及可视化展示的一体化平台,为油气藏研究与决策人员提供全方位的数据处理与可靠决策,极大地提升了油气藏的研究效率和决策质量。

关键词:数字化油气藏;研究与决策;数据挖掘

油气藏研究包含了从地质勘查到石油产品最终用户的复杂工艺流程,传统的油气藏研究方法存在工作效率低、准确性不高、过度依赖人工经验等问题。决策者需要从海量的数据中找出有用的关键信息;论证现场中研究人员携带和使用的各类图件无法充分展示其研究成果,也不能在论证现场短时间内消化大量资料并做出正确的决策,更不能使信息资源的共享和成果的交互上得到充分实现。信息落后的信息处理方法与单一的研究手段不但花费大量的精力与时间,更是造成大量宝贵的研究成果无法应用与共享。近年信息技术的快速发展,催生了数字化油藏,促进了数字油田的发展产,数据挖掘等信息技术与油气勘探开发数据资源的融合不断加深,能够提供更智能化的数据分析功能,更好地支持油气藏勘探开发决策,开创了一种全新的油气藏研究工作模式,降低了决策风险,提升开发决策水平。长庆油田针对具有数量庞大的、结构不完整的、内容不清晰且含有干扰信息的油气藏研究工作数据,开发了包括特征提取、规则划分分类分析、关联规则挖掘、聚类分析、模式分析及生成趋势分析等[1-2]系列数据挖掘技术,从中提取出包含在内部的、不被人们知晓的、却又含有有用的、重要的信息和知识[3-4],为长庆油田的高效开发、快速发展提供了有效的数据信息支持。

一、油气藏研究与决策支持系统

通过借鉴国内外著名油气公司在油气勘探计算机软件研发方面的经验[5-6],依托长庆油田丰富的数据资源,利用先进的软件研发技术,长庆油田研发出了一套数字化油气藏研究(RDMS)系统。它以油气藏研究为主线,业务驱动,数据链为手段,由协同工作平台、数据整合平台、数据可视化平台等组成的一体化多学科协同工作环境。数字化油气藏研究系统从功能架构上可划分为数据服务、基础工作、协同研究、决策支持和云软件五大平台。基础工作平台是以油气藏数据链技术为基础建立的系统底层框架,为各应用场景的协同工作提供基础环境;协同研究平台面向科研人员,通过对不同业务岗位定制不同工作场景和工作内容,为研究人员提供便捷的数据组织、共享和知识应用平台;决策支持平台面向技术主管和普通技术人员,为一体化技术交流及方案决策提供环境,并实现远程异地协同决策;云软件平台基于虚拟存储技术将勘探开发主流软件统一部署在云中心服务器,实现专业软件接口统一升级、许可动态调度和集中维护管理。目前,基础工作平台、研究工作平台(29个研究主题)和决策支持平台(16个决策主题)已基本开发完成,在勘探开发研究院、油气工艺研究院、采油(气)厂已推广运行。图1展示了数字化油气藏研究与决策支持系统功能模块的细分情况。

二、数字化油气藏的数据挖掘技术

长庆油田建设的数字化油气藏研究与决策支持系统,为油田生产的勘探部署、产能建设等决策提供辅助。在决策支持系统的建设中采用了数据挖掘技术,在数据分类的过程中使用了神经网络技术,在数据关联过程中使用了决策树方法,在预测过程中使用了回归分析和贝叶斯网络。由勘探井的数据结合模型库系统和数据仓库系统,为井位部署、产能预测、生产方法等决策提供支持。在图2的结构中有一个模型库系统,它由模型库、方法库、数据库、格式库、衍生数据库及其管理系统组成。该系统可被抽象为六元结构,即S={ModelD,methodD,FormD,ParaD,D,DeriveD}。其中,ModelD={model1,model2,…,modeln},它是模型库,用于集成各种模型。模型库为整个系统提供支撑。它有包含模型库管理子系统(MDBMS)对模型库进行统一的管理,具有对模型定义、建立、存储、查询等功能。模型库是系统的核心结构。用于油气藏研究的各种数据库在模型库中统一管理、调用;MethodD={method1,method2,…,methodn},它是方法库,集成各模型计算的参数获取方法。方法库系统为系统提供算法模型支撑,它包含方法库管理子系统(ADBMS)对方法库进行统一的管理;FormD为数据格式库,定义了每个数据的数据类型,数据格式;ParaD为参数库,用于存放各种油气藏分析程序运转的各种参数;D为数据库,用于存放计算数学模型所需的各种数据;DevriveD为衍生数据库,存放油气藏研究过程中产生的新数据。

三、油气藏数据挖掘技术的实现

1.建立数据仓库建立数据仓库是实现数据挖掘的基础。本系统中使用的是原型法,快速的实现数据仓,并根据反馈信息修改油气藏决策步骤中不合理的需求分析和主题情况,为后面的决策工作提供技术基础和经验积累。本系统主题是油田勘探井位布置位置、测井实时数据、产能分析、储量管理等主题。在对油气藏决策系统进行分析之后,根据油气藏决策系统中包含的油气藏数据、决策内容进行逻辑分类。针对各个的分析主题,在油气藏数据仓库中建立关系表,用来描述与决策结果相关的各种信息,关系表主要从油气藏系统数据库中的流程表中提取数据,包括地质图、地理图、地震数据等。在数据仓库的建设过程中,对油田的盆地、各级构造、圈闭、地震工区、勘探沉积相、各级储量区块、油田各类开发生产单元、井等勘探开发图形对象的转换、加载入库,建立完成地质信息库。2.油气藏研究工作数据抽象和总结技术数据总结的最终结果是对油气藏研究数据进行抽象模型化,给出油气藏研究决策工作流程的总体综合描述。通过对油气藏数据的归纳抽象,数据挖掘方法能够将数据库中的所有数据从较低的个体层次抽象总结到较高的总体层次上,从而实现对原始基本数据的总体把握。在本系统中使用的数据总结方法是目前最为成熟的数学方法,也就是利用数学方法计算出数据库的各个数据项的统计学特征,如总和、方差、最大值、平均、最小值等;或者通过利用数学中的统计图形工具,对数据制作统计图形,如直方图、饼状图等。长庆油田的数字化油气藏研究系统中利用了OLAP技术实现对油田井位的地质图、地理图、地震数据的多维查询,分析了多种数据的统计特征,同时用多个统计图形描述了数据间的联系。最后对多个数据进行归纳,提取统计信息。3.数据分类数据挖掘中的分类是建立需要的分类函数或分类模型。通过这个分类模型可以将数据划分到不同的组中。它的实现步骤一般是:首先分析工作数据的各种特征,并找出或者建立出工作数据的属性模型,确定数据的归属组别,然后利用这些模型来分析工作数据,最后预测后面的工作数据可能会属的分组。分类应用的实例很多,本系统的采油井中,将油田井位出油量分为好、一般和较差三种类型,以此分析这三种类型井位的各种属性,特别是位置、地质等属性,并决定它们分类的关键属性及相互间关系。此后就可以根据这些关键属性对每一个预期的井位进行分析,以便决定预期井位属于哪一种类型。4.关联分析原始数据库中各个工作数据都存在相互关联、相互影响的联系。两个或多个工作数据的取值之间存在某种逻辑联系。这种关联关系主要有简单关联和时间关联两种。比如油田井位中的地质环境、地震数据和出油量存在关联。关联分析的目的是找出工作数据中隐藏的关联网,描述众多数据项目的密切度或关联关系。由于事先往往并不知道工作数据的关联是否存在,或者是否可以用精确的关联函数描述。因此,关联分析生成的规则通常都带有置信度,置信度级别描述了关联规则的强度。5.聚类与分析油藏工作数据往往缺少比较详细的描述信息,甚至是无法组织成任何分类模式时,通常可以采用聚类分析。通过聚类分析,按照约定的相近程度度量方法或者其他的标准,将工作数据分成许多有意义的子集合;每一个集合中的数据特征相近甚至相同,不同数据集合之间的数据性质差异较大,容易区分。长庆油田的数字化油气藏研究在实现过程中,使用了Fayyad过程模型,如图3所示。在数据挖掘的过程中,系统执行一个循环迭代过程。在每一步的执行中,从油田的盆地、各级构造、圈闭、地震工区、勘探沉积相、各级储量区块、油田各类开发生产单元等数据中,分析出勘探井位的位置信息,如果发现某个阶段产生的结果和预想的内容有出入。则重复前面阶段步骤。

四、结束语

长庆油田针对油气藏研究数据量大、信息隐晦的技术现状,建立了油气藏研究与决策支持系统[7-10],并在其中开发和应用了系列数据挖掘技术,取得了较大进展:(1)与众多学科及技术相融合,形成了包括人工智能、统计学、数据仓库、在线分析处理、专家系统、数据可视化、高性能计算等数据挖掘技术,将原始数据库转化为有用的研究知识,为油气藏决策了有力支持。(2)海量数据及其挖掘技术的开发为油气藏研究与决策支持系统的高效应用打下了基础,极大地提高了油气藏的研究与决策水平,为长庆油田快速发展提供了强有力的技术支持。

参考文献

[1]郭萌,王珏.数据挖掘与数据库知识发现:综述[J].模式识别与人工智能,1998,11(03):292-299.

[2]胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述[J].软件学报,1998(01):54-64.

[3]GrossmanR,KasifS,MooreR,etal.Dataminingresearch:Op-portunitiesandchallenges[C].AreportofthreeNSFworkshopsonmininglarge,massive,anddistributeddata,1999.

[4]DeogunJS,RaghavanVV,SarkarA,etal.Datamining:Re-searchtrends,challenges,andapplications[J].RoughsSetsandDataMining:AnalysisofImpreciseData,1997:9-45.

[5]王宏琳.油气勘探计算机软件:平台•体系结构•框架[J].石油工业计算机应用,2004(02):3-8.

[6](美)HohmannL著.蓝莉,曾永和译.超越软件架构创建和维护优秀解决方案[M].北京:中国电力出版社,2005.

[7]石玉江.数字油田中的勘探井位快速部署技术[J].石油工业计算机应用,2016(12):11-16.

[8]王娟.数字油气藏数据中心建设的关键技术[J].石油工业计算机应用,2016(1):16-18.

[9]付金华,石玉江,王娟,等.长庆油田勘探开发服务型共享数据中心构建研究[J].中国石油勘探,2017,22(6):1-8.

[10]王娟,姚卫华,石玉江,等.基于云架构的油气藏数据智能管理技术[J].天然气工业,2014,34(3):137-141.

作者:王娟 梁立星 武璠 孙亚莉 孙学萌 单位:中国石油长庆油田分公司勘探开发研究院 中国石油长庆油田分公司油气工艺研究院 中石油川庆钻探工程有限公司钻采工程技术研究院长庆分院