采油工程大数据挖掘系统在华北油田的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

采油工程大数据挖掘系统在华北油田的应用

檀朝东1 李鑫2 刘志海3 黄少伟2 彭健3杨若谷3

(1.中国石油大学(北京),北京昌平,102249;2. 中石油华北油田采油院,河北任丘,062550;

3.北京雅丹石油技术开发有限公司,北京昌平,102200)

摘要:本文针对华北油田采油生产过程中的海量生产数据,以抽油机井“百米吨液耗电量”为目标,应用PDMiner采油工程大数据挖掘数据系统,挖掘出影响不同区块和单井的“百米吨液耗电量”的主要因素,关联指标的趋势预测,为油井的节能降耗提出更加有针对性的措施建议。

关键词:采油工程大数据挖掘PDMiner 百米吨液耗电量

1 前言

随着石油勘探和开发工作的不断深入,油田数据呈爆炸式增长,包括地质、测井、物探、开发等各个环节中积累的数据,尤其近几年来数字油田的建设,将石油信息化带到了“大数据(Big Data)”时代。石油公司拥有的数据越多,对数据挖掘利用得越好,找到油气资源的可能性和掌控市场的能力就越大。掌握并利用好大数据,是石油公司提高核心竞争力的重要手段。

大数据挖掘技术可实现将海量数据转化为可用于指导油田生产的信息,如何利用采油生产过程中产生的海量数据,来实现采油生产的节能降耗就显得尤为重要。百米吨液耗电量指标是油田生产管理者和决策者都十分关注的一项技术经济指标,但由于影响百米吨液耗电量指标的因素众多,对于何种因素是影响区块或单井的百米吨液耗电量指标的主要因素并不十分明确,这就需要利用大数据挖掘技术来剖析各种影响因素与百米吨液耗电量之间的内在规律。本文展示了针对华北油田油井,利用PDMiner采油工程大数据挖掘系统,以“百米吨液耗电量”为目标进行的一系列的挖掘成果。

2 PDMiner大数据挖掘系统简介

2.1系统简介

PDMiner大数据挖掘系统是通过数据挖掘目标制定的数据挖掘方案,对原始数据进行处理然后建立主题数据库,并配置相关的数据挖掘算法形成数据挖掘软件系统,实现相应的业

务应用,并以图表、报表等多种展现形式进行挖掘成果展现。

PDMiner采油工程大数据挖掘系统通过寻找历史生产数据的变化规律,可有效指导油气生产的设备安全、故障诊断、工艺挖潜和节能降耗。通过数据挖掘可以解决以下问题:①发现油气生产过程中各个指标的异常情况;②油气田各个生产要素之间的关联关系;③预测油气水井生产指标变化趋势和增产增注措施效果;④预测工艺流程的安全性和工况效率指标;

⑤生产设备寿命预测和维修预警;⑥科学地对油气生产活动和成本控制提出预警和优化等

[1]。

2.2系统架构

整个系统架构分三层,数据层、应用层、展现层,如图2.1所示。

图2.1 数据挖掘软件平台系统架构图

数据层是负责所有数据的持久存储、处理,通过从各个数据源经过抽取、清洗、加载等转换操作后,进入主题数据库。

应用层是利用软件通过挖掘算法进行数据挖掘。

展现层是对数据挖掘进行图形、报表、进程分析等展示功能。

2.3大数据挖掘流程

在进行数据挖掘之前,首先需要清晰地定义出业务问题,认清数据挖掘的目标,并形成挖掘方案,这是进行大数据挖掘的重要一步;其次根据数据挖掘方案提出数据需求,从而进行数据准备工作,有了充分的数据准备,才有可能得到想要的挖掘结果。大数据挖掘流程如图2.2所示。

图2.2 大数据挖掘流程

(1)数据集成:在这一步中,将从操作型环境中提取并集成数据,解决语义二义性问题,消除脏数据等。很明显,数据集成的目的和所利用的技术与数据挖掘中的数据集成完全一致,都是为了建立统一的数据视图。

(2)数据选择:这一步的作用是缩小数据范围,提高数据挖掘质量。

(3)数据预处理:主要任务是数据清洗、数据集成、数据转换、数据归约。

3 大数据挖掘在华北油田应用效果分析

3.1数据可视化

3.1.1应用技术

PDMiner通过直观地传达关键的方面与特征,实现对相当稀疏而又复杂的数据集的深入洞察。PDMiner根据客户的需要,利用各种图表组件,将采集到的信息,加以可视化解释,使得能耗盲点与节能潜力等都可以直观地体现。

3.1.2应用案例

数据可视化展示是将抽象的数据空间转换为直观的视觉空间,以便于采油工程技术或管理人员通过强大的视觉处理能力发现隐藏在抽象数据空间中的模式、见解和知识,比如通过图表以直观的方式展示区块所有油井的能耗现状图、单井或区块综合指标、生产日报等。

图3.1 阿尔3-12井综合曲线

如图3.1所示,该图是阿尔3-12井综合曲线,从图中可直观看出油井日产液、系统效率和功率因数等变化趋势及相互影响关系。

3.1.3应用场景

数据可视化的基本思想是将PDMiner数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。PDMiner中的各种图表组件都是利用数据可视化方法将采油工程中的能耗属性、生产运行参数、生产运行指标及状态等进行全面而丰富的展示。

3.2离群点分析

3.2.1应用技术

PDMiner通过离群点分析,在能源管理时间序列数据中,搜索非正常的序列模式,查找能耗异常的空间或时间维度的离群点,即自动查找出超出正常值的异常时段能耗、异常区块能耗、异常设备能耗等,并通过其他物联网传感器数据,判明能耗异常原因,并进行调整记录[2]。

3.2.2应用案例

以华北油田油井为例,比如某口油井的百米吨液耗电量指标远高于该区块其它油井,这意味该油井的能耗行为与该区块的正常能耗行为相比,是一个离群点,有很大可能是该油井的下泵深度较深,原油粘度较高,抽油设备较其它油井所用型号更高,电机的装机功率更大等缘故,类似于这样的离群点就不能作为噪声数据或异常点数据清除掉,而需要分析和查明原因。

图3.2 离群点分析

相关文档
最新文档