课程教育研究 课程教育研究杂志简介 课程教育研究杂志学术期刊 课程教育研究杂志公告 课程教育研究期刊目录 课程教育研究投稿须知 课程教育研究编号查询 课程教育研究征稿启事
课程教育研究杂志

主管:内蒙古自治区文化厅
     中国外语学习学研究会
主办:内蒙古自治区北方文化研究院
投稿邮箱:tougao@kcjyyj.com
网  址:http://www.kcjyyj.com
数据库收录:中国知网全文收录
我刊入选第二批学术期刊名单
期刊类别:纯教育、G4
国际标准刊号 ISSN 2095-3089
国内统一刊号 CN 15-1362/G4
邮发代号:16-129

我刊投稿论文
当前位置:网站首页 > 我刊投稿论文 >
2020-07-31 | 所属栏目:我刊投稿论文 | 阅读次数:

作者:杨春颖 王赟 张致付
  【摘要】随着学科间交叉以及大数据方法在地球物理学科的不断渗透,需要培养具有地球物理和大数据知识的综合型人才。传统地球物理专业向油气勘探开发各个阶段输送了大批人才,但在大数据方面的教学模型设计方面尚未形成对应的培养方案。本文从大数据的技术体系出发,分析了数据采集、存储管理、计算模式、数据挖掘分析等流程,并介绍了数据挖掘方法在油气勘探开发中的应用。以此为基础,设计了面向地球物理专业的数据挖掘教学模型,介绍了具体内容,希望以此教学模型为起点,设计教学大纲,开展教学探索。
  【关键词】大数据  地球物理  数据挖掘  教学模型
  【中图分类号】P3-4;G642.423【文献标识码】A 【文章编号】2095-3089(2020)26-0116-03
  大数据起源于互联网并迅速发展,在各个行业得以应用。油田勘探开发行业采集并管理着庞大的数据体:从三维宽方位采集、四维地震、生产数据到测井、岩心、生产测井,再到光纤实时数据传输。国内含油气盆地具有多样化、多期次的构造特征,有海相碳酸盐岩孔缝储层,又有陆相碎屑岩和隐蔽油气藏,,诸多复杂构造、复杂储层的勘探开发需要高精度地球物理方法,利用大数据方法进行生产决策,可以充分利用发挥已有地震数据的优势,提高并推动地球物理核心技术的发展。而大数据方法在能源行业的发展和应用,需要懂专业和大数据知识的综合型人才,该背景下地球物理专业学生培养的投入相对薄弱。
  1.大数据技术体系
  大数据流程(图1)涉及数据采集和预处理,存储和管理,计算模式,大数据挖掘和分析,以及可视化等五个方面[1,2]。数据采集主要包括以下几个方面:(1)科学实验采集,是在预先假定条件下观测到并用于研究和学术的信息系统;(2)物理信息,可以是对各种物理现象或物理过程的监控和检测,是关于介质物性、化学性质的测量数据;(3)管理信息,为日常管理和经营过程中产生的数据,例如,办公和事务处理系统;(4)Web信息系统,通常指互联网产生的各种数据信息。这些数据是对某一过程或某周期状态或某种现象的描述,这些数据的质量决定了可用性,能否精确的描述生产过程、学术问题均受到数据质量的影响。
  采集的大规模数据,可能是结构化的,也可能是非结构化的,均需要存储技术支撑;根据用户需求,数据的处理方式和结果也多种多样。因此数据的存储和管理,是大数据的另一个重要环节。将PB(1000TB)级甚至更高的EB(1000PB)级数据分散到各个节点或者设备上,是分布式存储的基本特征,目前常用的技术包括分布式文件系统,分布式数据库,大数据索引查询等。大数据计算模式(图2)有批处理、内存计算、流式计算、迭代计算、查询分析计算和图计算[3]。以常见的批处理为例,其对应的计算系统有Hadoop、MapReduce和Spark,采用的是分而治之的并行思路,是目前最为主流、较为成功的并行计算模式,具有简单易用的特点,很多企业内部使用这种批处理方法计算大数据。
  大数据的优势在于数据的体量大,通过数据挖掘,可以克服观测数据的个体波动,从而揭示更多可信赖的深层次的模式和规律,发现更潜在的数据价值,数据挖掘是通过机器学习、统计等实现数据聚类的过程。在TB级别的数据体上迭代查找有用信息,需要深入理解和扎实的数据挖掘方法。该方法本身经过了很多年的发展,已经出现了很多较为成熟的挖掘算法[4],而传统的算法较难直接应用到MapReduce、Spark等分布计算系统上,需要开发新的方法,挖掘算法可以分为聚类算法、预测回归算法、索引排序法和关联规则分析法[5],可实现知识的提取。这些方法可以在分布式存储系统框架下,并行的执行大数据挖掘任务,在准确率和效率方面大大提升。
  从大数据的技术体系可见,与数据的存储方式、计算系统研究相比,数据挖掘是面向用户需求的一种计算过程,可服务各行各业,对油气行业的发展将有很大的帮助。大数据在能源行业的发展和应用,需要懂专业和大数据知识的综合型人才,此类人才缺口较大,仅美国就需要14万到19万名拥有数据深度分析专长的从业者。近年来,像中石油这样的大型央企未雨绸缪,也在加大数据专业人才的培养力度,开始大数据的人才储备;广海局在可燃冰技术方向走在国内外前列,近两年也开始招聘数据挖掘方向,招聘专业限制为测绘和地球物理这两个专业,可见,企业和科研高校对这方面人才的需求趋势;寻求数据挖掘和地球物理专业的结合点,将是未来人才培养的一个新方向。
  2.大数据对地球物理技术的影响
  勘探地球物理旨在圈定油气藏边界,需要采集和分析大量数据,例如:野外宽方位、节点式采集产生海量地震数据,时延地震通过对有利区块重复三维采集,产生的大数据等。随着技术的发展,采集1000平方公里的三维数据是500TB,1.92万次覆盖,道数已高达700亿道。通过大数据和云技术实现数据快速传输,并实现野外与室内的实时互动,这些工作的展开都要围绕大数据技术。很多工作者已经尝试采用数据挖掘方法开展油田解释和反演工作。例如,通过关联规则、神经网络方法,统计分析油田勘探开发数据库,并研究水淹层自动识别技术[6];通过贝叶斯方法和聚类分析技术实现油田数据库监控,实现数据质量、静态、动态数据跟踪等[7]。
  国内外公司也已经开始布局大数据在油田勘探方面的应用,像国外大型油服公司CGG、Schlumberger,都在开发大数据应用平台。Schlumberger推出了认知勘探开发环境,利用了数据挖掘方法,例如,机器学习、物联网等来提供生产率,同时,也发布了数字化井建设规划方案,以便能够在统一的系统内访问钻井数据,并将此项技术逐渐应用到勘探开发的其他环节。中石化自主开发了π-frame地震数据处理和解释软件,是处理和解释一体化平台,实现了数据IO和处理的并行化,在业界首次使用MapReduce和Hadoop等分布式大数据技术,能够支撑PB级别海量地震数据的高效组织和管理。π-frame的功能不仅局限于此,未来还将包括钻井、测井等勘探开发技术,该平台与现在主流软件相比,已经具备了明显的优势。此外,中石油也在开展油田生產管理系统。随着技术的不断发展,以及生产效率的不断提高,数据挖掘技术在油气行业将展现出广泛的应用前景,对具有地球物理背景的综合型人才需求较大。


版权所有:课程教育研究杂志 网站地图 最近更新
投稿邮箱:tougao@kcjyyj.com
中国知网全文收录,第二批学术期刊。欢迎投稿!
国际标准刊号:ISSN2095-3089,国内统一刊号CN15-1362/G4