坑透数据处理
数据分析的5大陷阱及其解决方案
数据分析的5大陷阱及其解决方案本篇文章小编给大家分享一下数据分析的5大陷阱及其解决方案,喜欢大数据开发技术的小伙伴可以随着小编一起来了解下。
1、数据碎片化严重毋庸置疑,计算机行业仍然是新兴产业,技术标准和市场规范暂时无法完全实现。
解决问题的方法及创意五花八门。
当然,这是好事——一般新兴产业都是这样发展的。
虽然市场现在逐渐有一些整合和标准,但革命道路漫漫,仍然有许多问题亟待解决。
这种半规范环境产生的副作用之一,便是数据碎片化——这给营销人员造成了很多困难。
想想看你正在使用的那些软件或工具——全部来自不同的开发商,每一款都独立不兼容——它们都可以满足营销人员追踪目标数据的需求。
你有网页分析工具(先不论它具体追踪什么,也不谈它提供的数据精度有多少),很可能还有一款单独的移动应用分析工具,客户关系管理(CRM)系统,后台系统,甚至社交媒体测评解决方案,独立邮件营销解决方案,以及一大群数字广告和线下广告数据供应商——包括机构和平台等。
营销人员经常被要求“依据数据作决策”,然而网络工具太多,扑面而来的数据早已让人看不真切。
事实上,只有极少数企业能做到有效整合数据,锁定目标客户。
如今,营销的对象是每一位不同的顾客个体。
而且营销人员接近顾客比以往要容易许多。
因为顾客在使用各种设备,如智能手机,电脑,机顶盒等。
不过,虽然现在这种多设备多渠道的环境提供了很多机遇,但要将碎片化的信息和数据整合到一起,仍是不小的挑战。
无法整合各种渠道的数据,会加剧数据碎片化。
而营销人员只能依据单一渠道提供的数据作决策。
于是,营销人员对数字媒体和传统媒体的投资,只能通过每个渠道单一的数据进行评估分析。
不过,有远见的营销人员则学会用联系的角度看问题,将营销看作整体,关注顾客消费历史和过往消费体验。
他们会从现有顾客中锁定受众,并从培养忠诚顾客的角度掌握其所有消费经历,把握各种渠道的接触点。
虽然计算机行业仍处于初步发展阶段,要做到这一点确实不易。
针对不完整数据的大数据清洗方法
针对不完整数据的大数据清洗方法大数据清洗是指对大数据集中存在的不完整数据进行处理和修复的过程。
不完整数据可能包括缺失值、异常值、重复值等。
本文将介绍针对不完整数据的大数据清洗方法。
一、缺失值处理1. 删除法:如果缺失值占比较小,可以直接删除包含缺失值的样本或特征。
但要注意,删除缺失值可能会导致信息的丢失,需要谨慎使用。
2. 插补法:常见的插补方法有均值插补、中位数插补、众数插补等。
这些方法适用于数值型数据,可以用样本的均值、中位数、众数等代替缺失值。
3. 回归法:对于存在相关性的特征,可以通过回归模型来预测缺失值。
通过已知特征的值来预测缺失特征的值,常见的回归方法有线性回归、多项式回归等。
4. 插值法:插值法适用于连续型数据,常见的插值方法有线性插值、拉格朗日插值、样条插值等。
这些方法通过已知数据点之间的插值来估计缺失值。
二、异常值处理1. 删除法:对于明显的异常值,可以直接删除。
但要注意,异常值可能包含有用的信息,需要谨慎判断。
2. 替换法:可以用均值、中位数或者其他合理的值来替换异常值。
替换方法的选择应根据具体情况来决定。
3. 剔除法:对于包含异常值的样本,可以将其从数据集中剔除。
但要注意,剔除异常值可能会导致数据集的偏差,需要谨慎使用。
4. 分箱法:将连续型数据分成多个区间,将超出某个区间的值视为异常值。
分箱法可以有效处理连续型数据中的异常值。
三、重复值处理1. 删除法:对于重复的样本或特征,可以直接删除。
但要注意,删除重复值可能会导致信息的丢失,需要谨慎使用。
2. 标记法:可以给重复值打上标记,标记出重复的样本或特征。
标记法可以帮助识别和处理重复值。
3. 合并法:对于重复的样本或特征,可以将其合并为一个样本或特征。
合并法可以减少数据集的大小,提高处理效率。
四、数据清洗流程1. 数据预处理:包括数据采集、数据存储、数据清洗等步骤。
在数据采集过程中,要注意数据的准确性和完整性。
2. 缺失值处理:根据缺失值的情况选择合适的处理方法,如删除法、插补法等。
坑透仪操作精简版本
接收机:
1、按“电源”键开机;
2、按“有效”键,接着按“清零”,选择数字,按“有效”键确认;(如果内存
没数据开机直接显示PS 005,跳过2步骤做3);
3、按“复位”键,接着按“重显重写”键,选择频率对应数字,按“有效”键
确认;
4、按“增量输出”键,选数字“8”或“9”,将“PS+1”,改为“5”,按“有效”
确认,接着选“8”或“9”,“RE+1”不修改,按“有效”键确认;
5、设置发射点和接收点的实际位置,按“有效”键确认;
6、开始测量,按“有效”键保存数据。
测量一个发射点对应的11个接收点,按
“换页”键,此时发射点自动递增或递减50米,按“有效”键确认,修改接收点的位置,加或减5,按“有效”键确认。
开始测量。
一条巷道测完直接关机;
7、交换巷道。
开机,按“有效”键,接着按任意“数字键”,接着按“增量输出”
键,接下步骤同4、5、6。
测完关机。
发射机:
1、挂好天线,选定频率,开机调调谐按钮使指针偏向最大即可。
3分钟发射完
毕移动到下一个点。
2分钟移动50米,5分钟一个工作周期。
坑透数据处理
无线电波透视法(坑透)从上世纪20年度苏联A·A·彼得罗夫斯基院士提出设想至今,在坑道找矿、煤层工作面构造探测等方面取得了很好的应用效果。
对于无线电波透视法的资料处理,早期采用手工计算、绘图,比较繁琐、工作量大;随着电子计算机技术的发展,采用计算机自动处理的技术逐渐被推广应用,使资料处理效率得到了很大的提高,减轻了地球物理工作者的劳动强度。
从无线电波透视法理论出发,结合无线电波资料处理、解释以及生产报告撰写要求,设计了条件试验分析、异常数据的编辑、多方法的求参分析功能、单点综合曲线绘制、单巷道多测点综合曲线绘制、工作面内吸收系数的反演计算等功能,满足无线电波透视法资料处理高效、准确的要求。
坑透资料的基本处理流程如下:一、参考处理流程对坑透资料的基本处理步骤如下:1.进行“文件->新建工程”操作,输入工程名称、各拐点坐标等工程参数。
2.进行“数据->测值输入”操作,输入各发射点对应的实测场强值及参数。
3.若存在条件试验,可以执行菜单中的“条件试验分析”,采用回归算法分析初始场强H0及吸收系数β。
4.进行“参数分析”操作,可以选择“实测场强法”、“图解法”、“回归分析法”,对各个发射点对应的接收场强值进行初始场强H0及吸收系数β分析,掌握测区的电磁参数。
5.进行“层析成像计算”操作,选择“绝对衰减法”或“相对衰减法”进行CT成像反演计算。
6.进行“结果输出”操作,将反演结果输出为文本格式,可以利用Surfer等专业绘图软件进行绘图操作。
7.进行“图形查看”操作,可以根据资料解释、报告撰写的要求,输出各种曲线。
对于已经存在的工程,可以执行“打开工程”操作,然后再进行3~7步。
二、新建工程点击菜单中的“文件”->“新建工程”,弹出对话框:图2-1 新建工程对话框http:// 好pan.好baidu.好com/s/好1o6I5uyu——去掉“好”,见演示程序。
(1)输入工程名称、组成工作面的拐点总数、发射点数目。
Python数据清洗处理和清理不规范的数据
Python数据清洗处理和清理不规范的数据在数据分析和机器学习过程中,往往需要处理和清理不规范的数据。
不规范的数据包括缺失值、异常值、重复值以及格式不一致等问题。
本文将介绍使用Python进行数据清洗处理和清理的常用技巧和方法。
一、缺失值处理缺失值是指数据中的某些信息或数值未被记录或保存的情况。
在数据分析中,缺失值会导致结果失真或者无法进行分析。
常见的处理方法包括删除缺失值、填充缺失值和插值填充。
1. 删除缺失值:对于缺失值较多或者对结果影响较小的情况,可以选择删除缺失值所在的行或列。
示例代码:```df.dropna() # 删除包含缺失值的行df.dropna(axis=1) # 删除包含缺失值的列```2. 填充缺失值:对于缺失值较少或者对结果影响较大的情况,可以选择填充缺失值。
填充的方法包括使用均值、中位数、众数等。
示例代码:```df.fillna(value=df.mean()) # 使用均值填充缺失值df.fillna(value=df.median()) # 使用中位数填充缺失值df.fillna(value=df.mode().iloc[0]) # 使用众数填充缺失值```3. 插值填充:对于数据具有连续性的情况,可以使用插值方法进行填充,如线性插值、样条插值等。
示例代码:```df.interpolate() # 使用线性插值填充缺失值```二、异常值处理异常值是指与其他观测值相比明显偏离的数值。
异常值可能是由于数据采集错误、测量误差或者真实存在的特殊情况引起的。
在数据分析中,异常值往往会对结果产生较大的干扰,因此需要进行处理。
1. 利用箱线图识别异常值:箱线图可以有效地识别数据中的异常值。
根据箱线图中的上下限,可以判断哪些观测值属于异常值。
示例代码:```import seaborn as snssns.boxplot(data=df) # 绘制箱线图```2. 使用统计方法判断异常值:通过计算数据的均值、标准差等统计指标,可以判断哪些观测值偏离正常范围。
数据透析表中的遗漏数据处理与错误数据纠正技巧解析
数据透析表中的遗漏数据处理与错误数据纠正技巧解析数据透析是现代企业决策的重要工具,用于分析和解读大量的数据,从而帮助企业做出合理的决策。
然而,在数据透析中,遗漏数据和错误数据是常见的问题,它们可能会导致分析结果的不准确性,从而影响决策的质量。
因此,如何处理和纠正遗漏数据和错误数据成为了数据透析工作中的重要一环。
首先,我们需要了解什么是遗漏数据和错误数据。
遗漏数据是指在数据透析表中缺失的数据,可能是由于数据收集过程中的疏忽或技术问题导致的。
错误数据则是指在数据透析表中存在的不准确的数据,可能是由于数据录入错误或数据源产生错误导致的。
对于遗漏数据,最常见的处理方法是使用插值法填充。
插值法是一种根据已有数据的规律推测缺失数据的方法。
其中,线性插值法是最简单的一种方法,它基于已有数据的趋势进行插值。
例如,如果数据透析表中某一列的数值按照时间变化趋势递增,那么可以使用线性插值法根据已有数据的趋势来推测缺失数据的数值。
此外,还有更复杂的插值方法,如多项式插值、样条插值等,在实际应用中可以根据数据的特点选择适合的插值方法。
对于错误数据,首先需要进行数据清洗工作。
数据清洗是指通过一系列的操作,如去除重复项、填补缺失数据、校正格式等,使数据适应分析的要求。
其中,去除重复项是非常重要的一步,可以避免在分析过程中对重复数据进行多次计算。
填补缺失数据的方法同样可以使用插值法,如最近邻插值法、均值插值法等。
校正格式主要包括转换日期格式、修正数据类型等操作。
另外,还需要进行异常值的识别和处理。
异常值是指与其他观测值显著不同的特殊数值,可能是由于测量误差、数据录入错误或其他原因导致的。
通常情况下,可以使用箱线图和Z-score方法识别异常值,并根据实际情况决定是否进行处理或排除。
除了数据清洗外,还可以使用数据校验的方法来纠正错误数据。
数据校验是指通过一系列的规则或算法来检查数据的准确性和一致性,并进行相应的纠正。
例如,可以使用公式校验来检查数值之间的关系是否正确,使用逻辑校验来检查数据的一致性和合理性。
物探工测试题(含参考答案)
物探工测试题(含参考答案)1、坑透法利用岩矿石的()不同来进行探测的A、力学性B、磁性|C、电性|答案:C2、PROTEM瞬变电磁仪的动态范围是()bits.A、27B、28C、29D、30答案:C3、发射时电流过大(大于70mA),仪器发射后显示“error!”需()。
A、提高电压B、重新砸电极C、接入限流盒D、重新启动仪器答案:C4、瓦斯喷出区域和突出煤层采用局部通风机通风时,必须采用()。
A、压入式B、抽出式C、混合式D、其它答案:A5、过滤电场的形成是由于()。
A、岩石颗粒与溶液负离子的选择吸附作B、溶液与矿体之间的电化学作用C、高浓度溶液向低浓度的溶液的扩散答案:A6、瞬变电磁仪二次磁场具有对于高阻体,曲线衰减();对含水低阻体呈现为衰减( )的特征。
A、较慢、较快|B、较快、较慢C、较慢、较慢D、较快、较快7、射线和波前的关系是()A、无关联B、相互平行C、相互斜交|D、相互垂直答案:D8、对共反射点道集记录,经过动校正后,各道反射波的传播时间,都校正成()反射时间。
A、垂直B、标准答案:A9、探放水工打钻过程中()停风。
A、可以B、不准C、不注意D、及时答案:B10、使用音频电穿透仪探测时,在接收巷道布置M、N电极时,电极一般()。
A、与巷道平行、不定间距B、与巷道平行、等间距C、与巷道垂直、等间距D、与巷道垂直、不定间距答案:C11、槽波地震施工时,炮点与数据采集站布置在同一巷道内,接收来自工作面内的地震反射信号,属于()A、透射/反射联合勘探法B、回射槽波勘探法C、反射槽波勘探法D、透射槽波勘探法答案:C12、瞬变电磁操作时,叠加次数应不少于()次。
A、30B、24D、64答案:A13、采区避灾路线上应当设置压风管路,其中主管路直径不小于()mm。
A、120B、100C、75D、50答案:B14、井下临时停工的作业地点()停风。
A、根据瓦斯浓度大小决定B、不得C、可以D、根据时间长短决定答案:B15、关于逆断层,下列说法错误的是( )。
电磁坑透实施方案
电磁坑透实施方案引言:电磁坑透是一种利用电磁波穿透材料的技术,可以在不破坏外观的情况下,对材料内部进行观测和探测。
本文将介绍电磁坑透的实施方案,包括所需设备和步骤。
一、设备准备1. 电磁波发射器:用于产生电磁波,并将其发送到待观测物体上。
2. 电磁波接收器:用于接收经过物体后反射出来的电磁波,并将其转化为可视化的图像或数据。
3. 数据处理设备:用于处理接收到的电磁波数据,提取有用的信息并进行分析。
二、实施步骤1. 选择适当的电磁波频率:不同的材料对不同频率的电磁波有不同的穿透效果。
根据待观测物体的特性选择合适的频率,以获得更准确的结果。
2. 对待观测物体进行准备:确保待观测物体表面干净平整,以减少电磁波的散射和衰减。
3. 配置电磁波发射器和接收器:将发射器和接收器放置在适当的位置,使其与待观测物体保持一定的距离。
确保发射器和接收器之间没有遮挡物,以确保电磁波的传输和接收。
4. 发射电磁波:通过发射器产生电磁波,将其发送到待观测物体上。
电磁波在物体内部穿透并与物体内部结构相互作用。
5. 接收电磁波:接收器接收经过物体后反射出来的电磁波,并将其转化为可视化的图像或数据。
6. 数据处理和分析:使用数据处理设备对接收到的电磁波数据进行处理和分析。
通过比对已有的数据和标准模型,可以对物体内部的结构和特性进行分析和判断。
三、应用领域1. 工业领域:电磁坑透可以用于检测工业产品内部的缺陷、异物或裂纹等问题,如金属材料的焊接质量检测、管道内部的堵塞检测等。
2. 医学领域:电磁坑透可以用于医学影像检查,如X光透视、CT 扫描等。
它可以帮助医生观察和诊断患者的内部情况,从而指导治疗。
3. 地质勘探:电磁坑透可以用于地质勘探,例如探测地下矿藏、水资源分布等。
通过分析电磁波在不同地质结构中的传播和反射,可以推断出地下的结构和物质分布情况。
4. 安全检查:电磁坑透可以用于安全检查,例如机场安检中的行李透视、建筑物中的隐蔽武器探测等。
大数据分析师的数据分析过程中的常见错误和陷阱
大数据分析师的数据分析过程中的常见错误和陷阱数据分析在当今互联网时代扮演着至关重要的角色,而大数据分析师则是这个领域中的重要从业人员。
然而,在进行数据分析的过程中,大数据分析师常常会遇到一些常见的错误和陷阱。
本文将探讨这些错误和陷阱,并提供相应的解决方法,以帮助大数据分析师更加准确地进行数据分析。
一、数据清洗错误和陷阱在进行数据分析之前,数据清洗是非常重要的一步。
然而,很多大数据分析师在数据清洗过程中存在一些常见错误和陷阱。
以下是几个常见的错误和陷阱,以及相应的解决方法:1. 缺失数据处理不当在实际数据采集和整理过程中,可能会出现缺失数据的情况。
如果不妥善处理,缺失数据可能会对最终的分析结果造成误导。
解决方法之一是使用适当的填充方法,如均值、中位数或众数填充缺失的数据。
2. 异常值未正确处理在数据中存在异常值时,如果没有正确处理,这些异常值可能会对分析结果产生不利影响。
解决方法之一是使用合理的统计指标,如平均绝对偏差(MAD)或箱型图(box plot)来检测和处理异常值。
3. 数据格式错误数据分析中常常会涉及到不同的数据格式,如日期时间、文本或数值。
在处理过程中,如果没有正确处理不同的数据格式,可能会导致分析结果的误解。
解决方法之一是将数据按照正确的格式进行转换,以便于后续的分析和处理。
二、数据分析方法错误和陷阱在进行数据分析的过程中,选择合适的分析方法是非常重要的。
以下是一些常见的数据分析方法错误和陷阱,以及相应的解决方法:1. 不适当的统计方法选择在进行数据分析时,选择适当的统计方法能够更准确地得出结论。
然而,很多大数据分析师在选择统计方法时存在迷茫和错误。
解决方法之一是对不同的统计方法进行充分了解,并根据问题的特点选择最合适的方法。
2. 忽略样本量大小样本量对于数据分析的可靠性非常重要,但很多分析师在进行数据分析时常常忽视样本量的大小。
解决方法之一是进行样本容量计算,确保样本量足够大以得到可靠的结果。
针对不完整数据的大数据清洗方法
针对不完整数据的大数据清洗方法一、引言在大数据时代,数据的质量对于数据分析和决策制定至关重要。
然而,现实中我们常常面临着不完整的数据,这些数据可能包含缺失值、异常值、重复值等问题,对数据的准确性和可靠性造成了影响。
因此,针对不完整数据的大数据清洗方法成为了必不可少的步骤。
本文将介绍几种常用的针对不完整数据的大数据清洗方法。
二、缺失值处理缺失值是指数据中某些项的值缺失或未记录的情况。
处理缺失值的方法主要有删除、插补和建模三种。
1. 删除法删除法是指直接删除包含缺失值的样本或变量。
这种方法适用于缺失值比例较低的情况,并且缺失值是随机分布的。
但是,这种方法会导致数据量减少,可能影响模型的准确性。
2. 插补法插补法是指根据已有的数据推测缺失值,并用推测值替代缺失值。
常用的插补方法有均值插补、中位数插补、回归插补等。
均值插补适用于数值型数据,将缺失值用该变量的均值替代;中位数插补适用于偏态分布的数值型数据,用该变量的中位数替代缺失值;回归插补适用于存在关联关系的变量,通过建立回归模型来预测缺失值。
3. 建模法建模法是指利用已有的数据建立模型,通过模型预测缺失值。
常用的建模方法有KNN(K最近邻)算法、决策树、随机森林等。
这些方法可以根据已有的数据特征,预测缺失值,并用预测值替代缺失值。
三、异常值处理异常值是指与其他观测值相比明显不同的观测值。
处理异常值的方法主要有删除、替换和离群值检测三种。
1. 删除法删除法是指直接删除异常值。
这种方法适用于异常值对数据分析结果影响较大的情况。
但是,删除异常值可能会导致数据量减少,需要谨慎使用。
2. 替换法替换法是指用合理的值替代异常值。
常用的替换方法有均值替代、中位数替代、分位数替代等。
均值替代适用于正态分布的数据,用该变量的均值替代异常值;中位数替代适用于偏态分布的数据,用该变量的中位数替代异常值;分位数替代适用于存在极端值的数据,用该变量的分位数替代异常值。
3. 离群值检测离群值检测是指通过统计学方法或机器学习算法识别和标记异常值。
YDT175矿用无线电波透视仪使用说明书
矿用无线电波透视仪数据处理解释软件 处理软件使用说明书中国煤炭科工集团西安研究院有限公司2014年5月一软件概况1 软件的简介本软件系统是专为矿用无线电波透视仪开发的数据处理系统,该软件系统具比较强大的数据处理功能,能十分容易地实现坑透数据的显示、预处理、处理以及成果图的输出工作,且所有的工作均只需触发相应的按键即可实现,对工作面内的异常(尤其是沿走向方向上的异常)具有良好的分辨率。
2 软件运行的环境运行系统要求:本款软件能在现有较为常见的系统上平稳运行,如window2000、windowXP、window7、window8系统。
硬件要求:Cpu:PENTIUM 166硬盘:20G内存:80M3 软件的安装及运行双击Setup.exe文件,弹出如下的安装界面图1.1 矿用无线电波透视仪软件安装界面单击“下一步”继续安装过程图1.2 矿用无线电波透视仪软件安装界面单击“我接收”继续下一步图1.3 矿用无线电波透视仪软件安装界面默认情况下,软件会安装在系统文件C盘的根文件夹下,通过“浏览”可以更改安装路径。
单击“安装”,软件安装过程开始。
图1.4 矿用无线电波透视仪软件安装界面软件安装完成后,安装matlab的运行库图1.5 矿用无线电波透视仪matlab运行库安装单击“完成”,进行运行时的安装。
图1.6 矿用无线电波透视仪matlab运行库安装完成单击“finish”完成整个软件的安装过程并退出安装程序,桌面上会出现软件快捷方式图标。
4 数据原始文件的说明WKT-2000输出结果格式为dat文本文件,文件内包含五列数据,数据的具体内容为:第一列第二列第三列第四列第五列发射巷号发射点号接收巷号接收点号接收场值其中,第一列数据的值为1或2,第三列与第一列对应,其值为2或1,第2,4列的值为实际的发射/接收点号,第五列是接收的场值。
二数据的显示对无线电波坑透数据的显示主要包括:单发射点接收曲线、不同巷同点发射接收对比曲线、同一巷道不同点发射对比曲线、射线分布曲线。
简述基坑监测数据处理的基本步骤。
简述基坑监测数据处理的基本步骤。
简述基坑监测数据处理的基本步骤基坑监测数据处理是确保基坑工程安全和质量的重要环节。
其基本步骤包括数据采集、数据整理、数据分析、图表绘制、对比分析、趋势预测、信息反馈、安全评估和报告编制。
数据采集数据采集是基坑监测的第一步,通过合适的仪器设备对基坑进行实时数据采集和传输。
这些设备包括但不限于水准仪、全站仪、测斜仪、孔隙水压力计等,用于监测基坑的位移、沉降、变形、地下水位等关键参数。
数据采集的准确性和及时性对于后续的数据处理和分析至关重要。
为了确保数据的准确性,通常需要对设备进行定期校准,并在采集过程中进行多次测量以减少误差。
此外,数据采集的频率和时间间隔应根据基坑施工的进度和环境条件进行合理设置,以确保数据的连续性和代表性。
数据整理在每个监测周期后,需要对观测数据进行整理、计算和编录。
这包括检查数据的完整性、剔除异常值、进行必要的单位转换等。
数据整理的目的是确保数据的准确性和一致性,为后续的数据分析提供可靠的基础。
数据整理过程中,通常会使用专业软件进行数据的初步处理,以提高效率和准确性。
对于异常数据的处理,需要结合现场实际情况进行判断,避免误删有效数据。
同时,数据整理的结果应进行详细记录,以便于后续的追溯和验证。
数据分析与图表绘制数据分析是基坑监测数据处理的核心环节。
通过对监测数据进行及时的分析和判断,可以确定边坡是否存在安全隐患。
常用的数据分析方法包括统计分析、趋势分析、相关性分析等。
同时,根据处理后的数据,绘制各类图表如累计变形曲线、变形速率曲线等,以直观展示基坑的变形情况。
数据分析的结果可以帮助工程师识别潜在的风险区域,并为施工方案的调整提供依据。
图表绘制过程中,应注意选择合适的图表类型和比例,以确保信息的清晰传达。
对比分析、趋势预测与信息反馈将监测数据与设计值、预警值进行对比分析,可以评估基坑的稳定性。
如果监测数据接近或超过预警值,需要立即采取措施进行处理。
物探工单选测试题与参考答案
物探工单选测试题与参考答案一、单选题(共100题,每题1分,共100分)1、如果构造含水,由于矿井水的矿化度较高,因其导电良好,相当于存在局部()值地质体。
A、高电阻率B、低电阻C、低电阻率D、高电阻正确答案:C2、地震勘查精查时,控制第一水平内主要煤层的底板标高,其深度小于200m时解释误差不大于()。
A、10mB、5mC、15mD、14m正确答案:A3、直流电法三极超前探测时,供电电极固定不动,测量电极极距固定不变,沿巷道后方移动。
每移动一次,变换A1、A2、A3、三个供电电极,分别测量以A1O,A2O,A3O、为半径测量对应与MN之间的()。
A、电流B、电压C、电位D、电阻正确答案:C4、()不是透水预兆。
A、水叫B、掉渣C、煤壁变冷|D、挂红正确答案:B5、PROTEM瞬变电磁仪的第()行显示了垂直方向的信号分辨率。
A、三B、四C、一正确答案:A6、音频电透视采用低频交流供电,频率一般为()。
A、30Hz~100HzB、15Hz~100HzC、10Hz~80HzD、0Hz~100Hz正确答案:B7、槽波地震勘探中,透射法探测的距离能达到煤厚的()倍。
A、200B、300C、350D、100正确答案:B8、地震勘查精查时,查明第一水平或初期采区内主要煤层露头位置,其平面位置误差不大于()。
A、200mB、150mC、100mD、50m正确答案:C9、地面三维地震勘探时,目前主要利用反射()。
A、横波B、纵波C、声波D、面波正确答案:B10、关于矿用瞬变电磁法BI地面瞬变电磁,说法不正确的是()A、分辨率低B、体积效应小C、测量速度快D、轻便正确答案:A11、掘进工作面瞬变电磁探测发现前方存在低阻异常区,一般预测为()B、采空或含水层及构造水富水异常区C、陷落柱正确答案:B12、面波的传播速度比折射波的传播速度()。
A、高B、相等C、低正确答案:C13、音频电透视交汇法中,集流效应使得点源场中高阻地质体方向上的电位下降梯度()。
物探工练习题库(附参考答案)
物探工练习题库(附参考答案)1、纵波和横波可以在介质的整个立体空间中传播,所以把他们合称为()。
A、面波B、体波答案:B2、沉积岩区别于岩浆岩最具特征的构造是( )。
A、泥裂B、片状构造|C、层理构造D、块状构造答案:C3、随着测点的变化,下列哪种装置的装置系数K是恒定不变的。
()A、联合剖面装置B、中间梯度法装置C、对称四极测深装置答案:C4、YTR(D)矿用瑞利波探测仪探测距离一般小于等于()米A、120B、100C、80答案:C5、音频电透视法采用A—MN装置施工时,MN应布置在帮和槽的底面拐角处,其连线应( )顺槽走向。
A、平行B、垂直C、斜交D、其他答案:B6、用于石油和天然气勘探最有效的物探方法是( )A、电法|B、磁法C、地震D、重力|答案:C7、直流电法仪探测时利用目标体电性参数的差异来分辨目标体,其中电性参数包括()。
A、视电阻率B、电流C、电压D、以上三项答案:D8、非均匀介质的视电阻率是指( )A、电场作用范围内地层地点断面的均方根电阻率B、电场作用范围内电阻率的综合反映,哪一层的电阻率都不是C、电场作用范围内地层地电断面的平均电阻率。
答案:B9、石炭二叠纪最重要的标准化石是( )。
A、鱼类B、笔石海绵等C、三叶虫腕足类等D、珊瑚等答案:D10、在电阻率对称四极法中,某测点已知:AM=100米,MN=10米,I=1000mA,∆ Umn=10mV,求其视电阻率值为()Ωm。
A、10πB、11πC、12πD、13π答案:B11、矿井音频电透视法是在采煤工作面的两顺槽间进行,一般每()一个测点,50m一个供电点。
A、15m|B、20mC、5mD、10m答案:D12、槽波地震中横波比纵波传播的慢,只在固体介质中传播,振动方向与传播方向()A、无法确定B、垂直C、平行D、呈30°答案:B13、“物探”专业的全名叫( )A、地球物理勘探B、物质勘探C、补充勘探D、物体勘探答案:A14、矿用钻孔测井分析仪探头探测时由()将其推入被测钻孔中A、推杆B、锚索|C、钻杆D、顶杆答案:A15、仪器使用()年,需由现场操作人员检查能否正常充电和工作,能否基本达到技术要求。
针对不完整数据的大数据清洗方法
针对不完整数据的大数据清洗方法引言概述:随着大数据时代的到来,数据的规模和复杂性不断增加,但往往数据中存在着各种不完整的情况,如缺失值、异常值等。
这些不完整的数据会影响到数据分析和决策的准确性和可靠性。
因此,针对不完整数据的大数据清洗方法变得至关重要。
本文将介绍针对不完整数据的大数据清洗方法,并分为五个部份进行详细阐述。
一、缺失值处理:1.1 删除缺失值:当缺失值占比较小且对整体数据影响不大时,可以选择直接删除缺失值所在的行或者列。
1.2 插补缺失值:对于缺失值较多或者对整体数据影响较大的情况,可以采用插补方法填充缺失值。
常用的插补方法有均值、中位数、众数等。
1.3 模型预测:利用其他变量建立模型,预测缺失值,并进行填充。
例如,可以使用回归模型、KNN算法等进行预测。
二、异常值处理:2.1 简单统计方法:通过统计学方法,如3σ原则、箱线图等,识别和处理异常值。
2.2 预测模型:利用机器学习算法构建异常检测模型,对数据进行异常值检测和处理。
2.3 集成方法:将多个异常检测算法进行组合,提高异常值检测的准确性和鲁棒性。
三、重复值处理:3.1 基于主键的去重:根据数据集的主键进行去重操作,保留惟一的记录。
3.2 基于规则的去重:根据特定的规则判断记录是否为重复,如姓名、电话号码等。
3.3 基于相似度的去重:利用文本相似度或者数值相似度计算方法,判断记录之间的相似度,进而去重。
四、数据格式规范化:4.1 统一单位:对于存在不同单位的数据,进行单位转换,使数据具有一致性。
4.2 格式转换:将数据转换为特定的格式,如日期格式、数值格式等,以便于后续的分析和处理。
4.3 数据标准化:对数据进行标准化处理,使其具有相同的尺度和范围,避免不同变量之间的差异性影响分析结果。
五、数据去噪:5.1 平滑技术:利用滑动窗口、滤波器等平滑技术,去除数据中的噪声。
5.2 聚类方法:通过聚类算法将数据点进行分组,去除异常点和噪声。
针对不完整数据的大数据清洗方法
针对不完整数据的大数据清洗方法大数据清洗是指对大规模数据进行预处理、筛选和修正,以确保数据的准确性、完整性和一致性。
在实际应用中,我们往往会遇到不完整的数据,包括缺失值、异常值、重复值等情况。
针对这些不完整的数据,我们需要采取相应的方法进行清洗,以保证数据的质量和可用性。
一、缺失值处理方法:1. 删除法:对于缺失值较多的数据,可以选择直接删除缺失值所在的行或者列。
这种方法适合于缺失值较少且对结果影响较小的情况。
2. 插补法:对于缺失值较少的数据,可以采用插补法进行填充。
常用的插补方法有均值插补、中位数插补、众数插补等。
根据数据的特点和背景知识,选择合适的插补方法进行填充。
二、异常值处理方法:1. 删除法:对于明显的异常值,可以选择直接删除。
但需要注意,异常值可能包含实用的信息,需要结合实际情况进行判断。
2. 替换法:对于异常值,可以选择用合适的值进行替换。
常用的替换方法有均值替换、中位数替换、分位数替换等。
根据数据的分布和特点,选择合适的替换方法进行处理。
三、重复值处理方法:1. 删除法:对于重复值,可以选择直接删除。
但需要注意,重复值可能包含实用的信息,需要结合实际情况进行判断。
2. 合并法:对于重复值,可以选择将其合并为一个值。
常用的合并方法有取平均值、取最大值、取最小值等。
根据数据的特点和背景知识,选择合适的合并方法进行处理。
四、数据一致性处理方法:1. 格式统一化:对于不同格式的数据,可以选择统一格式。
例如,将日期统一为相同的格式,将单位统一为相同的标准。
2. 数据匹配:对于相同含义的数据,可以进行匹配和合并。
例如,将不同数据源的客户信息进行匹配和合并,以获得更完整和一致的客户信息。
以上是针对不完整数据的大数据清洗方法的一些常见处理方法。
在实际应用中,需要根据具体情况选择合适的方法进行处理,并结合数据的特点和背景知识进行判断和决策。
清洗后的数据将更准确、完整和一致,为后续的数据分析和挖掘提供可靠的基础。
针对不完整数据的大数据清洗方法
针对不完整数据的大数据清洗方法大数据清洗是指对海量数据进行筛选、整理和修复,以确保数据的准确性和完整性。
在实际应用中,经常会遇到不完整数据的情况,即数据中存在缺失、错误或不一致的部分。
针对不完整数据的大数据清洗方法可以通过以下几个步骤来实现:1. 数据预处理在进行大数据清洗之前,首先需要进行数据预处理。
数据预处理包括数据采集、数据存储和数据传输等步骤。
在数据采集阶段,可以通过网络爬虫、传感器等方式获取数据。
在数据存储阶段,可以选择使用关系型数据库、非关系型数据库或分布式文件系统等进行数据存储。
在数据传输阶段,可以使用消息队列、数据总线等方式进行数据的传输。
2. 数据清洗数据清洗是指对不完整数据进行筛选、整理和修复的过程。
数据清洗的主要目标是发现和纠正数据中的错误、缺失和不一致之处。
数据清洗可以通过以下几个步骤来实现:a. 数据预览与统计:首先对数据进行预览和统计,了解数据的整体情况,包括数据的类型、分布和异常值等。
b. 缺失值处理:对于存在缺失值的数据,可以选择删除缺失值、填充缺失值或使用插值方法进行缺失值处理。
删除缺失值的方法适用于缺失值较少的情况,填充缺失值的方法适用于缺失值较多的情况,插值方法适用于连续型数据的缺失值处理。
c. 异常值处理:对于存在异常值的数据,可以选择删除异常值、修复异常值或使用插值方法进行异常值处理。
删除异常值的方法适用于异常值较少的情况,修复异常值的方法适用于异常值较多的情况,插值方法适用于连续型数据的异常值处理。
d. 重复值处理:对于存在重复值的数据,可以选择删除重复值或合并重复值进行重复值处理。
删除重复值的方法适用于重复值较少的情况,合并重复值的方法适用于重复值较多的情况。
e. 数据一致性处理:对于存在数据不一致的情况,可以进行数据一致性处理。
数据一致性处理可以通过数据规范化、数据转换和数据合并等方式来实现。
3. 数据验证数据验证是指对清洗后的数据进行验证,以确保数据的准确性和完整性。
数据处理一般方法
数据处理一般方法我折腾了好久数据处理这事儿,总算找到点门道。
我以前处理数据的时候啊,那真叫一个乱套。
最开始我就知道把数据都堆在一起,像把乱七八糟的衣服一股脑塞到衣柜里,根本找不着要用的东西。
这数据乱七八糟的堆着就不行,第一步得整理数据,就像整理衣柜先得把衣服分类一样。
比如说我有一堆销售数据,有日期、销售额、销售量这一类的,那我就得把它们按照不同的类别分开,不然到后面分析的时候你都不知道哪个数字是干啥的。
然后就是数据清洗这一步,可别小看它。
我就犯过错误,好多数据里有重复的或者错误的东西我没发现,就直接拿那些脏数据去分析了。
这就好比你用没洗干净还带着泥的菜去做菜,得到的结果肯定不好啊。
你得仔细检查看看有没有特别大或者特别小的异常值,这些可能就是错误的数据。
比如说销售数据里突然出现个销售额是负的,这一看就不对嘛,得把它找出来修正或者删除掉。
还有数据编码这回事儿呢。
有一次我处理一些关于不同地方的客户数据,地方中文名称看起来就乱哄哄的。
这时候把它们编码成数字或者字母代码就整齐多了,就像把同类型的玩具放到一个个有标记的小盒子里。
数据转换也很重要。
我做调查数据处理的时候,有些是比例数,有些是实际数,为了能统一分析,就得把部分数据转换下。
这个就像把不同单位的东西统一换算成一样的单位。
数据分组也挺讲究的。
我之前在分析年龄数据的时候,直接按每一岁分一个组,这太细了,结果分析起来特别复杂而且没重点。
后来发现可以按年龄段,像青年、中年、老年这么分,一下子就清晰多了。
再就是数据缺失的处理,我真的想了好多办法。
有时候数据少了一些,我想过直接把那些有缺失数据的记录都扔掉,但后来发现这样可能会扔掉很多有用的信息。
后来我就尝试着用平均值、中位数去填充这些缺失值,就像把缺了一块的拼图找个差不多的补上一样。
虽然可能不是最完美的,但是也能让数据看上去完整些,做分析的时候也能得到更可靠的结果,不过这个方法也不是在所有情况下都适用,所以还是得根据具体的数据实际情况来决定用什么方法处理缺失值。
数据透析表中的数据清洗与数据预处理方法
数据透析表中的数据清洗与数据预处理方法在进行数据透析时,数据的质量对分析结果的准确性和可靠性至关重要。
因此,对数据进行清洗和预处理是数据透析中不可或缺的步骤。
本文将讨论数据透析表中的数据清洗和数据预处理方法,并提供一些实用的技巧和建议。
一、数据清洗方法1. 缺失值处理:当数据透析表中存在缺失值时,需要采取合适的方法进行处理。
可以选择删除包含缺失值的行或列,但需要考虑缺失值的比例和对分析结果的影响。
除了删除,还可以使用插补方法,如均值、中位数或回归预测等来填补缺失值。
2. 异常值处理:异常值可能会对数据透析的结果产生不良影响。
因此,需要识别和处理这些异常值。
一种常用的方法是使用箱线图来检测异常值,并进行合理的处理,如替换为该变量的上限或下限值,或根据上下文推断出合适的值进行替换。
3. 数据一致性检查:在数据透析表中,可能会存在数据值的不一致性,如同类数据应该具有相似的取值范围。
为了保证数据的一致性,可以进行数据一致性检查,通过比较不同字段之间的关系来发现潜在的数据一致性问题,并进行相应的处理。
4. 数据去重:在数据透析表中,可能会存在重复记录。
为了保证数据的准确性和可靠性,需要进行数据去重操作。
通过识别重复记录,并进行删除或合并操作,可以消除数据中的重复信息。
二、数据预处理方法1. 数据平滑:数据平滑是用来减少数据中的随机误差,使数据更平滑和一致。
常用的数据平滑方法包括移动平均、加权平均和指数平滑等。
数据平滑可以减少异常值对结果的影响,并更好地展现数据的趋势。
2. 数据变换:数据变换是通过对原始数据进行数学变换,将其转化为更适合分析和建模的形式。
常见的数据变换方法包括对数变换、幂变换、标准化和归一化等。
数据变换可以改善数据的分布性质,使其更接近正态分布,从而提高分析和建模的效果。
3. 特征选择:在数据透析中,选取适当的特征对结果的准确性和解释性起着至关重要的作用。
特征选择方法可以通过评估特征与目标变量之间的相关性,选择最具有代表性和相关性的特征。
针对不完整数据的大数据清洗方法
针对不完整数据的大数据清洗方法大数据清洗是指对大规模数据集进行预处理,去除错误、不完整或冗余的数据,以确保数据的准确性和一致性。
针对不完整数据的大数据清洗方法是一种特殊的数据清洗方法,旨在处理数据中存在缺失值、异常值或不完整信息的情况。
本文将介绍一种针对不完整数据的大数据清洗方法,并详细描述其步骤和应用。
一、背景介绍在大数据时代,数据的规模和复杂性不断增加,数据质量成为数据分析和决策的关键因素。
然而,真实世界中的数据往往存在缺失、错误和不完整的情况,这给数据分析和应用带来了挑战。
因此,针对不完整数据的大数据清洗方法的研究变得非常重要。
二、针对不完整数据的大数据清洗方法针对不完整数据的大数据清洗方法主要包括以下步骤:1. 数据预处理首先,对原始数据进行预处理,包括数据采集、数据存储和数据预处理等。
数据采集是指从各种数据源获取数据,并将其存储在数据仓库或数据湖中。
数据存储是指将数据按照一定的结构和格式存储起来,以便后续的数据清洗和分析。
数据预处理是指对原始数据进行初步的处理,包括数据去重、数据格式转换和数据标准化等。
2. 缺失值处理缺失值是指数据中某些字段或属性的取值缺失的情况。
针对缺失值的处理方法主要有删除、插值和建模三种。
删除是指直接删除包含缺失值的记录或属性,但这样可能会导致数据的丢失。
插值是指根据已有的数据推测缺失值,常用的插值方法有均值插值、中值插值和多重插补等。
建模是指利用已有的数据建立模型,然后根据模型预测缺失值。
3. 异常值处理异常值是指数据中与其他数据明显不符或超出正常范围的值。
针对异常值的处理方法主要有删除、替换和离群点检测三种。
删除是指直接删除异常值,但这样可能会导致数据的丢失。
替换是指用其他值替换异常值,常用的替换方法有均值替换、中值替换和分位数替换等。
离群点检测是指通过统计学或机器学习方法识别和标记异常值。
4. 不完整信息处理不完整信息是指数据中某些字段或属性的信息不完整的情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无线电波透视法(坑透)从上世纪20年度苏联A·A·彼得罗夫斯基院士提出设想至今,在坑道找矿、煤层工作面构造探测等方面取得了很好的应用效果。
对于无线电波透视法的资料处理,早期采用手工计算、绘图,比较繁琐、工作量大;随着电子计算机技术的发展,采用计算机自动处理的技术逐渐被推广应用,使资料处理效率得到了很大的提高,减轻了地球物理工作者的劳动强度。
从无线电波透视法理论出发,结合无线电波资料处理、解释以及生产报告撰写要求,设计了条件试验分析、异常数据的编辑、多方法的求参分析功能、单点综合曲线绘制、单巷道多测点综合曲线绘制、工作面内吸收系数的反演计算等功能,满足无线电波透视法资料处理高效、准确的要求。
坑透资料的基本处理流程如下:一、参考处理流程对坑透资料的基本处理步骤如下:1.进行“文件->新建工程”操作,输入工程名称、各拐点坐标等工程参数。
2.进行“数据->测值输入”操作,输入各发射点对应的实测场强值及参数。
3.若存在条件试验,可以执行菜单中的“条件试验分析”,采用回归算法分析初始场强H0及吸收系数β。
4.进行“参数分析”操作,可以选择“实测场强法”、“图解法”、“回归分析法”,对各个发射点对应的接收场强值进行初始场强H0及吸收系数β分析,掌握测区的电磁参数。
5.进行“层析成像计算”操作,选择“绝对衰减法”或“相对衰减法”进行CT成像反演计算。
6.进行“结果输出”操作,将反演结果输出为文本格式,可以利用Surfer等专业绘图软件进行绘图操作。
7.进行“图形查看”操作,可以根据资料解释、报告撰写的要求,输出各种曲线。
对于已经存在的工程,可以执行“打开工程”操作,然后再进行3~7步。
二、新建工程点击菜单中的“文件”->“新建工程”,弹出对话框:图2-1 新建工程对话框http:// 好pan.好baidu.好com/s/好1o6I5uyu——去掉“好”,见演示程序。
(1)输入工程名称、组成工作面的拐点总数、发射点数目。
(2)输入4条巷道的测点参数。
巷道:对于一个工作面,规定由4条巷道组成,即上、下巷、切眼、联络巷。
巷道编号按顺时针进行,上巷为1号巷。
拐点:即组成工作面的各条线段的端点。
拐点按顺时针编号,左上角第一个点为0号点。
测点编号:每个巷道的测点编号独自进行。
上、下巷从左往右编号,点距10米,起点为0号,向左1、2、3…以此类推。
切眼和联络巷从上往下编号,起点为0号。
图2-2 巷道、拐点编号(3)输入拐点坐标。
对于拐点坐标约定:(a) 垂向上最上方一个点Y坐标为0;(b)横向上最左面一个点的X坐标为0。
由以上两点确定坐标原点,X坐标向左为增大方向,Y方向向下为增大方向。
坐标值都大于零。
如图2-3所示。
图2-3 拐点坐标规定三、打开已有工程点击“文件”->“打开工程”菜单,可以打开已保存的工程,进行重新计算或查看、出图操作。
四、数据“数据”主菜单下包括“测值输入”、“测值修改”、“工程参数修改”三个子菜单。
(1)测值输入点击“测值输入”菜单后,弹出4-1对话框,输入逐个发射点对应的观测值。
观测值由逗号隔开。
输入值后可以“检查”输入的数据个数是否与输入接收点匹配。
图4-1 定点观测数据输入(2)修改数据点击“修改数据”子菜单,可以选择对已经输入的数据进行修改。
图4-2为选择待修改的记录编号对话框;图4-3为修改数据对话框。
图4-2 选择修改记录号图4-3 修改数据对话框(3)修改工程参数若工程参数输入有误,可以对其进行修改,点击“工程参数修改”子菜单,弹出图4-4所示对话框。
需注意:修改工程参数后要重新输入测值。
图4-4 修改工程参数对话框五、编辑在数据输入后,可以对单独发射点的接收数据中的畸变数值进行编辑。
点击“编辑”菜单,客户区生产单发射点对应的接收曲线,数据点用红点表示,可以通过鼠标进行数据值的修改。
鼠标点击数据点,数据点被选中后变成绿点,移动鼠标到下点,点击屏幕,数据点将移到新位置,同时数据值也在内存中改变。
如图5-1、5-2所示图5-1 被选中的数据点图5-2 修改后的数据点六、条件试验该项功能是对条件试验所观测的数据利用线性回归法来求取初始辐射场强H。
和煤层的吸收系数β。
点击“条件试验”菜单,弹出条件试验数据录入对话框,如图6-1所示。
图6-1 条件试验数据录入利用线性回归算法获得求取初始辐射场强H。
和煤层的吸收系数β。
H。
=52.64dB,β=0.0254dB/m。
并利用计算所得的初始场强和煤层吸收系数计算各个接收点的理论场强值H0。
图6-2为分析结果,图中蓝线为实测值,红虚线为计算所得理论场强曲线,棕色线为衰减系数曲线。
图6-2 条件试验回归分析结果七、参数分析因为条件试验的数据有限,通常在无线电波透视工作时往往利用所有测量值进行分析,通过大量的实测值分析,更能找到适合工作区的电磁参数。
对于电磁参数的分析一般采用三种方法:实测计算法、图解法、回归分析法。
(1)实测计算法选择均匀介质地段设置发射点,距离发射点为若r 1和r 2两点接收场强为H 1和H 2,由磁场表达式可知:θβsin 1011r e H H r -= θβsin 2022r e H H r -= 移项相除,并取对数)(ln 122211r r r H r H -=β 则吸收系数β为:122211ln ln r r r H r H --=β图7-1 实测法计算初始辐射场强H 。
和煤层的吸收系数β(2)图解法由于煤层并非完全均匀,采用选两点实测场强计算出H 。
和β与实际仍存在大的差异,为了求取准确的H 。
和β,可以采用多点测值用图解法求取H 。
和β值。
图解法的原理:将多点实测的H 1,H 2,….H n 值乘上相应的发-收距离r 1,r 2,…r n 作为纵坐标,r 1,r 2,…r n 作为横坐标,作单发射点实测场强曲线图。
由公式122211ln ln r r r H r H --=β 可知,理论上均匀介质形成的lnHr-r 曲线应该是条直线。
我们通过多点实测散点中拾取一条与实测值比较吻合的直线,直线的斜率就是吸收系数β,而r=0时的纵轴的截距就是H 0。
如图7-2所示。
点击“参数分析”->“图解法”,在客户窗口显示 0号记录的实测值lnHr-r 曲线,点击左上角工具栏的按钮,可以用鼠标在图上绘制直线,并计算H 。
和β值。
图7-2 图解法获取初始辐射场强H 。
和煤层的吸收系数β(3)回归分析法采用图解法计算初始辐射场强H 。
和煤层的吸收系数β具有很大的随意性,为了取得好效果,可以采用直线回归分析方法,采用线性回归迭代算法拟合出最佳直线,求取合理的电性参数。
在干扰小、煤层内部无构造情况下,回归分析法可以取得很好的效果,但是对于构造多、干扰多的地段,回归分析法效果不好。
回归分析法原理:线性回归法是用一系列测点,进行最小二乘法意义下的线性拟合。
设有n 个实测的实i H ,i =1 ,2 , ... , n ,令x r i i = i i i r H y lg 20+=实对于均匀介质,n 个实测值的lnHr-r 曲线理论上是条曲线,因此对于这些散点所在的曲线可以采用直线回归方程表示:bx a y +=对于散点的直线回归方程的求解采用最小二乘法。
最小二乘法的出发点是使实际测量数据yi 与拟合直线上对应的估计值的残差的平方和为最小。
即为使值最小,只要使a 和b 的偏导数为零,即可解得a 和b 的值。
()a y x x x y xx i i n i i i ni i n =--===∑∑∑21121 ()b xy n x y xx i i i n i i n=--==∑∑121 式中 : x n x y n y i i ni i n ====∑∑1111由于实测数据受构造、干扰等很多因素控制,有的散点偏离度比较大,其参与计算求出的直线回归方程与实际情况误差较大,为了获得最佳的拟合直线,需要采用迭代法进行拟合,每次迭代剔除离散大的数据,最终参与计算的散点都是紧密在回归直线附近的,其计算所得的H 。
和煤层的吸收系数β比较准确。
图7-3 线性回归法计算初始辐射场强H。
和煤层的吸收系数β八、层析成像计算上世纪70年代中期,美国已故的测井学家R.J.Lyele等人率先利用直射线理论,把医学CT引入地学领域,把透射层析应用于跨孔电磁波探测的资料处理,推动了全球范围内地下物探层析技术的应用和研究。
层析成像技术在无线电波透视方法中的应用,提高了该方法解释的精度,结合传统的综合曲线分析,有效解决煤层中的构造问题。
图8-1 反演参数(1)绝对衰减法在无线电波透视中,由于综采工作面煤层的倾角都小于25°,发射天线与观测点方向近乎正交,即在θ=90°时,电磁场的计算公式为:re H H rβ-=0 此式中H 、H 0的单位为微伏,r的单位为米,β的单位为奈培/米。
对上式两边取对数,经变换后可得:βr =H 0-H -20lg r式中H 、H 0的单位为分贝,r 的单位为米,β的单位为分贝/米。
如图所示是一个工作面被网格化后的示意图。
把网格化后每个均匀的小块称为一个像素,在此区域内有一条射线y i 穿过了衰减系数分别为x x x n 12,,...,的诸像素,并在这些像素上的截距分别为d d d i i i n 12,,..., 。
这样在第i 条射线路径上则有:βr d x i j j j n==∑1把式(1-5)代入式(1-4)中可得到第i条射线的方程:dx y i j j i j n ==∑1这里 y H H r i i i =--010lg式中 H i ── 第i 次观测的实测场强值。
r i ── 第i 条射线长度,即 r di ij j n ==∑1 。
若进行多重观测,即用多个波源发射,对每个发射点进行多点接收测量,即可得到如下矩阵方程:d d d d d d d d d x x x y y y n n m m mn m m 1112121222121212 ⎡⎣⎢⎢⎢⎢⎢⎤⎦⎥⎥⎥⎥⎥⎡⎣⎢⎢⎢⎢⎤⎦⎥⎥⎥⎥=⎡⎣⎢⎢⎢⎢⎤⎦⎥⎥⎥⎥ 也就是[]D []X = []Y 式中:[]D ── m ⨯ n 阶系数矩阵,为射线穿过诸像素的截距。
其中D 的元素d i j 是第i 次观测中射线被第j 个像素的截距。
i =1,2…m ,m 是射线总条数 (观测次数)。
j =1,2… n ,n 是工作面网格化后像素的个数。
[]X ── 是n ⨯ 1阶未知数矩阵,代表诸像素的绝对衰减值。
[]Y── m ⨯ 1阶常数矩阵,是各观测方式下与实测场强有关的常数。
由于方程的建立是基于各像素绝对衰减作用的叠加,因此求得的各像素的绝对衰减系数也就体现了介质的物性。