地质统计学 张树泉(课件)

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学考试试卷A及答案

2012—2013学年第二学期闽江学院考试试卷 考试课程:统计学 试卷类别:A卷□√B卷□考试形式:闭卷□√开卷□ 适用专业年级:2011级金融学、国际贸易学、保险学专业 注明:试卷答案请做在答题纸上。 一、单选题(每题1分,共30分,30%) 1. 下列不属于描述统计问题的是() A根据样本信息对总体进行的推断B了解数据分布的特征 C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据 2. 根据样本计算的用于推断总体特征的概括性度量值称作() A.参数 B. 总体C.样本 D. 统计量 3. 通过调查或观测而收集到的数据称为() A.观测数据 B. 实验数据 C.时间序列数据 D. 截面数据 4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。 A.重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为()。 A 系统抽样 B 整群抽样 C 滚雪球抽样 D 判断抽样 6. 下面的哪一个图形最适合于描述结构性问题() A.条形图 B.饼图 C.雷达图 D. 直方图 7. 对于大批量的数据,最适合描述其分布的图形是( ) A.条形图 B.茎叶图 C.直方图 D.饼图 8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。最后一组的组中值近似为( ) A.5000 B.7500 C.5500 D.6500 9. 下列关于众数的叙述,不正确的是() A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 D.众数不熟极端值的影响 10. 一组数据的最大值与最小值之差称为() A.平均数 B.规范差 C.极差 D.四分位差 11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是() A.至少有75%的数据落在平均数加减3个规范差的范围之内 B. 至少有89%的数据落在平均数加减3个规范差的范围之内

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

地质统计学

第一章绪论 一、历史背景与产生 地质统计学是二十世纪六七十年代发展起来的一门新兴的数学地质学科的分支。它开始主要是为解决矿床从普查勘探、矿山设计到矿山开采整个过程中各种储量计算和误差估计问题而发展起来的。它是由法国著名学者G. 马特隆教授于1962年创立的。其核心即所谓的“克立格”。它是一种无偏的最小误差的储量计算方法。该方法按照样品与待估块段的相对空间位置和相关程度来计算块段品位及储量,并使估计误差为最小。这是南非采矿工程师D. G. Krige 根据南非金矿的具体情况与1952年提出的,故命名为克立格法。后来法国学者G. 马特隆(Matheron)对克立格提出的方法进行研究,认为克立格提出的方法是在考虑了空间分布特征的基础上,合理地改进了统计学,是一种传统方法与统计学方法结合起来的新方法。同时为了解决具二重型(结构型与随机性)的地质变量的条件下使用统计方法的问题。马特隆教授提出了区域化变量的概念(Regionalized Variable),从而创立了地质统计学。根据地质统计学理论,地质特征可以用区域化变量的空间分布特征来表征。而研究区域化变量的空间分布特征分布的主要数学工具是变差函数(Variogram)。 到七十年代中后期,马特隆的学生JOURENL等在研究其它地质变量的基础上,认为某些地质变量并不是一成不变的,而是有一定波动的,这样使用克立格法就不能很好再现地质变量的分布特征。因此他们采样模拟的方法,将克立格估计的离散方差的波动性模拟出来,从而产生了随机模拟法。因此,从二十世纪八十年代以来,地质统计学分为两派:一派以法国的马特隆教授等人为主,仍致力于克立格估计的研究;一派以美国JOURENL等人为主,主要致力于随机模拟方法的研究。 地质统计学的产生是在经典统计学的基础上发展起来的。在此前,为了反映地质变量的空间变化性,一些地质学家曾经使用一些经典的概率统计方法来研究地质变量。但由于地质变量并不是纯粹的随机变量,因此,直接用简单的统计方法解决复杂的地质问题,有一定的局限性。主要表现在:①经典统计方法在研究地质变量时,不考虑样品的空间分布,由于样品的空间分布位置不同,尽管它们的均值、方差都一样,但地质变量的稳定性并不相同。②经典概率统计学研究对象是纯随机变量,并都服从一定的已知概率分布,而地质变量既有随机性又有结构性。③经典统计学的变量原则上要求可以无限次重复测量或试验,且每次测量可能结果均不同,而地质变量不行。④经典统计学一般要求每次抽样是独立进行,相互独立,而地质变量并不相互独立,往往具有空间相关性。为了寻求一种既能保持概率统计的有效性,又考虑到地质变量的特点,使地质统计学应运而生。 二、地质统计学研究现状 经过三十多年的发展,目前地质统计学已经形成了一套完整的理论体系,提出了一些重要的方法和技巧,形成了一系列有实用价值的程序包,并迅速传播到世界各地。从目前来看,可概括为如下: ⑴形成一套完整的理论体系 a. 完善的基础理论(5基本) 基本概念——区域化变量 基本工具——变差函数 基本假论——二阶平稳假设和本征(亦称“内蕴”)假设 基本公式——估计方差离散方差正则化公式 基本方法——普通克立格 b. 非线性及非平稳理论充实 泛克立格K阶本征函数析取克立格等

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

《地质统计学》读书报告

《地质统计学》课程读书报告

地质统计学读书报告 地质统计学包含经典统计学与空间统计学,按其基本原理可定义为:地质统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性,又有结构性的自然现象的科学。其为数学地质领域中一门发展迅速且有着广泛应用前景的新兴学科。国内外的生产实践表明,地质统计学除了在异常评价、找矿勘探、矿体圈定、储量计算、采矿设计、矿山生产及地学科研等方面具有明显的优越性外,它在石油地质、第四纪地质、地层学、生物学、生态学、岩石学、地球化学、构造地质、地震地质、海洋地质、农业、水文地质、工程地质、古气候、古地理、环境、林业、医学等许多方面都有成功应用的实例。地质统计学在不到50年的研究和实践中得到了很大的发展 [1]。 一、理论研究及进展 经历了数十年的发展,地质统计学的理论与方法研究有了很大的提高[2-3]。包括:①从初期二维平面分析到三维立体空间的静态估计,发展到今天在时空域内对研究对象进行四维乃至更高维空间的动态估计和模拟。Journel[4]将克立格法的估值问题,从一般矢量空间扩展到个原始数据的全部可测度函数所形成

的矢量空间(希尔伯特空间)进行考察;②在单变量区域化变量理论的基础上,提出了适合多变量的协同区域化理论[4];③发展了许多计算变异函数(或协方差函数)的方法;④线性地质统计学与非线性地质统计学共同发展;⑤参数地质统计学与非参数地质统计学相互补充。Matheron[5]为首的参数地质统计学派以正态假设为前提,在协同区域化理论的基础上,提出多元地质统计学的基本思想。Journel发展了无须对数据分布作任何假设的非参数地质统计学,提出了一些非参数地质统计学克立格方法;⑥由于时空多元地质统计学的研究得到重视,早期空间域静态建模技术的研究逐渐过渡到研究时空域多元动态条件模拟,各种模拟方法得到了发展;⑦早期的等因子模型的因子是埃尔米特多项式,它要求原始数据服从正态分布。为了拓宽等因子模型的应用,Matheron提出了离散的等因子模型和连续的等因子模型,Rivoirard利用析取克立格技术建立了正交指标剩余模型,Lajauine和La ntuejoul等也提出了建立等因子模型的一些方法;⑧已有的地质统计学方法相互融合。如指示克立格法与协同克立格法相结合形成指示协同克立格法;指示克立格法与因子克立格法相结合形成主分量指示克立格法;协同克立格法与其它不同的线性地质统计技术相结合形成各种协同克立格技术等[6]。 这里重点介绍一下多点地质统计学[7]。多点地质统计学是相对于基于变差函数的两点地质统计学而言的。在两点统计里,储集层相关性通过空间两点协方差( 变差函数) 进行描述。在多点统计里,则是利用空间多个点组合模式进行描述。空间多点组合样式称为数据样板,如果在空间点赋予了值,则为一个特定的空间多点组合模式,称为数据事件。在建模时,对每一个未知点,估计在其处满足给定条件的数据事件出现的概率,随后抽样获得未知点处值或者数

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

统计学考试试题及答案

统计学考试试题及答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《统计学原理》期末考试题 一、单选题{每小题2分,共12分} 1.对某城市工业企业未安装设备进行普查,总体单位是(B )。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 2.反映不同总体中同类指标对比的相对指标是( B)。 A.结构相对指标 B.比较相对指标 C.强度相对指标 D.计划完成程度相对指标 3.在组距分组时,对于连续型变量,相邻两组的组限(A ) A.必须是重叠的 B.必须是间断的 C.可以是重叠的,也可以是间断的 D.必须取整数 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是(A)。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 5.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A ) A.缩小为原来的% B.缩小为原来的50% C.缩小为原来的25% D.扩大为原来的四倍 6.下列哪两个变量之间的相关程度高(C )。 A.商品销售额和商品销售量的相关系数是0. 9 B.商品销售额与商业利润率的相关系数是0. 84 C.平均流通费用率与商业利润率的相关系数是一 D.商品销售价格与销售量的相关系数是一

二、多选题(每小题2分,共8分) 1.要了解某地区的就业情况( ABE) A.全部成年人是研究的总体 B.成年人口总数是统计指标 C.成年人口就业率是统计标志 D.反映每个人特征的职业是数量指标 E.某人职业是教师是标志表现 2.影响加权算术平均数的因素有(AB ) A.各组频率或频数 B.各组标志值的大小 C.各组组距的大小 D.各组组数的多少 E.各组组限的大小 3.简单随机抽样(ACDE ) A.适用于总体各单位呈均匀分布的总体 B.适用于总体各单位标志变异较大的总体 C.在抽样之前要求对总体各单位加以编号 D.最符合随机原则 E.是各种抽样组织形式中最基本最简单的一种形式 4.下面哪几项是时期数列(BC ) A.我国近几年来的耕地总面积 B.我国历年新增人口数 C.我国历年图书出版量 D.我国历年黄金储备 E.某地区国有企业历年资金利税率 三、填空题(每小题2分.共10分) 1.变量按其取值的连续性可分为(离散变量)和(连续变量)两种。 2.统计调查根据(被研究总体范围)可分为全面调查和非全面调查,根据(调查登记时间是否连续)可分为连续调查和不连续调查。 3.总体是非标志(0,1)分布的平均数为P ,方差为P(1-P)。

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

地质统计学

地统计(Geostatistics)又称地质统计,是在法国著名统计学家G. Matheron大 量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。 地统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本属性值的频率分布或均值、方差关系及其相应规则的分析,确定其空间分布格局与相关关系。但地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的 缺陷。 地统计分析理论基础包括前提假设、区域化变量、变异分析和空间估值。 第一章品位与储量计算 第一节概述 投资一个矿床开采项目,首先必须估算其品位和储量。一个矿床的矿量、品位及其空间分布是对矿床进行技术经济评价、可行性研究、矿山规划设计以及开采计划优化的基础,是矿山投资决策的重要依据。因此,品位估算、矿体圈定和储量计算是一项影响深远的工作,其质量直接影响到投资决策的正确性和矿山规划及开采计划的优劣。从一个市场经济条件下的矿业投资者的角度看,这一工作做不好可能导致两种对投资者不利的决策:(1)矿体圈定与品位、矿量估算结果比实际情况乐观,估计的矿床开采价值在较大程度上高于实际可能实现的最高价值,致使投资者投资于利润远低于期望值,甚至带来严重亏损的项目。(2)与第一种情况相反,矿床的矿量与品位的估算值在较大程度上低于实际值,使投资者错误地认为在现有技术经济条件下,矿床的开采不能带来可以接受的最低利润,从而放弃了一个好的投资机会。 然而,准确地估算出一个矿床的矿量、品位绝非易事。大部分矿体被深深地埋于地下,即使有露头,也只能提供靠近地表的局部信息。进行矿体圈定和矿量、品位估算的已知数据主要来源于极其有限的钻孔岩心取样。已知数据量相对于被估算的量往往是一比几十万乃至几百万的关系,即对一吨岩心进行取样化验的结果,可能要用来推算几十万乃至几百万吨的矿量及其品位。可以不过分地说,矿量、品位的估算是世界上最大胆的外推。因此,矿体圈定与矿量、品位估算不仅是一项十分重要的工作,而且是一项极具挑战性的工作。做好这一工作要求掌握现代理论知识与手段,并应用它们对有限的已知数据进行各种详细、深入的定量、定性分析;同时也要求从事这一工作的地质与采矿工程师具有科学的态度和求实精神。 本章将较详细地介绍当今世界上常用的矿量、品位估算方法,包括探矿数据的分析、处理和用于品位估值的剖面法、平面法及矿床模型法等。地质统计学作为品位估值的一种方法,从其诞生起就显示了强大的生命力,得到了越来越广泛的应用,本章对此给予较大的篇幅。本章的主要目的不是教会读者如何一步一步

地质统计学反演

地质统计学反演(StatMod) 一、方法原理 JASON的StatMod是一个集多种随机模拟技术的软件包,是以概率论为其理论基础的。其目的是提供一个或多个在某种概率条件下的,既满足数据的地质统计学特征又满足地质、测井和地震信息的三维储层参数概率模型。数据的地质统计学特征由数据的概率分布图和变异函数描述。 由于地质统计模拟是基于概率意义上的随机模拟。为满足概率条件必须有足够多的井资料。软件要求的已知井数不少于6口。 地质统计学主要的算法是岩性指示模拟和序贯高斯模拟技术(SGS)。 序贯高斯模拟方法是一种产生来自高斯场模型实现的方法。它基于序贯模拟思想。该方法首先是将研究区域离散为网格系统,然后序贯地处理每一个网格节点。由于每个节点处随机变量是服从条件化的正态分布,因此,网格节点值完全由均值和方差两个参数确定。通过求解克里金方程组就可给出该网格节点处的均值和方差,从而将节点处的正态分布确定下来,并采用相应的抽样方法得到该网格节点处的一个样本。直至全部网格节点计算完毕。需要指出的是:求解克里金方程组时的条件数据包括原始数据,先前已模拟的、落在模拟邻域内所有被模拟的网格节点处的值。序贯高斯模拟方法是一种条件模拟,它保证原始数据和直方图及变异函数都被条件化。在地震储层预测中,每一道就是一个网格节点。 在模拟过程中,需要求取的最典型的属性是波阻抗和孔隙度。地质统计学考虑了模拟过程中结果的不唯一因素,故而增加了结果的误差分析。通过用户定义方式在三维地质模型的每个网格节点上计算出的概率密度函数,可以计算出结果数据体。概率密度函数是数据体中能够对不确定性进行正常估算的参数分布规律。 地质统计学反演对测井曲线的应用方式,与Jason其它的反演方法截然不同。Jason其它反演方法再队测井曲线进行应用过程中,除子波估算外。只有在地震数据中没有低频信息时,在最终的反演结果中才会反映测井曲线的信息。然而地质统计学将重采样后的测井曲线沿井轨迹复制到三维网格点中。在这种方式下,测井曲线被认为是“Priori”类型的信息,因此,在开展地质统计学反演之前,开展其它类型的常规反演就显得十分重要。只有这样,我们才能够确保曲线和地震数据具有一致性,代表了相同带限的地质模型。因此,地质统计学反演比其它类型的反演具有如下技术优势: 1 小井距间的精细尺度内插 2能够进行误差估算,进而评价风险 3改善常规反演结果的分辨率 4能够生成岩性类型数据体,如砂岩和泥岩

统计学期末考试试题

西安交大统计学考试试卷 、单项选择题(每小题 2分,共 20 分) 1. 在企业统计中,下列统计标志中属于数量标志的是( C ) A 、文化程度 B 、职业 C 、月工资 D 、行业 2. 下列属于相对数的综合指标有( B ) A 、国民收入 B 、人均国民收入 C 、国内生产净值 D 、设备台数 3?有三个企业的年利润额分别是 5000万元、8000万元和3900万元,则这句话中有( B )个变量? A 、0个 B 、两个 4?下列变量中属于连续型变量的是( A ) A 、身高 B 、产品件数 5?下列各项中,属于时点指标的有( A ) A 、库存额 B 、总收入 6?典型调查是(B )确定调查单位的 A 、随机 B 、主观 C 、 1 个 D 、 3 个 C 、企业人数 D 、产品品 种 C 、平均收入 D 、人均收入 C 、随意 D 盲目 7?总体标准差未知时总体均值的假设检验要用到( A ): A 、Z 统计量 B 、t 统计量 C 、 统计量 D 、 X 统计量 8. 把样本总体中全部单位数的集合称为( A ) A 、样本 B 、小总体 C 、样本容量 9?概率的取值范围是 p ( D ) A 、大于1 B 、大于—1 C 、小于1 D 、在0与1之间 10.算术平均数的离差之和等于( A ) A 、零 B 、 1 C 、— 1 D 、2 二、多项选择题(每小题 2分,共 10分。每题全部答对才给分,否则不计分) 5?下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A 、算术平均数 B 、调和平均数 C 、几何平均数 D 、中位数 E 、众数 三、判断题(在正确答案后写“对” ,在错误答案后写“错” 。每小题 1 分,共 10分) 1 、 “性别”是品质标志。 (对 ) D 、总体容量 1?数据的计量尺度包括( A 、定类尺度 D 、定比尺度 ABCD B 、定序尺度 E 、测量尺度 ): C 、定距尺度 2?下列属于连续型变量的有 ( BE ): A 、工人人数 B 、商品销售额 C 、商品库存额 D 、商品库存量 E 、 总产值 3?测量变量离中趋势的指标有 ( ABE ) A 、极差 B 、 平均差 C 、几何平均数 D 、众数 E 、 标准差 4?在工业企业的设备调杳中 BDE ) A 、工业企业是调查对象 B 、 工业企业的所有设备是调查对象 C 、每台设备是 E 、每个工业企业是填报单位 填报单位 D 、每台设备是调查单位

统计学知识点的总结

1、统计的含义 (1)统计工作:即统计实践,是指很据科学的方法从事统计设计、收集、整理、分析研究和提供各种统计资料和统计咨询意见的活动的总称。其成果是统计资料(原始调查资料和加工处理后的系统资 料); (2)统计资料:即统计工作过程中所获得的各种有关数字资料以及与之相关的其他资料的总称。通常以统计表、统计图和统计报告的形式变现,用以反映社会经济现象的规模、水平、速度、结构和比例关系等信息的数字和文字资料; (3)统计科学:即统计理论,是指统计工作实践的理论概括和科学总结。 2、统计学 统计学:是一门搜集、整理、分析数据方法的科学,其目的是探索数据的内在数量规律性, 以达到对客观事物的科学认识。 3、统计学的研究对象 统计学研究的对象是:社会经济现象总体的数量特征和数量关系。 其根本特征:在质与量的辩证统一中,研究大量社会经济现象总体的数量方面,反映社会 现象发展变化的规律性在具体时间、地点和条件下的数量表现,揭示事物的本质、相互联系、 变动规律和发展趋势。 4、统计学研究特点 数量性、总体性、具体性、社会性 5、统计工作的过程及基本职能 统计工作的过程:统计设计、统计调查、统计整理、统计分析(定性一定量一定性:循环 往复)

统计设计:指根据统计研究对象的特点和研究的目的、任务,对统计工作的各个方面和各 个环节的通盘考虑和安排,是统计认识过程的第一个阶段,即定性认识的阶段; 统计调查:指根据统计研究对象和目的要求,依据统计设计的内容、指标和指标体系的要 求,有计划、有目的、有组织的收集原始资料的工作过程,即由定性到定量认识的阶段; 统计整理:指根据统计研究的目的,将统计调查得到的原始资料和通过各种方法得到的次 级资料进行科学的分类和汇总,使其条理化、系统化的工作过程,即为统计分析准备在一定 程度上可以反映总体特征的统计资料; 统计分析:指在统计整理的基础上,根据研究的目的和任务,应用各种科学的统计方法, 从静态和动态两个方面对研究对象的数量方面进行计算、分析研究,认识和揭示所研究对象 的本质和规律性,做出科学的结论,进而提出建议和可预测性的意见的工作过程,即从定量到定性深入认识的阶段。 统计工作的基本职能:信息、咨询、监督 6、统计学研究的基本方法 大量观察法、统计分组法、综合指标法、时间数列分析法、指数法、抽样推断法、相关分 析法。 7、统计学的基本概念 (1)总体:指客观存在的,有性质相同的许多个别事物组成的整体; (2)总体单位:指组成总体的许多性质相同的个别事物,简称单位/个体; (3)标志:用于说明总体单位特征的名称或概念,有数量标志和品质标志之分; (4)标志表现:标志特征在各单位的具体体现,数量标志表现为具体的数值,品质标志表现为对特征加以描述的文字;

地质统计学在环境科学领域的应用进展分析

地质统计学在环境科学领域的应用进展 分析 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 0引言 地质统计学,近年来又被称为空间信息统计学,是数学地质领域中一门发展迅速且有着广泛应用前景的新兴学科。它以区域化变量为核心和理论基础,以多孔介质空间结构的变异函数为基本工具,研究那些分布于空间中并显示出一定结构性和随机性的自然现象的一种数学地质方法,在优化采样方案、处理不规则采样及最优化插值计算等方面有明显的优点,在地学、矿业、石油、农林、环境、生态及医学等方面都有成功应用的实例。 1地质统计学的产生和发展现状 20世纪50年代初期,南非矿山工程师根据多年对南非金铀砾岩型金矿储量计算的经验,提出随样品空间位置不同,样品间相关性不同,应对每个样品赋予一定权值进行滑动加权平均来代替传统平均值对盘区块段金品位进行估计。60年代,法国著名统计学家经过大量工作将Krige的成果理论化、系统化,提出“区域化变

量”概念,创立了这门新的统计学分支学科。地质统计学的基本理论与研究方法于1978年由地质学家侯景儒等人系统引入中国科研工作中,经历了曲折的发展后,目前地质统计学在中国的理论方法与实际应用均达到一定的水平[2 3],但在环境科学领域的应用时间还很短。 在不到半个世纪的时间里,地质统计学已在需要评估空间和时间变异的许多领域得到广泛应用。 (1)形成了两大理论学派[4]即以法国统计学家G Matheron为代表的“枫丹白露地质统计学派”和以美国统计学家 A G Journel为代表的“斯坦福地质统计学派”。由于实际计算和应用方法不同,又称为“参数地质统计学”和“非参数地质统计学”。 (2)发展了多种空间局部估计方法,如普通克立格法、协同克立格法、泛克立格法、析取克立格法、对数克立格法、随机克立格法、因子克立格法、指示克立格法等。 (3)多学科相互渗透,拓宽了地质统计学的理论体系,使其不断应用于新的领域,如石油和煤炭勘探与开发、水文工程地质、环境污染预测、农林科学、生物科学、医学等领域。 (4)国内外学者已经研究开发出一批基于地质统

相关文档
最新文档