第六章 抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设是来自二维总体的样本,统计量 (6.1.16)
称为样本协方差,其统计值为
(13)样本相关系数 设是来自二维总体的样本,统计量 (6.1.17)
称为样本相关系数,其中与分别为总体与的样本方差,即 ,
样本相关系数的统计值为
样本协方差与样本相关系数均值描述两个总体之间相关关系的重要 统计量。
例6.1.6 取某型号火箭8枚进行射程试验,测得数据(单位:km) 如下:
频 数
4
3 15 42 49 wenku.baidu.com8 50 31 5
容易计算得样本均值和样本方差的近似值为:
思考题6.1
1、 什么是总体与个体,为什么把总体与个体看成随机变量? 2、 为什么样本的联合分布是由总体的分布决定的? 3、 常见的统计量有那些,如何根据样本值计算统计值? 4、 样本方差与样本二阶中心矩间的相同之处与差别是什么? 5、 如何利用计算器或Excel计算统计值?
三、统计量
我们在用样本获得的信息来对总体作出估计与推断时,需按不同的 要求确定样本的各种相应的函数。
一般地,设是来自总体的样本,若是元连续函数,则称函数
为样本的函数,特别地,我们对不包含任何未知参数的样本的函数作出 定义:
定义6.1.2 设为总体的样本,若样本的函数中不包含任何未知参 数,则称为统计量。
X2
X3
X4
解:将 X5 每一次观测
所得数据按
1
3
1
10
5
6 从小到大的
2
2
6
7
2
8 顺序排列得
3
8
3
9
10
5 下表:
X(k) 观测次数
1
1
3
5
6
10
2
2
2
6
7
8
3
3
5
8
9
10
(2)样本中位数 设是原样本的顺序统计量,则称统计量
(6.1.5) 为样本的中位数。即中恰有一半不超过。这是描述总体中心位置的
从定义6.1.1与概率论知识可知,若总体的分布函数为,则样本的联
合分布函数为完全决定,其表达式为:
(6.1.1) 特别地,如果总体是连续型随机变量,其概率密度函数为,则样本 的联合概率密度函数为
(6.1.2) 如果总体是离散型随机变量,其概率分布为 ,则样本 的联合概率 分布为
(6.1.3) 例6.1.1 设总体服从参数为的指数分布,从中取出一个容量为的样 本,试求样本的联合概率密度函数与联合分布函数。 解:总体服从参数为的指数分布,则其概率密度与分布函数分别为
403
0
127.875
故样本方差 样本标准差 样本误差 若利用Excel的功能进行计算,其步骤为: 1)先将此8个数据按列(或按行)输入Excel的表格中; 2)再选择工具栏上“工具”—“数据分析”—“确定”; 3)再选择“描述统计”,按对话框操作可得结果:
平均 50.375
标准 误差
1.511119
16.4,16.7
此时得样本中位数
3)
(4)样本众数(mod):
数据中最常出现的值为众数,即样本中出现性最大的值,众数可能
不惟一。
例6.1.5 现有一数据集合:{2,3,3,3,3,4,4,5,6,6,6,
6,6,7,7,8},其中每一个值出现的次数如下:
数值 2
3
4
5
6
7
8
出现次 1
4
2
1
5
2
1

从总体中抽出若干个体进行观测的方式称为抽样。抽样分为完全抽 样与随机抽样,完全抽样即是抽出总体的全部个体进行观测;随机抽样 即是从总体中随机抽出部分个体进行观测。由于对个体的观测需要付出 一定的人力、财力和物力,所以在实际上,因为观测资源的缺少,或是 观测的难度,或是观测本身具有破坏性(如观测灯泡的使用寿命的长 短)等原因,不能进行完全抽样,只能进行随机抽样。而且从观测结果 而言,完全抽样的观测分析不一定优于随机抽样的观测分析。因此多采 用随机抽样方式。
试求:1)样本中位数;
2) 若取第11件数据为15.2,此时又为何值;
3) 样本极差。
解:先将所得数据从小到大顺序排列为
13.0,14.2,14.5,14.5,15.0,15.1,15.3,15.9,16.4,16.7
1)n =10为偶数,故
2)时,n=11为奇数,故数据重新排列为:
13.0,14.2,14.5,14.5,15.0,15.1,15.2,15.3,15.9,
设为总体的样本,统计量
(6.1.13)
称为样本标准误差,或标准误,其统计值为
(10)样本偏度系数
设为总体的样本,统计量
(6.1.14)
称为样本偏度系数,其统计值为:
其中是样本标准差。 (11)样本峰度系数
设为总体的样本,统计量 (6.1.15)
称为样本峰度系数,其统计值为
其中是样本标准差。 样本偏度系数与样本峰度系数是反映总体分布形态的特征的统计 量。 若已知样本值,则在软件Excel中,利用描述统计函数容易计算上述 统计量的统计值。 (12)样本协方差
则称为原样本的顺序统计量。其中称为第个顺序统计量,意味着在中恰 有个不超过它,恰有个超过它。
易见,。 若样本值为,则按其从小到大的顺序排列后得到顺序统计值:
样本极小值 为,样本极大值为。
例6.1.3 设为的容量为5的样本,今对这个样本作了3次观测,得其
值如下表所列,试求顺序统计值。
Xk 观测次数
X1
52 50.375 1.625 2.640625
49 50.375 -1.375 1.890625
57 50.375 6.625 43.89063
43 50.375 -7.375 54.39063
47 50.375 -3.375 11.39063
50 50.375 -0.375 0.140625
51 50.375 0.625 0.390625
第六章 数理统计的基本概念
在前面五章里我们介绍了概率论的基本内容,后面的四章里我们将 讲述数理统计的基本内容。数理统计是随机数学的一个应用性极强的分 支,它是根据随机试验数据,以概率论理论为基础来研究随机现象,从 而对研究对象的统计规律性作出种种合理的统计分析和统计判断的一门 应用科学。数理统计的内容十分丰富,包括抽样分布、抽样调查、实验 设计、统计估计、统计假设检验、线性回归分析与方差分析等统计理论 与方法。随着计算机技术的迅猛发展,统计软件的大力开发,数理统计 知识的应用越来越广泛,现已成为自然科学与社会科学的各个学科必不 可少的数学工具。本章将介绍数理统计的基本概念,包括总体、样本、 统计量、抽样分布、直方图、经验分布函数、三大统计分布等等知识。
, 故样品的概率密度与分布函数分别为
, 由(6.1.2)式可得样本 的联合概率密度函数为 样本 的联合分布函数为
例6.1.2 设总体服从两点分布((0-1)分布),从中取出一个容量 为的样本,试求样本的联合概率分布。
解:设总体服从两点分布((0-1)分布),则其概率分布为 故样品的概率分布为
由(6.1.3)式可得样本 的联合概率分布为:
二、样本
数量指标的分布称为总体的分布。为了能了解总体的分布特征情 况,实际上是从总体中抽出若干个体,对这若干个体的进行观测,从而 去推断总体的分布特征的。例如要了解一批电视机的使用寿命,可以从 这批电视机中随机抽取n台电视机,观察这n台电视机的使用寿命,获得 n个观察值,然后根据这组观察值对整体电视机的寿命(即总体X)作 出分析和判断。
基本练习6.1
1. 设总体,是来自的一个样本,试写出的联合概率分布密度函数。 2. 设总体(均匀分布),是来自的一个样本,试写出的联合概率分布 密度函数。
统计量。
(3)样本极差
的顺序统计量,则称统计量
(6.1.6)
为样本的极差。它是样本中最大值与最小值之差,反映了样本观察
值的波动幅度。
例6.1.4 某工厂制作一种线圈,为了控制生产过程保持稳定,从产
品中任取10件,测定其电阻抗值(单位:)所得数据如下:
15.3,13.0,16.7,14.2,14.5,14.5,15.9,15.0,15.1,16.4
解:从表中可见,数字6出现的次数最多,故众数为6。 (5)样本均值
设为总体的样本,统计量 (6.1.7) 称为样本均值。它描述总体的平均可能取值。其统计值为
即为样本值的算术平均值。 (6)样本方差
设为总体的样本,统计量 (6.1.8)
称为样本方差,其统计值为
称为样本标准差。 (7) 样本变异系数 设为总体的样本,统计量
因为都是随机变量,而统计量是的函数,也是一个随机变量。若
()为样本的一次观察值,则是的观察值,称为统计值。 例如函数在 中,若参数已知,则该函数是统计量;若参数未知
时,则它只是样本的函数,而不是统计量。 下面列出一些常用的统计量:
(1) 顺序统计量 设为总体的样本,把它们按从小到大的顺序排列为: (6.1.4)
54,52,49,57,43,47,50,51 试计算样本平均数、样本中位数、样本极差、样本方差、样本标准差与 标准误差。
解:1)样本平均数
2)将8个数据按从小到大排列为 43,47, 49, 50,51,52,54,57 样本中位数
3) 样本极差 4) 样本方差列表计算:
54 50.375 3.625 13.14063
(1)独立性: 是相互独立的随机变量,即每个个体的观测结果互 相不受影响; (2)代表性:能代表总体的分布特征,即是指中每一个都与总体 具有相同分布。 定义6.1.1 (简单随机样本)设是来自总体X的容量为n的样本,如 果相互独立,且每一个都是与总体具有相同分布的随机变量,则称为总 体的简单随机样本,简称为样本或子样。 在以后的章节中,我们所提到的样本,如无特别声明的话,都是指 简单随机样本。
(6.1.9) 称为样本变异系数,其统计值为 (8) 样本矩 设为总体的样本,统计量
(6.1.10) 称为样本阶原点矩;
(6.1.11) 称为样本阶中心矩。它们相应的统计值分别为
其中样本一阶原点矩: 即为样本均值;
样本二阶中心矩:
(6.1.12)
显见,样本二阶中心矩与样本方差的关系为:
(9)标准误差(标准误)
频 数
4
3 15 42 49 78 50 31
5
若各组以该组中位数作为此样本的数值,近似计算样本均值和样本 方差。
解:本题是利用分组数据计算样本均值和样本方差,故首先计算各 组的组中值,得如下分布表:
分 组1 2 3 4 5 6 7 8 9 数
组 中 5.75 6.25 6.75 7.25 7.75 8.25 8.75 9.25 9.75 值
若总体包含多项研究的数量指标时,则对应分为多个总体进行研 究。例如考察某地区全体居民的身高或体重情况时,则某地区全体居民 的身高为一个总体,身高亦为一个总体。
总体中所包含的个体总数称为总体容量。包含有限个个体的总体称 为有限总体,包含无限个个体的总体称为无限总体。如果一个有限总体
所包含的个体很多,在实际中常当作无限总体来处理,如一大批某种产 品,一大袋粮食种子等。
中位 数
50.5
标准 4.274091 差
方差 18.26786
峰度 0.440271
偏度 -0.2422
区域
(极
14
差)
例6.1.7 某厂某种悬式绝缘子机电的破坏负荷数值分组列表如下:
分1
2
3
4
5
6
7
8
9


组 限
5.5~6
6~6.5
6~.57
7~7.5
7.5~8
8~8.5
8.5~9
9~9.5
9.5~10
一般地,从一个总体中随机抽出的个个体的集合称为总体的一个 样本(子样),样本中个体的个数称为样本的容量。对样本的一次观察 所得的观测值,我们称为样本观测值,简称样本值。样本所有可能取值 的全体称为样本空间,它是维实数空间或其子集。样本观测值则是样本 空间中的一个点。
为了更有效地利用样本来反映总体的分布特性,我们要求从总体 中抽出的样本,必须满足下述两个条件:
§ 6.1 总体与样本
一、总体与个体
在数理统计中,我们把所研究对象的全部元素组成的集合称为总体 (母体),组成总体的每一个元素称为个体(样品)。例如要考察某地 区全体居民的情况,则该地区的全体居民构成一个总体,每位居民为一 个个体;又如考察一批灯泡的质量情况,这一批灯泡构成一个总体,其 中每一个灯泡为一个个体。而在实际问题中,我们关心的仅仅是总体的 某项数量指标,如考察某地区全体居民的身高情况,一批灯泡的使用寿 命情况,因此以后我们就把总体和数量指标等同起来,视某地区全体居 民的身高为一个总体,每位居民的身高为一个个体;一批灯泡的使用寿 命为一个总体,每一个灯泡的使用寿命为一个个体。由于总体的数量指 标是随所考察的个体不同而取不同数值的量,且每个个体所取的值是不 同的,事先是无法准确确定的,因此总体的数量指标是一个随机变量, 可用等大写英文字母表示,个体的数量指标也是随机变量,可用表示。
相关文档
最新文档