第六章 统计量及其抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如: 二项分布
3. 经典统计推断的基础
f (x)
6 - 18
x
经济、管理类 基础课程
统计学
f ( x) 1
概率密度函数
1 2
2
e
x 2 2
,
x
f(x) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71828 x = 随机变量的取值 (- < x < ) = 总体均值
6 - 14
经济、管理类 基础课程
统计学
6.2.2 渐进分布
由于寻找精确的抽样分布有困难,统计学 者转而研究当样本大小 n→∞时统计量 的渐近分布(即极限分布),这种研究是 数理统计大样本理论的基础性工作。
6 - 15
经济、管理类 基础课程
统计学
6.2.3 随机模拟获得的近似分布
在实际应用中,有许多问题要寻求它的 精确分布和渐进分布都是非常困难的, 而在计算机飞速发展的今天,利用计算 机进行模拟来获得某种统计量的近似分 布已十分容易。 Excel ——工具——数据分析——随机数 发生器
(4) P(| X | 2) = P(-2 X | 2)= (2)- (-2)
6 - 31
= (2)- [1-(2)]=2 (2)- 1=0.9545
经济、管理类 基础课程
统计学
正态分布 (实例)
(1) P(X 10) ; (2) P(2<X <10)
【例】设X~N(5,32),求以下概率
6 - 16
6.3 由正态分布导出的几个重 要分布 统计学
经济、管理类 基础课程
6.3.1 6.3.2 6.3.3 6.3.4
正态分布 卡方分布 t分布 F分布
6 - 17
经济、管理类 基础课程
统计学
6.3.1 正态分布
1. 描述连续型随机变量的最重要的分布
2. 可用于近似离散型随机变量的分布
m 1 2 n 1 2 m
则Tm仍是一个统计量,不过不是充分的。
6 - 10
经济、管理类 基础课程
统计学
充分性是数理统计的一个重要基本概念,它是 R.A.费希尔在1925年引进的,费希尔提出, 并由J.奈曼和P.R.哈尔莫斯在1949年严格证 明了一个判定统计量充分性的方法,叫因子 分解定理。这个定理适用面广且应用方便,利 用它可以验证很多常见统计量的充分性。例 如,若正态总体有已知方差,则样本均值是充分 统计量。若正态总体的均值、方差都未知, 则样本均值和样本方差S2合起来构成充分统 计量。一个统计量是否充分,与总体分布有密 切关系。
• 统计方法
描述统计 推断统计
参数估计
6-2
假设检验
经济、管理类 基础课程
统计学
总体
统计推断的过程
样 本
样本统计量
例如:样本均 值、比例、方 差
6-3
经济、管理类 基础课程
统计学
6.1统计量
6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3次序统计量 6.1.4 充分统计量
6-4
经济、管理类 基础课程
6 - 11
经济、管理类 基础课程
统计学
6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布
6 - 12
经济、管理类 基础课程
统计学
6.2.1 抽样分布
统计量的分布叫抽样分布。
统计量的性质以及使用某一统计量作推 断的优良性,取决于其分布。所以抽样 分布的研究是数理统计中的重要课题。 寻找统计量的精确的抽样分布,属于所 谓的小样本理论的范围,但是只在总体 分布为正态时取得比较系统的结果。对 一维正态总体,有三个重要的抽样分布 ,即ⅹ2分布、t分布和F分布。
标准正态分布
= 10
=1
.1664
.0832 .0832
6 - 30
2.9 5 7.1
X
-.21 0 .21
Z
经济、管理类 基础课程
统计学
正态分布 (实例)
【例】设X~N(0,1),求以下概率:
(1) P(X <1.5) ;(2) P(X >2); (3) P(-1<X 3) ; (4) P(| X | 2)
6-9
经济、管理类 基础课程
统计学
6.1.4 充分统计量
统计量是由样本加工而成的, 在用统计量代替样本作统计推 断时,样本中所含的信息可能有所损失,如果在将样本加工 为统计量时,信息毫无损失,则称此统计量为充分统计量。 例如,从一大批产品中依次抽出n个,若第i次抽出的是合格品 ,则xi=0,否则xi=1(i=1,2,…,n)。总体分布取决于整批产品的 废品率p,可以证明:统计量 Tn ( X1 , X 2 , X n ) X1 X 2 X n 即样本中的废品个数,包含了(x1,x2,…,xn)中有关p的 全部信息,是一个充分统计量。若取m<n,令 , T ( X , X , X ) X X X
( x) ( x)dt
x
1 2
e dt
t2 2
经济、管理类 基础课程
统计学
标准正态分布
Z X
标准正态分布
一般正态分布
1
6 - 26
x
Z
经济、管理类 基础课程
统计学
标准正态分布表的使用
1、将一个一般的转换为标准正态分布 2、计算概率时 ,查标准正态概率分布表 3、对于负的 x ,可由 (-x)1 x得到 4、对于标准正态分布,即X~N(0,1),有 P (a X b) b a P (|X| a) 2 a 1
wk.baidu.com
6 - 27
经济、管理类 基础课程
统计学
5.对于一般正态分布,即X~N( , 2 ),有
b a P ( a X b)
6 - 28
经济、管理类 基础课程
统计学
标准化的例子 计算P(5 X 6.2)
X 6.2 5 Z 0.12 10
2 Y Z,则 Y 服从自由度为1的2分布,即
Y ~ (1)
2
2 当总体 X ~ N ( , ) ,从中抽取容量为n的样本,则
( X i X )2
6 - 33
i 1
n
2
~ 2 ( n 1)
经济、管理类 基础课程
统计学
(性质和特点)
2分布
分布的变量值始终为正
分布的形状取决于其自由度n的大小,通常为不对 称的正偏分布,但随着自由度的增大逐渐趋于 对称
统计学
正态分布的概率
概率是曲线下的面积!
f(x)
P(a x b) f ( x)dx ?
a b
a
6 - 23
b
x
经济、管理类 基础课程
统计学
标准正态分布的重要性
一般的正态分布取决于均值和标准差 计算概率时 ,每一个正态分布都需要有自 己的正态概率分布表,这种表格是无穷 多的 若能将一般的正态分布转化为标准正态分 布,计算概率时只需要查一张表
期望为:E(2)=n,方差为:D(2)=2n(n为自由度) 可加性:若U和V为两个独立的 2 分布随机变量, U~2(n1), V~2(n2),则U+V这一随机变量服从 自由度为n1+n2的2分布
经济、管理类 基础课程
统计学
6.3.2 卡方分布 (2分布、2 distribution)
由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特 (Hermert)和卡· 皮尔逊(K· Pearson) 分别于1875 年和1900年推导出来 设 令
X ~ N ( , 2 ),则
X Z ~ N (0,1)
6 - 24
经济、管理类 基础课程
统计学
标准正态分布函数
1.任何一个一般的正态分布,可通过下面的线 性变换转化为标准正态分布 X Z ~ N (0,1) 2. 标准正态分布的概率密度函数
1 ( x) e 2
x
x2 2
,
x
3. 标准正态分布的分布函数
6 - 25
6 - 13
经济、管理类 基础课程
统计学
抽样分布
某个样本统计量的抽样分布 (sampling distribution),从理论上说就是在重复选 取容量为n的样本时,由每一个样本算出的该统计 量数值的相对频数分布或概率分布。 所有样本指标(如均值、比例、方差等)所形成的分 布是一种理论概率分布; 样本统计量是随机变量; 如:样本均值、样本方差、样本比例等 结果来自容量相同的所有可能样本
解 (1)
X 5 10 5 P( X 10) P 3 3 X 5 P 1.67 (1.67) 0.9525 3
(2)
6 - 32
X 5 10 5 25 P(2 X 10) P 3 3 3 X 5 P 1 1.67 3 (1.67) (1) 0.7938
解:(1) P(X <1.5) = (1.5)=0.9332
(2) P(X >2)=1- P(2 X)=1-0.9973=0.0227 (3) P(-1<X 3)= P(X 3)- P(X <-1) = (3)- (-1)= (3) – [1-(1)] = 0.9987-(1-0.8413)=0.8354
1 n mk ( X i X ) k n i 1
为k阶样本原点矩和k阶样本中心矩, 统称为样 本矩。最常用的统计量,都可由样本矩构造。例 如,样本均值 (即α1)和样本方差
6-8
经济、管理类 基础课程
统计学
6.1.3 次序统计量
把样本X1,x2,…,xn由小到大排列,得到 ,
称之为样本x1,x2,…,xn的次序统计量。中位数、四分 位数、分位数都是次序统计量。 其中最小次序统计量 x(1)最大次序统计量x(n)称为 极值,在那些如年枯水量、年最大地震级数、材料的 断裂强度等的统计问题中很有用。 还有一些由次序统计量派生出来的有用的统计量, 如:样本中位数 是总体分布中心位置的一种度量, 它容易计算且有良好的稳健性。
经济、管理类 基础课程
统计学
第六章 统计量及其抽样分布
6.1统计量 6.2关于分布的几个概念 6.3由正态分布导出的几个重要分布 6.4样本均值的分布与中心极限定理 6.5样本比例的抽样分布 6.6两个样本平均值之差的分布 6.7关于样本方差的分布
6-1
经济、管理类 基础课程
统计学
推断统计在统计方法中的地位
如:样本均值、方差等是统计量
6-6
经济、管理类 基础课程
统计学
样本均值 样本方差 样本变异系数 样本矩
6.1.2 常用统计量
掌握
了解
6-7
经济、管理类 基础课程
统计学
6.1.2 常用统计量
样本矩 : 设x1,x2,…,xn是一个大小为n的样本,对自然数 k,分别称
1 n k ak X i n i 1
经济、管理类 基础课程
统计学
4.曲线f(x)相对于均值对称,尾端向两
个方向无限延伸,且理论上永远不会与 横轴相交 5.正态曲线下的总面积等于1
6.随机变量的概率由曲线下的面积给出
6 - 21
经济、管理类 基础课程
统计学
f(x)
和 对正态曲线的影响
B
A C x
6 - 22
经济、管理类 基础课程
统计学
6.1.1统计量的概念
Statistic 是用来描述样本特征的概括性数字度 量。它是根据样本数据计算出来的 一个量,由于抽样时随机的,因此 统计量是样本的函数。
6-5
经济、管理类 基础课程
统计学
定义6.1
设x1,x2,…,xn是从总体X中抽取的容量为n的 一个样本,如果此样本构造一个函数 T(x1,x2,…,xn) ,不依赖于任何未知参数, 则称T(x1,x2,…,xn) 是一个统计量。
一般正态分布
1
标准正态分布
1
.0478
5 6.2
6 - 29
x
0.12
Z
经济、管理类 基础课程
统计学
标准化的例子 P(2.9 X 7.1)
X 2.9 5 Z .21 10 X 7.1 5 Z .21 10
一般正态分布
6 - 19
经济、管理类 基础课程
统计学
正态分布函数的性质
1.概率密度函数在x 的上方,即f (x)>0 2.正态曲线的最高点在均值,它也是分布 的中位数和众数 3.正态分布是一个分布族,每一特定正态分 布通过均值的标准差来区分。 决定曲 线的高度,决定曲线的平缓程度,即宽度
6 - 20