统计学原理贾俊平PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(n1)s2
2
~2(n1)
将2(n – 1)称为自由度为(n-1)的卡方分布
6 - 19
经济、管理类 基础课程
统计学
总体
6 - 20
卡方 (2) 分布
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值 2 = (n-1)S2/σ2
计算出所有的 2值
不同容量样本的抽样分布
n=
1
n=
4
n=10
统计学
区间估计 (概念要点)
1. 根据一个样本的观察值给出总体参数的估计范围 2. 给出总体参数落在这一区间的概率 3. 例如: 总体均值落在50~70之间,置信度为 95%
置信区间
样本统计量 (点估计)
6 - 37
置信下限
置信上限
经济、管理类 基础课程
统计学
置信区间估计 (内容)
置信区间
均值
2 已知
1
2
3
4
= 2.5 σ2 =1.25
6 - 15
.3 P ( x )
抽样分布
.2
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
x 2.5
x2 0.625
经济、管理类 基础课程
统计学
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所有容量为n的样本的均值X也服从正态分布, X 的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
=10
= 50
X
总体分布
6 - 16
n=4
x 5
n =16
x 2.5
X
x 50
抽样分布
经济、管理类 基础课程
统计学
中心极限定理 (图示)
中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分布的 总体
6 -7
经济、管理类 基础课程
统计学
抽样方法 (概念要点)
1. 概率抽样:根据已知的概率选取样本 简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层”,然后在每一层内进行抽样 整群抽样:将一组被调查者(群)作为一个抽样单位 等距抽样:在样本框中每隔一定距离抽选一个被调查者
2. 非概率抽样:不是完全按随机原则选取样本 非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选择被调查者
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
6 - 12
4
4,1
4,2
4,3
4,4
经济、管理类 基础课程
统计学
样本均值的抽样分布 (一个例子)
计算出各样本的均值,如下表。并给出样本均值的抽样分布
16个样本的均值(x)
第一个
第二个观察值
观察值
1
2
3
4
1
1.0
1.5
正态分布
X t 分布与正态分布的比较
6 - 26
t (df = 5)
Z t 不同自由度的t分布
经济、管理类 基础课程
统计学
一. 点估计
二. 点估计的优良性准则
三.
区间估计
第二节 参数估计基本方法
6 - 27
经济、管理类 基础课程
统计学
参数估计的方法 估计方法
6 - 28
点估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
统计学
总体均值的区间估计 (2已知)
6 - 44
经济、管理类 基础课程
统计学
总体均值的置信区间 (2 已知)
1. 假定条件 总体服从正态分布,且总体方差(2)已知 如果不是正态分布,可以由正态分布来近似 (n 30)
2. 使用正态分布统计量Z
Z x ~N(0,1) n
3. 总体均值 在1-置信水平下的置信区间为
6 -4
经济、管理类 基础课程
统计学
学习目标
1. 了解抽样和抽样分布的基本概念 2. 理解抽样分布与总体分布的关系 3. 了解点估计的概念和估计量的优良标准 4. 掌握总体均值、总体比例和总体方差的区间估计
6 -5
经济、管理类 基础课程
统计学
第一节 抽样与抽样分布
一. 总体、个体和样本
二. 关于抽样方法
3. 配额抽样:选择一群特定数目、满足特定条件的被调查者
6 -8
经济、管理类 基础课程
统计学
样本均值的抽样分布
6 -9
经济、管理类 基础课程
统计学
抽样分布 (概念要点)
1. 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布
2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本比例等
区间估计
经济、管理类 基础课程
统计学
一个总体
两个总体
6 - 29
被估计的总体参数
总体参数 均值 比例 方差
均值之差 比例之差
方差比
符号表示
P 2
1 2
P1 P2
12 22
用于估计的样本统计 量
x pˆ s2
x1 x2 pˆ1 pˆ2 s12 s22
经济、管理类 基础课程
统计学
点估计
6 - 30
(10,10)
F
经济、管理类 基础课程
统计学
T 统计量的分布
6 - 25
经济、管理类 基础课程
统计学
T 统计量的分布
设X1,X2,…,Xn1是来自正态总体N~(μ1,σ12 )的一个样本, 称
T
n(X ) 为统计量,它服从自由度为(n-1)的t 分布
S
t 分布
标准正态分布
t (df = 13)
6 - 31
经济、管理类 基础课程
统计学
估计量 (概念要点)
1. 用于估计总体某一参数的随机变量 如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值的一个估计量 如果样本均值 x = 3 ,则 3 就是 的估计值
2. 理论基础是抽样分布
6 - 32
二战中的点估计
经济、管理类 基础课程
x Z 2
n
,
x
Z
2
n
21.4
1.96
0.15 9
,21.4
1.96
0.15 9
21.302,21.498
我 们 可 以 95 % 的 概 率 保 证 该 种 零 件 的 平 均 长 度 在 21.302 ~ 21.498 mm之间
6 - 46
统计学
影响区间宽度的因素
1. 数据的离散程度,用 来测度
2. 样本容量,
3.
3. 置信水平 (1 - ),影响 Z 的大小 n x
6 - 42
经济、管理类 基础课程
统计学
一. 总体均值的区间估计
二. 总体比例的区间估计
三.
样本容量的确定
第三节 总体均值和总体比例 的区间估计
6 - 43
经济、管理类 基础课程
sx2 sy2 sx2
s 2 2
2
12
y
2
2 2
~F(n11,n21)
1
将F(n1-1 , n2-1 )称为第一自由度为(n1-1),第二自由度为(n2-1)的F分布
6 - 23
经济、管理类 基础课程
统计学
不同样本容量的抽样分布
两个样本方差比的抽样分布
(1,10)
6 - 24
(5,10)
2 未知
比例
6 - 38
方差
经济、管理类 基础课程
统计学
X = Zx
落在总体均值某一区间内的样本
_ x
- 2.58x
X
-1.65 x
+1.65x
+ 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
6 - 39
99% 的样本
经济、管理类 基础课程
统计学
置信水平
1. 总体未知参数落在区间内的概率 2. 表示为 (1 -
x
n 当样本容量足够大时(n 30) ,样本均值的抽 样分布逐渐趋于正态分 布
6 - 17
X
x
经济、管理类 基础课程
统计学
样本方差的抽样分布
6 - 18
经济、管理类 基础课程
统计学
样本方差的分布
设总体服从正态分布N ~ (μ,σ2 ), X1,X2,…,Xn为来自该正态总体的样本,则样本方差 s2 的分布为
统计学
估计量的优良性准则 (无偏性)
无偏性:估计量的数学期望等于被估计的总体 参数
P( X )
无偏 A
有偏 C
X
6 - 33
经济、管理类 基础课程
统计学
估计量的优良性准则 (有效性)
有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量
P(X )
6 - 34
均值的抽样分布 B
A
中位数的抽样分布
X
经济、管理类 基础课程
统计学
估计量的优良性准则 (一致性)
一致性:随着样本容量的增大,估计量越来越接 近被估计的总体参数
P(X )
较大的样本容量 B 较小的样本容量
A
6 - 35
X
经济、管理类 基础课程
统计学
区间估计
6 - 36
经济、管理类 基础课程
n
(xi x)2
2 i1 x
M
(1.02.5)2
(4.02.5)2
2
0.625
16
n
式中:M为样本数目 比较及结论:1. 样本均值的均值(数学期望)等于总体均值
2. 样本均值的方差等于总体方差的1/n
6 - 14
经济、管理类 基础课程
统计学
样本均值的分布与总体分布的比较
总体分布
.3
.2
.1 0
n=20
2
经济、管理类 基础课程
统计学
均值的标准误
1. 所有可能的样本均值的标准差,测度所有样本均值的离散程度 2. 小于总体标准差 3. 计算公式为
x
n
6 - 21
经济、管理类 基础课程
统计学
两个样本方差比的抽样分布
6 - 22
经济、管理类 基础课程
统计学
两个样本方差比的抽样分布
设X1,X2,… ,Xn1是来自正态总体N~(μ1,σ12 )的一个样本, Y1,Y2,… ,Yn2是来自正态总体 N~(μ2,σ22 )的一个样本,且Xi(i=1,2,…,n1),Yi(i=1,2, …,n2)相互独立,则
4. 结果来自容量相同的所有可能样本
6 - 10
经济、管理类 基础课程
统计学
样本均值的抽样分布 (一个例子)
【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下
均值和方差
总体分布
N
Xi
.3
i1 2.5
6 - 45
xZ2
n,xZ2
n
经济、管理类 基础课程
统计学
总体均值的区间估计 (正态总体:实例)
【例】某种零件长度服从 正态分布,从该批产品中 随机抽取9件,测得其平 均长度为21.4 mm。已知 总体标准差 =0.15mm, 试建立该种零件平均长度 的置信区间,给定置信水 平为0.95。
解:已知X~N(,0.152),x=2.14, n=9, 1- = 0.95,Z/2=1.96 总体均值的置信区间为
三.
样本均值的分布与中心极限定理
四.
样本方差的分布
五.
两个样本方差比的分布
六.
六. T 统计量的分布
6 -6
经济、管理类 基础课程
统计学
总体、个体和样本 (概念要点)
总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量
N
.2
N
.1
(Xi )2
0
2 i1
1.25
1
N
6 - 11
2
3
4
经济、管理类 基础课程
统计学
样本均值的抽样分布 (一个例子)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的 结果如下表
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
经济、管理类 基础课程
统计学
点估计 (概念要点)
1. 从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 ▪ 例如: 用样本均值作为总体未知均值的估计值就是一个点估计
2. 点估计没有给出估计值接近总体未知参数程度的信息 3. 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等
为显著性水平,是总体参数未在区间内的概率 3. 常用的显著性水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
6 - 40
经济、管理类 基础课程
统计学
区间与置信水平
均值的抽样分布
x
/2
1 -
/2
X
x
(1 - ) % 区间包含了 % 的区间未包含
6 - 41
经济、管理类 基础课程
2.0
2.5
2
1.5
2.0
2.5
3.0
3
2.0
2.5
3.0
3.5
4
2.5
3.0
3.5
4.0
6 - 13
.3 P ( x )
.2
.1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x 样本均值的抽样分布
经济、管理类 基础课程
统计学
所有样本均值的均值和方差
n
xi M 1xi 1.01.51 64.02.5
统计学原理贾俊平PPT
经济、管理类 基础课程
统计学
参数估计在统计方法中的地位 统计方法
描述统计
6 -2
推断统计
参数估计
假设检验
经济、管理类 基础课程
统计学
总体
统计推断的过程
6 -3
样
样本统计量
本
例如:样本均值、
比例、方差
经济、管理类 基础课程
统计学
第六章 抽样与参数估计
第一节 抽样与抽样分布 第二节 参数估计基本方法 第三节 总体均值和总体比例的区间估计 第四节 两个总体均值及两个总体比例之差的估计 第五节 正态总体方差及两正态总体方差比的区间估计