第二讲 应用统计 统计推断的过程

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5
区间估计


区间估计是在点估计的基础上给出总体 参数估计的一个估计范围。这个范围通 常是样本的点估计值加减估计误差而得 到的。 在区间估计中,由样本统计量所构造的 总体参数的估计区间称为置信区间,
6
1)估计参数(续)

区间估计的例子 用样本均值 X 估计正态总体的期望 μ,
Байду номын сангаас
误差范围 ( X k , X k ) 有多大,有多大的概率
2
一、统计推断 1.统计推断基本概念


总体:有限总体、无限总体; 样本 X1, X 2 ,, X n ; 1 n X xi 统计量:样本的函数。例如样本均值 n i 1 参数: 总体的数字特征。如均值、标准差 统计推断的任务:通过样本(的统计量)来了解总体 的特性(参数)。 为什么需要利用抽样来了解总体: 1) 总体无法得到; 2) 时间或成本不允许; 3) 实验具有破坏性。
30 15 10 15 10 5 15 15 5 10
11
总体分布 0.6
概率
0.4 0.2 0 5 10 价值 样本分布 0.6 15 30
概率
0.4 0.2 0 5 10 价值 15 30
10 2 55 7 .4 2
x 1 0.3 3 s 5 6.7 8 s 7 .5 4
抽样方式
总体分布===== 抽样分布
15
2. 样本均值的抽样分布(简单随机样本)

如果总体服从 N ( , 2 ) , 那么简单随机样
2
本的均值 x 服从正态分布 N ( , ) n x
Z

n
。或者
~ N (0,1)

x
n
是样本均值 x 的标准差,又专门
称它为标准误差。
16

如果总体不见得服从正态, 期望是,
方差是 2<+,在样本容量n非常大的条件下
(n30),那么简单随机样本的均值 x 近似
服从正态分布 N ( , ) (中心极限定理), n x 或 Z 近似服从标准正态分布 。
n
2
17
一个例子

一种电器元件设计的服务寿命为3000小时, 标准差为800小时。一名顾客买了49个元件。 这49个元件的平均寿命至少为2750小时的概 率为多大?至少为3000小时呢?
18
3.样本比率的抽样分布(简单随机样本) x 小样本情况, p 总体中某特征的比率 p n x :n个样本中特征发生的频数,它服从二 项式分布B(n,p)。取值范围 0,1, n;期望 np,方

差np(1-p) 。 :取值范围0,1/n, ,1;期望p,方差/p(1-p)/n 。 p 仍然服从同样的二项分布。 大样本情况 [ np 5且] n,按照中心 (1 p) 5 极限定理,近似地 p(1 - p) p ~ N ( p, ) n 19
9

总体分布和样本的例子: 一个箱子中有10000个筹码,其中50%标 价5元, 30%标价10元, 10%标价15元, 10%标价30元。 y P(y) 5 .5 10 .3 15 .1 30 .1
10

从中抽一个容量为30的样本:
1
10 5 5 10 5 5 10 10 10 30
30 5 5 5 5 5 10 5 5 5
4.大样本的渐进分布和大样本分布

如果样本容量n非常大,则有简单随机样本的
2
x N ( , ) 均值 近似服从正态分布 n
x p n
;同样有样
p(1 - p) ) n
本比率 近似服从正态分布 一个统计量当样本很大时近似服从某一常见分 布,称统计量以该分布为渐进分布,或称该分布 是这个统计量的大样本分布。

一个水库有多少条鱼,一片森林的木材储 蓄量有多少,一批灯管的平均使用寿命是多少, 一批产品的合格率是多少,怎样才能知道这些 问题的答案? 问题很简单,你只要从中抽出部分样品, 根据样品提供的信息去推断就可以了。这就是 用样本推断总体的问题。

1
统计推断的过程
总体
样 本
样本统计量 如:样本均值 、比例、方差
2
2.无限总体的简单随机抽样: 1)特性:抽取一个样本对以后样本无影 响,每个样本都和总体同分布,且相互 独立; 2)简单随机样本定义:样本与总体同分 布且相互独立。(和有限总体定义相同) 3)例子:掷硬币 它是无限总体吗?写出它的分布。
14
三、抽样分布 1.抽样分布的概念
1)样本是随机变量,样本取值不同,均值 x 也 不同。 x 也是随机变量 , x 的概率分布称作它的抽 样分布。 2)统计量的分布称做该统计量的抽样分布. 3)抽样分布在统计推断中的中心地位。 4)抽样分布取决于总体的分布(模型)以及抽 样的方式。
p ~ N ( p,

20
5.方差未知时样本均值的抽样分布
1)正态总体,2未知,使用样本方差s2来 替代2,则样本均值满足: (x ) t ~ t ( n 1) s
保证μ在得到的区间内。
7
2)假设检验



假设检验: 样本是否适合所选用的模型? 例子: 是否可以使用模型N(570,306)来刻画所 有居民的家庭年收入? 思想: 如果该模型是适合的,那么 X 和570相 差很多的可能性(概率)不能太大。
8
二、随机抽样与简单随机样本
1.有限总体的随机抽样 1) 等概率抽样。 2) 样本x1, x2 ,, xn 是数值又是随机变量。 3) 有放回抽样:每一个样本抽取的环境相同, 与总体同分布,相互独立。 4) 简单随机样本定义:样本与总体同分布且相 互独立。 5) 无放回抽样:样本抽取的环境各不相同,相 互不独立,不是简单随机样本。 6) 随机样本的抽样方法:
3
2.统计推断的基本思想


1)选用一个概率模型来刻画样本所取自 的总体,使用样本对模型的一些特性做 出推断(由部分来认识总体) ; 2)由于样本的随机性,需要分析作出的 推断犯错误(风险)的可能性的大小。
4
3.统计推断的内容 1)估计参数
点估计和区间估计 点估计的例子 2 N ( , ) 居民家庭年收入遵从 1 n 样本均值X xi n i 1 n 1 2 2 样本方差s 2 ( x x ) i n 1 i 1 样本均值和样本方差都是统计量,利用统 计量做估计又称估计量。
相关文档
最新文档