统计推断-参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用t分布构建的总体均值的(1-α)%置信区间公式如下:
t(1-a/2,df):t的分位值, 决定于置信度和自由度,可通 过查表得到。
19
利用t分布构建总体均值的置信区间
电阻的电阻值服从正态分布,抽取了10个电阻值的观察 值如下:
电阻值 608 630 610 636 637 610 626 602 604 636
n
Z的分位值,决定于置信度 当置信度为95%时,Z的 0.975的分位值为1.96
应用以上公式的前提条件为:
总体σ已知,或者 大样本(n≥30)
16
学生t分布
定义
设x1,x2…xn是来自正态总体N (, 2 )的一个样本, x 和S为样
本均值和标准差,则:
t x ~ t(n 1)
2
(n 1)s2
2
~
2 (n 1)
2 (n 1) 表示为自由度为(n-1)的卡方分布,卡方分布有以下特
点:
非负非对称分布
21
卡方分布
利用卡方分布构建的总体方差(1-a)%置信区间公式如下:
(n 1)s2
2 (1 / 2, df
)
2
(n 1)s2
2 ( / 2, df
)
卡方的分位值可通过 查表得到.
代表性:所抽取样本能够代表所要研究的总体 随机性:总体中每一个个体都有相等的机会被选中 独立性:样本中一个个体被选中不影响另外一个个体被选中
的可能性
10
抽样分布
因为统计量从样本到样本是变化的,所以根据统计量 作出的任何推断必定带有不确定性,但这种不确定性 是有规律可循的,这种规律就体现在抽样分布中。
x
2 x
2
n
x
又称为标准误差,它反 映了抽样误差的大小
12
中心极限定理图示
13
标准误与样本量的关系
14
利用抽样分布建立总体均值置信区间
根据中心极限定理,当样本量足够大时,Xbar服从 N , 2 / n
15
总体均值置信区间的构建
总体均值的置信区间有以下的形式:
x Z(1 / 2) x x Z(1 / 2)
636
4. 代入公式的:
637 610
914.382 2 914.382
19.023
2.7
626
总体方差的95%置信区间(97.8,689.3)
602
总体标准差的95%置信区间(9.89,26.25)
604
636
23
The End
24
描述统计
(统计数据的搜集、整
总体数据 理、显示和分析等)
推断统计
(利用样本信息和概率 论对总体的数量特征进
行估计和检验等)
总体内在的 数量规律性
4
统计中的几个基本指标
总体

☺ ☺
☺ ☺
☺☺☺
样本
☺☺ ☺
参数
统计量
平均数
x
标准差
s
比例
p
5
有以下常用的样本统计量
衡量中心位置的:
样本统计量
自由度df指的是独立偏差 的个数。
区间估计 点估计存在估计可靠性问题,区间估计就是可靠性的衡 量 如前页描述的本地区人员身高均值的95%的信心区 间为(171.762,174.238),通常取信心为95%, 这就是常说的95%置信区间。
要利用统计量对总体参数进行估计,须先了解抽样的 一些性质。
9
抽样
为了能够准确推断中体,样本必须满足以下的原则:
抽样分布
样本平均值的分布:中心极限定理 学生t分布 卡方分布 F分布
以上的分布往往被用于对总体参数进行估计。
11
中心极限定理
中心极限定理
不管总体服从何种形状的分布,只要样本量足够大,来自此 总体的随机样本均值具有近似正态分布的抽样分布。样本量 越大,这种近似性就越好。
样本平均值的抽样分布具有以下的性质:
s/ n
t(n-1)表示为自由度为(n-1)的t分布,t分布有以下特点:
对称分布 比Z分布更平坦,也就是同样的分位值t要比Z大(绝对值) t分布的极限分布(自由度无穷大)为Z分布
17
t分布
t分布的0.025,0.95,0.975分位值可以通过查t分布表得到
18
利用t分布构建总体均值的置信区间
计算总体均值置信区间的步骤:
1. 计算样本均值Xbar=619.9 2. 计算样本标准差s=14.38 3. 决定置信度,取95%(既α=0.05) 4. 查t分位值t(0.975,9)=2.262 5. 代入以下公式
x t(1 / 2, df ) s 619.9 2.262 14.38
n
6
常见的几种分布
常见的总体分布
二项分布(描述计件质量特征) 柏松分布(描述计点质量特征) 正态分布(描述计量质量特征) 超几何分布
7
正态分布的分位数与尾概率
概率!
8
对总体参数进行估计
样本统计量的目的是对总体参数进行估计,存在以下 两类估计方法:
点估计 用样本统计量的单一值对参数进行估计 如用Xbar估计,用s估计σ,用p估计P。
22
卡方分布构建总体标准差的置信区间
电阻的电阻值服从正态分布,抽取了10个电阻值的观察
值如下:
电阻值
计算总体方差置信区间的步骤: 1. 计算样本标准差s=14.38
608
2. 决定置信度,取95%(既a=0.05)
630
3. 查卡方分位值: 2(0.975,9) 19.023,
610
2(0.025,9) 2.7
统计推断
统计方法
统计方法
描述统计
推断统计
参数估计
假设检验
2
1. 研究如何利用Hale Waihona Puke 本数据来推 断总体特征的统计学分支
总体
2. 内容
参数估计 假设检验
3. 目的
对总体特征作出推断
推断统计
样 本
3
描述统计与推断统计的关系
概率论
(包括分布理论、大数定律 和中心极限定理等)
反映客观 现象的数

样本数据
10
总体均值的95%置信区间(609.61,630.19)
20
总体标准差的估计
和总体均值的置信区间相类似,总体标准差也可以构建 置信区间。
样本标准差的抽样分布既非正态分布,也非t分布,而是
卡方分布 2 。
定义:
设x1,x2…xn是来自正态总体 N (, 2 ) 的一个样本,s为样本
标准差,则:
相关文档
最新文档