统计学第4章用样本推断总体 PPT

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

43万元以上的交易数量 所占比例p
21 52.50%
25 69.44%
两个总体比例之差的区间估计
n1 40, n2 36; p1 52.5%, p2 69.44%. 在95%置信水平下的置信区间为: p1 1 p1 p2 1 p2 p1 p2 z / 2
s 1 x x 2 n 1 1 1265 1266.62 1257 1266.62 1269 1266.62 1276 1266.62 1266 1266.62 4 6.8775


区间估计法
• 区间估计法的步骤: 1)确定未知总体参数落在某区间内的概率1-, 介于0—1之间 2)(1-),称为置信水平;
估计量的优劣标准
• 估计总体参数的估计量有许多个 • 用好的估计量去估计总体参数 • 好的估计量的标准是: 1)无偏性:样本均值、样本比例、样本方差是总 体特征值的无偏估计 2)有效性:在所有无偏估计量中,方差最小的是 有效的 3)一致性:随着样本量的增大,点估计量的值越 来越接近总体参数的真实值
本章小结
• 参数估计的基本原理 • 点估计 • 区间估计
是参数不落在区间内的概率
3)置信水平1-,通常取值为 99%, 95%, 90%
即0.011,0.055,0.1010
区间估计法
x Z x Z x n
(x z

n
, x z
2

n
)
_ x
1.645
总体比例的区间估计
1)单一总体比例的区间估计 2)两个总体比例之差的区间估计
单一总体比例的区间估计
1)假设
总体服从二项分布 可以用正态分布近似估计 n p 5 且 n (1 - p) 5
2)置信区间估计 p z / 2
p 1 p n
P为总体比例。若总体比例未知,用样本比例代替
2011年交易价格 550.2 620 540 660.8 780 440 620.5 580 1030.5 1090 -50.5 2012年市场估价 640.5 690.5 640.8 差额 -90.3 -70.5 500.2 720.1 650 -60.2 -90.6 -70
-100.8 -110.2
d z / 2
2)小样本条件下,两个总体均值之差的置信区 _ sd 间为:
n
d t / 2 n 1
其中,d 为各差值的均值;当总体标准差未知时,可以 用样本差值的标准差替代 。
-
n
两个总体均值之差的区间估计
为比较分析北京市同一地区不同年份二手房价格的差异 ,某房地产中介公司从中关村地区2011年第四季度的 二手房交易中,抽取了8个交易作为样本;并根据2012 年当月市场行情,分别对这8个房源进行重新估价,得 到二手房价格如下表所示(单位:万元)。
总体方差的区间估计
1)假设 – 总体服从正态分布 2 2)用 分布,自由度为n-1
3)置信区间:
n 1 s
/ 2
2
2
n 1 s 2
2
2
1 / 2
总体方差的区间估计
• 假定二手房的交易价格服从正态分布。试在95%的置信水平下估计二手 房交易价格方差的置信区间
4.2总体参数估计
1)一个总体均值的区间估计 2)两个总体均值之差的区间估计
一个总体均值的区间估计
已知总体的标准差 总体服从正态分布 如果不是正态, 可被正态分布逼近 (样本n 30)
1)假设
2)置信区间:(

x Z ,x Z n n 2 2
一个总体均值的区间估计
由于1-0.95, t0.05/ 2 (7) 2.365 在95%置信水平下的置信区间为:
d t
sd 20.134 80.388 2.356 n 1 n 8 2 100.172,60.604
即(-100.172,-60.604) 结果表明:在置信水平为95%时,总体平均价格的差异介于- 10.17万元~-6.60万元之间。即认为中关村地区2012年第一季 度比2011年第四季度的二手房平均价格有显著提高。
已知
n1 n2 52.5% (1 52.5%) 69.44% (1 69.44%) (52.5% 69.44%) 1.96 40 36 16.94% 21.56%
即(-38.5%,4.62%)。 结果表明:当置信水平为95%时,两个年份价格在43万元以上的 二手房交易所占比例的差异介于-38.50%到4.62%之间。本例中 ,所求置信区间包含0,说明我们没有足够的理由认为2012年第 一季度与2011年第四季度价格在43万元以上的二手房交易所占 比例存在显著差异。
两个总体比例之差的区间估计
根据前面的数据,整理得出2012年第一季度与2011年 第四季度交易价格在430万元以上的二手房交易数量 及所占比例,试在95%置信水平下估计这两个时期, 交易价格在43万元以上的二手房交易所占比例的差值 的置信区间。整理数据如下 :
2011年第四季度 样本容量n 40 2012年第一季度 36
这时,两个样本均值之差经标准化后服从自由度 为的t分布。两个总体均值之差的置信区间为:
1 1 ( x1 x 2 ) t / 2 (n1 n2 2) s ( ) n1 n2
2 p
两个总体均值之差的区间估计 配对样本( Matched sample),即一个样本中 的数据与另一个样本中的数据相对应。 1)大样本条件下,两个总体均值之差的置信区 _ 间为: d
• 用估计量估计总体参数
• 估计量:是样本的函数,其中并不含有任何未知参数
4.1怎样进行推断
• 用估计量估计总体参数的基本方法 1)点估计法 估计的结果只是一个确定的值。用样本指标直接 替代总体指标。如; x X , p P, s 2)区间估计法 估计的结果是一个区间。该区间由点估计值加上 或减去估计误差而得到
( x1 x 2 ) z / 2

2 1
n1


2 2
n2
两个总体均值之差的区间估计
1.大样本条件下 (2)在两个总体的方差12和22均未知的情 况下,可用两个样本的方差s12和s22代替。 这时,两个总体均值之差的置信区间为:
( x1 x 2 ) z / 2
s s n1 n2
两个总体比例之差的区间估计
1)假设
– 总体服从二项分布 – 可以用正态分布近似估计
• n p1 5 且 n (1 - p1 ) 5; • n p2 5 且 n (1 – p2 ) 5
2)置信区间估计
p1 p2 z / 2
p1 1 p1 p2 1 p2 n1 n2
点估计法
例:设某批产品的寿命服从均匀分布,但是参数未知, 随机地抽取五个产品,测得寿命分别是1265小时, 1257小时,1276小时,1269小时和1266小时,试求总 体均值和标准差。 解:样本平均寿命和标准差分别是:
1 1 6333 x ( 1265 1257 1276 1269 1266 ) 5 n 5 1266 .6 x
总体均值区间估计的计算步骤:
1)确定置信水平1-a ;
2)根据置信水平,确定其临界值Za/2值;
3)实际抽样,并计算样本均值和抽样标准误差 4)确定置信区间:(x z , x z ) n n 2 2 例4.1;
假设:
一个总体均值的区间估计 (未知且小样本)
总体服从正态分布 总体标准差未知;用样本标准差s代替总体标准差σ 用 t 分布代替标准正态分布, t 分布的自由度为n-1
ห้องสมุดไป่ตู้
总体方差的区间估计
计算得 x 450.48, s 2 2920 .13 由0.05
2 2 2 12 / 2 n 1 0.975 39 24.433, n 1 0.025 39 59.342 /2
在95%置信水平下的置信区间为:
59.342
40 1 2920 .13 2 40 1 2920 .13
24.433
即(-191.99%,466.3%);相应地,总体标准差的 置信区间为(13.86%,21.59%)。 结果表明:当置信水平为95%时,2011年第四季度二 手房交易价格的标准差介于130.86万元到210.59万元 之间。
2
2.58
X
1.645
X
1.96
X
X 1.96
2.58
X
X
X
90% 样本 95% 样本 99% 样本
影响区间宽度的因素
• 影响因素:
1. 数据离散程度 .数据越离散,区间越宽 2. 样本容量 n。样本容量越大,区间越窄 3. 置信水平 (1-)。置信水平越大,区间越大
2 1
2 2
两个总体均值之差的区间估计
• 2. 小样本条件下 (1)当两个总体的方差均已知时,可建立两个总体均值之差的置信区间 (2)当两个总体的方差12和22均未知,且1222时,可用两个样本的方差 s12和s22计算总体方差的合并估计量sp2 。
2 2 n 1 s n 1 s 1 1 2 2 2 sp n1 n2 2
假定二手房价格服从正态分布,且方差相等。试以95% 置信水平估计中关村地区2012年第一季度和2011年第 四季度的二手房平均价格差值的置信区间。
已知n=8,总体方差未知;计算得。
两个总体均值之差的区间估计
x1 630.25, x2 710.64, d 80.388 , sd 20.134
置信区间:(
例4.2
) s s x t , x t ,( n 1) ,( n 1) n n 2 2
t
2
,( n 1)为临界值
两个总体均值之差的区间估计
独立样本(Independent sample):两个样本 是从两个总体中独立地抽取的,即一个样本中的 元素与另一个样本中的元素相互独立。 1.大样本条件下 (1)在两个总体的方差12和22均已知的情况 下, 两个总体均值之差的置信区间为:
用样本推断总体
主要内容
4.1怎样进行推断?
4.2总体参数估计
2
4.1怎样进行推断
• 人们通常关心总体的某个特征值:平均成本,平均价格; 产品合格率,次品率;一批产品销售价格的标准差,产 品成本的标准差等等 • 要得到这些指标,不可能把所有的产品都检测一遍
• 根据样本值推断和估计总体的特征值
相关文档
最新文档