lecture10 统计推断 区间估计 清华大学 课件

合集下载

§6.2区间估计精品PPT课件

§6.2区间估计精品PPT课件
§6.2 区间估计
前面,我们讨论了参数点估计. 它是用 样本算得的一个值去估计未知参数.
点估计的缺点:
1.没有指出误差; 2没有指出产生误差的概率. 区间估计正好弥补了点估计的这个缺陷 .
一、 置信区间定义:
设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量
ˆ1 ˆ1( X1, X2,, Xn ),ˆ2 ˆ2 ( X1, X2,, Xn )
n
n
(Xi )2
(Xi )2
P{ i1 2 (n) 2
2
i 1
2 1
2
(n)
} 1
(2)μ未知:
取 2
nS
2 n
2
~
2 (n 1)
P{12 2 (n 1)Βιβλιοθήκη nS2 n2
2 (n 1)} 1 2
P{
2
nSn2 (n
1)
2
2
nS
2 n
2 1
2
(n
} 1
1)
2.两个总体方差比的置信区间:
信区间.
三、总体均值的置信区间
1.单个总体均值的置信区间 设X1,…Xn是取自X~N(μ,σ2) 的样本, 求参数 μ
的置信度为 1-α的置信区间.
(1)σ2 已知:
取 U X ~ N (0,1) n
P{|
X
n
|
u
2} 1
P{X
n
u
2
X
n
u
2}
1
例1 设X~N(μ,1.52),样本为11,9,14,10,12,7,13,11,12, 求参数μ的置信度为 95%的置信区间.
的置信度为 1-α的置信区间.

概率论区间估计PPT课件

概率论区间估计PPT课件

2
(n
1)
第23页/共25页
作业 P131 5,7,8,9,14,15*
预习 第10章 1~5节
第24页/共25页
感谢您的观看!
第25页/共25页
(1)方差已知,对均值的区间估计
构造U-统计量,反查标准正态分布表, 确定U的双侧分位数
u 2
得EX的区间估计为
X
u
2
,
n
X u 2
n
第18页/共25页
小结
总体服从正态分布的均值或方差的区间估计 假设置信水平为1- (2)方差未知,对均值的区间估计
构造T-统计量,查t-分布临界值表, 确定T的双侧分位数
5
第1页/共25页
可以认为该种灯泡的使用寿命在1473.4个单位时间左右, 但范围有多大呢?又有多大的可能性在这“左右”呢?
如果要求有95%的把握判断在1473.4左右,则由U统计 量可知
U X ~ N 0,1
n

P
X
0.95
n
查表得 1.96
0.95
X 1.96 X 1.96
由 X
构造T-统计量
~ t(n 1)
Sn
T X
Sn
当置信水平为1-时,由
P T t 2(n 1) 1
查t-分布表确定
t 2 (n 1)
从而得的置信水平为1-的置信区间为
X
S n
t
2
(n
1) ,
X
S n
t
2
(n
1)
第9页/共25页
例3 某厂生产的一种塑料口杯的重量X被认为服从正态 分布,今随机抽取9个,测得其重量为(单位:克): 21.1,21.3,21.4,21.5,21.3,21.7,21.4,21.3, 21.6。试用95%的置信度估计全部口杯的平均重量。

区间估计与统计指数ppt课件

区间估计与统计指数ppt课件

42
第九章 统计指数
【例】计算销售总额的变动并对其进行因素分析。
计 商品 量 名称 单

甲米
销售量
基期 报告期
Q0 Q1
1000 2000
价格(元)
基期 报告期
P 0 P1
8
7

公 斤
3000
4000
6
5
丙 个 5000 6000 10
9
合计 — —



销售额(元)
Q 0 P0
8000
Q1 P1
47
二、抽样组织设计
(一)简单随机抽样
简单随机抽样,也称纯随机抽样,它是按照随机 原则直接从总体N个单位中抽取容量为n个单位的样 本。
纯随机抽样的取样方法:
① 直接抽取法 ② 抽签法
③ 随机数表法
可编辑课件PPT
48
(二)分层抽样
分层抽样又叫分类抽样(stratified sampling)或类 型抽样。它是按与调查目的有关的某个主要标志将总体 划分为若干层(或类),然后从各层中按随机原则分别 抽取一定数目的单位构成样本。
第七章 抽样与抽样分布
2013.10.21
可编辑课件PPT
1
内容框架
内容框架
一、抽样分布定理
大样本时总体均值的估计
小样本时总体均值的估计
二、区间估计
大样本时总体均值的区间估计
小样本时总体可编均辑课值件PPT的区间估计
2
回顾:中心极限定理
可编辑课件PPT
3
一、抽样分布定理
可编辑课件PPT
4
可编辑课件PPT
5
一、抽样分布定理
可编辑课件PPT

清华大学经管学院 计量经济学 施新政课件第三章 统计推断

清华大学经管学院 计量经济学 施新政课件第三章 统计推断

第三章统计推断•什么是统计推断?–()ˆkE β=–给定一次抽样,我们的估计量并不必然等于•例子kβˆkβkβ^*ˆˆincome β+0.401ˆβ=0089ˆ例子:,;•我们关心是否为零,不等于零并不意味着不等于零。

01educationβ=10.089β=1β1ˆβ1β–我们也会关心同一个回归方程中不同系数之间的关系。

**•例子:•我们关心是否等于,或者两者谁大谁小。

1β012kideducation dadeducation momeducation uβββ=+++2β•随机变量的概率分布()–密度函数: f(x)1aμ2aA B CD•1122Pr (); Pr (); Pr ()ob x A ob x B C ob x Da a a a <=<<=+>=–Cumulative distribution function (CDF)•Pr ()F z ob x z < •()Pr ()()()ob a x b F b F a <<=−•置信度的图示:双侧检验为例α‐c0c•单侧检验β–•计算1:0j H >ˆj t β•选择置信度,确定–αc1Pr ()n k ob c T α−−>=•如果,那么我们就可以拒绝原假设ˆjc t β>αc–•计算1:0j H β<ˆ•选择置信度,确定jt βc –•1Pr ()n k ob c T α−−>=ˆct <−如果,那么我们就可以拒绝原假设j βαc−•P 值能够拒绝原假设的最小置信度–给定,能够拒绝原假设的最小置信度。

•双侧检验:P 值=ˆjt β1(||||)ˆj n k prob t Tβ−−>•单侧检验–:P 值=1:0j H β>1()ˆj n k prob t T β−−>–:P 值= 1:0j H β<1()ˆjn k prob t T β−−<双侧检验P 值单侧检验P 值1:0j H β>ˆjt βˆj t β−•在假设成立的情况下,我们实际上是在做一个有约束条件的极小化问题0H 个有约束条件的极小化问题。

统计学原理(区间估计).PPT

统计学原理(区间估计).PPT

置信下限和置信上限 置信水平。 置信下限 置信上限,1置信水平 θ1 及θ2分别称为置信下限 置信上限 α称为置信水平 说明:(1)式表示( θ 1 , θ 2)包含未知参数θ的真值概率为1-α,如
θ 则称随机区间(θ , )是θ置信区间 置信区间, 置信区间
如何求未知参数的置信区间呢?下面通过一个例子阐述其方法。
σ/ n
S / n
~ N (0, 1)
~ t ( n 1)
上页
结束
2 、 σ2未知,的1- α置信区间
X n
X P < t α (n 1) = 1 α 故对给定的置信概率1-α,有 S/ n 2 S S P X t α (n 1) < < X + t α (n 1) = 1α n n 2 2
下页
结束
二、两个正态总体均值差及方差比的1-α置信区间 设总体 X ~ N (1,σ12) Y ~ N (2,σ2 2) 相互独立
X 1 , X 2 ,L , X n1 和Y1 , Y2 ,L , Yn2 分别是来自总体X和Y的样本
(n 1)s2 2 2 Pχ α (n 1) < < χα (n 1) =1α σ2 12 2
σ2 的1-α置信区间为:
n ( xi ) 2 ∑ i =1 , 2 χ α (n) 2
首页
∑ ( xi ) i =1 χ 2 α (n) 1 2
n 2
1 ( x2i ) 2 ~ χ 2 (n) σn 1)S (2 ∑ (n 1)S2 2 i=1 2 , 2 n ( 1) 1 2 (χαn2S ) ~χχα (n 1)) 1 (n 1 2 2σ
n
上页
下页
例2. 从车床加工的一批零件中随机抽取16个进行试验,测得零件 长度如下(单位:cm) 2.15 2.10 2.12 2.10 2.14 2.11 2.15 2.13 2.13 2.11 2.14 2.13 2.12 2.13 2.10 2.14
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

variable. We have that æX -m ö ˆ - p)2 (p 2 2 ÷ ÷ . Zn c1 =ç ç ÷ ç ÷ ˆ ˆ) / n (1 p -p ç ès / n ø
2 This suggests the use of Z n as the test statistic and rejects H 0 if and only 2 2 if Z n . > c1, a 2
Let X1, , X n be a random sample from a Bernoulli (p ) population. Consider the test H 0 : p £ p0 versus H 1 : p > p0 Since for a Bernoulli populatoin, m = EX = p and s 2 =VarX = p(1 - p), from the central limit theorem and the Slutskey’stheorem, when n ¥, ˆ-p X -m p N (0,1), Zn = ˆ(1 - p ˆ) / n s/ n p n ˆ = X = å i =1 X i / n is the estimator of p, and p ˆ(1 - p ˆ) is that of s 2 . where p This suggest a test with the test statistic ˆ - p0 X - m0 p = Zn = . ˆ(1 - p ˆ) / n s/ n p This test reject H 0 if and only if Z n > z a .
3
11/24/2010
Tests of two proportions
Protocol
Tests of two proportions
Contingency table
Let Populatoin X and Population Y in a contingency have Bernoulli (pX ) and Bernoulli (pY ) distributions, respectively. We like to test (1) H 0 : pX = pY (2) H 0 : pX = pY (3) H 0 : pX = pY versus versus versus H 1 : pX > pY ; H 1 : pX < pY ; H 1 : pX ¹ pY .
Hypothesis: H 0 : p = p0 Test statistic: B = å Xi , Small values of B give evidence that H 1 is true. Under the null, B has a Binomial (n, p0 ) distribution. Therefore, the p -value is n æ ö ÷ p(x) = P ç çBn , p0 £ å x i ÷ ÷ ÷ ç è ø i =1
q ÎQ0
Here, Bn ,q is a Binomial (n, q) random variable.
Then, p(X) is a valid p -value.
Binomial test, less
One-sample binomial test, less
Normal approximation
NB
NG
Are two coins equally fair?
In 1000 tosses of coin 1, 520 heads and 480 tails appear. In 1200 tosses of coin 2, 680 heads and 520 tails appear. Is it reasonable to assume that the two coins are equally fair?
(q0 < q1 ).
SX is a sufficient statistic of q, and the pmf of SX is Therefore f (Sx | q1 ) f (Sx | q0 )
æq 1- q ö 1 0÷ ÷ =ç ç ÷ çq 1 - q ÷ ç è 0 1ø q1 1 - q2010
Karlin-Rubin Theorem
Let X 1, ¼, X n Bernoulli(q), iid. Consider the hypotheses H 0 : q = q0 versus H 1 : q > q0 . SX is a sufficient statistic of q. Moreover, SX has a Binomial distribution, which has a monotone likelihood ratio. According to the Karlin-Rubin theorem, the test reject H 0 when SX > t0 is a UMP level a test, where a = P (Bn ,q > t0 ).
Successes Failures Total Population X SX FX nX Population Y SY FY nY Total S = SX + SY F = FX + FY n = nX + nY
Conditional on a sufficient statistic
Conditional on a sufficient statistic to define a p-value
11/24/2010
Is the proportion of girls in Tsinghua less than 50%
统计学方法及其应用
Statistical Methods with Applications
NB
Rui Jiang, PhD Associate Professor
Ministry of Education Key Laboratory of Bioinformatics Bioinformatics Division, TNLIST/Department of Automation Tsinghua University, Beijing 100084, China
Sx (1 - q0 )n -Sx q0
A random sample X1, X n is observed from a Bernoulli population whose probability of success is p. We like to test (1) H 0 : p = p0 versus H 1 : p > p0 ; (2) H 0 : p = p0 versus H 1 : p < p0 ; (3) H 0 : p = p0 versus H 1 : p ¹ p0 .
q ÎQ0
Then, p(X) is a valid p -value.
Let W (X) be a test statistic such that small values of W give evidence that H 1 is true. For each sample point x, define p(x) = sup Pq (W (X) £ W (x)) .
NG
November 24, 2010
Tests of a single proportion
Protocol
Neyman-Pearson Test
Let X1,¼, X n Bernoulli(q), iid. Consider the simple hypotheses H 0 : q = q0 versus H 1 : q = q1 f (Sx | qi ) µ qiSx (1 - qi )n -Sx , = q1Sx (1 - q1 )n -Sx
统计学方法及其应用
Fisher’s Exact Test
统计学基础 随机变量的函数
“A random variable is a quantity whose values are random and to which a probability distribution is assigned.”
is a sufficient statistic for pY , we can make the decision with the use of only S X and SY . Obviously, S X has a binomial (nX , pX ) distribution and SY has a binomial (nY , pY ) distribution. When the null is true (pX = pY = p), the joint pmf of (S X , SY ) is æn öæ n ö (n +n )-(s +s ) X ÷ ç Y ÷ sX +sY ÷ç ÷ ÷p f (s X , sY | nX , nY , p) = ç (1 - p) X Y X Y , ç ÷ ç ç s ÷ ÷ ç ç è X øèsY ø which suggests that S = S X + SY is a sufficient statistic for p under the null hypothesis.
0
p-value
p-value
Let W (X) be a test statistic such that large values of W give evidence that H 1 is true. For each sample point x, define p(x) = sup Pq (W (X) ³ W (x)) .
相关文档
最新文档