《统计学》参数估计
统计学-参数估计
ˆ为参数 的估计量
定义:如果对一切 ,有 E(ˆ) 成立,
则称ˆ为参数的无偏估计量,简称无偏估计。
一)、无偏性
是指样本估计量的均值应等于被估计总体
参数的真值,即 E (ˆ) 。
X1 和 X 的有 效性。
解:D(X1) =D(X)= 2
D( X ) 2
n
所以 X 比 X1 有效。
例:条件同上,试证X在 的所有线性无偏估计中方差最小。
解:所谓线性估计是指 ˆ a1X1 a2X2 anXn
为样本的线性函数。 由ˆ是的 无 偏 估 计 , 即
n
n
n
n
Eˆ E( ai X i ) aiEX i ai 知,必有 ai 1
i 1
i 1
i 1
i 1
n
n
n
D( ˆ) D( ai X i ) ai2D(X i ) 2 ai2
D( X ) 1 2
n
i 1
n
i n1
n
i 1
n
1 ( ai )2 ( 1)( ai2 ) n ai2
D X Dˆ
i 1
i 1
i 1
i 1
三)、一致性(相合性)
统计学中的参数估计方法
统计学中的参数估计方法
统计学中的参数估计方法是研究样本统计量与总体参数之间关系的重要工具。通过参数估计方法,可以根据样本数据推断总体参数的取值范围,并对统计推断的可靠性进行评估。本文将介绍几种常用的参数估计方法及其应用。
一、点估计方法
点估计方法是指通过样本数据来估计总体参数的具体取值。最常用的点估计方法是最大似然估计和矩估计。
1. 最大似然估计(Maximum Likelihood Estimation)
最大似然估计是指在给定样本的条件下,寻找最大化样本观察值发生的可能性的参数值。它假设样本是独立同分布的,并假设总体参数的取值满足某种分布。最大似然估计可以通过求解似然函数的最大值来得到参数的估计值。
2. 矩估计(Method of Moments)
矩估计是指利用样本矩与总体矩的对应关系来估计总体参数。矩估计方法假设总体参数可以通过样本矩的函数来表示,并通过求解总体矩与样本矩的关系式来得到参数的估计值。
二、区间估计方法
区间估计是指根据样本数据来估计总体参数的取值范围。常见的区间估计方法有置信区间估计和预测区间估计。
1. 置信区间估计(Confidence Interval Estimation)
置信区间估计是指通过样本数据估计总体参数,并给出一个区间,该区间包含总体参数的真值的概率为预先设定的置信水平。置信区间估计通常使用标准正态分布、t分布、卡方分布等作为抽样分布进行计算。
2. 预测区间估计(Prediction Interval Estimation)
预测区间估计是指根据样本数据估计出的总体参数,并给出一个区间,该区间包含未来单个观测值的概率为预先设定的置信水平。预测区间估计在预测和判断未来观测值时具有重要的应用价值。
统计学第3章(参数估计)
◆置信水平1-α这个概率,不能用来描述 某个特定的区间包含总体参数真值的可能性。 只能知道在多次抽样得到的区间中,大概有多 少个区间包含了总体参数的真值。 一个特定的区间包不包含总体参数的真值 是绝对的,不存在可能或不可能包含的问题。
【例如】在99%的置信度下,得到某班学生身高 的置信区间为(155,175),若该班平均身高 的真值为170,则绝对包含;若为150,则绝对 不包含。
ˆ) max L( ) L(
, xn ) 满足
(3.3)
则称 ˆ 是 的最大似然估计。
3、矩法和最大似然法的比较
◆矩估计法是采用样本矩替换总体矩来估 计参数,相当于使用了分布函数的部分信息; ◆最大似然估计法是采用似然函数来求得 参数的估计,理论上相当于使用了分布函数的 全部信息; 在已知总体分布的前提下,采用最大似然 估计法的理由更充分,而在总体分布函数未知 但有关的总体矩已知的情况下,采用矩估计法 更合适。
六、理解置信区间必须注意的问题
◆若在所有区间中,有95%的区间包含总 体参数的真值,有5%的区间不包含,则这个区 间就称为置信水平为95%的置信区间。
这样表述置信区间的理由是:总体参数真 值是固定的、未知的,而用样本构造的区间随 样本不同而不同,因此置信区间是一个随机区 间,它不仅因样本的不同而不同,且不是所有 的区间都包含总体参数的真值。
统计学参数估计
统计学参数估计
参数估计是统计学中的一个重要概念,它是指在推断统计问题中,通
过样本数据对总体参数进行估计的过程。这一过程是通过样本数据来推断
总体参数的未知值,从而进行总体的描述和推断。
在统计学中,参数是指总体的其中一种特征的度量,比如总体均值、
总体方差等。而样本则是从总体中获取的一部分观测值。参数估计的目标
就是基于样本数据来估计总体参数,并给出估计的精确程度,即估计的可
信区间或置信区间。
常见的参数估计方法包括点估计和区间估计。
点估计是一种通过单个数值来估计总体参数的方法。点估计的核心是
选择合适的统计量作为估计量,并使用样本数据计算出该统计量的具体值。常见的点估计方法包括最大似然估计和矩估计。最大似然估计是一种寻找
参数值,使得样本数据出现的概率最大的方法。矩估计则是通过样本矩的
函数来估计总体矩的方法。
然而,点估计只能提供一个参数的具体值,无法提供该估计值的精确
程度。为了解决这个问题,区间估计被引入。区间估计是指通过一个区间
来估计总体参数的方法。该区间被称为置信区间或可信区间。置信区间是
在一定置信水平下,总体参数的真值落在该区间内的概率。置信区间的计
算通常涉及到抽样分布、标准误差和分位数等概念。
在实际应用中,参数估计经常用于统计推断、统计检验和决策等环节。例如,在医学研究中,研究人员可以通过对患者进行抽样调查来估计其中
一种药物的有效性和不良反应的发生率。在市场调研中,市场研究人员可
以通过抽取部分样本来估计一些产品的市场份额或宣传效果。
参数估计的准确性和可靠性是统计分析的关键问题。估计量的方差和
统计学参数估计
5 -该30食品平均重量的置信区间101.44g~109.28g
统计学 总体均值的区间估计
STATISTICS
【例4】一家保险公司收集到由36投保个人组成 的随机样本,得到每个投保人的年龄(周岁)数据 如下表。试建立投保人年龄90%的置信区间
36个投保人年龄的数据
23
35
来自百度文库
39
27 36 44
36
42
x t 2
s 1490 2.131 24.77
n
16
1490 13.2
1476.8,1503.2
该种灯泡平均使用寿命的置信区间为
1476.8小时~1503.2小时
5 - 37
统计学 总体比率的区间估计
STATISTICS
1. 假定条件 总体服从二项分布 可以由正态分布来近似
2.使用正态分布统计量 z z p ~ N (0,1) (1 )
z x ~ N (0,1) n
3. 总体均值 在1- 置信水平下的置信区间为
x z 2 n
或 x z 2
s ( 未知)
n
5 - 24
统计学正态总体的抽样分布定理
STATISTICS
证明:
5 - 25
是n 个独立的正态 随机变量的线性组 合,故服从正态分布
统计学 总体均值的区间估计
STATISTICS (正态总体:举例)
统计学--参数估计 ppt课件
• (一)区间估计的含义
估计总体参数的区间范围,并给出区间 估计成立的概率值。
p(1 2 ) 1
• 其中: 1-α(0<α<1)称为置信度;α是区间估计的显著性水 平,其取值大小由实际问题确定,经常取1%、5%和10%。
PPT课件
10
区间估计的基本要求
–1.置信度。随机区间 (ˆL,ˆU ) 包含 的
PPT课件
22
总体成数估计区间估计总结
• 总体成数估计区间的上下限
只考虑大样本情况(请记住大样本条件)
P1 P
P z 2
n
P1 P N n
P z 2
n
N 1
PPT课件
23
对总量指标的区间估计
• 在对总体平均数进行区间估计的基础 上,可进一步推断相应的总量指标, 即用总体单位总数N分别乘以总体平均 数的区间下限和区间上限,便得到相 应总量(Nμ)的区间范围。
• 3.上面的公式计算结果如果带小数,这时样本容量不 按四舍五入法则取整数,取比这个数大的最小整数代 替。例如计算得到:n=56.03,那么,样本容量取57, 而不是56。
PPT课件
32
例:对某批木材进行检验,根据以往经验,木材长度的标准 差为0.4米,而合格率为90%。现采用重复抽样方式,要 求在95.45%的概率保证程度下,木材平均长度的极限误 差不超过0.08米,抽样合格率的极限误差不超过5%,问 必要的样本单位数应该是多少?
统计学——参数估计
统计学——参数估计
第8 讲参数估计
本讲的主要内容
8.1 参数估计的⼀般问题
8.2 ⼀个总体参数的区间估计
8.3 两个总体参数的区间估计
8.4 样本量的确定
学习⽬标
1.估计量与估计值的概念
2.点估计与区间估计的区别
3.评价估计量优良性的标准
4.⼀个总体参数的区间估计⽅法
5.两个总体参数的区间估计⽅法
6.样本量的确定⽅法
8.1 参数估计的⼀般问题
8.1.1 估计量与估计值
估计量与估计值(estimator & estimated value)
1.估计量:⽤于估计总体参数的随机变量
如样本均值,样本⽐例, 样本⽅差等
例如: 样本均值就是总体均值m 的⼀个估计量
2.参数⽤θ表⽰,估计量⽤表⽰
3.估计值:估计参数时计算出来的统计量的具体值
如果样本均值?x=80,则80就是m的估计值
8.1.2 点估计与区间估计
点估计 (point estimate)
1.⽤样本的估计量的某个取值直接作为总体参数的估计值
例如:⽤样本均值直接作为总体均值的估计;⽤两个样本均值之差直接作为总体均值之差的估计
2.⽆法给出估计值接近总体参数程度的信息
⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出⼀个具体的样本得到的估计值很可能不同于总体真值
⑵⼀个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明⼀个具体的点估计值⽆法给出估计的可靠性的度量
区间估计 (interval estimate)
1.在点估计的基础上,给出总体参数估计的⼀个区间范围,该区间由样本统计量加减估计误差⽽得到
2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出⼀个概率度量
统计学:参数估计
返回本节首页
(一)总体和样本
1、总体(全及总体)
(1)定义:研究对象的全体,用 N 表示。
(2)分类:两种 变量总体:按数量标志分组而成 属性总体:按品质标志分组,且只有两种表现
变量总体:
某市居民年收入(元) 人数(万人)
10000以下 10000~30000 30000~60000 60000以上
(二)全及指标(参数)和抽样指标(统计量) 1、全及指标
反映总体数量特征的指标 变量总体和属性总体均有: 总体平均数、方差或标准差
返回本节首页
(1)变量总体
第一,平均数: 第二,标准差
X XF X N F
X X
N
2
X X F F
2
标准差的平方即方差
上述案例中有两句话的使用需要注意:
一是:用样本中同意发展轨道交通的比例来估计真 实的比例。 二是:虽然真实的比例在抽样过程中永远也无法知 道,但有可能知道估计出来的比例和真实的比例 大致差多少 这是有数学依据的: 大数定理 数学上有两个重要的定理: 中心极限定理
大数定理是人们用样本平均估计总体平均的依据:
抽样推断: 从样本数据得到关于总体参数的一些结论的过程
本章内容
第一节、 抽样的基本概念
第二节、 抽样平均误差(抽样分布)
统计学参数估计PPT课件
在应用参数估计时,需要注意样本的代表性、数据的准确性和可靠性等问题, 以保证估计的准确性和可靠性。
对未来研究的建议
01
进一步探讨参数估计的理论基础
可以进一步探讨参数估计的理论基础,如大数定律和中心极限定理等,
以更好地理解和掌握参数估计的方法和原理。
02
探索新的估计方法
随着统计学的发展,可以探索新的参数估计方法,以提高估计的准确性
利用最小二乘法估计线性回归模型的参数
总结词
最小二乘法是一种常用的线性回归模型的参数估计方 法。
详细描述
最小二乘法的核心思想是通过最小化预测值与实际值之 间的平方误差来估计线性回归模型的参数。设 (y) 为因变 量,(x) 为自变量,线性回归模型为 (y = beta_0 + beta_1 x + epsilon),其中 (beta_0) 和 (beta_1) 是待 估计的参数,(epsilon) 是误差项。最小二乘法通过最小 化 ((hat{y} - y)^2) 来估计 (beta_0) 和 (beta_1),其中 (hat{y}) 是根据模型预测的 (y) 值。
最小二乘法的缺点是假设误差项独立 同分布,且对异常值敏感,可能影响 估计的稳定性。
最小二乘法的优点是简单易行,适用 于线性回归模型,且具有优良的统计 性质。
贝叶斯估计法
《统计学》第3章 参数估计
它是 的函数,记作
L L( ) L( x1, x2 , x3 ,, xn , ) f ( xi , )
i 1
n
并称为来自百度文库然函数
当 已知时,似然函数描述了样本取得样 本观察值x1, x2, x3,……,xn的可能性。同 样,当一组样本观察值取定时(即抽样完 成时),要问它最大可能取自什么样的总 体(即总体的参数 应等于什么时的可能 性最大),也要从似然函数 L L( ) 的极大 化中求出相应的 值来,这个值就是 的 一个估计值。于是,我们可以给出极大似 然估计的定义。
又 ∵
1 1 n n ,即 ( 2 1 ) ( x( n) x(1) )
L(1,2 ) L( x(1) , x(n) )
∴ 1 , 2 的极大似然估计量分别为 x(1) , x(n) 。
三、估计量的优良标准
在对总体参数做出估计时并非所有的估计量 都是优良的,从而产生了评价估计量是否 优良的标准。对于点估计量来说,一个好 的估计量有如下三个标准:
【例3.1】试用矩估计法对总体 2 X~N( , )的参数μ ,σ 2作出估计。
解: 因E(X)=μ,D(X)=σ2 设 X1,X2,……,Xn 为 X 的 一 个 样 本 , 其 2。 样本均值为,样本方差为 S X 令E(X)= ,D(X)=S2,即得的估 2 2 ˆX, 计量为 ˆ S 。
统计学参数估计公式
统计学参数估计公式
统计学参数估计公式指的是通过统计学方法估计参数的一组数学公式。不同的统计学
参数估计公式各有特点、应用场景和优劣,它们通常用来估计描述性统计或者回归系统的
参数。本文将讨论统计学参数估计公式,并详细说明下面常见参数估计公式:极大似然估计、贝叶斯估计、最小二乘估计、局部加权线性回归和最小化重要性采样。
极大似然估计(MLE)也叫最大似然估计,是一种基于极大似然法的估计统计量的方法。它的目的是最大化制定概率模型的参数的后验概率。MLE得出的结果往往比矩估计更加精确。与贝叶斯估计不同,MLE不需要选择先验分布,且不考虑实证概率,只考虑已知数据。
贝叶斯估计(Bayesian Estimation)是基于概率模型进行参数估计时,结合预先取得
的知识,使用条件概率的方法。基于已有的先验知识,贝叶斯估计将未知参数的概率分布
转化为后验的概率,以此来进行估计。贝叶斯估计法可以克服极大似然估计出现的不平滑
问题,而且还能考虑实证概率的影响。
最小二乘估计(Least Square Estimation,LSE)是一种基于数据拟合的参数估计方法。它将未知数参数表示为一个函数,并使得残差平方和最小,最小化残差平方和来估计未知
参数,也就是拟合曲线最适合数据点。实际运用中往往会遇到过度拟合和欠拟合等问题,
所以LSE在多项式回归时需要采用正则化项依据损失函数来控制模型的复杂度,以避免过
拟合的情况。
局部加权线性回归(Local Weighted Linear Regression,LWLR)是一种用来解决非线
统计学中的参数估计方法
统计学中的参数估计方法
统计学是一门研究收集、分析和解释数据的学科。在统计学中,参数估计是其中一个重要的概念,它允许我们通过样本数据来推断总体的特征。本文将介绍统计学中常用的参数估计方法,包括点估计和区间估计。
一、点估计
点估计是一种通过样本数据来估计总体参数的方法。在点估计中,我们选择一个统计量作为总体参数的估计值。常见的点估计方法有最大似然估计和矩估计。
最大似然估计是一种基于样本数据的估计方法,它通过选择使得观察到的数据出现的概率最大的参数值来估计总体参数。最大似然估计的核心思想是找到一个参数估计值,使得观察到的数据在该参数下出现的概率最大化。最大似然估计方法在统计学中被广泛应用,它具有良好的渐进性质和统计学性质。
矩估计是另一种常用的点估计方法,它基于样本矩的性质来估计总体参数。矩估计的核心思想是将样本矩与总体矩相等,通过求解方程组来得到参数的估计值。矩估计方法相对简单,易于计算,但在样本较小或总体分布复杂的情况下,可能会出现估计不准确的问题。
二、区间估计
区间估计是一种通过样本数据来估计总体参数的方法,它提供了参数估计的置信区间。在区间估计中,我们通过计算样本数据的统计量和抽样分布的性质,得到一个包含真实参数的区间。
置信区间是区间估计的核心概念,它是一个包含真实参数的区间。置信区间的计算依赖于样本数据的统计量和抽样分布的性质。常见的置信区间计算方法有正态分布的置信区间和bootstrap置信区间。
正态分布的置信区间是一种常用的区间估计方法,它基于样本数据的统计量服
从正态分布这一假设。通过计算样本数据的均值和标准差,结合正态分布的性质,我们可以得到一个包含真实参数的置信区间。
统计学 参数估计
51.3
53.7
56.0
76.8
60.6
74.5
57.9
70.4
63.8
77.9
76.7
解:已知n=36, 1- = 95%,z/2=1.96。根据样本数
据计算得:
总体均值在1- 置信水平下的置信区间为
x z
2
s
7.94
63.28 1.96
n
36
63.28 2.45
400
因此,在置信度95%下,该行储户的提现平均额
度的置信区间为985.3元~1014.7元。
总体均值的区间估计
(正态总体、2未知、小样本)
总体均值的区间估计
(小样本)
1. 假定条件
总体服从正态分布,但方差(2) 未知
小样本 (n < 30)
2. 使用 t 分布统计量
t
x
s
n
~ t ( n 1)
1 510 1 530
1 470
1 500 1 520
1 510 1 470
试建立该批灯泡平均使用寿命的95%的置信区间。
解:根据抽样结果计算得
xത=
∑
23 840
=
=1
16wenku.baidu.com
=1
490(小时)
统计学中的参数估计与假设检验
统计学中的参数估计与假设检验统计学是一门研究如何收集、整理、分析和解释数据的学科。参数估计和假设检验是统计学中两个重要的概念和方法,用于推断总体参数和判断假设是否成立。本文将详细介绍参数估计与假设检验的基本原理和应用。
一、参数估计
参数估计是通过样本数据推断总体的未知参数。在统计学中,总体是指研究对象的全体,而样本是从总体中抽取的一部分。参数是总体的特征指标,例如均值、方差、比例等。参数估计旨在通过样本数据对总体参数进行估计,并给出估计的精度。
参数估计分为点估计和区间估计两种方法。点估计是通过样本数据计算得到的单个数字,用来估计总体参数的具体数值。常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。区间估计是通过样本数据计算得到的一个范围,该范围包含总体参数真值的概率较高。置信区间是区间估计的一种形式,它可以用来描述估计值的不确定性。
二、假设检验
假设检验是用于检验研究问题的特定假设是否成立的一种统计推断方法。在假设检验中,我们提出一个原假设和一个备择假设,并根据样本数据对两个假设进行比较,进而判断原假设是否应该被拒绝。
原假设通常表示一种无关,即不发生预期效应或差异。备择假设则表示研究者所期望的效应或差异。在进行假设检验时,我们首先选择
一个适当的统计检验方法,例如t检验、F检验或卡方检验等。然后,
计算出样本数据的检验统计量,并根据相关的分布理论和显著性水平
进行推论。最后,比较检验统计量与临界值,以决定是否拒绝原假设。
三、参数估计与假设检验的应用
参数估计和假设检验在实际问题中有广泛的应用。以医学研究为例,研究人员可能希望通过抽样来估计某种药物的有效剂量,并对药效进
统计学参数估计
统计学参数估计
统计学是一门研究如何收集、处理、分析和解释数据的学科,参数
估计是统计学中的重要内容之一。参数估计旨在利用样本数据来推断
总体参数的取值范围,从而为决策和推断提供依据。本文将介绍统计
学参数估计的基本概念和方法。
一、参数估计的概念
在统计学中,参数是描述总体特征的数字指标,如总体均值、方差、比例等。总体是指我们研究的对象的全体,参数是对总体特征的数值
度量。而样本是从总体中抽取的一部分个体,样本统计量是对总体参
数的估计。参数估计就是通过样本数据推断总体参数的过程。
二、最大似然估计
最大似然估计是一种常用的参数估计方法。它基于一个假设:样本
观察值是从总体中独立抽取的,并且满足某种概率分布。最大似然估
计的目标是找到一个参数值,使得观察到的样本出现的概率最大。
以估计总体均值为例,假设总体服从正态分布。根据最大似然估计
的原理,我们需要找到一个样本均值和样本方差,使得样本观察值出
现的概率最大。通常情况下,我们使用样本均值作为总体均值的估计值,并使用样本方差除以样本容量的平方根作为总体均值的标准误差
的估计值。
三、区间估计
除了点估计,我们经常需要给出参数估计的置信区间。置信区间是
估计总体参数的取值范围,其中包含了真实参数值的可能性特定置信
水平。常见的置信水平有95%和99%,意味着我们有95%或99%的置
信度相信参数落在该区间内。
求解置信区间的方法有很多,其中一种常用的方法是使用样本均值
加减总体均值的标准误差乘以相应的分位数来计算。这样得到的区间
便是总体参数的置信区间。
四、样本容量对参数估计的影响
《统计学》课件参数估计
STATISTICS
参数估计方法
5-1
统计学
STATISTICS
参数估计概述
5-2
统计学 参数估计在统计估计问题中的地位
STATISTICS
统计估计方法
非参数估计
参数估计
点估计 区间估计
5-3
统计学
STATISTICS
统计估计问题的产生
以下情况会导致统计估计问题: 需要估计分别类型的问题:
p z 2
p(1 p) n
65% 1.96 65%(1 65%) 100
65% 9.35%
55.65%,74.35%
该城市下岗职工中女性比例的置信 区间为55.65%~74.35% 。
统计学
STATISTICS
总体比例的区间估计
(例题分析)
【 例 】 某 企 业 共 有 解:已知 n=100,p=75% ,z/2=1.96
有时分布类型已知,如在农民收入调查中,根据实际经 验和理论分析,可以断定收入服从正态分布;
5 - 4 但分布中的参数未知,需要估计。
统计学
STATISTICS
统计估计的类别
统计估计问题专门研究由样本估计总体的未知分 布或分布中的未知参数。
非参数估计和参数估计:
直接对总体的未知分布进行估计的问题为非参数 估计;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
全及总体与样本总体
全及总体,简称总体,是指所要认识对象的全 体。通常用N表示。
抽样总体,简称样本,是指从全及总体中随机 抽取出来的那部分单位的集合体。通常用n表示。
一般来说,样本单位数达到或超过30称为大样 本,而在30以下称为小样本。
n
z ) 1
2
即
P( X z
2
X z
n
2
n
)
1
,
总体均值 的置信水平为1 的置信区间
(X z , X z )
2n
2n
置信区间的观测值
(x z
2
, x z
n
2
)
n
正态分布分位数见
x z 2n
教材P121图5.3
x
x z 2n 19
【例 5.1】某灯具生产厂家生产一种 60W 的灯泡,假设其寿命为随机变量 X,服从正态分布 N(,1296) 。现在从该厂生产的 60W 的灯泡中随机地抽取 了 27 个产品进行测试,直到灯泡烧坏,测得它们的平均寿命为 1478 小时。 请计算该厂 60W 灯泡的平均寿命的置信水平为 95%的置信区间。
13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9 20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1 25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4 16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6 设湖水中钠的含量为随机变量 X ,服从正态分布 N (, 2) ,求湖水钠的平均含量 的
x z
2
1478 1.96 n
1296/ 27 1478 13.58 1491.58 ,
因 此 该厂 60W 灯 泡 的平 均寿 命的 置信 水 平为 95% 的置 信区 间 为
(x z
2
, x z
n
2
n ) (1464.42, 1491.58) 。
20
单正态总体均值的区间估计(方差未知时)
【解】问题实际上就是求总体均值(60W 灯泡的平均寿命)的置信区间, 由已知得,总体方差 2 1296,样本容量为 n 27 ,样本均值 x 1478。
因为置信水平为1 0.95,所以查标准正态分布表可得 z z0.025 1.96 , 2
x z
2
1478 1.96
n
1296 / 27 1478 13.58 1464.42 ,
25
两正态总体均值之差的区间估计
设
X
1
,,
X
n
和
Y1
,
,
Ym
分别是从正态总体
N
(1
,
2 1
)
和
N
(
2
,
2 2
)
抽取的两个样本,
且相互独立,设 X 和Y 分别表示 X 和 Y 样本的样本均值,容易证明 X Y
是 1 2 的无偏估计。
1.
两个正态总体的方差
2 1
和
2 2
已知
Z X Y (1 2 ) ~ N (0, 1)
2
n
2
n
S 2
1 n 1
n i 1
( xi
x)2
置信区间的观测值为
P122图5.4
s
s
(x t (n 1) , x t (n 1) )
2
n
2
n
21
【例 5.2】某饮料公司生的一种瓶装软饮料,其包装上标明净容量是 500ml, 在市场上随机抽取了 25 瓶,测得到其平均容量为 499.5ml,标准差为 2.63ml。 试求该公司生产的这种瓶装饮料的平均容量的置信水平为 99%的置信区间 (假定饮料的容量服从正态分布 N (, 2) )。
95%置信区间。
【解】由已知可得,样本容量为 n 32, x 19.0688, s 3.2555 ,因为置
信 水 平 1 0.95 , 查 自 由 度 为 n 1 31 的 t 分 布 表 得 分 位 数
t 2 (n 1) t0.025(31) 2.04 ,所以
s
x t (n 1) 19.0688 2.04 3.2555 / 32 19.0688 1.1737 17.90
【 解 】 注 意 到 两 个 总 体 的 方 差 都 已 知 ; 因 为 1 0.90 , 所 以
1
/
2
0.95,所以查标准正态分布表得
z 2
z0.05
1.65
(若用软件计算为
1.6449),因此, z 2
12
2 2
1.65
nm
62 42 15 8
3.4611,
x y z
2
2 1
n
2 2
9
抽样推断的特点
1.根据部分实际资料对全部总体的数量特征 做出估计;
2.按随机性原则从总体中抽选样本单位; 3.抽样推断的抽样误差可以事先计算并加以 控制,但不能消灭。
10
抽样推断的作用
1.有些现象无法进行全面调查,为了测算其 全面资料,必须采用抽样调查。
2.有些理论上可进行全面调查的现象,采用 抽样调查可以达到事半功倍的效果。
【解】以 表示瓶装饮料的平均容量,由已知可得,样本容量为n 25 ,
样本均值 x 499.5,样本标准差为 s 2.63 ,因为置信水平1 0.99 ,查
自由度为
n
1
24 的
t
分布表得分位数 t 2
(n
1)
t0.005 (24)
2.797
,所以
s
x t (n 1) 499.5 2.797 2.63/ 25 499.5 1.4712 498.03
二、总体成数的大样本区间估计
6
第五节 正态总体方差的区间估计 一、单正态总体方差的区间估计 二、两正态总体方差的区间估计
7
第六节 样本容量的确定 一、总体均值估计的必要样本容量 二、总体成数估计的必要样本容量 三、影响必要样本容量的因素
8
统计推断的概念
抽样推断是按照随机性原则从全部研究对象中抽 取一部分单位进行观察,并依据所获得的数据对全 部研究对象的数量特征做出具有一定可靠性的估计 推断。
不重复抽样是指从全及总体中抽取第一个样本 单位,记录该单位有关标志表现以后,这个样本单 位不再放回到全及总体中去参加下一次的抽选。这 样每个单位最多只有一次被抽中的机会。
14
抽样误差与区间估计的基本思想
抽样误差是一种偶然性的代表性误差。抽样误 差是抽样调查所固有的,它无法避免,但可以事 先计算并加以控制。
影响抽样误差的因素 1.抽样单位数的多少; 2.总体被研究标志的变异程度; 3.抽样组织方式方法。
15
抽样误差与区间估计的基本思想
抽样平均误差就是抽样平均数(或抽样成数)的 标准差。反映抽样平均数(或抽样成数)与总体平 均数(或总体成数)的平均误差程度。
抽样平均误差的定义公式(理论公式)为:
(
x
X
枢轴量 t
X Sn
~
t(n 1)
P(| t | t (n 1)) P(
2
X S
n
t (n 1)) 1 , 2
即 P( X t (n 1) S X t (n 1) S ) 1 。
2
n
2
n
正态总体方差 2 未知时,总体均值 的置信水平为1 的置信区间为
( X t (n 1) S , X t (n 1) S )
总体均值 的置信水平为1 的(双侧)置信区间都可以用(5.13)式进
行计算。
S
S
( X t (n 1) , X t (n 1) )
2
n
2
n
但是在自由度较大时(比如大于 30 或 50),t 分布和标准正态分布极
为接近(见下图),所以也可以用标准正态分布的分位数 z2 来近似 t 分布
的分位数 t (n 1) 。 2
2
n
x t (n 1)
2
s n
19.0688 1.1737
20.24 ,
因此湖水钠的平均含量 的 95%置信区间为(17.90, 20.24)。
如果用正态分布近似,z0.025 1.96 ,则湖水钠的平均含量 的 95%近
似置信区间为(17.94, 20.20)。这个近似区间比精确区间窄!
(X z S , X z S )
2
n
2
n
实际上,可以证明当样本容量
n
充分大时,枢轴量
t
X S
Fra Baidu bibliotek n
近似服从
标准正态分布,这也可以解释当 n 较大时,用标准正态分布的分位数 z 2
来近似 t 分布的分位数t (n 1) 的合理性。 2
23
t分布与标准正态分布的比较
24
【例 5.3】为研究某内陆湖的湖水的含盐量,随机地从该湖的 32 个取样点采了 32 个湖 水样本,测得它们的含钠量(单位:ppm)分别为:
2 1
2 2
,
nm
由
P
X
Y (1 2 )
12
2 2
nm
z
1
2
得
P( X Y z
2
2 1
n
2 2
m
1 2
X
Y
z
2
2 1
n
2 2
m
)
1
,
从而得到两个正态总体均值之差 1 2 的置信水平为1 的置信区间为
(X Y z
2
2 1
2 2
,
nm
X Y z
2
2 1
2 2
)
nm
26
【例 5.4】设两个正态总体 N(1,62) 和 N (2,42 ) 相互独立,现在分别从它们中 抽取了容量为 n 15 和 m 8 的样本,测得其样本均值分别为 x 70.1 , y 75.3。求两总体均值之差 1 2 的置信水平为 90%的置信区间。
2
n
x t (n 1) s 499.5 1.4712 500.97
2
n
因此该公司生产的这种瓶装饮料的平均容量的置信水平为 99%的置信
区间为(498.03, 500.97)。由于该区间包含了 500,故该公司的这种瓶装
饮料的容量符合其包装上的标准,不存在容量不足欺骗消费者的行为
22
不论样本容量 n 是大还是小,只要总体为正态分布,总体方差未知,
其计算公式是:
u 平均数条件下:
t
x
x
z
u x
2
u 成数条件下:
t
p
p z up
2
18
单正态总体均值的区间估计(方差已知时)
设样本 X1,, Xn 来自正态总体 N (, 2 ) ,这里 2 已知,如何求总体均值
的置信水平为1 的置信区间?
枢轴量
Z X n
~
N (0, 1) ,有
P( X
m
70.1 75.3 3.4611 8.66 ,
x y z
2
2 1
n
2 2
m
70.1 75.3 3.4611 1.74 ,
所以两总体均值之差 1 2 的置信水平为 90%的置信区间是(8.66, 1.74) 。 由于该置信区间没有包含 0,所以我们认为第二个总体的均值 2 要大于第 一个总体的均值 1 。
参第数五估章 计
参数估计
南京财经大学统计学系
朱龙杰
1
本章内容
第一节 统计推断的概念和作用 第二节 抽样推断的基本概念 第三节 正态总体均值的区间估计 第四节 一般总体均值的大样本区间估计 第五节 正态总体方差的区间估计 第六节 样本容量的确定
2
第一节 统计推断的概念和作用
一、统计推断的概念 二、统计推断的特点 三、统计推断的作用
全及总体是唯一确定的,样本总体是不唯一确 定的。
12
总体指标与样本指标
总体指标是根据全及总体各单位的标志值 或标志表现计算的综合指标。
总体指标是唯一确定的。 样本指标是根据样本总体各单位的标志值 或标志表现计算的综合指标。 样本指标不是唯一确定的,是一个随机变 量。
13
重复抽样与不重复抽样
重复抽样是指从全及总体中抽取样本时,随机 抽取一个样本单位,记录其有关标志表现以后,把 它放回到全及总体中去,再从全及总体中随机抽取 第二个样本单位,记录它的有关标志表现以后,再 把它放回到全及总体中去,直到抽够所需的样本单 位。这样每个单位可以有多次重复被抽中的机会。
3
第二节 抽样推断的基本概念 一、全及总体与样本总体 二、总体指标与样本指标 三、重复抽样与不重复抽 样
4
第三节 正态总体均值的区间估计 一、抽样误差与区间估计的基本思想 二、单正态总体均值的区间估计 三、两正态总体均值之差的区间估计
5
第四节 一般总体均值的大样本区间估计
一、非正态总体均值的大样本区间估计
2
)
x
N
抽样平均误差的计算:
16
抽样误差与区间估计的基本思想
抽样平均数条件
抽样成数条件
重 复
抽样
2
xn
P(1 P)
P
n
2
不重复
(1 n )
抽样 x n N
p(1 p) (1 n )
p
n
N
17
抽样误差与区间估计的基本思想
抽样极限误差是指样本指标和总体指标之间抽样误 差的可能范围。又称为允许误差。
.
可得
两个正态总体均值之差 1 2 的置信水平为1 的置信区间为
27
2.
两个正态总体的方差
12和
22未知,但
12
2 2
2
样本方差 S12
1 n 1
n
(Xi
i 1
X )2
和 S22
1 m 1
m i 1
(Yi
Y
)2
分别是
2 1
和
2 2
无偏估计,
枢轴量 t
X
Y Sp
(1 2 ) 1 1 nm
~
t(n m 2) ,这里 Sp
(n 1)S12 (m 1)S22 nm2