总体均值估计时样本容量的确定

合集下载

样本容量的计算公式

样本容量的计算公式

样本容量的计算公式一、总体均值的样本容量计算公式当需要对总体均值进行估计时,常用的样本容量计算公式是根据总体的标准差(σ)和期望抽样误差(E)进行估计。

该公式为:n=(Z*σ/E)^2其中,n表示样本容量,Z表示所使用的显著性水平对应的Z值(一般是1.96,对应95%的置信水平),σ表示总体的标准差,E表示期望抽样误差。

例如,假设我们想要估计一些国家成年人的平均月收入,希望抽样误差为100元,总体的标准差为500元,显著性水平为95%。

代入公式可以计算得到样本容量为:n=(1.96*500/100)^2=96.04所以,需要抽取至少97个样本才能以95%的置信水平估计总体的平均月收入。

二、总体比例的样本容量计算公式当需要对总体比例进行估计时,常用的样本容量计算公式是基于二项分布的公式。

该公式为:n=(Z^2*P*(1-P)/E^2)其中,n表示样本容量,Z表示所使用的显著性水平对应的Z值(一般是1.96,对应95%的置信水平),P表示总体的比例(即事件发生的概率),E表示期望抽样误差。

例如,假设我们想要估计产品的市场份额,希望抽样误差为0.02,总体的比例为0.4,显著性水平为95%。

代入公式可以计算得到样本容量为:n=(1.96^2*0.4*(1-0.4)/0.02^2)≈9604所以,需要抽取至少9605个样本才能以95%的置信水平估计总体的市场份额。

三、其他因素的影响除了上述公式中所使用的参数外,样本容量的计算还可能受到以下因素的影响:1. 置信水平(Confidence level):通常我们使用的置信水平是95%或99%,不同的置信水平会导致不同的样本容量。

2. 抽样误差(Margin of error):抽样误差是指样本估计值与总体真值之间的差异,抽样误差越大,样本容量通常会越大。

3. 总体标准差(Population standard deviation):总体标准差越大,样本容量通常会越大。

概率与统计公式速查手册样本容量标准差估计与置信水平

概率与统计公式速查手册样本容量标准差估计与置信水平

概率与统计公式速查手册样本容量标准差估计与置信水平概率与统计公式速查手册——样本容量、标准差估计与置信水平在概率与统计领域中,样本容量、标准差估计和置信水平是非常重要的概念和技巧。

本文将为你提供一份速查手册,方便你在需要时快速查阅相关公式和方法。

一、样本容量的计算在进行统计推断时,样本容量的确定是至关重要的。

样本容量通常决定了统计推断的准确性和可靠性。

以下是一些常用的样本容量计算公式:1. 总体均值估计:当我们想要估计总体均值μ时,可以使用以下公式来计算样本容量n:n = (Z * σ / E) ^ 2其中,Z是所选置信水平对应的Z值,σ是总体标准差的估计值,E是期望的估计误差。

2. 总体比例估计:当我们想要估计总体比例p时,可以使用以下公式来计算样本容量n:n = (Z^2 * p * (1 - p)) / E^2其中,Z是所选置信水平对应的Z值,p是总体比例的估计值,E是期望的估计误差。

二、标准差估计方法在概率与统计中,标准差是用来描述数据的离散程度。

当我们无法获取总体数据时,需要通过样本数据来估计总体标准差。

以下是一些常用的标准差估计方法:1. 样本标准差:样本标准差是最常用的标准差估计方法,用来估计总体标准差σ。

公式如下:s = sqrt( Σ(xi - x)^2 / (n - 1) )其中,xi是样本中的每个观测值,x是样本均值,n是样本容量。

2. 均值区间法:均值区间法是一种利用样本数据来估计总体标准差的方法。

通过计算样本均值的置信区间,间接估计总体标准差。

具体计算步骤如下:a. 计算样本均值x和样本容量n。

b. 根据所选置信水平,查找对应的Z值。

c. 计算置信区间上下限:下限 = x - (Z * s / sqrt(n))上限 = x + (Z * s / sqrt(n))其中,s为样本标准差。

三、置信水平的意义与计算在统计推断中,置信水平是对样本估计结果准确性的度量。

常用的置信水平有90%、95%和99%等。

统计学问答题

统计学问答题

统计学问答题1. 什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示与分析统计数据的科学,其目的是探索数据内在的数量规律性。

统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法乃至统计学就失去了其存在意义。

3.简要说明抽样误差与非抽样误差答:统计调查误差可分为非抽样误差与抽样误差。

非抽样误差是由于调查过程中各有关环节工作失误造成的,从理论上看,这类误差是可以避免的。

抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以计量与控制的。

4(先分为集中趋势与分散程度,再继续细分,即综述7、8)一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、分布形状(偏态与峰度)几方面来测度。

分布集中趋势的测度有众数、中位数、分位数、均值、几何平均数、切尾均值;分布离散程度的测度有极差、内距、方差与标准差、离散系数。

7.简述众数、中位数与均值的特点与应用场合。

答:众数、中位数与均值是分布集中趋势的三个主要测度,众数与中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。

众数一组数据分布的峰值,容易计算,但不是总是存在,众数只有在数据量较多时才有意义,数据量较少时不宜使用。

主要适合作为分类数据的集中趋势测度值,应用场合较少;中位数是一组数据中间位置上的代表值,直观,不受极端数据的影响,但数据信息利用不够充分,当数据的分布偏斜较大时,使用中位数也许不错。

主要适合作为顺序数据的集中趋势测度值。

均值数据对数值型数据计算的,而且利用了全部数据信息,提取的信息最充分,当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。

但受极端数据的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。

8.标准差与方差反映数据的什么特征反映数据离散程度的特征. 标准差反应数据的变化幅度,即上下左右波动的剧烈程度。

样本容量的确定

样本容量的确定
一、在实际中采用不重复抽样,但常用重复抽样下的公式代替; 二、若和p未知,其处理方式是: 1.用过去近期的数据代替, 2.用样本数据代替, 3.取p=0.5或最接近0.5的值; 三、对同一总体,若求出的Nx,Np不等,这时取较大的作为必要样本容量, 以同时满足做两种调查的需要; 四、在实际工作中,常使用重复抽样下的简单随机抽样公式。
第四节
样本容量的确定
• 样本容量:
样本中个体的数目或组成抽样总体的单位数。
• 必要样本容量:
亦称必要样本单位数,是指满足调查目的要求的情况下, 至少需要选择的样本单位数。
一、估计总体均值时样本容量的确定
1.重复抽样 一旦确定了置信水平(1-α ),Zα/2的值就确定了,对于给定的的值 和总体标准差σ ,就可以确定任一希望的允许误差所需要的样本容量。令 E代表所希望达到的允许误差,即:
例:拥有MBA学位的研究生年薪的标准差大约为4000 元,假定想 要估计年薪95%的置信区间,希望允许误差为10000 元,应抽取 多大的样本容量? 解:已知 =4000,E=1000,1-=95%, Zα /2=1.96,所以,应抽取的样本容量为:
(1.96)2 40002 n 2 E 10002 61.47 62
即应抽取62人作为样本。
(z α 2 ) 2 σ 2
二、估计总体比例时样本容量的确定
1.重复抽样
一旦确定了置信水平(1-α ),Zα /2的值就确定了。由于总体比例的值是固定 的,所以允许误差由样本容量来确定,样本容量越大允许误差就越小。估计的 精度就越好。因此,对于给定的的π 值,就可以确定任一希望的允许误差所需 要的样本容量。令E代表所希望到的允许误差,即:
n (z α 2 ) 2 π(1 π)

样本容量的确定

样本容量的确定
抽样结果的点估计在很少的情况下完全准确 因此人们更偏于区间估计 区间估计就是 对变量值如总体平均值的区间或范围进行估计 除了要说明区间大小外 习惯上还要说明实 际总体平均值在区间范围以内的概率 这一概率通常被称为置信系数或者置信度 区间则被 称为置信区间
都在此范围内 而通过简单随机样本对总体做的估计为实际总体平均值 2 倍标准误差范围 内的概率为 95 在实际总体平均值 3 倍标准误 差范围内的概率为 99.7 5.5.3 点估计和区间估计
当利用抽样要对总体平均值进行估计时 有两种估计方法 点估计和区间估计 点估计 是指把样本平均值作为总体平均数的估计值 观察图 5.3 的平均数抽样分布可知某一特定的 抽样结果 其平均数很可能相对更接近总体平均数 但是 样本平均数分布中的任一个值都 可能是这一特定样本的平均值 有一小部分的样本平均值与实际总体平均值有相当的差距 这种差距就叫抽样误差
在任何确定样本容量的问题中 都必须认真考虑所要分析并要据此做统计推断的总体样 本的各个子群的数目的预期容量 例如 从整体上看样本容量为 400 很符合要求 但若要分 别分析男性和女性被调查者 并且要求男性与女性的样本各占一半 那么每个子群的容量仅
1
广州方舟市场研究有限公司
统计学基础知识
为 200 这个数字是否符合要求 能使分析人员对两组的特征做出预期的统计推断呢 再如 要按年龄和性别分析调研结果 问题就变得更复杂了 假设要按以下方式将总体样本划分为 四组
5
广州方舟市场研究有限公司
统计学基础知识
5.5.2 根据单个样本做出推断 在实际操作中 人们往往不愿从总体中抽出所有可能的随机样本 画出像表 5.3 和图 5.4
那样的频率分布表和直方图来 人们希望进行简单的随机抽样 并据此对总体进行统计推断 问题出现了 通过任一简单的随机样本对总体均数进行的估计 其估计值在总体平均值 1 个标准误差内的概率究竟为多大 根据表 5.2 可知概率为 68 因为所有样本平均数有 68

样本容量的确定

样本容量的确定

四、样本容量的确定
2. 估计总体比例时样本容量的确定
(1)重复抽样条件下样本容量的确定。 进行总体比例的区间估计时,总体比例p的置信区间为
(5-53) (2)不重复抽样条件下样本容量的确定。 当有限总体不重复抽样时,同理可得允许误差为
(5-57)
四、样本容量的确定
【例5-25】 某茶叶生产厂对某批10000包茶叶的每ቤተ መጻሕፍቲ ባይዱ包平均重量和合格率进行检验,根据以往资料,每包平均重 量的标准差为10g,茶叶合格率为92%,在概率保证程度 为95.45%、每包茶叶平均重量的抽样极限误差不过2g、 合格率的抽样极限误码差不超过5%的条件下,求应抽取多 少包茶叶进行检验。
四、样本容量的确定

式中,n′为重复抽样的样本容量。 抽检合格率,由p=92%,Z=2,Δp=5%,得

所以,在不重复抽样条件下,抽检平均每包重量时需要抽取99包茶叶,抽 检合格率时需要抽取117包茶叶。
四、样本容量的确定
3. 估计两个总体均值之差时样本容量的确定
(在估计两个总体均值之差时,样 本容量的计算与上述类似,在给定的允 许误差和置信水平条件下,估计两个总 体均值之差所需要的样本容量为
(5-59)
四、样本容量的确定
4. 估计两个总体比率之差时样本容量的确定
在给定的允许误差和置信水平为1-α的 条件下,估计两个总体比率之差时所需的样本 容量为
(5-60)
四、样本容量的确定
【例5-27】 某厂家要估计消费者对一种新产品认知的广告效果,该厂在广 告前和广告后各抽取一个消费者随机样本进行调查,若以10%的允许误差和95% 的置信水平估计广告前和广告后知道该产品消费者的比率之差,则应从两个样本 中分别抽取多少名消费者进行调查?

数理统计之样本容量的选择

数理统计之样本容量的选择

的一个置信水平为 1的置信区间: X
S n
t
/
2
(n

1)
.
在总体均值的区间估计时,半置信区间的宽度为:
s
L t (n 1)
2
n
精度要求: L
问题:两个不确定!
可得
n

t2
2 (n 1)s2 2
与样本容量n 有关,与观测值的 样本方差(s)有关。
2020/2/29
0是专家经验估计的 上界。
2020/2/29
西南交通大学数学学院统计系
J. TANG
2第.4 五估计章总体参均数值时估,计样本容量的确定
近似逼近方法二、
L
S n
t
/2
(n
1)


n
t2
2 (n 1)s2 2
替换成 n
z2
2
20
2
这里:首 再先 用选 单择 侧容 区量 间为 估m计的的样方本法容求量出; 的置信度为1-的置信上界; 用此上界为 0 .
2
n
2 2 2
2

1.962 1800000 5002

27.65
28
这家广告公司应抽选28个商店作样本(注意抽取样本 数总是整数,所以n 应圆整成整数)。
2020/2/29
西南交通大学数学学院统计系
J. TANG
2第.4 五估计章总体参均数值时估,计样本容量的确定
情形2、方差 2未知的条件下,估计u的区间
第五章 参数估计 第4节 样本容量的确定
需要考虑问题:
➢ (1)要求什么样的精度?即我们想构造多宽的区间? ➢ (2)对于构造的置信区间来说,想要多大的置信度?

《统计学》样本容量的确定

《统计学》样本容量的确定
5.7 样本容量的确定
样本容量确定的两难
样本容量取得较大,收集的信息 就相对多,从而估计精度较高,但 进行观测所投入的费用、人力及时 间就比较多; 样本容量取得较小,则投入的费 用、人力及时间就相对节约,但收 集的信息也较少,从而估计精度较 低; 所以,精度和费用对样本量的影 响和要求是矛盾的,不存在既使精 度最高又使费用最省的样本量 。
估计总体均值时样本容量的确定 (例题分析)
解: 已知=2000,d=400, 1-=95%, z/2=1.96 置信度为95%的置信区间为:
n ( z 2 )2 2 (1.96 )2 20002
d2
4002
96.04 97
即应抽取97人作为样本。
估计总体比例时样本容量的确定
估计总体比例时ห้องสมุดไป่ตู้本容量的确定
1. 根据比例区间估计公式可得样本容量n为:
• •
重复抽样n
(
z
2
)2
d2
(1
)

2.
不重复抽n样
(
N
N( z 2 )2 (1 ) 1)d2 ( z 2 )2 (1
)
d的取值一般小于0.1
其中: d z 2
p(1 p ) n
3. π未知,以样本比例p替代
4. π或p都未知时,可取0.5,这是一种谨慎估计
1. 估计总体均值时样本容量n为:
• •
重复抽样 n
(
z
2
d
)2
2
2

不重复抽样
n
(N
N( z 2 )2 2 1)d2 ( z 2 )2 2
其中:d
Z
2

n
2. 样本容量n与总体方差成正比,与绝对误差成

统计学简答题与课后答案

统计学简答题与课后答案

统计学简答题1.简述描述统计学的概念、研究容和目的。

概念:它是研究数据收集、整理和描述的统计学分支。

研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。

研究目的:描述数据的特征;找出数据的基本数量规律。

2.简述推断统计学的概念、研究容和目的。

概念:它是研究如何利用样本数据来推断总体特征的统计学分支。

研究容:参数估计和假设检验的理论与方法。

研究目的:对总体特征作出推断。

3.什么是总体和样本?总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。

可分为有限总体和无限总体:有限总体的围能够明确确定,且元素的数目是有限的,可数的。

无限总体所包括的元素数目是无限的,不可数的。

总体单位数可用N表示。

样本就是从总体中抽取的一部分元素的集合。

构成样本的元素的数目称为样本容量,记为n。

4.什么是普查?它有哪些特点?普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。

它有以下的特点:(1)通常是一次性或周期性的(2)一般需要规定统一的标准调查时间(3)数据的规化程度较高(4)应用围比较狭窄。

5.简述统计调查方案的概念及包括的基本容答:统计调查前所制订的实施计划,是全部调查过程的指导性文件。

是调查工作有计划、有组织、有系统进行的保证。

统计调查方案应确定的容有:调查目的与任务、调查对象与调查单位、调查项目与调查表、调查时间和调查时限、调查的组织实施计划。

6.简述统计分组的概念,原则和具体方法答:统计分组是根据事物的在特征和研究要求,将总体按照一定的标准划分为若干部分的一种方法。

统计分组必须遵循“穷举”和“互斥”的原则。

“穷举”是指总体中的任何一个单位都有可能被归入某一组。

“互斥”是指任何一个单位只能归属于一个组,而不能同时归属于两个或两个以上的组。

统计分组方法因选择的分组标志及其组合形式不同而异。

常用的有按一个品质标志或一个数量标志所作的简单分组;将两个或两个以上的分组标志重叠起来所作的复合分组等。

2012年统计学第8章抽样调查理论与方法

2012年统计学第8章抽样调查理论与方法

8-26
一、估计总体均值时样本容量的确定
重复抽样时
1. 估计总体均值时样本容量n为 允许误差
n x
(z 2 )2 2
2
x
其中: x
z 2
n
2. 可见,样本容量
✓ 与总体方差成正比 ✓ 与允许误差成反比 ✓ 与置信度成正比
《统计学》第8章抽样调查理论与方法
8-27
不重复抽样时:
n x
NZ2 / 2 2
X
1 N
N i 1
Xi
N
X Xi N X
i 1
总体比例 总体方差 标准差
P N1 ,Q N0 N N1 1 P N NN
2
1 N
N
(Xi X )2
i 1
1 N
N
( Xi X )2
i 1
《统计学》第8章抽样调查理论与方法
8-9
统计量:是根据样本的n个单元的变量值计 算出来一个量,也叫估计量
解:Q N 15000 n 150
p 147 98% 150
p
p(1 p) n
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n ) 0.98 (1 0.98) (1 150 ) 1.1374%
n
N
150
15000
《统计学》第8章抽样调查理论与方法
8-24
8.5.1影响样本容量确定的主要因素
总体被研究标志的变异程度 调查者对推断精确度的要求 抽样调查的方式和方法 人力、物力和财力的允许条件
《统计学》第8章抽样调查理论与方法
8-25
8.5.2 样本容量的确定
一、估计总体均值时样本容量的确定 二、估计总体比率时样本容量的确定

总体均值估计时样本容量的确定77页PPT

总体均值估计时样本容量的确定77页PPT
总体均值估计时样本容量的确定
46、法律有权打破平静。——马·格林 47、在一千磅法律里,没有一盎司仁 爱。— —英国
48、法律一多,公正就少。——托·富 勒 49、犯罪总是以惩罚相补偿;只有处 罚才能 使犯罪 得到偿 还。— —达雷 尔
50、弱者比强者更能得到法律的保护 。—— 威·厄尔
46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特

应用统计单项选择题

应用统计单项选择题

应用统计单项选择题1.社会经济统计是(C)的有利工具。

A.处理问题B.进行交流C.认识社会D.引进外资2.(A)是用图形、表格和概括性的数字对数据进行描述的统计方法。

A.描述统计B.推断统计C.理论统计D.应用统计3.(A)是我们所要研究的所有基本单位(通常是人、物体、交易或事件)的总和。

A.总体B.变量C.样本D.统计4.经济数据是对(B)进行计算的结果。

A.主观现象B.客观现象C.数字特征D.社会现象5.美国盖洛普(Gallup)调查公司在美国总统大选前通常会从全美国的选民中随机抽取1500人左右,对大选结果进行调查和预测,并会给出2%左右的预测误差。

这是利用样本信息和概率论原理进行(B)的过程。

A.统计描述B.统计推断C.统计分析D.统计应用6.统计学的核心内容是(C)。

A.统计数据的收集B.统计数据的整理C.统计数据的分析D.统计数据的应用7.(A)在《政治算术》一书中用大量的数字对英国、法国、荷兰三国的经济实力进行比较,用数字、重量、尺度等定量的方法进行分析和比较,表达他的思想和观点。

A.威廉配第B.约翰格朗特C.帕斯卡D.费马8.统计整理主要是对(C)的整理。

9.著名统计学家(B)给出了F统计量、最大似然估计、方差分析等方法和思想。

A.戈赛特B.费希尔C.奈曼和皮尔逊D.沃尔德10.统计数据的搜集活动是(B)。

A.应用统计B.统计工作C.统计数据D.统计学第02章-统计数据的描述1.某企业男性职工占60%,月平均工资为550元,女性职工占40%,月平均工资为500元,该企业全部职工的平均工资为(B)。

A.525元B.530元C.535元D.540元2.如果数据是左偏分布,则有(C)。

A.平均数=中位数=众数B.平均数>中位数>众数C.平均数A.抽样调查B.典型调查C.重点调查D.普查4.今有四位工人的工资分别为:400元,600元,700元,900元,计算四人平均工资,应采用的计算方式是(A)。

统计学大题(1-3) (2)

统计学大题(1-3) (2)

一,根据以下数据,分别计算:算术平均数,中位数,众数,标准差。

抽取零售企业105家的销售收入如下表:解:先求出组中值,如上表所示。

直接按计算器,可得:算术平均数=76.09标准差=30.65中位数=60+{(105/2)-34/26}*20=74.23众数=60+{(26-19)/(26-19)+(26-20)}*20=70.77附:计算器按法:开机→mode→2→shift→mode→1→=→输入数据(30shift,15M+50shift,19M+……)→shift→2→计算器即显示各个指标,1为平均数,2为总体标准差,3为样本标准差2,区间估计求置信区间的方法与步骤:第一步根据中心极限定理,构造一个含未知参数的分布第二步对给定的置信度,1-α查表得到标准分zα/2第三步利用不等式变形,求出未知参数1-α置信区间.二,总体均值的区间估计①正态总体,方差已知,(大、小)样本例1,某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4mm 。

已知总体标准差?=0.15mm ,试建立该种零件平均长度的置信区间,给定置信水平为0.95。

解:已知X-N (?,0.152),?x =2.14,n =9,1-?=0.95,Z?/2=1.96 总体均值?的置信区间为结论:我们可以95%的概率保证该种零件的平均长度在21.302~21.498mm 间。

当%5>N n 时,需要修正,⎪⎪⎭⎫⎝⎛--⋅±1:2N n N n Z x σμα 例2,某企业生产某种产品的工人有1000人,某日采用非重复抽样抽取100人调查他们的当日产量,样本人均产量为35件,如果总体产量的标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。

②正态总体,大样本,当方差未知时,以样本方差替代即可 ③总体比例的区间估计重复抽样VS 不重复抽样:⎪⎪⎭⎫⎝⎛--⋅±⎪⎪⎭⎫ ⎝⎛⋅±==1::),(:222N n N n pq Z p P n pq Z p P pq s p x αα大样本例:某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。

样本容量的确定

样本容量的确定

样本容量的确定分类:Statistics在参数区间估计的讨论中,估计值和总体的参数之间存在着一定的差异,这种差异是由样本的随机性产生的。

在样本容量不变的情况下,若要增加估计的可靠度,置信区间就会扩大,估计的精度就降低了。

若要在不降低可靠性的前提下,增加估计的精确度,就只有扩大样本容量。

当然,增大样本容量要受到人力、物力和时间等条件的限制,所以需要在满足一定精确度的条件下,尽可能恰当地确定样本容量。

一、影响样本容量的因素(一)总体的变异程度(总体方差)在其它条件相同的情况下,有较大方差的总体,样本的容量应该大一些,反之则应该小一些。

例如:在正态总体均值的估计中,抽样平均误差为它反映了样本均值相对于总体均值的离散程度。

所以,当总体方差较大时,样本的容量也相应要大,这样才会使较小,以保证估计的精确度。

(二)允许误差的大小允许误差指允许的抽样误差,记为,例如,样本均值与总体均值之间的允许误差可以表示为,允许误差以绝对值的形式表现了抽样误差的可能范围,所以又称为误差。

允许误差说明了估计的精度,所以,在其他条件不变的情况下,如果要求估计的精度高,允许误差就小,那么样本容量就要大一些;如要求的精确度不高,允许误差可以大些,则样本容量可以小一些。

(三)概率保证度1-α的大小概率保证度说明了估计的可靠程度。

所以,在其他条件不变的情况下,如果要求较高的可靠度,就要增大样本容量;反之,可以相应减少样本容量。

(四)抽样方法不同在相同的条件下,重复抽样的抽样平均误差比不重复抽样的抽样平均误差大,所需要的样本容量也就不同。

重复抽样需要更大的样本容量,而不重复抽样的样本容量则可小一些。

此外,必要的抽样数目还要受抽样组织方式的影响,这也是因为不同的抽样组织方式有不同的抽样平均误差。

二、样本容量的确定(一) 估计总体均值的样本容量在总体均值的区间估计里,置信区间是由下式确定的:例如,对于正态总体以及非正态总体大样本时,都是以它为置信区间。

统计学 第四章 参数估计

统计学 第四章  参数估计

由样本数量特征得到关于总体的数量特征 统计推断(statistical 的过程就叫做统计推断 的过程就叫做统计推断 inference)。 统计推断主要包括两方面的内容一个是参 统计推断主要包括两方面的内容一个是参 数估计(parameter estimation),另一个 数估计 另一个 假设检验 。 是假设检验(hypothesis testing)。
ˆ P(θ )
无偏 有偏
A
B
θ
ˆ θ
估计量的无偏性直观意义
θ =µ



• •
• • • •

2、有效性(efficiency)
有效性:对同一总体参数的两个无偏点估计 有效性: 量,有更小标准差的估计量更有效 。
ˆ P(θ )
ˆ θ1 的抽样分布
B A
ˆ θ2 的抽样分布
θ
ˆ θ
பைடு நூலகம்
3、一致性(consistency)
置信区间与置信度
1. 用一个具体的样本 所构造的区间是一 个特定的区间, 个特定的区间,我 们无法知道这个样 本所产生的区间是 否包含总体参数的 真值 2. 我们只能是希望这 个区间是大量包含 总体参数真值的区 间中的一个, 间中的一个,但它 也可能是少数几个 不包含参数真值的 区间中的一个
均值的抽样分布
总体均值的区间估计(例题分析)
25, 95% 解 : 已 知 X ~N(µ , 102) , n=25, 1-α = 95% , zα/2=1.96。根据样本数据计算得: x =105.36 96。 总体均值µ在1-α置信水平下的置信区间为 σ 10 x ± zα 2 = 105.36 ±1.96× n 25 = 105.36 ± 3.92

《应用统计学》第6章:置信区间估计

《应用统计学》第6章:置信区间估计

89.98,89.97,90.00,90.01,89.99
(
)
S求2 σ 02 .的01置8信532度为 95% 的置信区间。
10
二. 总体均值μ的区间估计
1. 标准正态分布的右侧 分位点 Z
Z 是标准正态分布中满足下式的右侧分位点:
P{ Z > Z } =
f (x)
1-
0
z x
如图所示, ( Z )=1- ,因此, 可由正态分布表
格式:TINV( 2 , n )
功能:返回 t (n)的值。
说明:TINV(, n )返回的是 t/2(n)的值。
17
4. 2 未知时总体均值 μ 的区间估计
设总体 X~N( μ, σ 2 ), X1, X2, ···, Xn 为 X 的容量为 n
的样本, X 和 S2 分别为样本均值和样本方差。
其中 d 称为估计的允许误差。
12
用 Excel 求 Zα
可用 Excel 的统计函数 NORMSINV 返回 Z 。 语法规则如下:
格式:NORMSINV(1-)
功能: 返回 Z 的值。
说明: NORMSINV() 返回的是 Z1- 的值。
13
3. t 分布
设 X~N(0, 1),Y~ 2(n), 且 X 与 Y 相互
得到 Z 。 如:要查 Z0.025, 由正态分布表可查得:
(1.96) = 0.975 = 1-0.025, 故 Z0.025 =1.96
11
2.σ 2 已知时总体均值μ的区间估计
由正态分布的性质可得
Z X ~N(0,1)
/ n
/2
对给定的置信度1-, 有
f (x)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

这里无偏估计量是指没有系统偏差(非随机偏差)的平均 意义上的量,即如果说一个估计量是无偏性的,并不是保证 用于单独一次估计中没有随机性误差,只是没有系统性偏差 而已。这是一个优良估计量的重要条件。
若以 代表被估计的总体参数,ˆ 代表 的无偏估计量
则有:

第六章 总体参数估计
根据表1的数据,质检科估计出该天生产的食品每袋的平均重量在
101.38~109.34克之间,其中,估计的可信程度为95%,估计误差不超过4
克。产品的合格率在96.07%~73.93%之间,其中,估计的可信程度为95%,
估计误差不超过16%。
第六章 总体参数估计
质检报告提交后,企业高层领导人提出几点意见:一是抽取的样 本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估 计的误差再缩小一点?比如,估计平均重量时,估计误差不超过3克, 估计合格率时误差不超过10%;三是总体平均重量的方差是多少?因为 方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应 对生产过程进行调整。
第六章 总体参数估计
表1 25袋食品的重量(克)
112.5 102.6 100.0 116.6 136.8
101.0 107.5 123.5 95.4 102.8
103.0 95.0 102.0 97.8 101.5
102.0 10808 101.6 108.4 98.4
100.5 115.6 102.2 105.0 93.3
第一节 参数估计的基本问题
一、点估计 点估计就是用样本估计量的一个具体观测值直接作为总体 的未知参数的估计值的方法。 如上例中随机抽取的100头的平均每头毛重(95.5kg)可作为
10000头平均每头毛重 的点估计值
常用的估计量有:
x (1)样本平均数 为总体平均数 的估计量;
(2)样本方差 S 2 为总体方差 2的估计量;
2、一致性
若估计量随样本容量n的增大而越来越接近总体参数值 时,则称该估计量为被估计参数的一致性估计量。估计 量的一致性是从极限意义上讲的,它适用于大样本的情 况。如果一个估计量是一致性估计量,那么采用大样本 就更加可靠。当然,样本容量n增大时,估计量的一致性 会增强,但调查所需的人、财、物力也相应增加。例如, 以样本平均数估计总体平均数,符合一致性的要求,即 存在如下关系:
第六章 总体参数估计
本章重点 1、参数估计的基本问题; 2、单个总体均值和比率的区间估计; 3、小样本下的总体参数估计方法; 4、样本容量的确定方法; 5、两个总体均值和比率差异的区间估计; 6、分层、整群和等距抽样的区间估计。 本章难点 1、一般正态分布标准正态分布; 2、区间估计的原理; 3、两总体联合方差的表达形式。 。经证明 : 源自(x) 2n 2
D(M e )
2
n
第六章 总体参数估计
• 点估计的缺点:不能反映估计的误差和精确程度
因为点估计是基于样本得到的,是随机变量,不可能期望它的 值与相应的总体参数的真实值相等,也就是说点估计值和总体参数的 真是值之间总会存在一定误差,并且我们是不知道这个误差有多大, 这样我们估计的可信度大打折扣。在这一节中,我们将说明如何利用 点估计值对单个总体均值和总体比率进行区间估计,并给出估计的可 靠程度和准确程度。
(3)样本成数 P 为总体成数 P 估计量。
第六章 总体参数估计
二、点估计的性质 在对总体特征做出估计时,并非所有估计量都是优良
的,从而产生了评价估计量是否优良的标准。作为优良的 估计量应该符合如下三个标准:
第六章 总体参数估计
1、无偏性
如果样本某统计量的数学期望值等于其所估计的总体 参数真值,则这个估计统计量就叫做该总体参数的无偏估计 量。如样本平均数的数学期望是总体平均数,则样本均值是 总体均值的无偏估计量。
• 区间估计:利用样本统计量和抽样分布估计总体参数的可 能区间
第二节 单个总体均值和比率的区间估计
一、总体均值的区间估计:大样本(n≥30)情形和小样本 (n<30)情形。
大样本的情形
• 【例1】Duotu公司是一家专营体育设备和附件的公司,为 了监控公司的服务质量, Duotu公司每月都要随即的抽取 一个顾客样本进行调查以了解顾客的满意分数。根据以往 的调查,满意分数的标准差稳定在20分左右。最近一次对 100名顾客的抽样显示,满意分数的样本均值为82分,试 建立总体满意分数的区间。 我们可以将样本满意得分的均值(82分)作为该公司 所有顾客组成的总体的平均满意得分的点估计。当然你也 许会问:“这一估计有多好?这次估计的把握程度有多 高?” "有多好"这一问题其实是想知道以样本均值作为 总体均值的点估计时所产生的误差有多大。
第六章 总体参数估计
实践中的统计
一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋 左右。按规定每袋的重量应不低于100克,否则即为不合格。为对产量 质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企 业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要 求。
由于产品的数量大,进行全面的检验是不可能的,可行的办法是 抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一 批食品中随机抽取了25袋,下表1是对每袋食品重量的检验结果。
• 我们把无偏点估计值与总体参数之差的绝对值称为抽样误 差。当我们用样本均值估计总体均值时,抽样误差可以表 达为:
lim Px 1
n
式中 为任意正数。
第六章 总体参数估计
3、有效性
有效性是指无偏估计量中方差最小的估计量。无偏估计 量只考虑估计值的平均结果是否等于待估计参数的真值, 而不考虑估计的每个可能值及其次数分布与待估计参数真 值之间离差大小的离散程度。我们在解决实际问题时,不 仅希望估计值是无偏的,更希望这些估计值的离差尽可能 地小,即要求比较各无偏估计量中与被估计参数的离差较 小的为有效估计量。如样本平均数与中位数都是总体均值 的无偏估计量,但在同样的样本容量下,样本平均数是有 效的估计量。
相关文档
最新文档