省电大开放教育开放本科金融专业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
省电大开放教育开放本科金融专业
«工商管理统计»单元辅导〔二〕
(4-5章)
第四章 推断未知的总体特征
〔一〕内容提要
本章主要引见参数估量的基本方法,也就是如何依据样本所提供的信息来推断我们所关心的总体特征。
关于一个总体,我们所关心的总体特征主要有总体均值μ、总体比例π和总体方差2σ等,这些特征通常是不知道的,需求依据样本停止推断。
本章内容主要触及总体均值和总体比例的推断。
要停止抽样推断,首先需求处置抽取样本的效果。
从总体抽取样本的方法有概率抽样和非概率抽样两类。
统计推断所依据的主要是概率抽样。
抽样的概率抽样方法有复杂随机抽样、分层抽样、系统抽样和整群抽样等。
本章所引见的推断方法主要依据复杂随机抽样。
依据复杂随机抽样抽取样本的方法主要是依据随机数字表来停止。
要依据样本停止推断,还必需知道样本统计量是如何散布的,比如样本均值的散布、样本比例的散布等。
样本统计量的散布与原有总体的散布以及样本容量的大小有关。
统计研讨说明,假设原有总体是正态散布,那么,无论样本容量的大小,样本均值也听从正态散布,在重复抽样条件下,其散布的数学希冀为()μ=x E ,方差为n 2
2σσ=。
也就是说,作为随机变量的样本均值)/,(~2n N X σμ。
在不重复抽样条件下,对重复抽样散布的方差用系数
⎪⎭⎫ ⎝⎛--n N N 1停止修正即可。
这时样本均值的抽样散布为:⎪⎪⎭
⎫ ⎝⎛⎪⎭⎫ ⎝⎛--n N N n N X 1,~2σμ。
关于有限总体停止不重复抽样时,或许关于有限总体,当N 很大,而抽样比N n /很小时,其修正系数
⎪⎪⎭
⎫ ⎝⎛⎪⎭⎫ ⎝⎛--n N N N X 1~趋于1,这时样本均值的方差也可n 22σσ=来计算。
假设原有总体的散布不是正态散布,就要看样本容量的大小了,当n 为大样本时()30≥n 依据统计分上的中心极限定理可知,当样本容量n 增大时,不论原来的总体能否听从正态散布,样本均值的抽样散布都将趋于听从正态散布。
这时就可以按正态散布来停止推断。
当n 为小样本时,其散布那么不是正态散布,这时就不能按正态散布停止推断。
异样,关于样本比例p
ˆ的散布,我们也需求知道p ˆ的数学希冀和方差。
统计证明,p ˆ的数学希冀等于总体的比例π,即:π=)ˆ(p
E ,而p ˆ的方差p 2σ那么与抽样方法有关,在重复抽样条件下,有:n p )1(2ππσ-=,在不重复抽样条件下,那么用修正系数加以修正,即:)1
()1(2n N N n p ---=ππσ。
也就是说,在重复抽样条件下,样本比例的抽样散布为
))
1(,(~n N P πππ-;在不重复抽样条件下,样本比例的抽样散布为:
()⎪⎪⎭
⎫ ⎝⎛⎪⎭⎫ ⎝⎛---11,~N n N n N P πππ。
与样本均值散布的方差一样,关于有限总体停止不重复抽样时,可以按重复抽样来处置。
此时样本比例的方差仍可按n p )1(2ππσ-=
来计算。
关于有限总体,当N 很大,而抽样比%5/≤N n 时,其修正系数⎪⎭⎫
⎝⎛--n N N 1趋于1,这时样本比例的方差也可以按n p )
1(2ππσ-=来计算。
统计证明,关于来自正态总体的复杂随机样本,比值()2
2
1σs n -的抽样散布听从自在度为〔n -1〕的2χ散布,即())1(~1222
2--=n s n χσχ。
总体方差的区间估量就是用2χ散布来树
立的。
在知道了样本统计量的散布后,我们就可以依据其散布来估量总体的参数了。
用样本统
计量估量总体参数的方法有点估量和区间估量两种。
点估量就是用样本估量量θ
ˆ直接作为总体参数θ的估量值。
一个优秀的估量量应满足无偏性、有效性和分歧性三个规范。
但由于点估量没有给出估量的牢靠水平,实践中我们更多的运用区间估量,它是在点估量的基础上,给出总体参数估量的一个范围,并指出总体参数落在这一范围的概率是多少。
总体参数所在的区间称为置信区间。
总体均值的区间估量有以下集中状况:
一是正态总体方差,或非正态总体方差未知但大样本。
这种状况下,可以依据正态散布树立总体均值μ的置信区间。
在重复抽样条件下,总体均值在∂-1置信水平下的置信区间为:n z x σα2/±;在不重复抽样条件下,总体均值的置信区间为:12/--±N n N n z x σα。
假设总体方差未知,即使总体为非正态散布,只需在大样本条件下,那么可以用样本方差2
s 替代总体方差2σ,这时总体均值μ在∂-1置信水平下的置信区间可以写为:n
s z x 2/α±。
在不重复抽样条件下,总体均值的置信区间为:1
2/--±N n N n s z x α。
二是正态总体方差2σ未知,且小样本。
在这种状况下,那么需求用样本方差2s 替代2σ,这时,将样本均值规范化后的结果不再听从规范正态散布,而是自在度为n-1的t 散布。
在这种状况下,应采用t 散布来树立总体均值μ的置信区间。
依据t 散布树立的总体均值μ在 ∂-1 置信水平下的置信区间为:n s t x 2/α±。
关于总体比例的置信区间,当样本容量很大时,即当5ˆ≥p
n ,就可以以为样本容量足够大,这时样本比例p ˆ的抽样散布可以用正态散布近似。
这时可以依据正态散布来树立总体比
例的置信区间。
总体比例在∂-1置信水平下的置信区间为:n p p z p
)1(ˆ2/-±α。
在不重复抽样条件下,总体比例在∂-1置信水平下的置信区间为:⎪⎭
⎫ ⎝⎛---±1)1(ˆ2/N n N n p p z p α 估量总体方差的置信区间那么要用2χ散布。
总体方差的置信区间为22/12
2
22/2)1()1(∂--≤≤-χσχαs n s n 。
开方后即失掉总体规范差的置信区间。
抽样估量中的另一个效果是如何确定一个适当的样本容量。
添加样本容量可以提高估量的准确性,但样本容量的添加会遭到许多限制。
一个适宜的样本容量与估量时所要求的估量误差〔边沿误差〕有关。
在一定的边沿误差条件下,采用重复抽样估量总体均值时所需的样本容量为:()22
22/E z n σ∂=;采用不重复抽样估量总体的均值时所需的样本容量为:
()()222/22
22/)1(σσααz E N z N n +-=。
采用重复抽样估量总体比例时多需的样本容量为:
n z E )1(2/ππα-=;采用不重复抽样的估量总体比例时所需的样本容量为:()222/)
1(E z n ππα-=。
〔二〕学习要求
经过本章的学习,要求掌握以下内容:
(1) 了解抽样的含义,掌握抽取样本的详细方法;
(2) 了解抽样散布的含义,掌握样本均值和样本比例的抽样散布。
(3) 了解点估量的含义,掌握平价估量量的规范;
(4) 掌握样本容量确实定方法;
(5) 熟练掌握总体均值和总体比例的区间估量方法;
(6) 能运用本章所学方法对实践效果停止估量与剖析。
1、对抽样推断的了解
抽样推断是从所研讨的总体全部元素〔单位〕中抽取一局部元素〔单位〕停止调查,并依据样本数据所提供的信息来推断总体的数量特征。
2、对抽样散布的了解,样本统计量的散布与总体散布的关系。
所谓抽样散布,就是指样本统计量的散布。
一切的样本均值构成的散布就是样本均值的抽样散布。
样本均值x 抽样散布的外形与原有总体的散布有关,假设原有总体是正态散布,那么,无论样本容量的大小,样本均值也听从正态散布。
其散布的数学希冀为总体均值,方差为总体方差的1/n ,即X ~N(μ,2
σ/n)。
假设原有总体的散布不是正态散布,就要看样本容量的大小了,当n 为大样本时〔n ≥30〕,依据统计上的中心极限定理可知,当样本容量n
增大时,不论原来的总体能否听从正态散布,样本均值的抽样散布都将趋于听从正态散布。
其散布的数学希冀为总体均值,方差为总体方差的1/n 。
3、简述评价估量量好坏的规范。
〔1〕无偏性。
无偏性是指估量量抽样散布的数学希冀等于被估量的总体参数。
设总体参数为θ ,所选择的估量量为 ∧θ,假设E(∧θ)=θ ,称 θ 为 ∧θ 的无偏估量量。
〔2〕有效性。
一个无偏的估量量并不意味着它就十分接近被估量的参数,它还必需与总体参数的团圆水平比拟小。
假定有两个用于估量总体参数的无偏估量量,区分用∧1θ和 ∧2θ表示,它们的抽样散布的方差区分用 D 〔∧1θ〕和D 〔∧2θ〕表示,假设 ∧1θ的方差小于∧2θ 的方差,即D 〔∧1θ〕< D 〔∧2θ〕,我们就称∧1θ是比∧
2θ更有效的一个估量量。
在无偏估量的条件下,估量量方差越小估量也就越有效。
〔3〕分歧性。
分歧性是指随着样本容量的增大,点估量量的值越来越接近总体的参数。
换言之,一个大样本给出的估量量要比一个小样本给出的估量量更接近总体的参数。
4、简述样本容量与置信概率、总体方差、边沿误差的关系。
从样本容量的公式可以看出,样本容量与置信概率成正比,在其他条件不变的状况下,置信概率越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与边沿误差的平方成正比,我们可以接受的边沿误差越大,所需的样本容量就越小。
4、Z 2/αn
σ 的含义是什么? Z 2
/αn σ是估量总体均值时的边沿误差〔Margin error 〕,也称为估量误差。
总体均值的置信区间就是由点估量值和描画估量量精度的边沿误差两局部组成的。
6、某居民小区共有居民500户,小区管理者预备采取一项新的供水设备,想了解居民能否赞成。
采取不重复抽样方法随机抽取了50户,其中有32户赞成,18户支持。
〔1〕求该小区中赞成该项革新的户数比例的置信区间,置信水平为95﹪。
〔2〕假设小区管理要求估量时的边沿误差不超越10﹪,应抽取多少户停止调查?
解答:〔1〕以知N=500,n=50,样本比例为:
∧
p =赞成的户数/n =32/50=64﹪
样本比例的抽样规范为: ∧p σ=1
)1(---∧∧N n N n
p p =150********)64.01(64.0--⨯-⨯=6.45﹪ 由于n ∧p =500⨯64﹪=32>5,所以可以用正态散布树立总体合格率的置信区间。
置信率为95﹪
时,Z 2/α=1.96。
边沿误差为:
E= Z 2/α1
)1(---∧∧N n N n p p =1.9615005050050)64.01(64.0--⨯-⨯⨯=12.63﹪ 总体比例的置信区间为:∧
p ± Z 2/α1
)1(---∧∧N n N n p p =64﹪±12.63﹪ 即我们可以用95﹪的概念保证,该居民小区赞成革新的户数比例在51.37﹪~76.63﹪之间。
〔2〕当要求边沿误差不超越10﹪时,应抽取的样本容量为: n=)
1()()1()1()(22/222/ππππαα-+--Z E N Z N =%)
641(%64)96.1(%)10()1500(%)641(%64)96.1(500222-⨯⨯+⨯--⨯⨯⨯ =75.33≈76(户)
7、某超市想要估量每个顾客平均每次购物破费的金额。
依据过去的阅历,规范差大约为120元,现要求以95﹪的置信水平估量每个顾客购物金额的置信区间,要求边沿误差不超越20元,应抽取多少个顾客作为样本?
解答:
σ=120,边沿误差E=20,置信概率为95﹪时,Z 2/α=1.96。
应抽取的样本容量为: n=2222/)(E Z σα=22
220
)120()96.1(⨯=138.3≈139 8、某大学共有在校本科生8000人,学校想要估量每个先生一个月的生活费支出金额,预备采取不重复抽样方法。
依据前几届的毕业生资料,平均每个先生月生活费支出金额的规范差约为50元,假定本次估量确定的置信概率为95﹪,要求边沿误差不超越20元,应抽取多少名先生停止调查?
解答:N=8000,σ=50,边沿误差E=20,置信概率为95﹪时,Z 2/α=1.96。
应抽取的样本容量为: n=222/2222/)()1()(σσααZ E N Z N +-=2222
2)
50()96.1()20()18000()50()96.1(8000⨯+⨯-⨯⨯=23.94≈24 应抽24个先生作为样本。
9、某种饮料采用自动饮料机停止灌装,其重量的方差抵消费厂家来说时十分重要的。
假设方差太大,过度灌装或灌装缺乏,都会使顾客不满意。
一个可以接受的灌装方差为σ≤8〔灌装重量以克计〕。
为抵消费进程停止检测,厂家随机抽取了20个样品组成一个样本,测得样本方差为12。
取清楚性水平α=0.05,树立该灌装饮料重量方差的置信区间,并说明样天分否说明方差太大,需求对灌装机停止停产检验?
解答:总体方差2σ的置信区间为:
2/12222/22
)1()1(ααχσχ--≤≤-s n s n
依据清楚性水平α=0.05和自在度〔n -1〕=〔20-1〕=19,查2χ散布表得
852.32)19()1(0025.022/2==-χχαn ,907.8)19()1(975.022/12==--χχαn 。
总体方差2σ
的置信区间为:
907
.812)120(852.3212)120(2
22⨯-≤≤⨯-σ 即6.94≤2
σ≤25.6。
即该种灌装饮料总量的方差在6.94~25.6克之间。
由于方差下限超越了可以接受的灌装方差2σ≤8,所以需求停产反省。
第五章 检验你所提出的假定
〔一〕内容提要
本章主要引见假定检验的基本原理与方法。
与参数估量一样,假定检验是统计推断的,另一个重要内容。
它与叁数估量的区别是:在参数估量中,估量之前总体参数是未知的,从总体中抽出一个样本,然后应用样本所提供的信息估量总体参数的值;在假定检验中,检验之前总体参数也是未知的,但我们先对总体参数提出一个假定,然后抽取样本,应用样本所提供的信息检验这一假定能否成立。
与参数估量一样,在假定检验中,就一个总体而言,我们所关心的总体参数也主要是总体均值、比例和方差;关于两个总体,所关心的参数主要有两个总体的均值之差、两个总体的比例之差、两个总体的方差等。
本章我们要对这些内容区分引见。
思索到先生曾经学过假定检验的内容,在写法上注重于方法的运用。
检验的进程大体上为:对总体参数提出假定;选择检验的统计量;依据样本计算统计量的值;选择清楚性水平∂;依据统计量的值与清楚性水平下的临界值停止比拟,作出接受或拒绝原假定的决策。
检验的方法有单侧检验和双侧检验。
采用哪种检验,要看我们所关心的效果以及假定的详细方式。
假定检验所依据的是统计上的小概率原理。
所谓小概率,是指一个概率很小的值。
通常所运用的小概率值主要有0.01、0.05和0.1等。
一个简直不能够发作的事情在一次实验中发作的概率很小,假设它一旦发作,我们就有理由拒绝原来的假定。
当然,拒绝或接受假定都有能够犯错误。
在假定检验中,这类错误称为第一类错误,也叫∂错误,也成为风险;另一类错误是原假定为假,我们却接受了原假定,这类错误称为第二类错误,也称为β错误。
在实践运用中,我们主要控制第一类错误。
就一个总体而言,我们要检验的参数主要有总体均值μ、总体比例π和总体方差2σ。
关于两个总体参数的检验,统计量的计算比拟复杂。
在学习中,要求运用Excel 停止有关的
统计检验。
〔二〕学习要求
经过本章学习,要求掌握以下内容:
〔1〕了解假定检验的原理与统计思想,掌握假定检验与参数估量的区别。
〔2〕了解假定检验中的小概率原理。
〔3〕了解清楚性水平的含义。
〔4〕掌握假定检验的拒绝准那么。
〔5〕了解并运用P 停止检验。
〔6〕可以应用Excel 停止两个总体参数的统计检验。
并对Excel 的输入结果停止解释和剖析。
〔7〕能结合实践效果停止假定检验。
1、对原假定和备择假定的了解
原假定是我们要经过样本判别其能否成立的一个命题,用0H 表示;备择假定是与原假定相反的假定,通常用1H 表示。
在假定检验中,原假定与备择假定是一个完备事情组,两个假定必有一个成立,而且只要一个成立。
2、在双侧检验中,拒绝原假定的规那么是什么?
在双侧检验中,原假定为〝=〞,备侧假定为〝≠〞,因此拒绝域在散布的两个尾部。
运用正态散布停止检验时,假定检验的统计量Z>2/αZ 或Z<-2/αZ 时,拒绝原假定。
或许说,假定检验的统计量2/αZ Z >时,拒绝原假定。
当运用t 散布停止检验时,假定检验的统计量t>t 2/α或t<- t 2/α时,拒绝原假定。
或许说,假定检验的统计量2/αt t >时,拒绝原假定。
当运用2χ散布停止检验时〔对总体方差的检验〕,假定检验的统计量2χ>t 2/α或2χ<2/12αχ-时,拒绝原假定。
3、单侧检验中,拒绝原假定的规那么是什么?
单侧检验有左侧检验和右侧检验两种。
左侧检验的原假定为0H :参数≥某一数值。
因此其拒绝域在左侧。
假设检验的统计量值小于α水平下的临界值,那么拒绝原假定。
右侧检验的原假定为0H :参数≤某一数值。
因此其拒绝域在右侧。
假设检验的统计量值大于α水平下的临界值,那么拒绝原假定。
4、一种杂志宣称25﹪的读者为大先生。
一个由400名读者组成的随机样本说明,其中84名是大先生。
〔1〕在0.01的清楚性水平下,检验该杂志的说法能否成立?
〔2〕在0.05的清楚性水平下,会得出什么样的结论?
〔3〕在0.1的清楚性水平下,会得出什么样的结论?
解答:先计算出样本比例,结果如下: %21400
84==∧p
提出假定:0H :%25=π, %25:1≠πH
计算检验的统计量为: Z=848.1400)25.01(25.025.021.0)
1(-=-⨯-=--∧
n p πππ
〔1〕当α=0.01时,临界值2/αZ =2.58,由于58.2848.1<=Z ,不能拒绝0H :%25=π。
即该杂志的说法是成立的。
〔2〕当α=0.05时,临界值2/αZ =1.96,由于96.1848.1<=Z ,不能拒绝0H :%25=π。
即该杂志的说法是成立的。
〔3〕当α=0.1时,临界值2/αZ =1.65,由于65.1848.1>=Z ,应拒绝0H :%25=π。
即该杂志的说法是不成立的。
5、一种产品需求人工组装,每个工人组装产品数量的方差为100。
企业预备采用一种新的方法组装产品,以提高产品的数量,但管理人员希望新的方法组装产品的方差坚持原有的水平。
由25名工人组成一个随机样本说明,采用新方法组装产品数量的方差为120。
试以清楚性水平α=0.05,检验新方法组装产品数量的方差与原来的方法能否相反?
解答:提出假定:
0H :2σ=100 1H :2σ≠100。
计算检验统计量:
2χ=8.28100
120)125()1(022
=⨯-=-σs n 由于是双侧检验,拒绝原假定的法那么是:)1(2/122-<-n αχ
χ或)1(2/22->n αχχ。
查
表得分位数为 )1(2/22->n αχχ=3641.39)24(025.02=χ,由2χ=28.8<39.3641,因此接受原假定0H ,以95﹪的牢靠性以为新方法组装产品数量的方差与原来相反。
或许,查表得分位数为4011.12)24()1(975.022/12==--χχαn ,由2χ=28.8>12.4011,因此接受原假定0H ,以95﹪的牢靠性以为新方法组装产品数量的方差与原来相反。
6、某企业管理人员对采用两种方法组装新产品所需的时间〔分钟〕停止测试,随机抽取6个工人,让他们区分采用两种方法组装同一种产品,采用方法A 组装所需的时间和采用方法B 组装所需的时间如下表。
假定组装的时间听从正态散布,以α=0.05的清楚性水平比拟两种方法能否有差异。
方法A 方法B
8.2 9.5
5.3 8.3
6.5
7.5
5.1 10.9
9.7 11.3
10.8 9.3
解答:由于总体方差未知,所以应采用t 检验。
提出假定:0H :1μ-2μ=0 两种方法组装的时间没有差异
1H : 1μ-2μ≠0两种方法组装的时间有差异
将A 种方法组装时间的数据输入就任务表中的A2:A7,B 种方法组装时间的数据输入就任务表中的数据输入就任务表的B2:B7。
然后按以下步骤操作:
第一步:选择〝工具〞下拉菜单
第二步:选择〝数据剖析〞选项
第三步:在剖析工具中选择〝t 检验:平均值的成对二样本剖析〞
第四步:当出现对话框后
在〝变量1的区域〞方框内键入A2:A7
在〝变量2的区域〞方框内键入B2:B7
在〝假定平均差〞方框内键入0
在〝α〞方框内键入0.05
在〝输中选项〞中选择输入区域
选择〝确定〞。