统计学第二章 统计量及其分布 习题及答案
统计学第二章 统计量及其分布 习题及答案
3、根据自由度为4的t分布的密度函数,求出该密度函数的峰值,以及该分布期望与方差。
参考答案:
一、填空题
1、样本量,总体方差,4
2、32
3、F(1,5)4、Biblioteka .215、样本量,正态分布
二、选择题
1、C 2、D 3、B 4、B 5、C
三、判断题
1、F 2、F 3、T 4、F 5、F
第二章统计量及其分布习题
一、填空题
1、简单随机抽样样本均值 的方差取决于和_________,要使 的标准差降低到原来的50%,则样本容量需要扩大到原来的倍。
2、设 是总体 的样本, 是样本方差,若 ,则 ____________。
(注: , , , )
3、若 ,则 服从_______分布。
4、已知 ,则 等于___________。
四、计算题
1、(1) (2)0.8293(3)67
2、0.5
3、峰值3/8,期望0,方差2.
A、样本容量为10 B、抽样误差为2
C、样本平均每袋重量是统计量D、498是估计值
5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从
A B
C D
三、判断题
1、所有可能样本平均数的方差等于总体方差。()
2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。( )
3、设 ,则对任何实数 均有: .()
4、样本方差就是样本的二阶中心距。()
5、设随机变量X 与Y满足XN(0,1), Y ,则 服从自由度为n的t分布。
四、计算题
1、从正态总体 中随机抽取容量为36的样本,要求:
浙江大学统计学第二章习题及答案
一、单项选择题1.相关关系是指( )A .变量间的非独立关系 B. 变量间的因果关系C .变量间的函数关系 D.变量间不确定的依存关系2.进行相关分析时,假定相关的两个变量( )A .都是随机变量 B.都不是随机变量C.一个是随机变量,一个不是随机变量D.随机或不随机都可以3.下列各回归方程中,哪一个必定是错误的( )A .8.02.030ˆ=+=XY ii r X Y B. 91.05.175ˆ=+-=XY i i r X Y C .78.01.25ˆ=-=XY ii r X Y D. 96.05.312ˆ-=--=XY i i r X Y 4.产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为:X Y 5.1356ˆ-=,这说明: A .产量每增加一台,单位产品成本增加356元B .产量每增加一台,单位产品成本减少1.5元C .产量每增加一台,单位产品成本平均增加356元D .产量每增加一台,单位产品成本平均减少1.5元5.在总体回归直线X Y E 10)(ββ+=中,1β表示:A .当 X 增加一个单位时,Y 增加1β个单位B .当X 增加一个单位时,Y 平均增加1β个单位C .当Y 增加一个单位时,X 增加1β个单位D .当Y 增加一个单位时,X 平均增加1β个单位6.对回归模型110μββ++=i i X Y 进行统计检验时,通常假定i μ服从:A .),0(2i N σ B.t(n-2) C. ),0(2σN D.t(n)7.以Y 表示实际观测值,Yˆ表示回归估计值,则普通最小二乘法估计参数的准则是使:A .0)ˆ(=-∑i i Y Y B. 0)ˆ(2=-∑ii Y Y C. )ˆ(i i Y Y -∑最小 D. 2)ˆ(ii Y Y -∑最小 8.设Y 表示实际观测值,Yˆ表示OLS 回归估计值,则下列哪项成立:A .Y Y=ˆ B.Y Y =ˆ C.Y Y =ˆ D.Y Y =ˆ 9.用普通最小二乘法估计经典线性模型i i i X Y μββ++=10,则样本回归直线通过点:A .(X ,Y ) B.)ˆ,(YX C.)ˆ,(Y X D.),(Y X 10.以Y 表示实际值,Yˆ表示回归值,则普通最小二乘法估计得到的样本回归线ii X Y 10ˆˆˆββ+=满足: A .0)ˆ(=-∑ii Y Y B.0)(=-∑Y Y i C.0)ˆ(2=-∑i i Y Y D.0)(2=-∑Y Y i11.对于线性回归模型i i i X Y μββ++=10,要使普通最小二乘估计量具备线性特性,则模型必须满足:A .0)(=i E μ B.2)(σμ=i ar V (常数)C.0),(=j i ov C μμ D .X i 为非随机变量,与i μ不相关12.用一组有30个观测值的样本估计模型i i i X Y μββ++=10后,在0.05的显著性水平下对1β的显著性作t 检验,则1β显著地不等于0的条件是统计量t 大于:A .t 0.05(30) B.t 0.025(30) C.t 0.05(28) D.t 0.025(28)13.下列样本模型中,哪一个模型通常是无效的:A .C i (消费)=500+0.8I i (收入)B .i D Q (商品需求)=10+0.8I i (收入)+0.9P i (价格)C .i S Q (商品供给)=20+0.75P i (价格)D .Y i (产出量)=0.65)()(4.06.0劳动资本i i L K14.如图: i X 10ββ+图中“ ” 所指的距离是:A .Y Y i - B.i i Y Y ˆ- C.Y Y i-ˆ D.Y Y i -ˆ 15.判定系数r 2是指:A .剩余变差占总变差的比重 B.总变差占回归变差的比重C .回归变差占总变差的比重 D.回归变差占剩余变差的比重16.已知某一直线回归方程的判定系数为0.64,则解释变量与被解释变量间的线性相关系数为:A .0.64 B.0.8 C.0.4 D.0.3217.下列哪个为常数弹性模型:A .i i i X Y μββ++=ln ln ln 10 B. i i i X Y μββ++=10ln lnC .i i i X Y μββ++=ln 10 D. i ii X Y μββ++=)1(10 18.模型i i i X Y μββ++=ln ln ln 10中,1β的实际含义是:A .X 关于Y 的弹性 B.Y 关于X 的弹性C .X 关于Y 的边际倾向 D.Y 关于X 的边际倾向19.模型i i i X Y μββ++=ln 10中,Y 关于X 的弹性为:A .iX 1β B.i X 1β C.i Y 1β D.i Y 1β 20.相关系数r 的取值范围是:A .1≤r B.1-≥r C.11-≤≤r D.11≤≤-r21.判定系数的取值范围是:A .12-≤r B.12≥r C.102≤≤r D.112≤≤-r22.某一特定的X 水平上,总体Y 分布的离散度越大,即2σ越大,则:A .预测区间越宽,精度越低 B.预测区间越宽,预测误差越小C .预测区间越窄,精度越高 D.预测区间越窄,预测误差越大23.用一组有30个观测值的样本估计模型i i i i X X Y μβββ+++=22110后,在0.05的显著性水平上对1β的显著性作t 检验,则1β显著地不等于0的条件是统计量t 大于等于:A .t 0.05(30) B.t 0.025(28) C.t 0.025(27) D.F 0.025(1,28)二、多项选择题1.指出下列哪些现象是相关关系A .家庭消费支出与收入 B.商品销售额与销售量、销售价格C .物价水平与商品需求量 D.小麦亩产量与施肥量E .学习成绩总分与各门课程成绩分数2.以带“∧”表示估计值,μ表示随机误差项,如果Y 与X 为线性相关关系,则下列哪些是正确的:A .t t X Y βα+= B.t t t X Y μβα++=C .t t t X Y μβα++=ˆˆ D.t t t X Y μβα++=ˆˆˆ E.tt X Y βαˆˆˆ+= 3.以带“∧”表示估计值,μ表示随机误差项,e 表示残差。
数理统计教程课后重要答案习题
第一章:统计量及其分布19.设母体ξ服从正态分布N(),,2σμξ和2n S 分别为子样均值和子样方差,又设()21,~σμξN n +且与n ξξξ,,,21 独立, 试求统计量111+--+n n S nn ξξ的抽样分布. 解: 因为ξξ-+1n 服从⎪⎭⎫⎝⎛+21,0σn n N 分布. 所以()1,0~121N nn n σξξ+-+ 而()1~222-n nS nχσ且2n S 与ξξ-+1n 独立,, 所以()1~1111--÷+--+n t S n n n n S nnn σξξ分布. 即111+--+n n S nn εε服从()1-n t 分布. 20.(),,,1,,n i i i =ηξ是取自二元正态分布N()ρσσμμ222121,,,的子样,设()∑∑∑===-===n i i i ni n i i n S n n 12111,1,1ξξηηξξξ2,()2121∑=-=n i i n S ηηη和 ()()()()∑∑∑===----=ni i ni ii ni ir 12211ηηξξηηξξ试求统计量()122221--+---n S rS S S ηξηξμμηξ的分布.解: 由于().21μμηξ-=-E ()()=-+=-ηξηξηξ,c o v 2D D D nn nn2122212σσρσσ-+.所以()()n 212221212σρσσσμμηξ-+---服从()1,0N 分布 .()()()()()()()[]211212121222122ηξηξηηξξηηξξ---=----+-=-+∑∑∑∑====i ini i i ni i ni i ni S rS S S ni i ηξ-是正态变量,类似于一维正态变量的情况,可证ηξηξS rS S S 222-+与ηξ-相互独立.()()1~22221222122--+-+n S rS S S n χσρσσσηξηξ, 所以 统计量()122221--+---n S rS S S ηξηξμμηξ()()()()1)2(222122212221222121--+-+-+---=n S rS S S n nσρσσσσρσσσμμηξηξηξ服从()1-n t 分布.第二章:估计量1. 设n ξξ,,1 是来自二点分布的一个子样,试求成功概率p 的矩法估计量.解: p E =ξ ξ=∴pˆ 3. 对容量为n 的子样,求密度函数()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计3. 对容量为n 的子样,求密度函数 ()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计量. 解: ()322adx x a ax E a=-=⎰ξ 令ξ=3a 得ξ3ˆ=a . 4. 在密度函数 ()()10,1<<+=x x a x f a中参数a 的极大似然估计量是什么? 矩法估计量是什么? 解: (1) ()()()∏∏==+=+=ni i ni nni x x L 111ααααα ()i i x ∀<<1∴()().ln 1ln ln 1⎪⎪⎭⎫⎝⎛⋅++=∏=n i i x n L ααα令()0ln 1ln 1=++=∂∂∑=i ni x nL ααα, 得 ∑=--=ni iL xn1ln 1ˆα。
统计量及其分布练习题答案
统计量及其分布练习题答案一、选择题1. 以下哪个是描述集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 众数答案:C2. 在正态分布中,数据的分布特征是什么?A. 数据对称分布,均值等于中位数B. 数据不对称分布C. 数据集中在均值附近D. 数据集中在众数附近答案:A3. 以下哪个统计量用于衡量数据的离散程度?A. 均值B. 众数C. 方差D. 标准差答案:C4. 标准差与方差之间的关系是什么?A. 标准差是方差的平方B. 方差是标准差的平方C. 标准差是方差的立方D. 方差是标准差的立方答案:B5. 以下哪个分布是描述二项分布的?A. 正态分布B. 泊松分布C. 二项分布D. 均匀分布答案:C二、简答题1. 请简述正态分布的特点。
答案:正态分布是一种连续概率分布,其特点是数据分布呈对称的钟形曲线,均值、中位数和众数相等。
在正态分布中,约68%的数据位于均值±1个标准差的范围内,约95%的数据位于均值±2个标准差的范围内,几乎所有数据(99.7%)位于均值±3个标准差的范围内。
2. 什么是标准正态分布?答案:标准正态分布是一种特殊的正态分布,其均值为0,标准差为1。
它是一种标准化的正态分布,常用于转换原始数据,使其具有标准正态分布的特性,便于进行统计分析。
三、计算题1. 假设有一个样本数据集:2, 4, 6, 8, 10,计算其平均数和标准差。
答案:平均数 = (2+4+6+8+10)/5 = 6标准差 = sqrt(((2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2) / 5) = sqrt(20) ≈ 4.472. 给定一组数据:10, 12, 14, 16, 18, 20,求其方差。
答案:首先计算平均数 = (10+12+14+16+18+20)/6 = 15然后计算方差 = ((10-15)^2 + (12-15)^2 + ... + (20-15)^2) / 6 = 11.67四、应用题1. 某班级学生的数学成绩呈正态分布,均值为80分,标准差为10分。
统计学课后第二章习题答案
第2章练习题1、二手数据的特点是()A.采集数据的成本低,但搜集比较困难B. 采集数据的成本低,但搜集比较容易C.数据缺乏可靠性D.不适合自己研究的需要2、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样3、从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A.重复抽样B.不重复抽样C.分层抽样D.整群抽样4、一个元素被抽中后不再放回总体,然后从所剩下的元素中抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A.不重复抽样B.重复抽样C.系统抽样D.多阶段抽样5、在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为()A. 简单随机抽样B. 系统抽样C.分层抽样D.整群抽样6、先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。
这样的抽样方式称为()A. 分层抽样B. 简单随机抽样C.系统抽样D.整群抽样7、先将总体划分为若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为()A. 系统抽样B. 多阶段抽样C.分层抽样D.整群抽样8、为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方是()A. 简单随机抽样B. 整群抽样C.系统抽样D.分层抽样9、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A. 系统抽样B. 简单随机抽样C.分层抽样D.整群抽样10、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是?()A.分层抽样B. 整群抽样C.系统抽样D.简单随机抽样11、为了了解女性对某种化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。
数理统计第二章课后习题参考答案
第二章 参数估计2.4 设子样1.3,0.6,1.7,2.2,0.3,1.1是来自具有密度函数()1f x ββ=;,0x β<<的总体,试用矩法估计总体均值、总体方差及参数β. 解: 1.30.6 1.7 2.20.3 1.1 1.26X μ+++++===.()()()()()()()22222222111 1.3 1.20.6 1.2 1.7 1.2 2.2 1.20.3 1.2 1.1 1.26ni i X X n σ=⎡⎤=-=-+-+-+-+-+-⎣⎦∑ ()222222210.10.60.510.90.10.4076σ=+++++==. ()()0112E X x f x dx xdx ββββ+∞-∞===⎰⎰;.令()E X X =,则12X β=,即2X β=.参数β的矩估计量为ˆ22 1.2 2.4X β==⨯=.2.6 设总体X 的密度函数为()f x θ;,1X ,2X ,…,n X 为其样本,求下列情况下θ的MLE.(iii )()()100x x e x f x ααθθαα--⎧>⎪=⎨⎪⎩,;,其它α已知解:当0i X >()12i n = ,,,时,似然函数为: ()()()()111111ni i i n n n x n x i i i i i i L f x x e x eαααθθαθθθαθα=----===∑⎛⎫=== ⎪⎝⎭∏∏∏;.()()11ln ln ln 1ln n ni i i i L n n x x αθθααθ===++--∑∑.由()1ln 0ni i L nx αθθθ=∂=-=∂∑,得θ的MLEˆθ,即1ˆnii nxαθ==∑.2.7 设总体X 的密度函数为()()1f x x ββ=+,01x <<,1X ,2X ,…,n X 为其子样,求参数β的MLE 及矩法估计。
今得子样观察值为0.3,0.8,0.27,0.35,0.62及0.55,求参数β的估计值。
统计学复习题1
第一章绪论一、填空1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。
2、由一组频数2,5,6,7得到的一组频率依次是0。
1 、0.25 、0。
3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变.3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。
4、如果各组相应的累积频率依次为0。
2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。
5、中位数eM可反映总体的集中趋势,四分位差DQ.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是5。
5,众数为 5 。
6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。
四、计算题1、某班的经济学成绩如下表所示:43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么?(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布?(3)上四分位数和下四分位数所在区间?要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。
(2)说明成年组和青少年组平均身高的代表性哪个大?为什么?要求:试比较哪个单位的职工工资差异程度小.8、一家公司在招收职员时,首先要通过两项能力测试.在A 项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
概率论与数理统计第二章习题及答案
概率论与数理统计习题 第二章 随机变量及其分布习题2-1 一袋中装有5只球,编号为1,2,3,4,5.在袋中同时取3只,以X 表示取出的3只球中的最大号码,写出X 随机变量的分布律.解:X 可以取值3,4,5,分布律为1061)4,3,2,1,5()5(1031)3,2,1,4()4(1011)2,1,3()3(352435233522=⨯====⨯====⨯===C C P X P C C P XP C C P X P 中任取两球再在号一球为中任取两球再在号一球为号两球为号一球为也可列为下表X : 3, 4,5 P :106,103,101习题2-2 进行重复独立试验,设每次试验成功的概率为p ,失败的概率为p -1)10(<<p .(1)将试验进行到出现一次成功为止,以X 表示所需的试验次数,求X 的分布律.(此时称X 服从以p 为参数的几何分布.)(2)将试验进行到出现r 次成功为止,以Y 表示所需的试验次数,求Y 的分布律.(此时称Y 服从以p r ,为参数的巴斯卡分布.)(3)一篮球运动员的投篮命中率为%45.以X 表示他首次投中时累计已投篮的次数,写出X 的分布律,并计算X 取偶数的概率.解:(1)P (X=k )=qk -1p k=1,2,……(2)Y=r+n={最后一次实验前r+n -1次有n 次失败,且最后一次成功},,2,1,0,)(111 ===+=-+--+n p q C p p q C n r Y P r n n n r r n n n r 其中 q=1-p , 或记r+n=k ,则 P {Y=k }= ,1,,)1(11+=----r r k p p C rk r r k(3)P (X=k ) = (0.55)k -10.45k=1,2…P (X 取偶数)=311145.0)55.0()2(1121===∑∑∞=-∞=k k k k X P习题2-3 一房间有同样大小的窗子,其中只有一扇是打开的。
统计量及其分布练习题答案
统计量及其分布练习题答案统计量及其分布练习题答案统计学是一门研究数据收集、分析和解释的学科,统计量是统计学中的重要概念。
统计量是根据样本数据计算出来的数值,用于描述总体或样本的特征。
在统计学中,我们经常使用统计量来推断总体的特征,并进行假设检验。
下面是一些统计量及其分布的练习题及其答案,希望对你的学习有所帮助。
1. 设X1, X2, ..., Xn是来自总体X的一个样本,其均值为μ,方差为σ²。
证明样本均值X̄和样本方差S²是总体均值μ和总体方差σ²的无偏估计。
答案:首先,样本均值X̄的期望值为E(X̄) = μ。
这是因为样本均值是所有样本观测值的总和除以样本容量n,而总体均值μ是所有总体观测值的总和除以总体容量N。
由于样本是从总体中随机抽取的,每个样本观测值都有相同的机会被选中,所以样本均值的期望值等于总体均值。
其次,样本方差S²的期望值为E(S²) = σ²。
这是因为样本方差是每个样本观测值与样本均值之差的平方和的平均值。
由于样本是从总体中随机抽取的,每个样本观测值都有相同的机会被选中,所以样本方差的期望值等于总体方差。
综上所述,样本均值X̄和样本方差S²是总体均值μ和总体方差σ²的无偏估计。
2. 在一个制药公司的质量控制部门,每天从生产线上随机抽取10个药片进行检验,得到的药片重量(单位:克)如下:12.1, 11.9, 12.5, 12.3, 12.2, 12.0, 11.8, 12.4, 12.1, 12.3计算样本均值、样本方差和样本标准差。
答案:样本均值的计算公式为X̄ = (12.1 + 11.9 + 12.5 + 12.3 + 12.2 + 12.0 + 11.8 + 12.4 + 12.1 + 12.3) / 10 = 12.2克。
样本方差的计算公式为S² = [(12.1 - 12.2)² + (11.9 - 12.2)² + (12.5 - 12.2)² + (12.3 - 12.2)² + (12.2 - 12.2)² + (12.0 - 12.2)² + (11.8 - 12.2)² + (12.4 - 12.2)² + (12.1 - 12.2)² + (12.3 - 12.2)²] / (10 - 1) ≈ 0.032克²。
统计学(第三版)课后答案 袁卫等主编
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
数理统计课后答案-第二章
证
(1) X n +1 =
= (1 −
(2)
1 1 1 )X n + X n +1 = X n + ( X n +1 − X n ) ; n +1 n +1 n +1 1 n +1 2 1 n +1 2 2 ( X − X ) = Xi − Xn ∑ ∑ +1 i n +1 n + 1 i =1 n + 1 i =1
1
(1)求样本均值 X ,修正样本方差 S * ,修正样本标准差 S * ,样本方差 S 和样本标准 差 S 的观测值; (2)求样本极差 R 和样本中位数 med( X 1 , L , X n ) 的观测值。 解 (1) 用计算器的统计功能可以求得 X = 2.125 , S * = 0.017127 , S * = 0.00029333 ,
2
1 n 1 X i − na ∑ n n X − a n i =1 1 X −a 1 n = = 解 (1) Y = ∑ Yi = ∑ i ; n i =1 b b n i =1 b
(2) S y =
2
1 n 1 n Xi − a X − a 2 1 2 ( Y − Y ) = ( − ) = 2 ∑ ∑ i n i =1 b b n i =1 nb
2
( X1 + X 2 )2 ( X 3 + X 4 + X 5 )2 ⎛ X1 + X 2 ⎞ ⎛ X 3 + X 4 + X 5 ⎞ 2 ~ χ ( 2) 。 =⎜ ⎟ + ⎟ +⎜ ⎜ ⎟ 2 3 2 ⎠ ⎝ 3 ⎝ ⎠
可见,只有当 a = 布,其自由度为 2。 (2) 因为 X 1 ~ N (0 ,1) , X 2 ~ N (0 ,1) , X 1 , X 2 相互独立,所以由 χ 分布的定义可知
统计学各章节试题
、中位数可反映总体的趋势,四分位差可反映总体的7、以下数字特征不刻画分散程度的是A、极差B、离散系数C、中位数D、标准差8、已知总体平均数为200,离散系数为0.05,则总体方差为A、 B、10 C、100 D、0.19、两个总体的平均数不相等,标准差相等,则A、平均数大,代表性大B、平均数小,代表性大C、两个总体的平均数代表性相同D、无法判断10、某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128元、148元、200元,计算结果均值为元,标准差为A、σ=33B、σ=34C、σ=34.23D、σ=3511、已知方差为 100 ,算术平均数为 4 ,则标准差系数为A、10B、2.5C、25D、无法计算12、有甲乙两组数列,若A、1<21>2,则乙数列平均数的代表性高B、1<21>2,则乙数列平均数的代表性低C、1=21>2,则甲数列平均数的代表性高D、1=21<2,则甲数列平均数的代表性低13、某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为A、右偏B、左偏C、对称D、不能作出结论14、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用A、众数B、中位数C、四分位数D、均值15、如果你的业务是提供足球运动鞋的号码,哪一种平均指标对你更有用?A、算术平均数B、几何平均数C、中位数D、众数三、判断1、已知分组数据的各组组限为:10~15,15~20,20~25,取值为15的这个样本被分在第一组。
()2、将收集到得的数据分组,组数越多,丧失的信息越多。
()3、离散变量既可编制单项式变量数列,也可编制组距式变量数列。
)4、从一个总体可以抽取多个样本,所以统计量的数值不是唯一确定的。
()5、在给定资料中众数只有一个。
数理统计课后习题答案第二章
30.解:由题意用U统计量
计算得置信区间为
把
代入计算得置信区间
31.解:由题意, 未知,则
则
经计算得
解得 的置信区间为
查表:
带入计算得 的置信区间为: 。
32.
解: 未知,则 即:
有: 则单侧置信下限为:
将 带入计算得
即钢索所能承受平均张力在概率为 的置信度下的置信下限为 。
33.解:总体服从(0,1)分布且样本容量n=100为大子样。
令 为样本均值,由中心极限定理
又因为 所以
则相应的单侧置信区间为 ,
将 =0.06
代入计算得所求置信上限为0.0991
即为这批货物次品率在置信概率为95%情况下置信上限为0.0991。
34.解:由题意:
解得 的单侧置信上限为
其中n=10, =45,查表 3.325
。一元回归的线性模型为 试求 , 的最小二乘估计。
8.对于自变量和因变量都分组的情形,经验回归直线的配置方法如下:对 和 作 次试验得 对试验值,把自变量的试验值分成 组,组中值记为 ,各组以组中值为代表;把因变量的试验值分为 组,组中值记为 ,同样地各组以组中值为代表。如果 取 有 对, , ;而 。用最小二乘法配直线 ,试求 的估计量23
77
7
9.4
44
46
81
8
10.1
31
117
93
9
11.6
29
173
93
10
12.6
58
112
51
11
10.9
37
111
76
12
统计学第三版书后答案第二章
第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见Excel练习题2.9)x=xn∑=822330=274.1(万元)或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。
在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:M e=2722732+=272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而:Q L=261+2732724-=261.25(万元)同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:Q U=291-2732724-=290.75(万元)。
(2)未分组数据的标准差计算公式为:s =302 1()1iix xn=--∑利用上公式代入数据计算是个较为复杂的工作。
手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。
(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。
数理统计之统计量及其分布(习题)
计算题、证明题1. 设(x 1,2x ,…,n x )及(1u ,2u ,…,n u )为两组子样观测值,它们有如下关系i u =ba x i -(ab ,0≠都为常数)求子样平均值u与x ,子样方差2u s 与2x s 之间的关系.解:b ax a x n b b a x n u i n n u i i i-=⎪⎭⎫ ⎝⎛-=-===∑1121121 ().11122222x i i us bb a x b a x n u u n S =⎪⎭⎫ ⎝⎛---∑=-∑= 2. 若子样观测值1x ,2x ,…,m x 的频数分别为1n ,2n ,…,m n ,试写出计算子样平均值x 和子样方差2n s 的公式 (这里n =1n +2n +…+m n ).解: ∑∑∑======m j m j jj j jm j j j x f x n n x n n x 1111()()()221221x x f x x n n x x n n S j j j j m j j j n-=-=-=∑∑∑= 其中nn f j j =,m j ,,2,1 =是j x 出现的频率。
3.利用契贝晓夫不等式求钱币需抛多少次才能使子样均值ξ落在0.4到0.6之间的概率至少为0.9 ? 如何才能更精确的计算使概率接近0.9所需抛的次数 ? 是多少? 解: 设需抛钱币n 次,第i 次抛钱币结果为n i i i i ,,2,101 =⎩⎨⎧=次抛出反面第次抛出正面第ξ, 则iξ独立同分布.且有分布()1,0,21===x x Piξ 从而41,21==i i D E ξξ。
设∑=i nξξ1是子样均值.则nD E 41,21==ξξ. 由契贝晓夫不等式()()()().9.0410011.011.01.05.01.06.04.02=-=-≥<-=<-<-=<<nD E P P P ξξξξξ2504.0100==∴n , 即需抛250次钱币可保证()9.06.04.0≥<<εP 为更精确计算n 值,可利用中心极限定理()()..9.012.02415.06.0415.0415.04.06.04.0≥-Φ=⎪⎪⎪⎪⎭⎫ ⎝⎛-<-<-=<<n n n n P P ξξ645.12.0≥∴n 68≥∴n . 其中()x Φ是()1,0N 的分布函数.4. 若一母体ξ的方差2σ= 4, 而ξ是容量为100的子样的均值. 分别利用契夫晓夫不等式和极限定理求出一个界限, 使得ξ-μ (μ为母体ξ的数学期望E ξ) 夹在这界线之间的概率为0.9.解:设此界限为.ε由()9.012=-≥<-εξεμξDP由此.6325.04.0.10041.022≈=∴===εσξεnD 由中心极限定理,().9.012=-⎪⎪⎭⎫⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛<-=<-ξεξεξμξεμξD D D P P.645.1.95.0=∴=⎪⎪⎭⎫⎝⎛ΦξεξεD D .329.01004645.1=⨯=ε 5.假定1ξ和2ξ分别是取自正态母体N (μ,2σ)的容量为n 的两个子样(n 11211,,,ξξξ ),和(n 22221,,,ξξξ )的均值,确定n 使得两个子样均值之差超过σ的概率大约为0.01.解: ⎪⎪⎭⎫ ⎝⎛nN i 2,~σμξ .2,1=i 且相互独立.,所以⎪⎪⎭⎫⎝⎛-n N 2212,0~σξξ于是()01.021222222121=⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛Φ-=⎪⎪⎪⎪⎪⎭⎫⎝⎛>-=>-n n n P P σσσξξσξξ .005.02=⎪⎪⎭⎫⎝⎛-Φ∴n .258.2⨯=n .14=n6.设母体ξ~N(μ,4 ),(n ξξξ,,,21 )是取自此母体的一个子样, ξ为子样均值,试问:子样容量n应取多大,才能使 (1) E (μξ-2)1.0≤;(2) E (μξ-)1.0≤; (3) P (μξ-1.0≤)95.0≥.解: (1)().401.04.1.042=≥∴≤==-n n D Eξμξ(2)()dx e x nE nx 22221μμπμξ--∞+∞--=-⎰=.1.0242262≤=-∞∞-⎰ndu e nπμπμ .255≥∴n(3)().95.021.021.0≥⎪⎪⎭⎫⎝⎛≤-=≤-n n P P μεμε.96.121.0≥n 1537≥n .7. 设母体()p b ,1~ξ(两点分布), (n ξξξ,,,21 )是取自此母体的一个子样, ξ为子样均值,若P =0.2,子样容量n 应取多大,才能使(1)P()1.0≤-p ξ;75.0≥ (2)E (丨p -ξ丨2).01.0≤若P ()1.0∈为未知数,则对每个p ,子样容量n 应取多大才能使E (丨p -ξ丨2).01.0≤解: (1) 要()().75.03.01.01.02.0≥≤≤=≤-ξξP P当n10=时,∑=ni i1ξ服从二项项分布().2.0,10,k b查二项分布表知().75.07717.01074.08791.0313.01.0101>=-=⎪⎭⎫⎝⎛≤≤=≤≤∑=i i P P ξξ所以n 应取10.(2)()np p D P E -==1.ξξ当2.0=p 时 ().16.01.016.02≥∴≤==-n n D p E ξξ(3) 当P 未知时,()()01.012≤-==-np p D pE ξξ由此知, ()p p n -≥1100, 要对一切()1,0∈p 此时均成立.只要求p 值使()p p -1最大, 显然当21=p , ()411=-p p 最大,.所以当2541100=⨯≥n 时,对一切p 的不等式均能成立.8 设母体ξ的k 阶原点矩和中心矩分别为k v =E ξk ,k μ=E()k E ξξ-,k =1,2,3,4,k1ξ和k m 分别为容量n 的子样k 阶原点矩和中心矩, 求证:(1) E()31νξ-=23nμ; (2) E()41νξ-=223nμ+32243n μμ-.解:()()()()()1213113311313[11νξνξνξνξνξ--+-=⎥⎦⎤⎢⎣⎡-=-∑∑∑≠==j i j i n i i n i E n n E E ++()()()]111γξγξγξ---∑k j iE注意到n ξξξ,,,21 独立, 且()0111=-=-νννξi E .,,2,1n i =所以().13231μνξn E=- ()()()()()()+--+--+-=-∑∑∑≠≠=2121131414144134[1νξνξνξνξνξνξj i ji j i j i i i E E n E()()()()()()()]111111216νξνξνξνξνξνξνξ----+---∑∑≠≠≠≠≠l k j ilk j i k j i kj i E E=().3313132242222443nn n n n n μμμμμ-+=-+ 9. 设母体ξ~N()2,σμ,子样方差2nS =n1()21∑=-ni iξξ, 求E 2n S ,D 2n S 并证明当n 增大时,它们分别为2σ+⎪⎭⎫ ⎝⎛n 1ο和n 42σ+⎪⎭⎫⎝⎛n 1ο.解: 由于().1~222-n nS nχσ所以()()()121.1122-=--=-n n DX n n E χ⎪⎭⎫ ⎝⎛+=-=⎪⎪⎭⎫ ⎝⎛=∴2222222101n n n nS E n ES n nσσσσ().10212244222242⎪⎭⎫ ⎝⎛+=-=⎪⎪⎭⎫ ⎝⎛=n n n n nS D n DS n nσσσσ .10. 设()21,ξξ为取自正态母体ξ~N ()2,σμ的一个子样, 试证: ξ1+ξ2,ξ1-ξ2是相互独立的. 证:()()()()()()()().,cov 21212221212121212121ξξξξξξξξξξξξξξξξξξ-+--=-+--+=-+E E E E E E E由于ξ1,ξ2 ~N ()2,σμ, 所以. E 212221,ξξξξE E E ==即()0,cov 2121=-+ξξξξ 又()2212,2~σμξξN + ,().2.0~221σξξN -所以由两个变量不相关就推出它们独立.11.设母体ξ的分布函数为F()x ,()n ξξξ,,,21 是取自此母体的一个子样,若F ()x 的二阶矩存在,ξ为子样均值,试证ξ1--ξ与ξj --ξ的相关系数ρ=11--n ,j i ≠,.,,2,1,n j i = 证 由于ξ的二阶矩存在,不妨设.μξ=E 2σξ=D()()()()()j i D E D i j i i j i ≠---=---=,,cov ξξξξξξξξξξξξρ()()().11111122222221σσξξξξξξn n n n n D n D n n n D D j ij in i i i i -=-+-=+-=⎪⎭⎫ ⎝⎛-=-∑∑≠=()()nE n E E E E E n j j i j i j i j i 221222σμξξμξξξξξξξξξξξ++⎪⎪⎭⎫ ⎝⎛-=+--=--∑=()[]n n n n E E E n n j i i j i 22222222212222σμσμσμξξξσμ-=-++-+=⎪⎪⎭⎫ ⎝⎛+-+=∑≠.11122--=--=∴n nn n σσρ12. 设ξ和2n S 分别是子样()n ξξξ,,,21 的子样均值和子样方差,现又获得第n +1个观测值,试证: (1)ξn+1=ξn +11+n (ξn+1-ξn );(2)12+n S =()⎥⎦⎤⎢⎣⎡-++++212111n n n n S n n ξξ. 证 (1)()()n n nn n n i i n n n n n ξξξξξξξ-++=++=+=+++=+∑11111111111()()()()2111211121112111111111)2(⎥⎦⎤⎢⎣⎡-+--+=-+-+=-+=++-++-++-+∑∑∑n n n i n i n n n i n i n i n i n n n n n S ξξξξξξξξξξ()()()()()()()21211121211112{11n n n n n n n i n i n n n i ni n n n n ξξξξξξξξξξξξ-+++-⨯⎥⎦⎤⎢⎣⎡-+-+--+-+=+++-+-∑∑=()().112122n n n n n S n n ξξ-++++ 13. 从装有一个白球、两个黑球的罐子里有放回地取球, 令ξ=0表示取到白球, ξ=1表示取到黑球.求容量为5的子样()51,,ξξ 的和的分布,并求子样均值ξ和子样方差2n S 的期望值.解:i ξ相互独立都服从二点分布,32;1⎪⎭⎫⎝⎛b E i ξ=.32 D .92=i ξ 5,2,1 =i所以,32=ξE .4589212=⨯-=n n ES n 521ξξξη+++= 服从二项分布.32;5⎪⎭⎫ ⎝⎛b 其分布列().313255kkk k p -⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛==η.5,2,1,0 =k14. 设母体ξ服从参数为λ的普哇松分布, ()n ξξξ,,,21 是取自此母体的一个子样,求: (1)子样的联合概率分布列:(2)子样均值ξ的分布列、E ξ、D ξ、和E 2n S 。
统计学习题及答案(完整)2
统计学习题及答案(完整)2第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数B.标准差C.几何均数D.中位数E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n 外,还可计算,S 和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
数理统计教程第二章课后习题答案
数理统计第二章习题解答1.设n ξξ,,1 是来自二点分布的一个子样,试求成功概率p 的矩法估计量.解: p E =ξ ξ=∴pˆ 2. 已知母体ξ均匀分布于()βα,之间,试求βα,的矩法估计量.解: 2βαξ+=E ,()122αβξ-=D 。
令()⎪⎪⎩⎪⎪⎨⎧=-=+22122n S αβξβα得 n S 3ˆ-=ξα,.3ˆnS +=ξβ 3. 对容量为n 的子样,求密度函数 ()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计量.解: ()322adx x a a x E a=-=⎰ξ 令ξ=3a 得ξ3ˆ=a . 4. 在密度函数 ()()10,1<<+=x x a x f a 中参数a 的极大似然估计量是什么? 矩法估计量是什么? 解: (1) ()()()∏∏==+=+=ni i ni nni x x L 111ααααα ()i ix∀<<1∴()().ln 1ln ln 1⎪⎪⎭⎫ ⎝⎛⋅++=∏=n i i x n L ααα 令()0ln 1ln 1=++=∂∂∑=i ni x nL ααα,得 ∑=--=ni iL xn1ln 1ˆα。
由于 ()01ln 222<+-=∂∂ααnL 故∑=--=ni iL xn1ln 1ˆα是α极大似然估计.(2) 由211+-=αξE 令ξα=+-211 得 .112ˆξξα--=5.用极大似然法估计几何分布 ()(),2,1,11=-==-k p p k P k ξ中的未知参数p .解:()()n x ni p p p L -∑-=1,令 ()01ln =---=∂∂∑pn x p n p p L i 得x p1ˆ=而01ln 2ˆ2<--=∂∂=x x n p Lpp ξ1ˆ=∴p是P 的极大似然估计. 6. 设随机变量ξ的密度函数为()0,,21>∞<<-∞=-σσσx e x f x,n ξξ,,1 是ξ的容量为n 的子样,试求σ的极大似然值. 解: ()()∑=--ix neL σσσ12,()01ln 2=+-=∂∂∑i x n L σσσσ。
统计量及其分布练习题答案
统计量及其分布练习题答案一、选择题1. 在统计学中,以下哪个不是描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差2. 标准正态分布的均值和标准差分别是多少?A. 0, 1B. 1, 0C. 1, 1D. 0, 03. 下列哪个分布是对称的?A. 泊松分布B. 二项分布C. 正态分布D. 指数分布4. 以下哪个统计量用于衡量数据的离散程度?A. 均值B. 方差C. 众数D. 中位数5. 假设检验中的P值是什么?A. 检验统计量B. 拒绝原假设的概率C. 接受原假设的概率D. 样本均值二、填空题6. 统计量是用来______数据集特征的数值,包括集中趋势、离散程度等。
7. 当总体很大时,我们通常使用______来估计总体参数。
8. 正态分布的密度函数表达式为f(x)=1/(σ√(2π))e^(-(x-μ)²/(2σ²)),其中μ是______,σ是______。
9. 样本均值的抽样分布是______分布,当样本容量足够大时,根据中心极限定理,即使总体不是正态分布,样本均值的分布也近似为正态分布。
10. 假设检验的基本步骤包括:提出原假设H0、提出备择假设H1、选择适当的______和______、计算检验统计量、确定P值、做出决策。
三、简答题11. 请简述正态分布的三个主要特征。
12. 什么是样本均值的分布?为什么样本均值的分布对于统计推断很重要?13. 什么是P值?它在假设检验中的作用是什么?14. 请解释什么是置信区间,并简述其在统计推断中的应用。
四、计算题15. 某班级有50名学生,他们的平均成绩为85分,标准差为10分。
如果从这个班级随机抽取一个样本容量为5的学生,求这个样本均值的期望值和标准误差。
16. 假设一个总体服从正态分布,总体均值μ=100,总体标准差σ=15。
如果从这个总体中随机抽取一个样本容量为100的样本,求样本均值的95%置信区间。
统计量的分布与性质例题和知识点总结
统计量的分布与性质例题和知识点总结在统计学中,统计量的分布与性质是非常重要的概念。
理解它们对于进行有效的数据分析和推断至关重要。
接下来,让我们通过一些具体的例题来深入探讨这部分知识。
首先,我们来明确一下什么是统计量。
统计量是指样本的函数,也就是通过对样本数据进行计算得到的量。
常见的统计量包括样本均值、样本方差、样本标准差等等。
我们先来看一个关于样本均值分布的例题。
假设从一个正态总体中抽取了一个样本容量为 n 的样本,已知总体的均值为μ,方差为σ²。
那么样本均值的分布是什么呢?根据中心极限定理,当样本容量 n 足够大时(通常n ≥ 30),样本均值的分布近似服从正态分布,其均值为总体均值μ,方差为总体方差σ² / n 。
例如,从一个均值为 50,方差为 25 的正态总体中抽取一个样本容量为 100 的样本,那么样本均值的均值仍然是 50,而方差为 25 / 100 = 025,标准差为 05 。
接下来,我们看一个关于样本方差分布的例题。
同样从上述正态总体中抽取样本容量为 n 的样本,样本方差 S²的分布是什么呢?样本方差 S²乘以(n 1) 再除以总体方差σ² 服从自由度为(n 1)的卡方分布,即服从自由度为(n 1) 的卡方分布。
再比如,已知一个总体的均值为 10,方差为 4,抽取样本容量为 20 的样本,计算样本方差 S²,并判断其分布。
首先求出,根据卡方分布的性质,可以知道它服从自由度为 19 的卡方分布。
了解了这些例题,我们来总结一下统计量分布的一些重要性质。
样本均值具有以下性质:1、它是总体均值μ 的无偏估计,即 E( )=μ 。
2、对于独立同分布的样本,样本均值的方差随着样本容量的增大而减小,这意味着样本容量越大,样本均值对总体均值的估计就越准确。
样本方差 S²具有的性质包括:1、它是总体方差σ² 的无偏估计,即 E(S²) =σ² 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 统计量及其分布 习题
一、填空题
1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)
3、若(5)X t ,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,
二、选择题
1、中心极限定理可保证在大量观察下
A 样本平均数趋近于总体平均数的趋势
B 样本方差趋近于总体方差的趋势
C 样本平均数分布趋近于正态分布的趋势
D 样本比例趋近于总体比例的趋势
2、设随机变量()(1)X t n n >,则21/Y X =服从2
1/Y X = 。
A 正态分布
B 卡方分布
C t 分布
D F 分布
3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A 68.27%
B 90%
C 95.45%
D 99.73%
4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )
A 、样本容量为10
B 、抽样误差为2
C 、样本平均每袋重量是统计量
D 、498是估计值
5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从
A (100/,25)N n
B N
C (100,25/)N n
D (100,N
三、判断题
1、所有可能样本平均数的方差等于总体方差。
( )
2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
( )
3、设),0(~2σN X ,则对任何实数,a b 均有:22
~(,)aX b N a b a σ++.( )
4、样本方差就是样本的二阶中心距。
( )
5、设随机变量X 与Y 满足X ~ N(0,1), Y ~2()n χ, 则/X 服从自由度为n 的t 分
布。
四、计算题
1、从正态总体2(52,6.3)N 中随机抽取容量为36的样本,要求:
(1)求样本均值x 的分布;
(2)求x 落在区间(50.8,53.8)内的概率;
(3)若要以99%的概率保证|52|2x -<,试问样本量至少应取多少?
2、设随机变量(,)X F n n ,计算(1)P X <
3、根据自由度为4的t 分布的密度函数,求出该密度函数的峰值,以及该分布期望与方差。
参考答案:
一、填空题
1、样本量,总体方差,4
2、32
3、F(1,5)
4、0.21
5、样本量,正态分布
二、选择题
1、C
2、D
3、 B
4、 B
5、C
三、判断题
1、F
2、F
3、T
4、F
5、F
四、计算题
1、(1)2(52,6.3/36)(52,1.1025)N N =(2)0.8293 (3)67
2、0.5
3、峰值3/8, 期望0,方差2.。