人大版统计学 习题加答案第四章 假设检验
假设检验与方差分析 习题及答案
第七章 假设检验与方差分析 习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。
2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。
3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。
4. 单侧检验:备择假设符号为大于或小于时的假设检验。
5. 显著性水平:原假设为真时,拒绝原假设的概率。
6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。
二、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 在任何情况下,假设检验中的两类错误都不可能同时降低。
( × ) 样本量一定时2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t 检验均可使用,且两者检验结果一致。
( √ )3. 方差分析中,组间离差平方和总是大于组内离差平方和。
( × )不一定4. 在假设检验中,如果在显著性水平0.05下拒绝了00:μμ≤H ,则在同一水平一定可以拒绝假设00:μμ=H 。
( × )不一定5. 为检验k 个总体均值是否显著不同,也可以用t 检验,且与方差分析相比,犯第一类错误的概率不变。
( × )会增加6. 方差分析中,若拒绝了零假设,则认为各个总体均值均有显著性差异。
( × ) 不完全相等六、简答题根据题意,用简明扼要的语言回答问题。
1. 假设检验与统计估计有何区别与联系?【答题要点】假设检验是在给定显著性水平下,计算出拒绝域,并根据样本统计量信息来做出是否拒绝零假设的决策;区间估计是利用样本信息来推断总体参数的一个可能范围。
区间估计结果可以用于假设检验,但假设检验不能用作区间估计。
2. 双侧检验与单侧检验有什么区别?【答题要点】双侧检验的零假设为等号,备择假设为不等号,得到的拒绝域为双侧的;单侧检验的备择假设或者是大于,或者是小于,其拒绝域为单侧区间。
人大版统计学 习题加答案第四章 假设检验
第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。
5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。
(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。
KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。
统计学第四章课后习题答案
第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。
从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。
3、简述四分位数的计算方法。
答:四分位数是一组数据排序后处于25%和75%位子上的值。
四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。
中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。
它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。
4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。
当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。
5、简述众数、中位数、平均数的特点和应用场合。
答:众数是数据中出现次数次数最多的变量值。
主要应用于分类数据。
中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。
平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。
6、简述异众比率、四分位差、方差、标准差的使用场合。
答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。
四分位差主要用于测度顺序数据的离散程度。
方差和标准差适用于测度数值型数据的离散程度。
7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。
其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。
还有就是在假设检验和估计中应用。
统计学人大第四版课后答案
3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:接收频率E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收频数频率(%)累计频率(%)C 32 32 32B 21 21 53D 17 17 70E 16 16 86A 14 14 1005101520253035CDBAE204060801001203.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:()l g 40l g () 1.60206111 6.32l g (2)l g 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
统计学教案习题04总体均数的估计和假设检验
第四章 总体均数的估计和假设检验一、教学大纲要求(一) 掌握内容1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。
(二) 熟悉内容 两样本方差齐性检验。
(三) 了解内容1. t 分布的图形与特征;2. 总体方差不等时的两样本均数的比较; 3. 等效检验。
二、教学内容精要(一) 基本概念 1. 抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。
统计上用标准误(standard error ,SE )来衡量抽样误差的大小。
不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。
均数的标准误与标准差的区别见表4-1。
表4-1 均数的标准误与标准差的区别均数的标准误标准差意义 反映的抽样误差大小 反映一组数据的离散情况 记法X σ(样本估计值X S )σ(样本估计值S )计算X σ=nσ X S =nSσ =nX 2)(∑-μS=1)(2--∑n X X控制方法增大样本含量可减小标准误。
个体差异或自然变异,不能通过统计方法来控制。
2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。
不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。
当0.05α=时,称为95%可信区间,记作95%CI 。
当0.01α=时,称为99%可信区间,记作99%CI 。
(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。
(完整版)统计学假设检验习题答案
1 •假设某产品的重量服从正态分布, 现在从一批产品中随机抽取 16件, 测得平均重量为 820克,标准差为60克,试以显著性水平 =0.01与=0.05, 分别检验这批产品的平均重量是否是 800克。
解:假设检验为 H 。
:800,H I : 0 800 (产品重量应该使用双侧检验)。
米用t 分布的检验统计量t -------- ---- 。
杳出/ Jnt <2.131<2.947,所以在两个水平下都接受原假设。
2 •某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取 100台,测得平均无故障时间为 10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(=0.01) ?解:假设检验为H 0: 010000,H 1 : 010000(使用寿命有无显2.34之间(因为表中给出的是双侧检验的接受域临界值, 因此本题的单侧检验显著性水平应先乘以2 ,再查到对应的临界值)。
计算统计量值z 10150 100003。
因为z=3>2.34(>2.32),所以拒绝原假设,无故障500M/100时间有显著增加。
3.设某产品的指标服从正态分布,它的标准差 b 已知为150,今抽了一个容量为26的样本,计算得平均值为1637。
问在5 %的显著水平下,能否认 为这批产品的指标的期望值 □为1600?解:H °:1600, H 1 : 1600,标准差 b 已知,拒绝域为 Z z ,=0.05和0.01两个水平下的临界值(df= n-1=15)为2.131和2.947。
t820 800 60/、161.667。
因为著增加,应该使用右侧检验)n=100可近似采用正态分布的检验统计量杳出 =0.01水平下的反查正态概率表得到临界值2.32 到取 0.05, n 26,, 由 检 验 统 计1.25 1.96,接受 H 。
: 1600,即,以 95%的把握认为这批产品的指标的期望值□为1600.4.某电器零件的平均电阻一直保持在2.64 Q,改变加工工艺后,测得100个零件的平均电阻为 2.62 Q,如改变工艺前后电阻的标准差保持在 0.06 Q,问新工艺对此零件的电阻有无显著影响(a =0.05)?解:H 0:2.64, H 1: 2.64,已知标准差(=0.16,拒绝域为Z z_,取0.05,z_Z 0.025 1.96 ,22接受比:2.64,即,以95%的把握认为新工艺对此零件的电阻有显著影响5 .某食品厂用自动装罐机装罐头食品,每罐标准重量为 500克,每隔一定时间需要检查机器工作情况。
人大版统计学 习题加答案第四章 假设检验
第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。
5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。
(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。
KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。
《统计学》人民大学出版社答案
一、思考题8.7 假设检验依据的基本原理是什么?答:假设检验的基本思想可以用小概率原理来解释。
所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。
也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。
二、练习题8.7某种电元件的寿命x(单位:小时)服从正态分布。
现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著的大于225小时(α=0.05)?解:16件元件的平均寿命测得为241.5小时。
标准差为98.7小时。
H0:μ≤225H1:μ>225t=(241.5-225)/(98.7/√16)=0.67当α=0.05时,自由度n-1=11,很容易可以知道拒绝域在右侧,查表得tα(15)=-1.7531由此可以证明,t的值在非拒绝域内,所以不拒绝原假设,没有理由认为元件的平均寿命显著大于225小时。
8.14 某工厂制造螺栓,规定螺栓口径为7.0cm,方差为0.03cm.今从一批螺栓中抽取80个测量其口径,得平均值为6.97cm,方差为0.0375cm。
假定螺栓口径为正态分布,问这批螺栓是否达到规定的要求(α=0.05)?解:σ=√0.03=0.1732H0:μ=7H1:μ≠7Z=(6.97-7)/(0.1732/√80)=-1.5492当α=0.05时,容易得知拒绝域在两侧,查表得临界值Zα/2=±1.96 |Z|<|Zα/2|由此可以证明,Z的值在非拒绝域内,所以不拒绝原假设,这批螺丝达到了规定的要求。
统计学 第四版 (贾俊平 著) 中国人民大学出版社 第四章课后答案
62.75
2 33.9375
82 64
(2) 可能的样本个数:
(3)由题可得所有样本的样本均值如下表:
第(3)小题图表
(4)利用SPSS软件得到Q-Q图:
(5)
x i 1
xi 64
m
62.75
33.9375 x 4.1193 2 n
0 4
(2) P(X≤2 )=
4.3 求标准正态分布的概率: (1)P ( 0 ≤ Z ≤ 1.2) ; (2)P ( -0.48 ≤ Z ≤ 0); (3)P (Z > 1.33)。
解: (1)P ( 0 ≤ Z ≤ 1.2) = P ( 1.2) -P ( 0 )= 0.3849 (2)P ( -0.48 ≤ Z ≤ 0 ) = P ( 0) -P (-0.48)= 0.1844 (3)P (Z > 1.33) = P ( -1.33) = 0.0918
(1 )
500 0.4 0.6 0.0219089 500
(2)
(3)由中心极限定理可知 p的分布近似正态分布
4.7 假设一个总体共有8个数值: 54,55,59,63,64,68,69,70.从该总体 中按重复抽样方式抽取n=2的随机样本。
(1)计算总体的均值和方差。 (2)一共有多少个可能的样本? (3)抽出所有可能的样本,并计算出每个样本的均值。 (4)画出样本均值的正态概率图,判断样本均值是否服从正态分布。 (5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行对比得 到的结论是什么?
E ( x ) 200
n 50 5 100
(2 ) x
(3) 由中心极限定理可知 X 的概率分布近似服从正态分布
(完整版)统计学假设检验习题答案
1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。
解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。
采用t 分布的检验统计量nx t /0σμ-=。
查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。
667.116/60800820=-=t 。
因为t <2.131<2.947,所以在两个水平下都接受原假设。
2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)?解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。
n=100可近似采用正态分布的检验统计量nx z /0σμ-=。
查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。
计算统计量值3100/5001000010150=-=z 。
因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。
3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。
问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2Z z α>,取0.05,α=26,n =0.0250.9752 1.96z z z α===,由检验统计量1.25 1.96Z ===<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600.4.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量3.33 1.96Z ===>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响.5.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。
统计学假设检验习题
一、单选1、如果检验的假设为0010:,:H H μμμμ≥<,则拒绝域为( )A 、 z z α>B 、z z α<-C 、A 或BD 、/2z z α<-二、多选1.下列关于假设检验的陈述正确的是( )。
A 、假设检验实质上是对原假设进行检验B 、假设检验实质上是对备选假设进行检验C 、当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误D 、假设检验并不是根据样本结果简单地或直接地判断原假设和备选假设哪一个更有可能正确E 、当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确2、在假设检验中, α与β的关系是( )。
A 、在其它条件不变的情况下,增大α,必然会减少βB 、α和β不可能同时减少C 、在其它条件不变的情况下,增大α,必然会增大βD 、只能控制α不能控制βE 、增加样本容量可以同时减少α和β3、设总体为正态总体,总体方差未知,在小样本条件下,对总体均值进行如下的假设检验:01000:);(:μμμμμ≠=H H 为一已知数,1.0=α,则下列说法正确的有 ( )。
A 、),(1.0Z --∞和),(1.0+∞Z 为原假设的拒绝区域B 、),(05.0Z --∞和),(05.0+∞Z 为原假设的拒绝区域C 、),(1.0t --∞和),(1.0+∞t 为原假设的拒绝区域D 、),(05.0t --∞和),(05.0+∞t 为原假设的拒绝区域E 、若检验统计量的绝对值越大,则原假设越容易被拒绝4.某一批原材料的质量实际上是不符合生产标准,检验部门抽取1%的原材料检验,得出结论是该批原材料的质量符合生产标准,说明( ).A 、检验部门犯了第一类错误B 、检验部门犯了第二类错误C 、犯这种错误的概率是αD 、犯这种错误的概率是βE 、犯这种错误的原因是检验部门没有遵循随机原则三、判断1.假设检验是一种科学的统计决策方法,因此使用它不会犯错误.( )四、简答1.简述参数估计和假设检验的联系和区别.五、计算1、从某批食品中随机抽取12袋,测定其蛋白质的含量(%),测定结果如下:24,26,27,23,20,28,23,24,27,25,26,23假定该食品每袋蛋白质的含量X 服从正态分布),(2σμN ,包装袋上表明蛋白质的含量为26%。
统计学假设检验习题
假设检验练习题(一)双正态总体,σ12,σ22已知,均值差的假设检验1.从甲乙两名射击运动员中选拔一名参加比赛,分别随机抽取了他们在同一次练习中的三十次射击成绩。
成绩如表一,设他们的设计成绩均服从正态分布,2=1.4σ甲,2=2.6σ乙。
检验假设0: H μμ=乙甲。
(α=0.05)2.某企业下辖两个分厂生产同一种糕点,为了检查两厂生产的糕点的质量,现随机从两厂各抽取糕点40块,测定其黄曲霉素含量(含量越高质量越差),结果如下表。
设两厂糕点中黄曲霉素含量服从正态分布,210.05σ=,220.031σ=。
请问两厂生产的糕点质量有无显著差异。
(α=0.05)表二 一厂产品黄曲霉素含量0.01 0.02 0.034 0.035 0.054 0.002 0.009 0.044 0.012 0.01 0.006 0.074 0.032 0.009 0.038 0.005 0.034 0.088 0.028 0.045 0.056 0.098 0.004 0.038 0.018 0.057 0.048 0.067 0.003 0.009 表三 二厂产品黄曲霉素含量0.062 0.037 0.051 0.028 0.001 0.007 0.073 0.037 0.029 0.016 0.019 0.008 0.082 0.001 0.004 0.098 0.079 0.075 0.019 0.012 0.002 0.066 0.046 0.047 0.0870.0530.0040.0990.0010.0873.为了了解学生的体能状况,随机从该校抽取男女生各30名,做台阶心率测试,结果如下.设男女生心率(/分)均服从从正态分布,2 1.9σ=男,2 1.1σ=女,问男女同学的心率(/分)有无显著差异.( α=0.05)表一 男生心率测试结果45 34 36 77 65 89 39 59 58 56 76 77 44 43 66 66 76 47 64 78 98 79 77 87 47 62 58634333表二 女生心率测试结果55 65 44 77 65 64 55 52 53 50 46 5649 50 60 58 63 6455 60 50 68 66 7056 54 65 53 44 43。
应用统计学——假设检验书面作业和答案
假设检验作业1. 一种罐装饮料采用自动生产线生产,每罐的容量是255ml (总体的均值 ),标准差为5ml (总体的标准差)。
为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml (样本的均值)。
取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求? 解:正态,总体方差已经,大样本,Z 检验统计量,双侧检验 96.105.040/52558.255)1,0(~n /2552552010==-=-=≠=αασμμμZ N X Z H H :: 若计算的Z 值在(-1.96,1.96)之间,不能拒绝原假设,认为符合标准;反之,拒绝原假设,即产品不符合标准。
2. 某一小麦品种的平均产量为5200kg/hm2 。
一家研究机构对小麦品种进行了改良以期提高产量。
为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。
试检验改良后的新品种产量是否有显著提高? (a=0.05)解:不知是否正态总体,总体标准差未知,但因是大样本,可用Z 分布检验统计量,右侧检验(注意临界值或拒绝域的确定,用图形表示更清楚)645.105.036/12052005275)1,0(~n /52005200010==-=-=≤ααμμμZ N s X Z H H ::计算出的Z 值,若Z 值大于1.645则拒绝原假设;反之,不能拒绝原假设。
3. 一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。
为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。
分别取显著性水平 a=0.05和a=0.01 ,检验该杂志读者群中女性的比率是否为80%?注意:(1)有些书,用大写的π表示总体比例。
(2) 不同的显著性水平,可能得出不同的结论。
医学统计学课后习题答案.
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
统计学第四章课后题及答案解析
第四章一、单项选择题1.由反映总体单位某一数量特征的标志值汇总得到的指标是()A.总体单位总量B.质量指标C.总体标志总量D.相对指标2.各部分所占比重之和等于1或100%的相对数()A.比例相对数 B.比较相对数 C.结构相对数 D.动态相对数3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为()A.104.76%B.95.45%C.200%D.4.76%4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度()A.14.5%B.95%C.5%D.114.5%5.在一个特定总体内,下列说法正确的是( )A.只存在一个单位总量,但可以同时存在多个标志总量B.可以存在多个单位总量,但必须只有一个标志总量C.只能存在一个单位总量和一个标志总量D.可以存在多个单位总量和多个标志总量6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是()A.大量的B.同质的C.有差异的D.不同总体的7.几何平均数的计算适用于求()A.平均速度和平均比率B.平均增长水平C.平均发展水平D.序时平均数8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是()A.3B.13C.7.1D.79.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是()A.方差B.极差C.标准差D.变异系数10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( )A.两个总体的标准差应相等B.两个总体的平均数应相等C.两个总体的单位数应相等D.两个总体的离差之和应相等11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用()A.简单算术平均数B.加权算术平均数C.加权调和平均数D.几何平均数12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。
统计学假设检验练习题
例3.7.9从一大批相同型号的金属线中,随机选取10根,测得它的直径(单位:mm)为:1.23 1.24 1.26 1.29 1.20 1.32 1.23 1.23 1.29 1.28(1)如果金属线直径X~N(μ,0.042),试求平均直径μ的置信度为95%的置信区间.(2)如果金属线直径X~N(μ, σ2),σ2未知,试求平均直径μ的置信度为95%的置信区间.例3.7.10随机取某牌香烟8支,其尼古丁平均含量为3.6mg,标准差为0.9mg.试求此牌香烟尼古丁平均含量μ的95%的置信区间.(假设尼古丁含量服从正态分布).4.某种袋装食品的重量服从正态分布.某一天随机地抽取9袋检验,重量(单位:g)为510 485 505 505 490 495 520 515 490(1) 若已知总体方差σ2=8.62,求μ的置信度为90%的置信区间;(2) 若已知总体方差未知,求μ的置信度为95%的置信区间.5.为了估计在报纸上做一次广告的平均费用,抽出了20家报社作随机样本,样本的均值和标准差分别为575(元)和120(元),假定广告费用近似服从正态分布,求总体均值的95%的置信区间.6.从某一班中随机抽取了16名女生进行调查.她们平均每个星期花费13元吃零食,样本标准差为3元,求此班所有女生每个星期平均花费在吃零食上的钱数的95%的置信区间.(假设总体服从正态分布)7.一家轮胎工厂在检验轮胎质量时抽取了400条轮胎作试验,其检查结果这些轮胎的平均行驶里程是20000k m,样本标准差为6000k m.试求这家工厂的轮胎的平均行驶里程的置信区间,可靠度为95%.8.为了检验一种杂交作物的两种新处理方案,在同一地区随机地选择8块地段.在各试验地段,按两种方案处理作物,这8块地段的单位面积产量是(单位:k g)一号方案产量: 86 87 56 93 84 93 75 79二号方案产量: 80 79 58 91 77 82 74 66假设两种产量都服从正态分布,分别为N(μ1, σ2) ,N(μ2, σ2), σ2未知,求μ1-μ2的置信度为95%的置信区间.9.为了比较两种型号步枪的枪口速度,随机地取甲型子弹10发,算得枪口子弹的平均值=500(m/s), 标准差s1=1.10(m/s); 随机地取乙型子弹20发,得枪口速度平均值=496(m/s),标准差s2=1.20(m/s). 设两总体近似地服从正态分布,并且方差相等,求两总体均值之差的置信水平为95%的置信区间.10.为了估计参加业务训练的效果.某公司抽了50名参加过训练的职工进行水平测验,结果是平均得分为4.5,样本方差为 1.8;抽了60名未参加训练的职工进行水平测验,其平均得分为3.75,样本方差为2.1. 试求两个总体均值之差的95%的置信区间.(设两个总体均服从正态分布).11、风驰汽车制造厂的装配车间安装车门仍需人工操作,不同工人的装配时间不同,同一工人的装配时间也有差异,为测定安装车门所需时间,每隔一定时间抽选一个样本,共抽取了10个样本,其数据如下(单位:秒):41 43 36 26 20 21 46 39 37 211. 以置信度95%,估计安装一个车门所需平均时间的置信区间,2.若要求估计平均装配时间的误差不超过2秒,置信度为95%,应抽选多大的样本?3.若费用为200元,观察每个样本的费用为4元,置信度为95%,则允许误差限是多少?4.假设上月测定的平均时间为35秒,则a=0.05时,检验其平均时间是否有显著缩短?12、万里橡胶制品厂生产的汽车轮胎平均寿命为40,000公里,标准差为7500公里。
统计学考试题及答案中国人民大学第六版.pdf
统计学一、单选1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计量是A 该校学生的总人数B 该校学生的月月平均生活费支出C 该校学生的生活费总支出D 100名学生的月平均生活费支出2、下列变量中,顺序变量是A职工人数 B产量 C产品等级 D利润总额3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位组成一个样本。
这种抽样方式是A 简单随机抽样B 分层抽样C 整群抽样D 系统抽样4、指出下面陈述中错误的是A 抽样误差只存在于概率抽样中B 非抽样误差只存在于非概率抽样中。
C概率抽样和非概率抽样都存在非抽样误差。
D在普查中存在非抽样误差。
5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图6、当样本量一定时,置信区间的宽度A 随置信水平的增大而减小B随置信水平的增大而增大C与置信水平的大小无关D与置信水平的平方根成反比7、在检验一个正态总体方差时,使用的分布是A z分布B t分布C X 分布D F分布8、指出下面陈述中的错误的是A 抽样误差可以避免B 抽样误差不可避免C 非抽样误差可以避免D 抽样误差可以控制9、假设检验中,如果计算出的P值越小,说明检验的结果越A 真实B 不真实C 显著D 不真实10、双因素方差分析涉及 自变量A 一个分类型B 一个数值型C 两个分类型D 两个数值型二、填空题1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内2、对于一组具有单峰分布的数据而言,当数据的m m >时,可判断数据是(左偏)分布3、连续变量在编制组距式变量数列时,其相邻两组的上下限必须重叠。
为解决不重的问题,应按照( 上组限不在内 )的规定确定数据所在的组4、单因素方差分析中,组间平方和SSA 对应的自由度为( k-1 ),组内平方和SSE 对应的自由度( n-k )5、数值型变量根据其取值的不同,可分为( 连续 )型变量和(离散 )型变量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。
5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。
(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。
KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。
假定这位经销商要检验假设0:24000H μ≤,1:24000H μ>,取显著水平为α=0.01,并假设为大样本,则此项检验的拒绝域为( )A 、 2.33z >B 、 2.33z <-C 、 2.33z >D 、 2.33z =6、某种感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。
从过去的生产数据得知克,质检员抽取25包冲剂称重检验,平均每包的重量为11.85克。
假定产品重量服从正态分布。
假定产品重量服从正态分布。
感冒冲剂的每包重量是否符合标准要求?()A、符合B、不符合C、无法判断D、不同情况下有不同结论KEY: C A C B A B三、判断1、如果拒绝原假设将会造成企业严重的经济损失时,那么α的值应取得小一些。
()2、统计假设总是成对提出的,即既要有原假设Ho,也要有备择假设1H。
()3、犯第二类错误的概率与犯第一类错误的概率是密切相关的,在样本一定条件下,α小,β就增大;α大,β就减小。
为了同时减小α和β,只有增大样本容量,减小抽样分布的离散性,这样才能达到目的。
()4、随着显著性水平α取值的减小,拒绝假设的理由将变得充分。
()5、假设检验是一种决策方法,使用它不犯错误。
()KEY: TTTTF三、计算1、下面是某个随机选取20只部件的装配时间(单位:分)设装配时间的总体服从正态分布,参数均未知)=(05.0α,可否认为装配时间的均值为10?2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。
一直这种原件的寿命服从正态分布,标准差为100小时。
试求在显著性水平为0.05下,确定厂家的声明是否可信?A批(x) 0.140 0.138 0.143 0.142 0.144 0.137B批(y) 0.135 0.140 0.142 0.136 0.138 0.140设两批器材电阻总体分别服从分布222211221212(,),(,).,,,N Nμσμσμμσσ均未知,且两样本独立,问在0.05α=下,可否认为两批电子器件的电阻相等?9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.210.39.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.74、在一批产品中抽 40 件进行调查,发现次品有 6 件,试按显著水平为 0.05 来判断该批产品的次品率是否高于 10 %。
5、某网络公司欲了解甲居民区中的家庭(21户)每月上网的平均小时数是否比乙居民区中的家庭(16户)少。
从这两个独立样本中得出的数据为1x=16.5(小时),2x=19.5(小时),S1=3.7(小时)S2=4.5(小时)。
假设两个居民区家庭每月上网小时数服从正态分布(α=0.01)KEY:1、假设检验分双边假设检验与单边假设检验,进行假设检验时要注意由问题所问进行区分。
由题设知总体),(~2σμNX,2,σμ均未知,要求在水平)=(05.0α下检验假设10:,10:1≠=μμHH(1)因2σ未知,采用t检验,取检验统计量为:nsxt0μ-=-(2)由于n=20,-x=10.2,s=0.51,05.0=α,()0930.2)19(1025.02==-tntα(3)绝对域为:()120-≥-=-ntnsxtαμ(4)经计算0930.275.1<=t即检验统计量不落在拒绝域内,故在水平05.0=α下接受原假设H,即认为装配时间均值可认为是10。
2、解:H O:μ≥1000cmH1::μ<1000cm)1,0(~Nnxzδμ-=代入数值,得到z=251001000950-=-2.5在显著性水平=0.05时,Z2α=1.96Z>Z2α, 拒绝原假设H O。
结论:该厂家的声称不可信。
3、解:分析:进行假设检验时,要仔细审题,搞清楚问题需要检验的假设,以及进行该检验需要知道的前提,本题进行的是两独立正态总体均值相等与否的假设检验,这种检验需要两总体方差是否相等的前提,所以本题需要进行两独立总体方差是否相等的假设检验,若经检验方差相等的假设成立,方可进行均值相等与否的检验。
由题设,A批电子器件的电阻),(~211σμNX,B批电子器件的电阻),(~222σμNY,这里221212,,,μμσσ均未知。
(1)在水平0.05α=下,检验假设2222012112:,:.H Hσσσσ=≠采用F检验,检验统计量)1,1(~212221--=nnFSSF现有222212122120.0256,0.0028,0.00266.(1,1)(5,5)7.15n n S S F n n Fα====--==1212212(1,1)1/(1,1)0.140F n n F n nαα---=--=,拒绝域为:221121212122222(1,1)(1,1)S SF F n n F F n nS Sαα=≥--=≤---或经计算:F=1.108,因0.140<1.108<7.15,故检验统计量不落在拒绝域,故在水平0.05α=下接受22012:Hσσ=的假设,认为两批电子器件电阻方差相等。
(2)基于两总体方差相等的前提,在水平0.05α=下,检验假设''012112:,:H Hμμμμ=≠,采用t检验。
检验统计量为2)1()1()2(~112122221122121-+-+-=-++--=nnsnsnsnntnnsyxTWWδ现有:222212120.1407,0.1385,0.0028,0.00266,6x y S S n n======2120.025(2)(10) 2.2281.t n n Fα+-=+拒绝域为:12||(2)T t n nα≥+-经计算:|T|=1.3958<2.2281,不落在拒绝域内。
故在水平0.05α=下接受假设H,认为两批器件电阻均值相等。
4、解:提出假设:H0:p≤10%H1:p>10%建立检验统计量:nppppz)1(--=P=6/40=0.15n=40∴Z=1.05对于显著性水平0.05,查正态分布表得1.65,故接受原假设,可以认为该批产品的次品率不高于18%5、解:(1)H0: 21σ=22σ,H1:21σ≠22σ检验统计量为F=2221ss~F(1n-1,2n-1),其观察值为F=225.47.3≈0.6761 05.0F(20,15)=2.33,95.0F(20,15)=)15,20(105.0F=20.21≈0.4545因为0.4545﹤0.6761﹤2.33,所以接受H:21σ=22σ(2)H:1μ≥2μ,1H:1μ<2μ方差21σ,22σ未知,但由(1)知21σ=22σ,因此可以t检验。
统计量为t=221221)xnsnsxpp+-(~t(1n+2n-2),其中,2)1()1(212222112-+-+-=nnsnsnsp观察值t=)161211(355.4157.3205.195.1622+⨯⨯+⨯-=-2.226﹤-1.0t(35)=-1.3062故应拒绝原假设,可以认为甲居民区中的家庭(21户)每月上网的平均小时数是比乙居民区中的家庭(16户)少。