人大版统计学 习题加答案第四章 假设检验

合集下载

统计学第四章课后习题答案

统计学第四章课后习题答案

第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。

2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。

从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。

3、简述四分位数的计算方法。

答:四分位数是一组数据排序后处于25%和75%位子上的值。

四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。

中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。

它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。

4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。

当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。

5、简述众数、中位数、平均数的特点和应用场合。

答:众数是数据中出现次数次数最多的变量值。

主要应用于分类数据。

中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。

平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。

6、简述异众比率、四分位差、方差、标准差的使用场合。

答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。

四分位差主要用于测度顺序数据的离散程度。

方差和标准差适用于测度数值型数据的离散程度。

7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。

其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。

还有就是在假设检验和估计中应用。

统计学人大第四版课后答案

统计学人大第四版课后答案

3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。

调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。

顺序数据(2)用Excel制作一张频数分布表。

用数据分析——直方图制作:接收频率E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。

用数据分析——直方图制作:(4)绘制评价等级的帕累托图。

逆序排序后,制作累计频数分布表:接收频数频率(%)累计频率(%)C 32 32 32B 21 21 53D 17 17 70E 16 16 86A 14 14 1005101520253035CDBAE204060801001203.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

1、确定组数:()l g 40l g () 1.60206111 6.32l g (2)l g 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

统计学教案习题04总体均数的估计和假设检验

统计学教案习题04总体均数的估计和假设检验

第四章 总体均数的估计和假设检验一、教学大纲要求(一) 掌握内容1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。

(二) 熟悉内容 两样本方差齐性检验。

(三) 了解内容1. t 分布的图形与特征;2. 总体方差不等时的两样本均数的比较; 3. 等效检验。

二、教学内容精要(一) 基本概念 1. 抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。

统计上用标准误(standard error ,SE )来衡量抽样误差的大小。

不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。

均数的标准误与标准差的区别见表4-1。

表4-1 均数的标准误与标准差的区别均数的标准误标准差意义 反映的抽样误差大小 反映一组数据的离散情况 记法X σ(样本估计值X S )σ(样本估计值S )计算X σ=nσ X S =nSσ =nX 2)(∑-μS=1)(2--∑n X X控制方法增大样本含量可减小标准误。

个体差异或自然变异,不能通过统计方法来控制。

2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。

该范围称为总体参数的可信区间(confidence interval ,CI )。

它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。

不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。

当0.05α=时,称为95%可信区间,记作95%CI 。

当0.01α=时,称为99%可信区间,记作99%CI 。

(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。

人大统计学作业答案

人大统计学作业答案

79、【104308】(单项选择题)设连续型随机变量X 的分布函数是)(X F ,密度函数是)(x p ,则对于任意实数α,有==)(αX P ( )。

A.)(X FB.)(x pC.0D.以上都不对 【答案】C80、【150761】(单项选择题)设6.0,1,4===XY DY DX ρ,则)23(Y X D -为( )。

A.40 B.9.10 C.25.6 D.17.6【答案】B81、【104317】(简答题)正态分布概率密度函数的图形有何特点? 【答案】 正态分布概率密度函数()x f 的图形有以下特点: ①()0≥x f ,即整个概率密度曲线都在x 轴上方。

②曲线()x f 关于μ=x 对称,并在μ=x 处达到最大值()σπμ21=f 。

③曲线的随缓程度由σ决定,σ越大,曲线越平缓;σ越小,曲线越陡峭。

④当x 趋于无穷时,曲线以x 轴为其渐近线。

由以上特性可见,正态分布的概率密度曲线()x f 是一条对称的钟形曲线。

82、【104318】(简答题)一事件A 的概率0)(=A P ,能否肯定事件A 是不可能事件?为什么?【答案】不能肯定A 是不可能事件。

不可能事件是指在同一组条件下每次试验都一定不出现的事件。

而0)(=A P ,并不能肯定A 就是不可能事件。

例如在闭区间[]1,0上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为0,因此概率为0的事件不一定都是不可能事件。

83、【104319】(简答题)常见的随机变量分为哪两种类型?各自都包含哪些常见的分布?【答案】常见的随机变量分为离散型随机变量和连续型随机变量。

离散型随机变量包括均匀分布、0-1分布、二项分布、泊松分布。

连续型随机变量包括均匀分布、正态分布。

正态分布衍生卡方分布、t 分布、F 分布。

84、【104313】(填空题)甲、乙、丙三人参加同一项考试,及格的概率分别为%70,%60,%90,则三人均及格的概率为_____;三个人都不及格的概率为_____;至少有一个人及格的概率为_____;至少有一个人不及格的概率为_____。

统计学课后第四章习题答案

统计学课后第四章习题答案

第4章练习题1、一组数据中出现频数最多的变量值称为()A。

众数 B.中位数 C。

四分位数 D.平均数2、下列关于众数的叙述,不正确的是()A。

一组数据可能存在多个众数 B.众数主要适用于分类数据C。

一组数据的众数是唯一的 D。

众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为()A。

众数 B.中位数 C。

四分位数 D.平均数4、一组数据排序后处于25%和75%位置上的值称为()A.众数 B。

中位数 C。

四分位数 D。

平均数5、非众数组的频数占总频数的比例称为()A.异众比率 B。

离散系数 C.平均差 D.标准差6、四分位差是()A.上四分位数减下四分位数的结果 B。

下四分位数减上四分位数的结果C。

下四分位数加上四分位数 D.下四分位数与上四分位数的中间值7、一组数据的最大值与最小值之差称为()A.平均差 B。

标准差 C.极差 D.四分位差8、各变量值与其平均数离差平方的平均数称为()A.极差B.平均差C.方差 D。

标准差9、变量值与其平均数的离差除以标准差后的值称为()A.标准分数B.离散系数 C。

方差 D.标准差10、如果一个数据的标准分数—2,表明该数据()A。

比平均数高出2个标准差 B.比平均数低2个标准差C。

等于2倍的平均数 D。

等于2倍的标准差11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有()A.68%的数据B.95%的数据C.99%的数据D。

100%的数据12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是()A。

至少有75%的数据落在平均数加减4个标准差的范围之内B。

至少有89%的数据落在平均数加减4个标准差的范围之内C. 至少有94%的数据落在平均数加减4个标准差的范围之内D。

至少有99%的数据落在平均数加减4个标准差的范围之内13、离散系数的主要用途是()A。

反映一组数据的离散程度 B。

反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平14、比较两组数据离散程度最适合的统计量是()A.极差B.平均差C.标准差 D。

《统计学》人民大学出版社答案

《统计学》人民大学出版社答案

一、思考题8.7 假设检验依据的基本原理是什么?答:假设检验的基本思想可以用小概率原理来解释。

所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。

也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。

二、练习题8.7某种电元件的寿命x(单位:小时)服从正态分布。

现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著的大于225小时(α=0.05)?解:16件元件的平均寿命测得为241.5小时。

标准差为98.7小时。

H0:μ≤225H1:μ>225t=(241.5-225)/(98.7/√16)=0.67当α=0.05时,自由度n-1=11,很容易可以知道拒绝域在右侧,查表得tα(15)=-1.7531由此可以证明,t的值在非拒绝域内,所以不拒绝原假设,没有理由认为元件的平均寿命显著大于225小时。

8.14 某工厂制造螺栓,规定螺栓口径为7.0cm,方差为0.03cm.今从一批螺栓中抽取80个测量其口径,得平均值为6.97cm,方差为0.0375cm。

假定螺栓口径为正态分布,问这批螺栓是否达到规定的要求(α=0.05)?解:σ=√0.03=0.1732H0:μ=7H1:μ≠7Z=(6.97-7)/(0.1732/√80)=-1.5492当α=0.05时,容易得知拒绝域在两侧,查表得临界值Zα/2=±1.96 |Z|<|Zα/2|由此可以证明,Z的值在非拒绝域内,所以不拒绝原假设,这批螺丝达到了规定的要求。

人大版统计学 习题加答案第四章 假设检验

人大版统计学 习题加答案第四章 假设检验

第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。

4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。

5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。

6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。

(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。

KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。

统计学 第四版 (贾俊平 著) 中国人民大学出版社 第四章课后答案

统计学 第四版 (贾俊平 著) 中国人民大学出版社 第四章课后答案
解: (1)
62.75
2 33.9375
82 64
(2) 可能的样本个数:
(3)由题可得所有样本的样本均值如下表:
第(3)小题图表
(4)利用SPSS软件得到Q-Q图:
(5)
x i 1

xi 64
m
62.75
33.9375 x 4.1193 2 n
0 4
(2) P(X≤2 )=
4.3 求标准正态分布的概率: (1)P ( 0 ≤ Z ≤ 1.2) ; (2)P ( -0.48 ≤ Z ≤ 0); (3)P (Z > 1.33)。
解: (1)P ( 0 ≤ Z ≤ 1.2) = P ( 1.2) -P ( 0 )= 0.3849 (2)P ( -0.48 ≤ Z ≤ 0 ) = P ( 0) -P (-0.48)= 0.1844 (3)P (Z > 1.33) = P ( -1.33) = 0.0918
(1 )
500 0.4 0.6 0.0219089 500
(2)
(3)由中心极限定理可知 p的分布近似正态分布
4.7 假设一个总体共有8个数值: 54,55,59,63,64,68,69,70.从该总体 中按重复抽样方式抽取n=2的随机样本。
(1)计算总体的均值和方差。 (2)一共有多少个可能的样本? (3)抽出所有可能的样本,并计算出每个样本的均值。 (4)画出样本均值的正态概率图,判断样本均值是否服从正态分布。 (5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行对比得 到的结论是什么?
E ( x ) 200

n 50 5 100
(2 ) x
(3) 由中心极限定理可知 X 的概率分布近似服从正态分布

(完整版)统计学假设检验习题答案

(完整版)统计学假设检验习题答案

1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。

解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。

采用t 分布的检验统计量nx t /0σμ-=。

查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。

667.116/60800820=-=t 。

因为t <2.131<2.947,所以在两个水平下都接受原假设。

2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)?解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。

n=100可近似采用正态分布的检验统计量nx z /0σμ-=。

查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。

计算统计量值3100/5001000010150=-=z 。

因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。

3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。

问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2Z z α>,取0.05,α=26,n =0.0250.9752 1.96z z z α===,由检验统计量1.25 1.96Z ===<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600.4.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量3.33 1.96Z ===>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响.5.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。

统计学假设检验习题

统计学假设检验习题

一、单选1、如果检验的假设为0010:,:H H μμμμ≥<,则拒绝域为( )A 、 z z α>B 、z z α<-C 、A 或BD 、/2z z α<-二、多选1.下列关于假设检验的陈述正确的是( )。

A 、假设检验实质上是对原假设进行检验B 、假设检验实质上是对备选假设进行检验C 、当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误D 、假设检验并不是根据样本结果简单地或直接地判断原假设和备选假设哪一个更有可能正确E 、当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确2、在假设检验中, α与β的关系是( )。

A 、在其它条件不变的情况下,增大α,必然会减少βB 、α和β不可能同时减少C 、在其它条件不变的情况下,增大α,必然会增大βD 、只能控制α不能控制βE 、增加样本容量可以同时减少α和β3、设总体为正态总体,总体方差未知,在小样本条件下,对总体均值进行如下的假设检验:01000:);(:μμμμμ≠=H H 为一已知数,1.0=α,则下列说法正确的有 ( )。

A 、),(1.0Z --∞和),(1.0+∞Z 为原假设的拒绝区域B 、),(05.0Z --∞和),(05.0+∞Z 为原假设的拒绝区域C 、),(1.0t --∞和),(1.0+∞t 为原假设的拒绝区域D 、),(05.0t --∞和),(05.0+∞t 为原假设的拒绝区域E 、若检验统计量的绝对值越大,则原假设越容易被拒绝4.某一批原材料的质量实际上是不符合生产标准,检验部门抽取1%的原材料检验,得出结论是该批原材料的质量符合生产标准,说明( ).A 、检验部门犯了第一类错误B 、检验部门犯了第二类错误C 、犯这种错误的概率是αD 、犯这种错误的概率是βE 、犯这种错误的原因是检验部门没有遵循随机原则三、判断1.假设检验是一种科学的统计决策方法,因此使用它不会犯错误.( )四、简答1.简述参数估计和假设检验的联系和区别.五、计算1、从某批食品中随机抽取12袋,测定其蛋白质的含量(%),测定结果如下:24,26,27,23,20,28,23,24,27,25,26,23假定该食品每袋蛋白质的含量X 服从正态分布),(2σμN ,包装袋上表明蛋白质的含量为26%。

人民大学《统计学》题库及答案

人民大学《统计学》题库及答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:12中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:23中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:3一、(20分)在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:要对各名运动员进行综合评价,使用的统计量有哪些?简要说明这些统计量的用途。

(1)集中趋势:指一组数据向某一中心值靠拢的程度,它可以反映选手射击成绩中心点的位置平均数:一组数据相加后除以数据的个数得到的结果。

若各组数据在组内是平均分布的,则计算的结果还是比较准确的,否则误差会比较大。

(如中国选手发挥很稳定,适合使用平均数判断其成绩)中位数:一组数据排序后处于中间位置上的变量值,但不受极端值的影响。

(如波兰选手大多数成绩比较平均,但有一枪打到8.1,会严重影响其平均值,但不会影响中位数)(2)离散程度:各变量值远离其中心值的程度,它可以反映选手发挥的稳定性标准差:方差的平方根,能够很好的反映出数据的离散程度,若选4中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:45中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:56中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:67中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:78中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:8一、(20分)在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。

《统计学原理》教材课后习题参考答案

《统计学原理》教材课后习题参考答案
1.设立假设。原假设为 备择假设为
2.给定显著性水平。取显著性水平 ,由于是双侧检验,因此需要确定上下两个临界值 和 。查表得到 ,所以。拒绝区间为小于-1.96或者大于1.96。
3.检验统计量
4.检验判断。
由于z的实际值在-1.96和1.96之间,没有落入拒绝区间,所以接受原假设,认为净重是符合规定
(五)计算题
1.因为2000年计划完成相对数是110%,所以
实际产值=
2000年计划产值比1999年增长8%,
所以1999年的计划产值=
那么2000年实际产值比1999年计划产值增长=
2.(1)
从第四年第四季度到第五年第三季度这一年的时间,实际上这一年的产量达到

这一题规定年末产量应达到170,所以提前时间按照水平法来算。
3..根据题意,样本的平均数和标准差为
根据样本信息,计算统计量
4.检验判断。因为 ,所以在显著性水平0.01下,拒绝原假设,也就是说,含量是超过规定界限
第九章相关与回归
(一)判断题
1.×2.√3.√4.√5.×6.×7.×8.×
(二)单项选择题
1.① 2.① 3.③ 4.④ 5.④6.②7.②8.④
2.由题意
=8.89
3.由题意
令这个数为a。则
4.由题意
5.
销售额
售货员人数
组中值
20000-30000
30000-40000
40000-50000
50000-60000
60000-70000
70000-80000
80000以上
8
20
40
100
82
10
5
25000
35000

应用统计学——假设检验书面作业和答案

应用统计学——假设检验书面作业和答案

假设检验作业1. 一种罐装饮料采用自动生产线生产,每罐的容量是255ml (总体的均值 ),标准差为5ml (总体的标准差)。

为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml (样本的均值)。

取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求? 解:正态,总体方差已经,大样本,Z 检验统计量,双侧检验 96.105.040/52558.255)1,0(~n /2552552010==-=-=≠=αασμμμZ N X Z H H :: 若计算的Z 值在(-1.96,1.96)之间,不能拒绝原假设,认为符合标准;反之,拒绝原假设,即产品不符合标准。

2. 某一小麦品种的平均产量为5200kg/hm2 。

一家研究机构对小麦品种进行了改良以期提高产量。

为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。

试检验改良后的新品种产量是否有显著提高? (a=0.05)解:不知是否正态总体,总体标准差未知,但因是大样本,可用Z 分布检验统计量,右侧检验(注意临界值或拒绝域的确定,用图形表示更清楚)645.105.036/12052005275)1,0(~n /52005200010==-=-=≤ααμμμZ N s X Z H H ::计算出的Z 值,若Z 值大于1.645则拒绝原假设;反之,不能拒绝原假设。

3. 一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。

为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。

分别取显著性水平 a=0.05和a=0.01 ,检验该杂志读者群中女性的比率是否为80%?注意:(1)有些书,用大写的π表示总体比例。

(2) 不同的显著性水平,可能得出不同的结论。

医学统计学课后习题答案.

医学统计学课后习题答案.

医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。

要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。

对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。

一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。

《统计学》-第4章-习题答案

《统计学》-第4章-习题答案

思考与练习1. 怎样确定假设检验问题的零假设和备择假设?一般根据以下几个原则设置零假设和备择假设:把研究者要证明的假设作为备择假设;将所作出的声明作为零假设;把现状作为零假设;把不能轻易否定的假设作为零假设。

2. 什么是抽样分布?常用的抽样分布有哪些?抽样分布是指统计量的概率分布。

从总体中抽取一个样本量为n的随机样本,我们可以计算出统计量的一个值;如果从总体中重复抽取样本量为n的样本,就可以得到统计量的多个值。

统计量的抽样分布就是这一统计量所有可能值的概率分布。

常用的抽样分布有正态分布、t分布、F分布、2χ分布。

3. 假设检验有哪些步骤?假设检验一般可以分为以下几个步骤:1)根据实际问题提出一对假设(零假设和备择假设);2)构造某个适当的检验统计量,并确定其在零假设成立时的分布;3)根据观测的样本计算检验统计量的值;4)根据指定的显著性水平确定检验统计量的临界值并进而给出拒绝域;5)根据决策规则得出拒绝或不能拒绝零假设的结论。

4. 单侧和双侧假设检验问题的拒绝域有何区别?单侧检验的拒绝域为检验统计量取值的单侧区间,双侧检验问题的拒绝域为检验统计量取值的双侧区间5. 怎样理解假设检验问题的p值?如何根据p值和显著性水平的关系得出检验结论?p值是在零假设成立的条件下,出现检验统计量的样本观测结果或更极端结果的概率,是能拒绝H0的α的最小值。

将p值与显著性水平α比较,当p值小于α时拒绝零假设。

当p值大于等于α时接受零假设。

6. 根据表4-3对100名儿童随机调查的结果(数据文件:看电视时间.sav),能否认为(1)该地区儿童平均看电视的时间等于25.5小时?解:在SPSS中打开相应的数据文件,选择“分析”→“比较均值”→“单样本t检验”,在弹出的对话框中将体重变量作为检验变量,检验值框中填入25.5,其余使用系统默认值,输出结果如表1。

表1 单样本t检验根据题目的要求,这里应采用双侧检验,零假设和备择假设为:25.5:25.5:10≠↔=μμH H 。

统计学课后答案

统计学课后答案

第四章 抽样分布与参数估计3.某地区粮食播种面积5000亩,按不重复抽样方法随机抽取了100亩进行实测,调查结果,平均亩产450公斤,亩产量标准差为52公斤。

试以95%的置信度估计该地区粮食平均亩产量和总产量的置信区间。

解:已知X =450公斤,n =100(大样本),n/N=1/50,11≈-Nn,不考虑抽样方式的影响,用重复抽样计算。

s =52公斤,1-α=95%,α=5%。

这时查标准正态分布表,可得临界值:96.1025.02/==z z α该地区粮食平均亩产量的置信区间是:1005296.14502⨯±=±nsz x α=[439.808,460.192] (公斤) 总产量的置信区间是:[439.808⨯5000,460.192⨯5000] (公斤) =[2199040,2300960](公斤)4.已知某种电子管使用寿命服从正态分布。

从一批电子管中随机抽取16只,检测结果,样本平均寿命为1490小时,标准差为24.77小时。

试以95%的置信度估计这批电子管的平均寿命的置信区间。

解:(1)已知X =1490小时,n =16,s =24.77小时,1-α=95%,α=5%。

这时查t 分布表,可得 2.13145)1(2/=-n t α该批电子管的平均寿命的置信区间是:1677.2413145.214902⨯±=±nst x α=[ 1476.801,1503.199](小时)因此,这批电子管的平均寿命的置信区间在1476.801小时与1503.199小时之间。

6.采用简单随机重复抽样的方法,从2 000件产品中抽查200件,其中合格品190件。

要求:(1)计算合格品率及其抽样平均误差。

(2)以95.45%的置信度,对合格品率和合格品数量进行区间估计。

(3)如果极限误差为2.31%,则其置信度是多少? 解:(1)合格品率:P=190/200⨯100%=95% 抽样平均误差:np p p )1()(-=σ=0.015(2)%3%95%100015.02%95)(22/02275.02/±=⨯⨯±=±==p Z P Z Z σαα]19601840[]2000%982000%92[(%]98%92[,,的置信区为:件合格品数量,:合格品率的置信区间为=⨯⨯)(3)%64.87)(8764.01,54.1%31.2%100015.0%31.2)(2/2/2/==-==⨯⨯==∆z F Z Z p Z ασααα查表得7.从某企业工人中随机抽选部分进行调查,所得工资分布数列如下:试求:(1)以95.45%的置信度估计该企业工人平均工资的置信区间,以及该企业工人中工资不少于800元的工人所占比重的置信区间;(2)如果要求估计平均工资的允许误差范围不超过30元,估计工资不少于800元的工人所占比重的允许误差范围不超过10%,置信度仍为95.45%,试问至少应抽多少工人? 解(1)通过EXCEL 计算可得: X =816元,n =50人,s =113.77元。

人大版 计量经济学课后习题答案

人大版 计量经济学课后习题答案
2.逆矩阵的求法
3.矩阵对应的行列式计算方法
4.数列中逆序的概念
5.向量组的线性相关和线性无关
6.齐次线性方程组解的结构
7.线性方程组有解的充分必要条件
8.矩阵的秩
9.最小二乘解的概念和几何意义
10.二次型的定义,正定、负定、不定的二次型
11.正交变换
12.特征根、特征向量
13.二次型变换成对角型的方法
二填空题
1.[解]由
所以, , , , .
2.[解]X= ;Y=
3.[解]由题设,秩r(A)=n-1,于是Ax=0的基础解系所含解向量的个数为n-r(A)=1,而 表明Ax=0有解 ,故Ax=0的通解为 .
4.[解]由题设,有 ,知x=-4.
5.[解]
6.[解]第一步:求A的特征值
因为
所以A的特征值为 (二重根)
A.正定B.负定C.半负定D.不定
二填空题
1.已知
则 =____, =____, =____, =____.
2.若矩阵A= ,B= ,AX=B,YA=B,则X=______,Y=______.
3.设A= ,A的伴随矩阵A*的秩为1,且 ,则Ax=0的通解为_____________.
4.已知-2是 的特征值,其中b为不等于零的任意常数,则
故所求的概率为
2、
解:把 只黑球及 只白球视为不同的(如设想把它们编号),若把摸出的球依次放在排列成一直线的 个位置上,则基本事件总数就是 个相异元素的全排列 。若记 为“第 次摸出黑球”,这相当于在第 个位置上放一只黑球,在其余 个位置上放另外的 个球,所以, 包含的基本事件个数为 ,故所求概率为
A.1个B.2个C.3个D.0个
9.设A为 阶矩阵,考虑以下命题:①Ax=0只有零解;②Ax=b有唯一解;③A的行向量组线性无关;④A的列向量组线性无关.则有()
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。

4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。

5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。

6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。

(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。

KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。

假定这位经销商要检验假设0:24000H μ≤,1:24000H μ>,取显著水平为α=0.01,并假设为大样本,则此项检验的拒绝域为( )A 、 2.33z >B 、 2.33z <-C 、 2.33z >D 、 2.33z =6、某种感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。

从过去的生产数据得知 克,质检员抽取25包冲剂称重检验,平均每包的重量为11.85克。

假定产品重量服从正态分布。

假定产品重量服从正态分布。

感冒冲剂的每包重量是否符合标准要求?( )A 、符合B 、不符合C 、无法判断D 、不同情况下有不同结论 KEY: C A C B A B三、判断1、如果拒绝原假设将会造成企业严重的经济损失时,那么α的值应取得小一些。

( )2、统计假设总是成对提出的,即既要有原假设Ho ,也要有备择假设1H 。

( )3、犯第二类错误的概率与犯第一类错误的概率是密切相关的,在样本一定条件下,α小,β就增大;α大,β就减小。

为了同时减小α和β,只有增大样本容量,减小抽样分布的离散性,这样才能达到目的。

( )4、随着显著性水平α取值的减小,拒绝假设的理由将变得充分。

( )5、假设检验是一种决策方法,使用它不犯错误。

( ) KEY: TTTTF三、 计算1、下面是某个随机选取20只部件的装配时间(单位:分)设装配时间的总体服从正态分布,参数均未知)=(05.0α,可否认为装配时间的均值为10? 2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。

一直这种原件的寿命服从正态分布,标准差为100小时。

试求在显著性水平为0.05下,确定厂家的声明是否可信?设两批器材电阻总体分别服从分布222211221212(,),(,).,,,N N μσμσμμσσ均未知,且两样本独立,问在0.05α=下,可否认为两批电子器件的电阻相等?4、在一批产品中抽 40 件进行调查,发现次品有 6 件,试按显著水平为 0.05 来判断该批产品的次品率是否高于 10 %。

5、某网络公司欲了解甲居民区中的家庭(21户)每月上网的平均小时数是否比乙居民区中的家庭(16户)少。

从这两个独立样本中得出的数据为1x =16.5(小时),2x =19.5(小时),S 1=3.7(小时)S 2=4.5(小时)。

假设两个居民区家庭每月上网小时数服从正态分布(α=0.01)KEY:1、假设检验分双边假设检验与单边假设检验,进行假设检验时要注意由问题所问进行区分。

由题设知总体),(~2σμN X ,2,σμ均未知,要求在水平)=(05.0α下检验假设10:,10:10≠=μμH H9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2 10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7(1) 因2σ未知,采用t 检验,取检验统计量为:n sx t 0μ-=-(2) 由于n=20,-x =10.2,s=0.51,05.0=α,()0930.2)19(1025.02==-t n t α(3) 绝对域为:()12-≥-=-n t n s x t αμ(4) 经计算0930.275.1<=t 即检验统计量不落在拒绝域内,故在水平05.0=α下接受原假设H 0,即认为装配时间均值可认为是10。

2、解:H O :μ≥1000cmH 1:: μ<1000cm)1,0(~N nx z δμ-=代入数值,得到z=251001000950-=-2.5 在显著性水平=0.05时,Z 2α=1.96Z >Z 2α, 拒绝原假设H O 。

结论:该厂家的声称不可信。

3、解:分析:进行假设检验时,要仔细审题,搞清楚问题需要检验的假设,以及进行该检验需要知道的前提,本题进行的是两独立正态总体均值相等与否的假设检验,这种检验需要两总体方差是否相等的前提,所以本题需要进行两独立总体方差是否相等的假设检验,若经检验方差相等的假设成立,方可进行均值相等与否的检验。

由题设,A 批电子器件的电阻),(~211σμN X ,B 批电子器件的电阻),(~222σμN Y ,这里221212,,,μμσσ均未知。

(1)在水平0.05α=下,检验假设2222012112:,:.H H σσσσ=≠ 采用F 检验,检验统计量)1,1(~212221--=n n F S S F 现有222212122120.0256,0.0028,0.00266.(1,1)(5,5)7.15n n S S F n n F α====--==1212212(1,1)1/(1,1)0.140F n n F n n αα---=--=,拒绝域为:221121212122222(1,1)(1,1)S S F F n n F F n n S S αα=≥--=≤---或经计算:F=1.108,因0.140<1.108<7.15,故检验统计量不落在拒绝域,故在水平0.05α=下接受22012:H σσ=的假设,认为两批电子器件电阻方差相等。

(2)基于两总体方差相等的前提,在水平0.05α=下,检验假设''012112:,:H H μμμμ=≠,采用t 检验。

检验统计量为2)1()1()2(~112122221122121-+-+-=-++--=n n s n s n s n n t n n s y x T WWδ现有:222212120.1407,0.1385,0.0028,0.00266,6x y S S n n ======2120.025(2)(10) 2.2281.t n n F α+-=+拒绝域为:12||(2)T t n n α≥+-经计算:|T|=1.3958<2.2281,不落在拒绝域内。

故在水平0.05α=下接受假设H 0,认为两批器件电阻均值相等。

4、解:提出假设:H 0 :p≤10% H 1 :p>10% 建立检验统计量:np p p p z )1(000--=P=6/40=0.15 n=40 ∴Z=1.05对于显著性水平0.05,查正态分布表得1.65,故接受原假设,可以认为该批产品的次品率不高于18%5、解:(1)H 0: 21σ =22σ,H 1:21σ≠22σ检验统计量为F=2221s s ~F(1n -1,2n -1),其观察值为F=225.47.3≈0.6761 05.0F (20,15)=2.33,95.0F (20,15)=)15,20(105.0F =20.21≈0.4545因为0.4545﹤0.6761﹤2.33,所以接受0H :21σ =22σ (2) 0H :1μ≥2μ,1H :1μ<2μ方差21σ ,22σ未知,但由(1)知21σ =22σ,因此可以t 检验。

统计量为t=221221)x n s n s x p p +-(~t(1n +2n -2),其中,2)1()1(212222112-+-+-=n n s n s n s p观察值t=)161211(355.4157.3205.195.1622+⨯⨯+⨯-=-2.226﹤-1.0t (35)=-1.3062故应拒绝原假设,可以认为甲居民区中的家庭(21户)每月上网的平均小时数是比乙居民区中的家庭(16户)少。

相关文档
最新文档