统计学习题区间估计假设检验..
梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案
旗开得胜1第七章 假设检验与方差分析 习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。
2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。
3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。
4. 单侧检验:备择假设符号为大于或小于时的假设检验。
5. 显著性水平:原假设为真时,拒绝原假设的概率。
6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。
二、填空题根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。
1. u ,nx σμ0-,标准正态; ),(),(2/2/+∞--∞nz nz σσααY2. 参数检验,非参数检验3. 弃真,存伪4. 方差旗开得胜25. 卡方, F6. 方差分析7. t ,u8. nsx 0μ-,不拒绝9. 单侧,双侧10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r18. 正态,独立,方差齐三、单项选择从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。
1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C四、多项选择从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。
1.AC 2.A 3.B 4.BD 5. AD五、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 在任何情况下,假设检验中的两类错误都不可能同时降低。
( ×)样本量一定时2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。
推断统计习题及参考答案
推断统计习题及参考答案统计学是一门重要的学科,旨在通过数据收集和分析来推断出有关总体特征的信息。
在学习统计学的过程中,解决习题是不可或缺的一部分。
本文将提供一些推断统计学习题,并附上相应的参考答案,以帮助读者巩固对推断统计学的理解。
第一节:抽样与估计问题1:某公司想要了解全员的满意度,但受时间和资源限制,只能对部分员工进行调查。
该公司选择从员工名单中随机抽取100人,并得到了他们对公司满意度的评分。
在这种情况下,我们可以将这100位员工的满意度评分作为全员满意度的估计吗?为什么?参考答案1:我们可以将这100位员工的满意度评分作为全员满意度的估计。
这是基于抽样理论的基本假设,即随机抽样的结果能够代表总体的特征。
通过适当的抽样方法和样本容量大小,我们可以确保抽样误差在可接受范围内,从而较准确地估计出总体特征。
问题2:某调查机构为了估计某城市的失业率,从该城市的人口中随机抽取500人进行调查。
发现有25人失业。
在95%的置信水平下,该城市的失业率的置信区间是多少?对于二项分布来说,当样本容量大于30且成功次数和失败次数均大于5时,可以使用正态分布近似。
由此可知,失业率的置信区间可以利用正态分布的性质来计算。
根据公式,我们可以得出该城市失业率的置信区间为:(23.09%,29.91%)。
第二节:假设检验问题3:某研究者想要验证某种新药对高血压患者的治疗效果。
他将100名患者随机分为两组,一组使用新药治疗,另一组使用常规药物治疗。
并在治疗结束后测量两组患者的血压水平。
研究者想要知道新药是否显著降低了患者的血压水平。
应该使用什么类型的假设检验?参考答案3:在这种情况下,应该使用成对样本t检验。
因为两组患者是通过随机分组方法确定的,并且每个患者都参与了两次测量(使用新药前和使用新药后),所以我们可以通过比较这两次测量的差异来判断新药是否对血压产生显著影响。
问题4:某汽车制造商声称其新产品的平均燃油效率为20升/百公里。
计量经济学----.区间估计和假设检验
即
P[ 2 t se( 2 ) 2 2 t se( 2 )] 1
2 2
8
^
^
^
^
假设检验
检验某一给定的观测是否与虚拟假设(原假设)相符, 若相符,则接受假设,反之拒绝。 当我们拒绝虚拟假设时,我们说该统计量是统计上显 著的,反之则不是统计上显著的。
的临界值 t 2 (n 2) ,则有
ˆ ˆ P{[YF t 2 SE (eF )] YF [YF t 2 SE (eF )]} 1
1 因此,一元回归时 Y 的个别值的置信度为 的 预测区间上下限为 1 ( X F X )2 ˆ ˆ YF YF t 2 1 n xi2
给定,查t分布表得t (n 2) 2 ( )若t -t 2 (n 2), 或t t 2 (n 2),则拒绝原假设 1 H 0: 2 0,接受备择假设H1: 2 0; (2)若 - t 2 (n 2) t t 2 (n 2), 则接受原假设。
30
^
^
应变量Y 区间预测的特点
1、Y 平均值的预测值与真实平均值有误差,主要是 受抽样波动影响
YF Y F t 2
^ ^
1 ( X F X )2 n xi2
Y 个别值的预测值与真实个别值的差异,不仅受抽
样波动影响,而且还受随机扰动项的影响
1 ( X F X )2 ˆ ˆ YF YF t 2 1 n xi2
^
1 ( X F X )2 ˆ SE (YF ) n xi2
Y F 服从正态分布,将其标准化,
^
当
2
2 ei2 (n 2) 代替,这时有 未知时,只得用 ˆ ˆ YF E (YF X F ) t ~ t (n 2) 1 ( X F X )2 ˆ n xi2
统计学中的假设检验与置信区间
统计学中的假设检验与置信区间统计学中最常用的方法就是假设检验和置信区间,它们是常见的统计推断方法,常用于判断总体参数是否满足某种假设或估计总体参数。
在不同的场景下,假设检验和置信区间都有非常重要的应用,本文将深入探讨它们的原理和应用。
假设检验假设检验是一种通过样本推断总体参数是否满足某种假设的方法,我们通常会根据样本推断总体参数的值,然后尝试去证伪原来的假设。
其中,假设又分为零假设和备择假设,我们通常来验证零假设是否成立。
在进行假设检验之前,我们需要先确定显著性水平,通常设定为5%或1%。
在假设检验的过程中,如果得到的P值小于设定的显著性水平,则可以拒绝原来的零假设。
例如,对于一组数据,我们要验证其均值是否等于30,其中零假设为均值等于30,备择假设为均值不等于30。
如果得到的P值小于设定的显著性水平,即P < 0.05,我们可以拒绝零假设,认为该数据的均值不等于30。
置信区间置信区间是指在一定置信水平下,总体参数的估计范围。
一般情况下,我们希望用样本数据去推断总体参数,但因为样本的局限性,我们无法确定总体参数的真实值,只能给出一个范围,这个范围就是置信区间。
置信区间的计算方法通常分为两种:参数法和非参数法。
参数法通常用于正态总体或样本量大于30的情况,非参数法则适用于小样本或未知总体分布的情况。
例如,我们要估计某城市成年人的平均收入,样本数据总共100个人,根据样本数据可以得到平均收入为5000元/月,标准差为1000元/月。
如果我们希望在95%的置信水平下估计总体平均收入,那么置信区间的计算公式为:置信区间 = 样本平均数 ± Z值 ×标准误差其中,Z值为95%置信水平下的标准正态分布的分位数,一般为1.96;标准误差是指样本平均数的标准误差,可以通过标准差除以样本量的平方根来计算。
通过计算,置信区间为:5000 ± 1.96 × (1000 / 10) = (4679, 5321)也就是说,在95%的置信水平下,我们可以估计该城市成年人的平均收入范围为4679元/月到5321元/月之间。
管理统计学习题参考答案第八章
第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。
因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。
根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。
当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。
后一种情况是小概率事件。
在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。
(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。
原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。
原假设和备择假设是相互对立的,检验结果二者必取其一。
接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。
② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。
在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。
③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。
假设检验就是应用了小概率事件实际不发生的原理。
这里的小概率就是指α。
但是要小到什么程度才算小概率? 对此并没有统一的标准。
通常取α=0.1,0.05,0.01。
给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。
简述假设检验与区间估计之间的关系 统计学原理
简述假设检验与区间估计之间的关系统计学原理一、简介假设检验与区间估计是统计学中两个重要的概念,它们都是基于样本数据对总体参数进行推断的方法。
假设检验主要用于判断总体参数是否符合某种特定假设,而区间估计则用于对总体参数进行范围性的估计。
本文将从统计学原理角度出发,详细介绍假设检验与区间估计之间的关系。
二、假设检验1. 假设检验的基本思想在进行假设检验时,我们首先要提出一个关于总体参数的假设(称为原假设),然后根据样本数据来判断这个假设是否成立。
具体来说,我们会根据样本数据计算出一个统计量(如t值、F值等),然后通过比较这个统计量与某个临界值(也称为拒绝域)来决定是否拒绝原假设。
2. 假设检验中的错误类型在进行假设检验时,有可能会犯两种错误:一种是将一个正确的原假设错误地拒绝了(称为第一类错误),另一种是将一个错误的原假设错误地接受了(称为第二类错误)。
通常情况下,我们会将第一类错误的概率控制在一个较小的水平(如0.05或0.01),这个水平被称为显著性水平。
3. 假设检验的步骤进行假设检验时,通常需要按照以下步骤进行:(1)提出原假设和备择假设;(2)选择适当的检验统计量,并计算出样本数据所对应的值;(3)确定显著性水平,并找到相应的拒绝域;(4)比较样本统计量与拒绝域,得出结论。
三、区间估计1. 区间估计的基本思想在进行区间估计时,我们会根据样本数据来构建一个区间,这个区间包含了总体参数真值的可能范围。
具体来说,我们会根据样本数据计算出一个点估计量(如样本均值、比例等),然后根据中心极限定理和大数定律等原理来构建置信区间。
2. 区间估计中的置信度在进行区间估计时,我们通常会给出一个置信度,表示该区间包含总体参数真值的概率。
例如,如果我们给出了一个95%置信度,则意味着在大量重复实验中,有95%的置信区间都会包含总体参数真值。
3. 区间估计的步骤进行区间估计时,通常需要按照以下步骤进行:(1)选择适当的点估计量,并计算出样本数据所对应的值;(2)确定置信度,并找到相应的置信区间;(3)解释置信区间的含义,得出结论。
假设检验例题和习题
超过1cm3。如果达到设计要求 -0.6 0.7 -1.5 -0.2 -1.9
,表明机器的稳定性非常好。 -0.5 1 -0.2 -0.6 1.1
现从该机器装完的产品中随机
抽取25瓶,分别进行测定(用样
本减1000cm3),得到如下结果
。检验该机器的性能是否达到
设计要求 (=0.05)
8 - 30
双侧检验
备择假设的方向为“<”(废品率降低) 建立的原假设与备择假设应为
H0: 2% H1: < 2%
8 -7
统计学
(第二版)
单侧检验
(原假设与备择假设的确定)
某灯泡制造商声称,该企业所生产的灯泡 的平均使用寿命在1000小时以上。如果 你准备进一批货,怎样进行检验
▪ 检验权在销售商一方
▪ 作为销售商,你总是想收集证据证明生产商 的说法(寿命在1000小时以上)是不是正确的
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
统计学
(第二版)
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜 单
第2步:选择“函数”点击
第3步:在函数分类中点击“统计”,在函数名的 菜
单下选择字符“NORMSDIST”然后确定
?( = 0.05)
统计学
(第二版)
均值的单尾 t 检验
(计算结果)
H0: 40000 H1: < 40000 = 0.05 df = 20 - 1 = 19 临界值(s):
拒绝域
.05
-1.7291 0
t
8 - 23
数理统计总复习(题型归纳)
56学 考题8(2005级 256学时) 三 、 ( 本 题 8 分 ) 设 X 1 , X 2 , L , X n为 服 从 泊 松 分 布 )的 π(λ )的总体X的一个样本,求λ的极大似然估计量。
32 考题9(2004级 32学时) 三、(本题8分)设总体X的概率密度为: ( θ + 1) x θ , 0 < x < 1, f ( x) = 0, 其它 其中θ > −1是未知参数,X 1 , X 2 , L , X n为总体X 的一个容量为n简单随机样本,求参数θ的极大 似然估计量。
考题5(2007级 64学时 作业P153 四) 七、(本题8分)设X 1 , L , X n为总体X的样本, X的密度函数为: 0< x<1 θ, f ( x , θ) = 1 − θ, 1 ≤ x < 2;其中未知参数θ > 0 0, 其他 设N为样本值x1 , L , xn中小于1的个数,求θ的极 大似然估计。
1 2 n
32学 考题4(2007级 32学时) 10分 六、(本题10分)设随机变量X的概率密度为 2x 2 , 0< x<θ f ( x) = θ ,其中未知参数θ > 0, 0, 其他 X 1 , L , X n是样本,求θ的矩估计和最大似然估计。
(此题和2008级的第三大题一样的.)
: 解(1)检验假设H 0:σ 2 = 1,H 1:σ 2 ≠ 1; ( n − 1) S 2 取统计量:χ 2 = 2 σ0
2 拒绝域为:χ 2 ≤ χ 2 α ( n − 1) = χ 0.975 ( 9) = 2.70 1−
或χ 2 ≥ χ 2 ( n − 1) = χ α
2
2 2 0.025
概率论15区间估计与假设检验
,X , S 2分别是 样本均值和样本方差,
则有
X
S
X S
~
t n 1
n 1
n
(2)方差 2 的区间估计
10 已 知
1
2
n
(Xi
i1
)2
~ 2(n)
2的置信度为1α的置信区间是
n (Xi )2
n (Xi )2
i1
2
(n)
2
,
i 1
12
2
(n)
20 未知
(n 1)S2
解 该问题是方差未知, 对正态总体均值进行估计.
(X t (n 1) S
2
n
,
X t (n 1) S
2
) n
x 3056.67 s* 375.31 n 12 t0.025 (11) 2.201
所求区间估计为(2812.21, 3295.13).
设 X1, X 2,, X n 是总体X ~ N , 2 的样本
即 X 0 0
Z 是 衡 量H0 真 伪 的 标 准 . 2
n
如 例1中, 0.005 Z 1.96 n 6
2
0 1 x 19.503 0 20
x 0 0
0.7351.96
n
故认为 机床生产正常,即该天加工的零件直径
平均是20mm.
综述假设检验方法的基本思想是:由 样本出发,在 H 0 为真的前提下通过对被 检参数的点估计量,结合统计量的分布,构 造统计量(枢轴函数),由此结合实际,并利 用上α分位点确定小概率事件,便得检验
其中例1为参数检验,例2为非参 数检验.
二 假设检验的基本思想
例1 用机床加工圆形零件,正常情况下 零件的直径X服从正态分布N(20,1)(单 位:mm), 某日开工后为检查机床是否 正常,随机抽取6个,测得直径分别为
统计学课堂练习题4
一、名词解释抽样误差、均数的抽样误差、标准误、可信区间二、填空题1.参数估计可分为_____点估计____ 和__区间估计______ 。
2. 在抽样研究中,当样本含量趋向无穷大时,X 趋向等于__μ___,S 趋向等于__0__,t(0.05,v) 趋向等于________ 。
3、定量资料常用的假设检验方法有 t 检验 、 u 检验 、 方差分析 。
4、方差分析可用于两个或两个以上样本均数的比较,其应用时要求,(1)正态分布;(2)方差齐。
5、标准误是 均数 的标准差,与标准差的关系可用公式 n s表示。
6、假设检验时根据检验结果作出的判断, 可能发生两种错误, 第一类错误的概率为 α,第二类错误的概率为 β , 同时减少两类错误的唯一方法是 增加样本含量 。
7、t 检验的应用条件是 正态分布 和 方差齐 。
8. 配对设计差值的t 检验无效假设是 d =0 。
9、两样本比较t 检验要求资料(1) 正态分布 ;(2) 方差齐 。
10、样本量较小的二组数值变量资料进行t 检验时,要求二组资料呈 正态分布; 方差齐。
11、数值变量数据常用的参数统计方法有 t 检验、u 检验和方差分析。
三、是非题1.在假设检验中,无论是否拒绝H 0,都有可能犯错误。
( V )2.同类研究的两组资料,n 1=n 2,则标准差大的那一组 ,μ的95%可信区间范围也一定小。
( X )3.两个同类资料的t 检验,其中P 1<0.01, 0.01﹤P 2<0.05,说明前者两样本均数之差大于后者。
( X )4.均数比较的u 检验的应用条件是n 较大或n 虽小但σ已知。
(V )5.标准误越小,表示用样本均数估计总体均数的可靠性越大。
( V )6.统计的假设是对总体特征的假设,其结论是概率性的,不是绝对的肯定或否定。
( V )7.成组设计的两样本几何均数的比较;当n 足够大时,也可以用u 检验。
(V )8.在配对T 检验中,用药前数据减去用药后的数据和用药后的数据减去用药前的数据,作T 检验后的结论是相同的。
统计学学习题及解答
统计学学习题及解答统计学学习题及解答⼀、填空题:1、“统计”⼀词,⼀般有三种涵义,即统计资料、统计⼯作和统计学。
2、统计指标按其反映的总体内容不同,可分为数量指标与质量指标;按其作⽤和表现形式不同,可分为总量指标、相对指标和平均指标。
结构相对指标是部分(或各组)总量与总体总量之⽐。
3、总量指标时间数列是基本的时间数列,它有时期数列和时点数列两种。
4、当我们研究某个班学⽣的学习情况时,某个班的学⽣便构成总体,⽽这个班的每⼀名学⽣则是总体单位。
5、可变的数量标志称为变量,⽽数量标志的表现则称标志值。
6、标志是⽤来说明总体单位特征的名称,⽽指标是说明总体的综合数量特征的。
7、⼈⼝按性别、民族、职业分组,属于按品质标志分组,⽽⼈⼝按年龄、⼯资、⾝⾼分组,则属于按数量标志分组。
8、⽅差分析中,如果在实验中变化的因素只有⼀个,这时的⽅差分析称为单因素⽅差分析。
9、直线相关系数等于0,说明两变量之间⽆线性相关关系;直线相关系数等于1,说明两变量之间完全线性正相关。
直线相关系数越接近于1,说明两变量之间相关关系越密切;直线相关系数越接近于0,说明两变量之间相关关系越不密切。
10、相关系数的取值在-1 和 1 之间,即[-1,1]。
11、从内容上看,统计表由主词栏和宾词栏两部分组成。
12、假设检验分为两类:参数假设检验和⾮参数假设检验。
p13、是⾮标志的平均数等于,是⾮标志的标准差等于14、统计调查按调查对象所包括的范围不同,可分为全⾯调查和⾮全⾯调查。
15、按照说明现象的范围不同,统计指数可分为个体指数和总指数。
16、保证时间数列中各个指标数值的可⽐性是编制时间数列的基本原则。
17、组中值是各组上限和下限的简单平均。
18、投资额与消费额的⽐例为1:3(A)。
投资额占国内⽣产总值使⽤额的25%(B)。
在这⼀资料中,A为⽐例相对指标,B为结构相对指标。
19、统计数据的表现形式有绝对数、相对数和平均数三种。
20、相关关系按相关的⽅向可分为正相关和负相关。
区间估计和假设检验
说明这个区间估计的可靠性为95%.
对于同一总体和同一抽样规模来说
①所给区间的大小与做出这种估计所具有的把握性形
成正比.
② 区间大小所体现的是估计的精确性,区间越大,精确
性程度越低,区间越小精确性越高,二者成反比.
精选可编辑ppt
3
③ 从精确性出发,要求所估计的区间越 小越好,从把握性出发,要求所估计的区间越大 越好,因此人们总是需要在这二者之间进行平 衡和选择.
Z(0.05/2)=1.96
精选可编辑ppt
16
然后根据样本数计算统计值:
公式为:
Z= X—μ = 220—210 = 6.67
S/√n
15/√100
由于Z=6.67>Z (0.05/2) =1.96 所以.拒绝虚无假设,接受研究假设,即
从总体上说,该单位职工月平均奖金与上月 相比有变化.
精选可编辑ppt
P≤
0 .1 0 0 .0 5 0 .0 2 0 .0 1
│ Z│ ≥
一端
二端
1 .2 9
1 .6 5
1 .6 5
1 .9 6
2 .0 6
2 .3 3
2 .3 3
2 .5 8
精选可编辑ppt
7
3.总体百分数的区间估计
总体百分数的区间估计公式为:
P±Z(1-α)
P(1—p) n
这里,P为样本的百分比 。 例题:
为了验证这一假设是否可靠,我们抽取100 人作调查,结果得出月平均收入为220元,标准 差位15元.
显然,样本的结果与总体 结果之间出现了 误差,这个误差是由于我们假设错误引起的,还 是由于抽样误差引起的呢?
如果是抽样误差引起的,我们就应该承认
(完整版)统计学假设检验习题答案
1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。
解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。
采用t 分布的检验统计量nx t /0σμ-=。
查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。
667.116/60800820=-=t 。
因为t <2.131<2.947,所以在两个水平下都接受原假设。
2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)?解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。
n=100可近似采用正态分布的检验统计量nx z /0σμ-=。
查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。
计算统计量值3100/5001000010150=-=z 。
因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。
3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。
问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2Z z α>,取0.05,α=26,n =0.0250.9752 1.96z z z α===,由检验统计量1.25 1.96Z ===<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600.4.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量3.33 1.96Z ===>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响.5.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。
统计学中的假设检验与置信区间
统计学中的假设检验与置信区间统计学中的假设检验与置信区间是两个重要的概念,用于分析样本数据并对总体参数进行推断。
假设检验是一种统计推断方法,用于判断某个断言是否成立或者拒绝。
而置信区间则是用于估计总体参数的范围。
一、假设检验假设检验是一种基于样本数据对总体假设进行推断的方法。
其基本思想是:首先提出一个关于总体参数的假设,然后通过样本数据的分析来判断该假设是否成立。
在进行假设检验时,首先需要提出原假设(H0)和备择假设(H1)。
原假设是我们希望得到支持的假设,而备择假设则是我们希望进行反驳的假设。
然后,选择一个合适的检验统计量,根据该统计量的取值,计算出相应的P值。
若P值小于预先设定的显著性水平(通常为0.05),则拒绝原假设,否则接受原假设。
举个例子来说,假设我们要检验某个新药物的疗效是否优于传统药物。
原假设可以是该药物的疗效不优于传统药物,备择假设可以是该药物的疗效优于传统药物。
然后,收集一部分病人的数据,计算出适当的统计量,并根据该统计量的取值计算出P值,用以判断是否拒绝原假设。
二、置信区间置信区间是用于对总体参数的范围进行估计的方法。
它给出了一个范围,该范围内包含了可能的参数值,并以一定的置信水平(通常为95%)表示。
计算置信区间的方法有很多种,最常用的是基于正态分布的方法。
该方法假设样本数据近似服从正态分布,通过样本均值和样本标准差的计算,结合正态分布的性质,可以计算出一个置信区间,用于估计总体参数。
举个例子来说,我们想要估计某个城市的平均工资水平。
收集到了一部分居民的工资数据,计算出样本均值和样本标准差,然后使用正态分布的方法计算出一个置信区间,例如95%的置信区间为(1000, 2000),表示我们对于总体平均工资的估计范围在1000到2000之间,且有95%的置信水平。
三、假设检验与置信区间的联系假设检验与置信区间在某种程度上可以互相转化和补充。
在假设检验中,我们可以根据置信区间来判断原假设的合理性。
统计学
第五章练习题一、单项选择题1、假设检验中,显著性水平表示()。
①为真时接受的概率② 为真时拒绝的概率③不真时接受的概率④ 不真时拒绝的概率2、假设检验中,第二类错误的概率表示()。
①为真时接受的概率② 为真时拒绝的概率③不真时接受的概率④ 不真时拒绝的概率3、假设检验的P值表示()。
①观察到的显著性水平②给定的显著性水平③正确决策的概率④错误决策的概率4、在左侧检验中,利用P值进行检验时,拒绝原假设的条件是()。
①P值> ② P值< ③P值> ④ P值<5、在假设检验中,若其他条件相同,则在下列多个P值中对原假设有利的是()。
①5% ② 15% ③ 45% ④65%6、在假设检验中,当我们作出接受原假设的结论时,表示()。
①原假设必定是正确的②没有充足的理由否定原假设③备择假设必定是正确的④备择假设必定是错误的7、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100的样本,则可采用()。
① t检验法② Z检验法③ 检验法④ F检验法8、设总体服从正态分布,总体方差未知,现抽取一容量为20的样本,拟对总体均值进行假设检验,检验统计量是()。
① ② ③ ④9、已知总体服从正态分布,总体方差为1,现抽取一容量为10的样本,拟对总体均值进行假设检验,:;。
=0.01,则原假设的拒绝区域为()。
① (3.25,+ )②(2.82,+ )③ (2.33,+ ) ④(2.58,+ )10、已知总体服从正态分布,现抽取一容量为16的样本,拟对总体方差进行假设检验,:=1;。
=0.05,则原假设的拒绝区域为()。
① (0,26.296)②(0,24.996)③ (0,7.962) ④(0,7.261)11、已知总体服从正态分布,现抽取一容量为50的样本,拟对总体方差进行假设检验,可近似采用()。
① t检验法② Z检验法③ 检验法④ F检验法12、在方差分析中,组间平方和反映的是()。
统计学 第五章 假设检验习题五
第五章 假设检验一、单项选择题1、假设检验是检验( )的假设是否成立:A 、样本指标B 、总体指标C 、样本容量D 、总体单位数 2、第二类错误是指总体的:A 、真实状况B 、真实状况检验为非真实状况C 、非真实状况D 、非真实状况检验为真实状况 3、假设检验中的临界区域是:A 、接受域B 、拒绝域C 、置信区域D 、检验域 4、在显著性水平α下,经过检验而原假设0H 没有被拒绝:A 、原假设0H 一定是正确的B 、备选假设1H 一定是错误的C 、0H 是正确的可能性为α-1D 、原假设0H 可能是正确的 5、经过显著性检验,原假设0H 被拒绝了,则:A 、原假设0H 一定是错误的B 、备选假设1H 一定是正确的C 、0H 是正确的可能性为αD 、原假设0H 可能是正确的 6、在假设检验中,一般情况下,( )错误。
A 、只犯第1类错误B 、只犯第2类错误C 、不犯第1、2类错误D 、可能犯第1、2类错误 7、双侧检验的原假设通常是:A 、0H :0X X =B 、0H :0X X ≥C 、0H :0X X ≤D 、0H :0X X ≠ 8、下列说法正确的是:A 、若备选假设是正确的,作出的决策是拒绝备选假设,则犯了弃真错误B 、若备选假设是错误的,作出的决策是接受备选假设,则犯了纳伪错误C 、若原假设是正确的,作出的决策是接受备选假设,则犯了弃真错误D 、若原假设是错误的,作出的决策是接受备选假设,则犯了纳伪错误 9、假设检验时,若增大样本容量,则犯两类错误的可能性:A 、都增大B 、都缩小C 、都不变D 、一个增大,一个缩小 10、若总体为非正态分布,则在( )情况下,也可选用z 统计量: A 、样本容量大于或等于30 B 、样本容量小于30 C 、任意的样本容量 D 、总体单位数很大 11、在假设检验中,显著性水平α表示:A 、{}α=假接受00/H H P B 、{}α=真拒绝00/H H P C 、{}α=真接受00/H H P D 、{}α=假拒绝00/H H P 12、在一项假设中,显著性水平05.0=α,下面表述正确的是:A 、接受0H 的可靠性为95%B 、接受1H 的可靠性为95%C 、0H 为假被接受的概率为5%D 、1H 为真时被拒绝的概率为5% 13、下列结论中,不正确的是:A 、假设检验的依据是小概率原理B 、若{}α=真拒绝00/H H P ,则α为犯第1类错误的概率 C 、α小则β也小 D 、尽量增大样本容量可以减小αβ 14、设X ~()2,σX N ,且2σ已知,从中抽取一样本,检验假设0H :0X X =采用z 检验法,则其拒绝域与( )有关。
统计学假设检验练习题
例3.7.9从一大批相同型号的金属线中,随机选取10根,测得它的直径(单位:mm)为:1.23 1.24 1.26 1.29 1.20 1.32 1.23 1.23 1.29 1.28(1)如果金属线直径X~N(μ,0.042),试求平均直径μ的置信度为95%的置信区间.(2)如果金属线直径X~N(μ, σ2),σ2未知,试求平均直径μ的置信度为95%的置信区间.例3.7.10随机取某牌香烟8支,其尼古丁平均含量为3.6mg,标准差为0.9mg.试求此牌香烟尼古丁平均含量μ的95%的置信区间.(假设尼古丁含量服从正态分布).4.某种袋装食品的重量服从正态分布.某一天随机地抽取9袋检验,重量(单位:g)为510 485 505 505 490 495 520 515 490(1) 若已知总体方差σ2=8.62,求μ的置信度为90%的置信区间;(2) 若已知总体方差未知,求μ的置信度为95%的置信区间.5.为了估计在报纸上做一次广告的平均费用,抽出了20家报社作随机样本,样本的均值和标准差分别为575(元)和120(元),假定广告费用近似服从正态分布,求总体均值的95%的置信区间.6.从某一班中随机抽取了16名女生进行调查.她们平均每个星期花费13元吃零食,样本标准差为3元,求此班所有女生每个星期平均花费在吃零食上的钱数的95%的置信区间.(假设总体服从正态分布)7.一家轮胎工厂在检验轮胎质量时抽取了400条轮胎作试验,其检查结果这些轮胎的平均行驶里程是20000k m,样本标准差为6000k m.试求这家工厂的轮胎的平均行驶里程的置信区间,可靠度为95%.8.为了检验一种杂交作物的两种新处理方案,在同一地区随机地选择8块地段.在各试验地段,按两种方案处理作物,这8块地段的单位面积产量是(单位:k g)一号方案产量: 86 87 56 93 84 93 75 79二号方案产量: 80 79 58 91 77 82 74 66假设两种产量都服从正态分布,分别为N(μ1, σ2) ,N(μ2, σ2), σ2未知,求μ1-μ2的置信度为95%的置信区间.9.为了比较两种型号步枪的枪口速度,随机地取甲型子弹10发,算得枪口子弹的平均值=500(m/s), 标准差s1=1.10(m/s); 随机地取乙型子弹20发,得枪口速度平均值=496(m/s),标准差s2=1.20(m/s). 设两总体近似地服从正态分布,并且方差相等,求两总体均值之差的置信水平为95%的置信区间.10.为了估计参加业务训练的效果.某公司抽了50名参加过训练的职工进行水平测验,结果是平均得分为4.5,样本方差为 1.8;抽了60名未参加训练的职工进行水平测验,其平均得分为3.75,样本方差为2.1. 试求两个总体均值之差的95%的置信区间.(设两个总体均服从正态分布).11、风驰汽车制造厂的装配车间安装车门仍需人工操作,不同工人的装配时间不同,同一工人的装配时间也有差异,为测定安装车门所需时间,每隔一定时间抽选一个样本,共抽取了10个样本,其数据如下(单位:秒):41 43 36 26 20 21 46 39 37 211. 以置信度95%,估计安装一个车门所需平均时间的置信区间,2.若要求估计平均装配时间的误差不超过2秒,置信度为95%,应抽选多大的样本?3.若费用为200元,观察每个样本的费用为4元,置信度为95%,则允许误差限是多少?4.假设上月测定的平均时间为35秒,则a=0.05时,检验其平均时间是否有显著缩短?12、万里橡胶制品厂生产的汽车轮胎平均寿命为40,000公里,标准差为7500公里。
统计学练习题 (3)
《统计学》练习题一、选择题1、根据样本计算的用于描述总体特征的度量工具(如均值)被称为( D )。
A、参数B、总体C、样本D、统计量2、下列属于分类变量的是( D )。
A、年龄B、工资C、产量D、性别3、为了估计某城市中拥有私家车的家庭比例,随机抽取500个家庭,得到拥有私家车的家庭比例为30%,这里的30%是( B )。
A、参数值B、统计量的值C、样本量D、统计量4、抽样调查不可避免的误差是( B )。
A、系统性误差B、偶然性误差C、观察性误差D、登记性误差5、下列关于抽样误差的说法,正确的是( B )。
A、抽样误差是针对某个具体样本的检测结果与总体结果的差异而言B、样本容量N越大,抽样误差越小C、总体的变异度越大,抽样误差越小D、抽样误差可控制,也可避免6、不适用于顺序尺度的统计量是( D )。
A、频率B、众数C、中位数D、均值7、描述定性数据的两种最常用的图示法是( A )。
A、条形图和饼图B、散点图和饼图C、散点图和条形图D、条形图和茎叶图8、下列图形中,适合描述顺序数据的是( D )。
A、直方图B、茎叶图C、箱线图D、环形图9、对连续变量或变量值较多的离散变量分组是,通常采用的分组方法是( B )。
A、单项式分组B、组距式分组C、等距分组D、异距分组10、为了描述身高与体重的依存关系,适合采用的图形是( B )。
A、直方图B、散点图C、箱线图D、雷达图11、在对几组数据的离散程度进行比较时使用的统计量通常是( D )。
A、异众比率B、平均差C、标准差D、离散系数12、当观察数据偏斜程度较大时,应该选用( D )测度数据的集中趋势。
A、均值B、标准差C、变异系数D、中位数13、从一个均值=20,标准差=1.2的总体中随机抽取n=36的样本。
假定该总体并不是很偏,则样本均值小于19.8的近似概率为( B )。
A、0.1268B、0.1587C、0.2735D、0.632414、从一个均值为60,标准差为8的总体里随机抽查容量n=100的样本,则样本均值和抽样分布的标准误差分别为( B )。
区间估计与假设检验
区间估计与假设检验在统计学中,区间估计和假设检验是两个常用的推断方法,用于对总体参数进行估计和推断。
本文将对区间估计和假设检验进行介绍,并讨论它们的应用和差异。
一、区间估计区间估计是用样本数据来推断总体参数的取值范围。
它通过计算估计值以及与之相关的置信水平,给出一个参数的范围估计。
这个范围被称为置信区间。
置信区间常用于描述一个参数的不确定性。
例如,我们要估计某种药物的平均效果。
通过对随机抽取的样本进行实验,我们可以得到样本均值和标准差。
然后,结合样本容量和置信水平,可以计算出药物平均效果的置信区间。
例如,我们可以得出一个95%置信区间为(0.2, 0.6),表示我们有95%的置信水平相信真实的平均效果在这个区间内。
二、假设检验假设检验是用于判断总体参数是否符合某种假设的统计方法。
假设检验通常分为两类:单样本假设检验和双样本假设检验。
1. 单样本假设检验单样本假设检验用于推断一个总体参数与某个特定值之间是否存在显著差异。
它包括以下步骤:(1)建立原假设(H0)和备择假设(H1),其中原假设是要进行检验的假设,备择假设是对原假设的补充或对立的假设。
(2)选择合适的显著性水平(α),表示我们接受原假设的程度。
(3)计算样本数据的检验统计量,例如t值或z值。
(4)根据显著性水平和检验统计量,判断是否拒绝原假设。
2. 双样本假设检验双样本假设检验用于比较两个总体参数之间是否存在显著差异。
常见的双样本假设检验包括独立样本t检验和配对样本t检验。
独立样本t检验用于比较两个独立样本的均值是否有差异,而配对样本t检验用于比较同一样本的两个相关变量的均值是否有差异。
三、区间估计与假设检验的差异区间估计和假设检验都是推断总体参数的方法,但它们的应用和目的略有不同。
区间估计主要关注参数的范围估计,给出了参数估计值的不确定性范围。
它强调了估计的稳定性和精确度,但不直接涉及参数的显著性判断。
因此,区间估计对于参数的精确度提供了一个相对准确的度量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学习题区间估计假设检验..第五章抽样与参数估计一、单项选择题1、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( B )A、样本容量为10B、抽样误差为2C、样本平均每袋重量是估计量D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( D )A、N(100,25)B、N(100,5/n)C、N(100/n,25)D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( C )A、一半B、一倍C、三倍D、四倍4、在其他条件不变时,置信度(1–α)越大,则区间估计的( A )A、误差范围越大B、精确度越高C、置信区间越小D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( C )A、1/4B、4倍C、7/9D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是( C )A、总方差B、群内方差C、群间方差D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( B )尽可能小A、总体层数B、层内方差C、层间方差D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( D )A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( A )A、分层抽样B、简单随机抽样C、等距(系统)抽样D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选( A )A、85%B、87.7%C、88%D、90%二、多项选择题1、影响抽样误差大小的因素有( ADE )A、总体各单位标志值的差异程度B、调查人员的素质C 、样本各单位标志值的差异程度D 、抽样组织方式E 、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。
根据抽样结果进行推断,下列说法正确的有( ADE )A 、n=200B 、n=30C 、总体合格率是一个估计量D 、样本合格率是一个统计量E 、合格率的抽样平均误差为2.52%3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布( BCE )A 、np ≤5B 、np ≥5C 、n (1–p )≥5D 、p ≥1%E 、n ≥30三、填空题1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。
请列出四种常见的抽样方法:、、、,当对全校学生的名单不好获得时,你认为方法比较合适,理由是。
四、简答题1、分层抽样与整群抽样有何异同?它们分别适合于什么场合?2、解释抽样推断的含义。
五、计算题1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。
对该日所生产的糖果,给定置信度为95%,试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知;(8125.1,8331.1,2281.2,2622.210,05.09,05.010,025.09,025.0====t t t t );2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。
该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。
为了节约调查费用,样本将尽可能小,试问样本量应该为多大?3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。
(1)试对家庭每天平均看电视时间进行区间估计。
(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05)答案:一、B ,D ,C ,A ,C ;C ,B ,D ,A ,A 。
二、ADE ,ADE ,BCE 。
三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。
四、1、答:都要事先按某一标志对总体进行划分的随机抽样。
不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。
分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。
2、答:简单说,就是用样本中的信息来推断总体的信息。
总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。
五、1、解:n=10,小样本(1)方差已知,由x ±z α/2nσ得,(494.9,501.1)(2)方差未知,由x ±t α/2ns 得,(493.63,502.37)2、解:n=222/1xp p z ?-??)(α=2202.05.05.01.6448??=1691 3、解:(1)x ±t α/2ns =6.75±2.131×1625.2=(5.55,7.95)(2)边际误差E= t α/2ns =2.131×1625.2=1.2n=2222/E z σα?=2222.15.21.96?=17第六章假设检验练习题一、单项选择题1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用( C )。
A 、左侧检验B 、右侧检验C 、双侧检验D 、左侧检验或右侧检验2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定元假设,则可认为( C )。
A 、抽样是不科学的B 、检验结论是正确的C 、犯了第一类错误D 、犯了第二类错误3、当样本统计量的观察值未落入原假设的拒绝域时,表示( B )。
A 、可以放心地接受原假设B 、没有充足的理由否定与原假设C 、没有充足的理由否定备择假设D 、备择假设是错误的4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( A )。
A、都减少B、都增大C、都不变D、一个增大一个减小5、关于检验统计量,下列说法中错误的是( B )。
A、检验统计量是样本的函数B、检验统计量包含未知总体参数C、在原假设成立的前提下,检验统计量的分布是明确可知的D、检验同一总体参数可以用多个不同的检验统计量二、多项选择题1、关于原假设的建立,下列叙述中正确的有( CD )。
A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2、在假设检验中,α与β的关系是( CE )。
A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β三、判断分析题(判断正误,并简要说明理由)1、对某一总体均值进行假设检验,H0:X=100,H1:X≠100。
检验结论是:在1%的显著性水平下,应拒绝H0。
据此可认为:总体均值的真实值与100有很大差异。
2、有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。
为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。
那么原假设可以为:H0:P≤1/3。
四、简答题1、采用某种新生产方法需要追加一定的投资。
但若根据实验数据,通过假设检验判定该新生方法能够降低产品成本,则这种新方法将正式投入使用。
(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。
(2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?五、计算题1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。
从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。
假设产品重量服从正态分布。
(1)建立适当的原假设和备择假设。
(2)在α=0.05时,该检验的决策准则是什么?(3)如果x =12.25克,你将采取什么行动?(4)如果x =11.95克,你将采取什么行动?答案:一、1、C 2、C 3、B 4、A 5、B 二、1、CD 2、CE三、1、错误。
“拒绝原假设”只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。
2、错误。
要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P (或男孩所占的比例P*)所以原假设为:H 0:P=3/4(或P ≤3/4);H 1:P >3/4。
也可以是:H 0:P*=1/4(或P ≥1/4);H 1:P*<1/4。
四、1、(1)H 0:x ≥350;H 1:x <350。
(2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。
犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。
五、1、(1)H 0:μ=120;H 1:μ≠12。
(2)检验统计量:Z=nx /0σμ-。
在α=0.05时,临界值z α/2=1.96,故拒绝域为|z|>1.96。
(3)当x =12.25克时,Z=nx /0σμ-=25/0.61212.25-=2.08。
由于|z|=2.08>1.96,拒绝H 0:μ=120;应该对生产线停产检查。
(4)当x =11.95克时,Z=nx /0σμ-=25/0.61211.95-=-0.42。
由于|z|=-0.42<1.96,不能拒绝H 0:μ=120;不应该对生产线停产检查。
第七章相关与回归分析一、单项选择题1、下面的关系中不是相关关系的是( D )A 、身高与体重之间的关系B 、工资水平与工龄之间的关系C 、农作物的单位面积产量与降雨量之间的关系D 、圆的面积与半径之间的关系2、具有相关关系的两个变量的特点是( A )A 、一个变量的取值不能由另一个变量唯一确定B 、一个变量的取值由另一个变量唯一确定C 、一个变量的取值增大时另一个变量的取值也一定增大D 、一个变量的取值增大时另一个变量的取值肯定变小3、下面的假定中,哪个属于相关分析中的假定( B )A 、两个变量之间是非线性关系B 、两个变量都是随机变量C 、自变量是随机变量,因变量不是随机变量D 、一个变量的数值增大,另一个变量的数值也应增大4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为( A )A 、完全相关关系B 、正线性相关关系C 、非线性相关关系D 、负线性相关关系5、根据你的判断,下面的相关系数取值哪一个是错误的( C )A 、–0.86B 、0.78C 、1.25D 、06、设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着( A )绝对值大于0.8A 、高度相关B 、中度相关C 、低相关D 、极弱相关7、在回归分析中,描述因变量y 如何依赖于自变量x 和误差项ε的方程称为( B )A 、回归方程B 、回归模型C 、估计回归方程D 、经验回归方程 8、在回归模型y=01x ββε++中,ε反映的是( C )A 、由于x 的变化引起的y 的线性变化部分B 、由于y 的变化引起的x 的线性变化部分C 、除x 和y 的线性关系之外的随机因素对y 的影响D 、由于x 和y 的线性关系对y 的影响9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误( B )A 、∧y =25–0.75xB 、∧y = –120+ 0.86x C 、∧y =200–2.5x D 、∧y = –34–0.74x10、说明回归方程拟合优度的统计量是( C )A 、相关系数B 、回归系数C 、判定系数D 、估计标准误差11、判定系数R 2是说明回归方程拟合度的一个统计量,它的计算公式为( A )A 、SST SSR B 、SSE SSR C 、SST SSE D 、SSRSST12、已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( A )4854/(4854+146)A 、97.08%B 、2.92%C 、3.01%D 、33.25%13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是( D )A、较高的男子趋于较重B、身高与体重存在低度正相关C、体重较重的男子趋于较高D、45%的较高的男子趋于较重14、下列回归方程中哪个肯定有误( A )A、∧y=15–0.48x,r=0.65 B、∧y= –15 - 1.35x,r=-0.81C、∧y=-25+0.85x,r=0.42 D、∧y=120–3.56x,r=-0.9615、若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R2为( C )A、0.8B、0.89C、0.64D、0.4016、对具有因果关系的现象进行回归分析时( A )A、只能将原因作为自变量B、只能将结果作为自变量C、二者均可作为自变量D、没有必要区分自变量二、多项选择题1、下列现象不具有相关关系的有( ABD )A、人口自然增长率与农业贷款B、存款期限与存款利率C、降雨量与农作物产量D、存款利率与利息收入E、单位产品成本与劳动生产率2、一个由500人组成的成人样本资料,表明其收入水平与受教育程度之间的相关系数r为0.6314,这说明( E )中度A、二者之间具有高度的正线性相关关系B、二者之间只有63.14%的正线性相关关系C、63.14%的高收入者具有较高的受教育程度D、63.14%的较高受教育程度者有较高的收入E、通常来说受教育程度较高者有较高的收入三、判断分析题(判断正误,并简要说明理由)1、一项研究显示,医院的大小(用病床数x反映)和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。