统计学习题区间估计与假设检验..学习资料

合集下载

医用统计学-总体均数的估计与假设检验练习题

医用统计学-总体均数的估计与假设检验练习题

医用统计学-总体均数的估计与假设检验练习题一、名词解释1.抽样误差2.标准误3.置信区间4.第一类错误5.第二类错误二、是非题1.即使变量偏离正态分布,只要样本含量相当大,样本均数也近似正态分布。

()2.同一批计量资料的标准差不会比标准误大。

()3.两次t检验都是对两样本均数的差别做统计检验,一次P<0.01,另一次0.01<P<0.05,就表明前者两样本均数差别大,后者两样本均数差别小。

()4.对两样本均数的差别做统计检验,两组数据具有方差齐性,但与正态分布相比略有偏离,样本含量都较大,因此仍可做t检验。

()5.t检验可用于同一批对象的身高与体重均数差别的统计检验。

()三、最佳选择题1、()小,表示用该样本均数估计总体均数的可靠性大。

D、RE、四分位间距A、CVB、SC、x2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明()。

A、两样本均数差别越大B、两总体均数差别越大C、越有理由认为两总体均数不同D、越有理由认为两样本均数不同E、越有理由认为两总体均数不同3、甲乙两人分别随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S12,X2和S22,则理论上()。

A、X1=X 2B、S12= S22C、作两样本均数的t检验,必然得出无差别的结论D、作两方差齐性的F检验,必然方差齐E、由甲、乙两样本均数之差求出的总体均数的95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,∣X-μ∣≥()的概率为5%。

A、1.96σB、1.96C、2.58D、t0.05,v SE、t0.05,vsx5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围()。

A、74±4×4B、74±1.96×4C、74±2.58×4D、74±2.58×4÷10E、74±1.96×4÷106、关于以0为中心的t 分布,错误的是( )。

统计学习题区间估计假设检验..

统计学习题区间估计假设检验..

统计学习题区间估计假设检验..第五章抽样与参数估计一、单项选择题1、某品牌袋装糖果重量的标准是(500±5)克。

为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。

下列说法中错误的是( B )A、样本容量为10B、抽样误差为2C、样本平均每袋重量是估计量D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( D )A、N(100,25)B、N(100,5/n)C、N(100/n,25)D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( C )A、一半B、一倍C、三倍D、四倍4、在其他条件不变时,置信度(1–α)越大,则区间估计的( A )A、误差范围越大B、精确度越高C、置信区间越小D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( C )A、1/4B、4倍C、7/9D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是( C )A、总方差B、群内方差C、群间方差D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( B )尽可能小A、总体层数B、层内方差C、层间方差D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( D )A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( A )A、分层抽样B、简单随机抽样C、等距(系统)抽样D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选( A )A、85%B、87.7%C、88%D、90%二、多项选择题1、影响抽样误差大小的因素有( ADE )A、总体各单位标志值的差异程度B、调查人员的素质C 、样本各单位标志值的差异程度D 、抽样组织方式E 、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。

统计学试题库和试题库答案及解析

统计学试题库和试题库答案及解析

统计学试题库和试题库答案及解析统计学题库及题库答案题库1一、单项选择题(每题2分,共20分) 1、调查时间是指()A 、调查资料所属的时间B 、进行调查的时间C 、调查工作的期限D 、调查资料报送的时间2、对某城市工业企业未安装设备进行普查,总体单位是()。

A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业3、对比分析不同性质的变量数列之间的变异程度时,应使用()。

A 、全距B 、平均差C 、标准差D 、变异系数4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量()A 、扩大为原来的3倍B 、扩大为原来的2/3倍C 、扩大为原来的4/9倍D 、扩大为原来的2.25倍5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选()。

A 、576户B 、144户C 、100户D 、288户 6、当一组数据属于左偏分布时,则()A 、平均数、中位数与众数是合而为一的B 、众数在左边、平均数在右边C 、众数的数值较小,平均数的数值较大D 、众数在右边、平均数在左边7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为()。

A 、520B 、 510C 、 500D 、4908、用组中值代表组内变量值的一般水平有一定的假定性,即()A 、各组的次数必须相等B 、变量值在本组内的分布是均匀的C 、组中值能取整数D 、各组必须是封闭组9、n X X X ,,,21 是来自总体),(2σμN 的样本,样本均值X 服从()分布 A 、),(2σμN B.、)1,0(N C.、),(2σμn n N D 、),(2n N σμ10、测定变量之间相关密切程度的指标是()A 、估计标准误B 、两个变量的协方差C 、相关系数D 、两个变量的标准差二、多项选择题(每题2分,共10分)1、抽样推断中,样本容量的多少取决于()。

假设检验例题和习题

假设检验例题和习题

超过1cm3。如果达到设计要求 -0.6 0.7 -1.5 -0.2 -1.9
,表明机器的稳定性非常好。 -0.5 1 -0.2 -0.6 1.1
现从该机器装完的产品中随机
抽取25瓶,分别进行测定(用样
本减1000cm3),得到如下结果
。检验该机器的性能是否达到
设计要求 (=0.05)
8 - 30
双侧检验
备择假设的方向为“<”(废品率降低) 建立的原假设与备择假设应为
H0: 2% H1: < 2%
8 -7
统计学
(第二版)
单侧检验
(原假设与备择假设的确定)
某灯泡制造商声称,该企业所生产的灯泡 的平均使用寿命在1000小时以上。如果 你准备进一批货,怎样进行检验
▪ 检验权在销售商一方
▪ 作为销售商,你总是想收集证据证明生产商 的说法(寿命在1000小时以上)是不是正确的
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
统计学
(第二版)
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜 单
第2步:选择“函数”点击
第3步:在函数分类中点击“统计”,在函数名的 菜
单下选择字符“NORMSDIST”然后确定
?( = 0.05)
统计学
(第二版)
均值的单尾 t 检验
(计算结果)
H0: 40000 H1: < 40000 = 0.05 df = 20 - 1 = 19 临界值(s):
拒绝域
.05
-1.7291 0
t
8 - 23

统计学导论 科学出版社 第五章 假设检验

统计学导论  科学出版社 第五章 假设检验

右侧检验

H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值

☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体

概率论15区间估计与假设检验

概率论15区间估计与假设检验

,X , S 2分别是 样本均值和样本方差,
则有
X
S
X S
~
t n 1
n 1
n
(2)方差 2 的区间估计
10 已 知
1
2
n
(Xi
i1
)2
~ 2(n)
2的置信度为1α的置信区间是
n (Xi )2
n (Xi )2
i1
2
(n)
2
,
i 1
12
2
(n)
20 未知
(n 1)S2
解 该问题是方差未知, 对正态总体均值进行估计.
(X t (n 1) S
2
n
,
X t (n 1) S
2
) n
x 3056.67 s* 375.31 n 12 t0.025 (11) 2.201
所求区间估计为(2812.21, 3295.13).
设 X1, X 2,, X n 是总体X ~ N , 2 的样本
即 X 0 0
Z 是 衡 量H0 真 伪 的 标 准 . 2
n
如 例1中, 0.005 Z 1.96 n 6
2
0 1 x 19.503 0 20
x 0 0
0.7351.96
n
故认为 机床生产正常,即该天加工的零件直径
平均是20mm.
综述假设检验方法的基本思想是:由 样本出发,在 H 0 为真的前提下通过对被 检参数的点估计量,结合统计量的分布,构 造统计量(枢轴函数),由此结合实际,并利 用上α分位点确定小概率事件,便得检验
其中例1为参数检验,例2为非参 数检验.
二 假设检验的基本思想
例1 用机床加工圆形零件,正常情况下 零件的直径X服从正态分布N(20,1)(单 位:mm), 某日开工后为检查机床是否 正常,随机抽取6个,测得直径分别为

统计学学习题及解答

统计学学习题及解答

统计学学习题及解答统计学学习题及解答⼀、填空题:1、“统计”⼀词,⼀般有三种涵义,即统计资料、统计⼯作和统计学。

2、统计指标按其反映的总体内容不同,可分为数量指标与质量指标;按其作⽤和表现形式不同,可分为总量指标、相对指标和平均指标。

结构相对指标是部分(或各组)总量与总体总量之⽐。

3、总量指标时间数列是基本的时间数列,它有时期数列和时点数列两种。

4、当我们研究某个班学⽣的学习情况时,某个班的学⽣便构成总体,⽽这个班的每⼀名学⽣则是总体单位。

5、可变的数量标志称为变量,⽽数量标志的表现则称标志值。

6、标志是⽤来说明总体单位特征的名称,⽽指标是说明总体的综合数量特征的。

7、⼈⼝按性别、民族、职业分组,属于按品质标志分组,⽽⼈⼝按年龄、⼯资、⾝⾼分组,则属于按数量标志分组。

8、⽅差分析中,如果在实验中变化的因素只有⼀个,这时的⽅差分析称为单因素⽅差分析。

9、直线相关系数等于0,说明两变量之间⽆线性相关关系;直线相关系数等于1,说明两变量之间完全线性正相关。

直线相关系数越接近于1,说明两变量之间相关关系越密切;直线相关系数越接近于0,说明两变量之间相关关系越不密切。

10、相关系数的取值在-1 和 1 之间,即[-1,1]。

11、从内容上看,统计表由主词栏和宾词栏两部分组成。

12、假设检验分为两类:参数假设检验和⾮参数假设检验。

p13、是⾮标志的平均数等于,是⾮标志的标准差等于14、统计调查按调查对象所包括的范围不同,可分为全⾯调查和⾮全⾯调查。

15、按照说明现象的范围不同,统计指数可分为个体指数和总指数。

16、保证时间数列中各个指标数值的可⽐性是编制时间数列的基本原则。

17、组中值是各组上限和下限的简单平均。

18、投资额与消费额的⽐例为1:3(A)。

投资额占国内⽣产总值使⽤额的25%(B)。

在这⼀资料中,A为⽐例相对指标,B为结构相对指标。

19、统计数据的表现形式有绝对数、相对数和平均数三种。

20、相关关系按相关的⽅向可分为正相关和负相关。

简述假设检验与区间估计之间的关系 统计学原理

简述假设检验与区间估计之间的关系 统计学原理

假设检验与区间估计的关系假设检验和区间估计是统计学中两个重要的概念和方法。

它们在数据分析和推断中经常被使用,并且有密切的关联。

假设检验假设检验是统计学中一种通过样本数据对总体参数进行推断的方法。

它的基本思想是,我们根据样本数据得到的统计量,与我们对总体参数的假设进行比较,从而判断这个假设是否合理。

在假设检验中,我们通常会提出一个原假设(null hypothesis)和一个备择假设(alternative hypothesis)。

原假设是我们要进行推断的对象,备择假设则是原假设不成立时所代表的情况。

然后,我们根据样本数据计算得到一个统计量,并且利用该统计量对原假设进行检验。

这个统计量通常会服从某种已知或近似已知的概率分布。

最后,根据统计量在概率分布中所处位置的概率来决定是否拒绝原假设。

如果这个概率非常小(小于显著性水平),则我们有充分的证据拒绝原假设;反之,如果这个概率较大,则我们没有充分的证据拒绝原假设。

总结一下,假设检验的步骤如下:1.提出原假设和备择假设;2.根据样本数据计算得到一个统计量;3.假设这个统计量服从某种概率分布;4.利用概率分布来计算统计量在概率分布中所处位置的概率;5.根据这个概率来决定是否拒绝原假设。

区间估计区间估计是统计学中一种通过样本数据对总体参数进行估计的方法。

它的基本思想是,我们根据样本数据得到的统计量,以及该统计量的抽样分布特性,构建一个区间,这个区间可以包含真实总体参数的真值。

在区间估计中,我们通常会选择一个置信水平(confidence level),表示我们对该区间包含真实总体参数的程度的置信程度。

常用的置信水平有95%和99%。

然后,我们根据样本数据计算得到一个统计量,并且利用该统计量和抽样分布特性来构建一个置信区间。

这个置信区间具有以下特点:如果我们重复使用相同方法对不同样本进行估计,那么约有95%(或99%)的置信区间会包含真实总体参数的真值。

最后,我们根据置信区间来进行参数估计。

区间估计和假设检验

区间估计和假设检验

说明这个区间估计的可靠性为95%.
对于同一总体和同一抽样规模来说
①所给区间的大小与做出这种估计所具有的把握性形
成正比.
② 区间大小所体现的是估计的精确性,区间越大,精确
性程度越低,区间越小精确性越高,二者成反比.
精选可编辑ppt
3
③ 从精确性出发,要求所估计的区间越 小越好,从把握性出发,要求所估计的区间越大 越好,因此人们总是需要在这二者之间进行平 衡和选择.
Z(0.05/2)=1.96
精选可编辑ppt
16
然后根据样本数计算统计值:
公式为:
Z= X—μ = 220—210 = 6.67
S/√n
15/√100
由于Z=6.67>Z (0.05/2) =1.96 所以.拒绝虚无假设,接受研究假设,即
从总体上说,该单位职工月平均奖金与上月 相比有变化.
精选可编辑ppt
P≤
0 .1 0 0 .0 5 0 .0 2 0 .0 1
│ Z│ ≥
一端
二端
1 .2 9
1 .6 5
1 .6 5
1 .9 6
2 .0 6
2 .3 3
2 .3 3
2 .5 8
精选可编辑ppt
7
3.总体百分数的区间估计
总体百分数的区间估计公式为:
P±Z(1-α)
P(1—p) n
这里,P为样本的百分比 。 例题:
为了验证这一假设是否可靠,我们抽取100 人作调查,结果得出月平均收入为220元,标准 差位15元.
显然,样本的结果与总体 结果之间出现了 误差,这个误差是由于我们假设错误引起的,还 是由于抽样误差引起的呢?
如果是抽样误差引起的,我们就应该承认

(完整版)统计学假设检验习题答案

(完整版)统计学假设检验习题答案

1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。

解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。

采用t 分布的检验统计量nx t /0σμ-=。

查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。

667.116/60800820=-=t 。

因为t <2.131<2.947,所以在两个水平下都接受原假设。

2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)?解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。

n=100可近似采用正态分布的检验统计量nx z /0σμ-=。

查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。

计算统计量值3100/5001000010150=-=z 。

因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。

3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。

问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2Z z α>,取0.05,α=26,n =0.0250.9752 1.96z z z α===,由检验统计量1.25 1.96Z ===<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600.4.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量3.33 1.96Z ===>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响.5.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。

统计 习题课件 CH07

统计 习题课件 CH07

两独立样本设计资料 t 检验的功效
计算

: Zβ =
σ
|δ | Zα 1 1 + n1 n2
其 中 , n1 , n 2 分 别 为 两 样 本 的 样 本 含 量 , 其 余 符 号 含 义 同 上 .
第五节 假设检验的功效
三,应用假设检验需要注意的问题 对服从正态分布资料进行t检验,不是 看样本均数间差别的大小,而是推断两个 总体均数是否相等(或其中一个大于另一 个);类似地,对服从二项分布资料或 Poisson分布资料进行Z检验,目的也是对 相应的总体参数大小进行推断.
(二)两独立样本设计资料的 Z 检验 独立样本设计资料的 设计 检验统计量: 检验统计量: | p1 p2 | 1 1 pc (1 pc )( + ) n1 n2 | p1 p2 | 0.5( 或 Z= 1 1 + ) n1 n2 1 1 pc (1 pc )( + ) n1 n2
Z=
其中, n1 , n2 分别为两样本的样本含量;
思考与练习
3. 随机将 20 只雌体中年大鼠均分为甲,乙两组,乙组中的每只大鼠接受 3mg/kg 的内毒素,甲组作为对照组,分别测得两组大鼠的肌酐(mg/L)如下: 甲(对照)组: 6.2 乙(处理)组: 8.5 3.7 6.8 5.8 11.3 2.7 3.9 9.4 9.3 6.1 7.3 6.7 7.8 3.8 7.2 6.9 8.2
当 n 不太大时, 需作如下的连续性校正: | X n π 0 | 0 .5 n π 0 (1 π 0 ) | p π0 | 0 .5 n π 0 (1 π 0 ) n
Z =

Z =
其中,π0 为已知的总体概率(一般为理论值,标准值或经过大量观察所得的稳 X 定值等) p = , . n

统计学中的参数估计与假设检验

统计学中的参数估计与假设检验

统计学中的参数估计与假设检验统计学是一门研究如何收集、整理、分析和解释数据的学科。

参数估计和假设检验是统计学中两个重要的概念和方法,用于推断总体参数和判断假设是否成立。

本文将详细介绍参数估计与假设检验的基本原理和应用。

一、参数估计参数估计是通过样本数据推断总体的未知参数。

在统计学中,总体是指研究对象的全体,而样本是从总体中抽取的一部分。

参数是总体的特征指标,例如均值、方差、比例等。

参数估计旨在通过样本数据对总体参数进行估计,并给出估计的精度。

参数估计分为点估计和区间估计两种方法。

点估计是通过样本数据计算得到的单个数字,用来估计总体参数的具体数值。

常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。

区间估计是通过样本数据计算得到的一个范围,该范围包含总体参数真值的概率较高。

置信区间是区间估计的一种形式,它可以用来描述估计值的不确定性。

二、假设检验假设检验是用于检验研究问题的特定假设是否成立的一种统计推断方法。

在假设检验中,我们提出一个原假设和一个备择假设,并根据样本数据对两个假设进行比较,进而判断原假设是否应该被拒绝。

原假设通常表示一种无关,即不发生预期效应或差异。

备择假设则表示研究者所期望的效应或差异。

在进行假设检验时,我们首先选择一个适当的统计检验方法,例如t检验、F检验或卡方检验等。

然后,计算出样本数据的检验统计量,并根据相关的分布理论和显著性水平进行推论。

最后,比较检验统计量与临界值,以决定是否拒绝原假设。

三、参数估计与假设检验的应用参数估计和假设检验在实际问题中有广泛的应用。

以医学研究为例,研究人员可能希望通过抽样来估计某种药物的有效剂量,并对药效进行假设检验。

在市场调研中,我们可以使用参数估计和假设检验来推断总体的需求曲线和做出市场预测。

在质量控制中,我们可以利用参数估计和假设检验来判断产品是否符合标准。

四、总结参数估计和假设检验是统计学中重要的方法,可以通过样本数据来推断总体参数和判断假设是否成立。

统计学复习(抽样分布、参数估计、假设检验)

统计学复习(抽样分布、参数估计、假设检验)

两个样本均值之差的抽样分布 (1)如: ) 抽样
X1 − N(µ1,σ12 ), X2 − N(µ2 ,σ2 ),
2
则 x1 − x2 ) ~ N(µ1 − µ2 , (
σ12 σ22
n1 + n2
)
抽样
σ12 N1 − n1 σ22 N2 − n2 (x1 − x2 ) ~ N[(µ1 − µ2 , ( )+ ( )] n1 N1 −1 n2 N2 −1
对于无限总体, 对于无限总体, 一个估计 如果对任意 量如能完 ε>ˆ 0 满足条件 全地包含 LimP(|θn −θ |≥ ε ) = 0 未知参数 n→∞ 信息, 信息,即 则称 θˆ 是 θ 为充分量 的一致估计。 的一致估计。
点估计
常用的求点估计量的方法
用样本的数字特征 1.数字特征法: 1.数字特征法:当样本容量增大时 ,用样本的数字特征 数字特征法 去估计总体的数字特征。 去估计总体的数字特征。 例如,我们可以用样本平均数(或成数 和样本方差来估 例如,我们可以用样本平均数 或成数)和样本方差来估 或成数 计总体的均值(或比率 和方差。 或比率)和方差 计总体的均值 或比率 和方差。
样本均值的抽样分布(简称均值的分布) 样本均值的抽样分布(简称均值的分布) 抽样
均值µ=∑Xi/N 均值
均值 X = Σxi
n
样本均值是样本的函数, 故样本均值是一个统计量, 样本均值是样本的函数, 故样本均值是一个统计量, 统计量 统计量是一个随机变量 随机变量, 统计量是一个随机变量, 样本均值的概率分布称为 样本均值的抽样分布。 样本均值的抽样分布。
2
n
总体均值 (µ) )
X ± tα
2
( n −1 )

统计学 第五章 假设检验习题五

统计学 第五章   假设检验习题五

第五章 假设检验一、单项选择题1、假设检验是检验( )的假设是否成立:A 、样本指标B 、总体指标C 、样本容量D 、总体单位数 2、第二类错误是指总体的:A 、真实状况B 、真实状况检验为非真实状况C 、非真实状况D 、非真实状况检验为真实状况 3、假设检验中的临界区域是:A 、接受域B 、拒绝域C 、置信区域D 、检验域 4、在显著性水平α下,经过检验而原假设0H 没有被拒绝:A 、原假设0H 一定是正确的B 、备选假设1H 一定是错误的C 、0H 是正确的可能性为α-1D 、原假设0H 可能是正确的 5、经过显著性检验,原假设0H 被拒绝了,则:A 、原假设0H 一定是错误的B 、备选假设1H 一定是正确的C 、0H 是正确的可能性为αD 、原假设0H 可能是正确的 6、在假设检验中,一般情况下,( )错误。

A 、只犯第1类错误B 、只犯第2类错误C 、不犯第1、2类错误D 、可能犯第1、2类错误 7、双侧检验的原假设通常是:A 、0H :0X X =B 、0H :0X X ≥C 、0H :0X X ≤D 、0H :0X X ≠ 8、下列说法正确的是:A 、若备选假设是正确的,作出的决策是拒绝备选假设,则犯了弃真错误B 、若备选假设是错误的,作出的决策是接受备选假设,则犯了纳伪错误C 、若原假设是正确的,作出的决策是接受备选假设,则犯了弃真错误D 、若原假设是错误的,作出的决策是接受备选假设,则犯了纳伪错误 9、假设检验时,若增大样本容量,则犯两类错误的可能性:A 、都增大B 、都缩小C 、都不变D 、一个增大,一个缩小 10、若总体为非正态分布,则在( )情况下,也可选用z 统计量: A 、样本容量大于或等于30 B 、样本容量小于30 C 、任意的样本容量 D 、总体单位数很大 11、在假设检验中,显著性水平α表示:A 、{}α=假接受00/H H P B 、{}α=真拒绝00/H H P C 、{}α=真接受00/H H P D 、{}α=假拒绝00/H H P 12、在一项假设中,显著性水平05.0=α,下面表述正确的是:A 、接受0H 的可靠性为95%B 、接受1H 的可靠性为95%C 、0H 为假被接受的概率为5%D 、1H 为真时被拒绝的概率为5% 13、下列结论中,不正确的是:A 、假设检验的依据是小概率原理B 、若{}α=真拒绝00/H H P ,则α为犯第1类错误的概率 C 、α小则β也小 D 、尽量增大样本容量可以减小αβ 14、设X ~()2,σX N ,且2σ已知,从中抽取一样本,检验假设0H :0X X =采用z 检验法,则其拒绝域与( )有关。

医学统计学习题

医学统计学习题

一、最佳选择题1.卫生统计工作的步骤为CA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有DA.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括EA.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指BA.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指 BA.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用 DA.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是 CA.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用 AA.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是 CA.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有 BA.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为 DA.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 D A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指 CA.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布e A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为 BA.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指 BA.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大CA.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明 CA.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 DA.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高DA.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为 EA. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指 DA.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.多组均数的两两比较中,若不用q 检验而用t 检验,则 CA. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对24.说明某现象发生强度的指标为 EA.构成比B.相对比C.定基比D.环比E. 率25.对计数资料进行统计描述的主要指标是 BA.平均数B.相对数C.标准差D.变异系数E.中位数26.构成比用来反映CA.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对27.下列哪一指标为相对比EA. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数28.两个样本率差别的假设检验,其目的是BA.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同29.用正态近似法进行总体率的区间估计时,应满足DA. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求30.由两样本率的差别推断两总体率的差别,若P 〈0.05,则DA. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义31.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为DA. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u 32.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为EA. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4033.三个样本率比较得到2χ>2)2(01.0χ,可以为AA.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同34.四格表2χ检验的校正公式应用条件为CA. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<135.下述哪项不是非参数统计的优点DA.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料36.秩和检验和t 检验相比,其优点是AA. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小37.等级资料比较宜用CA. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验38.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为C A.两文结果有矛盾 B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大39.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用AA.普通线图B.直方图C.统计地图D.半对数线图E.圆形图40.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:BA.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料41. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。

统计学基础练习题库及参考答案

统计学基础练习题库及参考答案

第一章 定量资料的统计描述 1第一部分一、单选题1、甲乙丙三位研究者评价人们对四种方便面的喜好程度。

甲让评定者先挑选出最喜欢的品 牌,然后挑出剩余三种最喜欢的, 最后挑出剩余两种比较喜欢的。

研究者乙让评定者把四种 品牌分别给予 1~5 的等级评定 (1 表示最不 , 5 表示最喜欢 ),研究者丙只是让评定者挑出 自己最喜欢的品牌。

三位研究者所使用的数据类型是: BA .称名数据 -顺序数据 -计数数据B .顺序数据 -等距数据 -称名数据C .顺序数据 -等距数据 -顺序数据D .顺序数据 -等比数据 -计数数据2、调查 200 名不同年龄组的被试对手表的偏好程度如下:表 1 200该题自变量和因变量的数据类型是: A .称名数据 -顺序数据 C .顺序数据 -等距数据3、 157.5 的实上限是: CA . 157.75B . 157.65 4、随机现象的数量化表示称为 :B A .自变量 B .随机变量 5、实验或研究对象的全体称为: AA .总体B .样本点 6、下列数据中,哪个数据是顺序变量: A .父亲月收入 2400 元C .约翰 100 米短跑得第 2 名 二、概念题 数据类型、变量、观测值、随机变量、总体、样本、个体、次数、比率、概率、参数、统计 量、 μ、ρ、r 、 σ、 S 、 β、 n 。

第一章 定量资料的统计描述 2一、单选题1、一批数据中各个不同数据值出现的次数情况是: AA .次数分布B .概率密度C .累积概率密度D .概率2、以下各种图形中,表示连续数据频次分布的是: CA .条图B .圆图C .直方图D .散点图3、特别适用于描述具有百分比结构的分类数据的统计图 :BC .157.55D .158.5 C .因变量 D. 相关变量 C .个体 D .元素 C B .迈克的语文成绩是 80 分 D .玛丽某项技能测试得了 5 分。

DB .计数数据 -等比数据A.散点图B.圆图C.条图 D .线图5、以下各种统计图中,表示离散数据频次分布的:AA.圆图B.直方图C.散点图 D .线形图6、相关变量的统计图是: AA.散点图B.圆图C.条图 D .线图7、适用于描述某种事物在时间上的变化趋势,以及一事物随另外一事物的发展变化的趋势,还适用于比较不同人物群体在心理或教育现象上的变化特征以及相互联系的统计图是: DA散点图B圆图C条图D.线图二、多选题1、频次分布可以为:ABCDA .简单次数分布B.分组次数分布C.相对次数分布D.累积次数分布2、以下各种图形中,表示连续数据频次分布的是:BDA .圆图B.直方图C.条图D.线图3、累加曲线的形状大约有:ABDA .正偏态B.负偏态C.F 分布D.正态分布4、统计图按照形状划分为:ABCDA直方图B曲线图C圆图D.散点图三简答题1、简述条图、直方图、圆图、线图、散点图的用途。

统计学假设检验习题

统计学假设检验习题

一、单选1、如果检验的假设为0010:,:H H μμμμ≥<,则拒绝域为( )A 、 z z α>B 、z z α<-C 、A 或BD 、/2z z α<-二、多选1.下列关于假设检验的陈述正确的是( )。

A 、假设检验实质上是对原假设进行检验B 、假设检验实质上是对备选假设进行检验C 、当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误D 、假设检验并不是根据样本结果简单地或直接地判断原假设和备选假设哪一个更有可能正确E 、当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确2、在假设检验中, α与β的关系是( )。

A 、在其它条件不变的情况下,增大α,必然会减少βB 、α和β不可能同时减少C 、在其它条件不变的情况下,增大α,必然会增大βD 、只能控制α不能控制βE 、增加样本容量可以同时减少α和β3、设总体为正态总体,总体方差未知,在小样本条件下,对总体均值进行如下的假设检验:01000:);(:μμμμμ≠=H H 为一已知数,1.0=α,则下列说法正确的有 ( )。

A 、),(1.0Z --∞和),(1.0+∞Z 为原假设的拒绝区域B 、),(05.0Z --∞和),(05.0+∞Z 为原假设的拒绝区域C 、),(1.0t --∞和),(1.0+∞t 为原假设的拒绝区域D 、),(05.0t --∞和),(05.0+∞t 为原假设的拒绝区域E 、若检验统计量的绝对值越大,则原假设越容易被拒绝4.某一批原材料的质量实际上是不符合生产标准,检验部门抽取1%的原材料检验,得出结论是该批原材料的质量符合生产标准,说明( ).A 、检验部门犯了第一类错误B 、检验部门犯了第二类错误C 、犯这种错误的概率是αD 、犯这种错误的概率是βE 、犯这种错误的原因是检验部门没有遵循随机原则三、判断1.假设检验是一种科学的统计决策方法,因此使用它不会犯错误.( )四、简答1.简述参数估计和假设检验的联系和区别.五、计算1、从某批食品中随机抽取12袋,测定其蛋白质的含量(%),测定结果如下: 24,26,27,23,20,28,23,24,27,25,26,23假定该食品每袋蛋白质的含量X 服从正态分布),(2σμN ,包装袋上表明蛋白质的含量为26%。

社会统计学复习题

社会统计学复习题

社会统计学名词解释:原假设:又称“0假设”、“虚无假设”、“解消假设”。

研究者想收集证据予以反对的假设。

它常常是根据已有资料或根据周密考虑后确定的。

表示为H0。

备择假设:也称“研究假设”。

研究者想收集证据予以支持的假设。

表示为H1。

区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

即根据样本,合理地猜一猜总体的参数大概在什么范围。

点估计:根据样本数据算出一个单一的估计值,用来估计总体的参数值。

即根据样本,合理地猜一猜总体的参数大概是什么。

中心极限定理:研究在什么条件下,随机变量之和的分布可以近似为正态分布,称中心极限定理。

大数定律(大数定理):研究在什么条件下,随机事件可以转化为不可能事件或必然事件,即有关阐明大量随机现象平均结果的稳定性的一系列定理。

正相关:指现象之间存在着同一方向变动的相关关系,即当一个现象的变量数值增加(或减少)时,另一现象的变量数值也同向增加(或减少),两现象的变量值基本表现为同增同减的关系。

负相关:指现象之间存在着不同方向变动的相关关系,即当一个现象的变量数值增加时,另一现象的变量数值却相应地减少,两现象的变量值表现为一增一减的关系。

简答题:1.标志变异指标有什么作用?标志变异指标,也称标志变动度指标。

是反映总体各单位标志值之间差异程度大小的综合指标。

标志变异指标说明的是变量的离中趋势。

测量标志变异的主要指标有极差、平均差、方差、标准差和标志变异系数等。

作用:1.衡量平均指标代表性的尺度;2.研究现象的稳定性和均衡性。

3.是计算抽样误差和确定样本量的依据。

2.标志指标之间有何区别?有何联系?区别:首先,指标和标志的概念明显不同,标志是说明单位属性的,一般不具有综合的特征。

指标是说明总体的综合数量特征的。

具有综合的性质。

其次,统计指标分为数量指标和质量指标,它们都是可以用数量来表示的。

标志分为数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。

参数估计和假设检验练习题

参数估计和假设检验练习题

参数估计和假设检验练习题作业⼆(⼀)单项选择题1.标准误的英⽂缩写为:A.S B.SE C.S D.SDX2.通常可采⽤以下那种⽅法来减⼩抽样误差:A.减⼩样本标准差B.减⼩样本含量C.扩⼤样本含量D.以上都不对3.配对设计的⽬的:A.提⾼测量精度B.操作⽅便C.为了可以使⽤t检验D.提⾼组间可⽐性4.以下关于参数估计的说法正确的是:A.区间估计优于点估计B.样本含量越⼤,参数估计准确的可能性越⼤C.样本含量越⼤,参数估计越精确D.对于⼀个参数只能有⼀个估计值5.关于假设检验,下列那⼀项说法是正确的A.单侧检验优于双侧检验B.采⽤配对t检验还是成组t检验是由实验设计⽅法决定的C.检验结果若P值⼤于0.05,则接受H0犯错误的可能性很⼩D.⽤u检验进⾏两样本总体均数⽐较时,要求⽅差齐性6.两样本⽐较时,分别取以下检验⽔准,下列何者所取第⼆类错误最⼩A.α=0.05 B.α=0.01 C.α=0.10 D.α=0.207.统计推断的内容是A.⽤样本指标推断总体指标B.检验统计上的“假设”C.A、B均不是D.A、B均是8.当两总体⽅差不齐时,以下哪种⽅法不适⽤于两样本总体均数⽐较A.t检验B.t’检验C.u 检验(假设是⼤样本时)D.F检验A.1X=2X,1S=2SB.作两样本t检验,必然得出⽆差别的结论C.作两⽅差齐性的F检验,必然⽅差齐D.分别由甲、⼄两样本求出的总体均数的95%可信区间,很可能有重叠10.以下关于参数点估计的说法正确的是A.CV越⼩,表⽰⽤该样本估计总体均数越可靠B.σ越⼩,表⽰⽤该样本估计总体均数越准确XC.σ越⼤,表⽰⽤该样本估计总体均数的可靠性越差XD.S越⼩,表⽰⽤该样本估计总体均数越可靠(⼆)名词解释(三)是⾮题1.若两样本均数⽐较的假设检验结果P值远远⼩于0.01,则说明差异⾮常⼤。

P⼩于0.01只能说明两样本均数有差异,但并不能说明差异的⼤⼩。

2.对同⼀参数的估计,99%可信区间⽐90%可信区间好。

社会统计学复习资料

社会统计学复习资料

《社会统计学》复习资料一、概念辨析(3×8') 1.参数估计与假设检验参数估计是通过样本对总体的未知参数进行估计,假设检验指通过样本对总体的某种假设进行检验。

参数估计是先看样本的情况,再看总体的情况。

假设检验是先假设总体的情况,再以一个随机样本的统计值来检验这个假设是否正确。

换言之,要先构思总体情况,才进行抽样和分析样本的资料。

2.点估计与区间估计点估计指根据样本资料以一个最适当的样本统计值来代表总体的参数值,简单明确,但不能说明估计结果的抽样误差和把握程度;区间估计指以两个数值之间的间距来估计参数值。

点估计是区间估计的基础。

3.置信度和置信度水平置信度又称置信概率或置信系数,表示用置信区间估计的可靠性,即置信区间包含参数Q 的概率。

置信度水平表示用置信区间估计不可靠的概率。

置信度与置信度水平之和为1。

4.虚无假设与研究假设虚无假设0H 又称原假设、零假设。

是一种无差别假设,是一种已有的,具有稳定性的经验看法,没有充分根据,是不会被轻易否定的。

研究假设1H 又称备择假设,是研究者所需证实的假设。

否定0H 后可以认为1H 是对的。

5.甲种误差与乙种误差甲种误差又称第一类错误,是指0H 为真,但小概率事件发生了,拒绝了0H ,即把真的当成假的,它是在拒绝原假设时出现的错误。

犯甲种误差的概率是显著性水平α。

乙种误差即纳伪的错误,又称第二类错误,是指0H 为假,但小概率事件没有发生,接受即把假的当成真的,它是在接受原假设时出现的错误。

犯乙种误差的概率为β,β的值随着真值μ与原假设中0μ的偏离程度而变化,0μμμ-=∆越小,β的数值就越大。

α大β就小,α小β就大。

6.独立样本和配对样本独立样本指从二个总体中,分别独立地各抽取一个随机样本进行比较和研究。

配对样本指它只有一个样本,但样本中每个个体要先后观测两次,这样所有个体先观测的值看作是来自第一个总体的样本值,所有个体后观测的值,看作是来自另一个个体的样本值,以此来比较两总体之间的不同。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章抽样与参数估计一、单项选择题1、某品牌袋装糖果重量的标准是(500±5)克。

为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。

下列说法中错误的是( B )A、样本容量为10B、抽样误差为2C、样本平均每袋重量是估计量D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( D )A、N(100,25)B、N(100,5/n)C、N(100/n,25)D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( C )A、一半B、一倍C、三倍D、四倍4、在其他条件不变时,置信度(1–α)越大,则区间估计的( A )A、误差范围越大B、精确度越高C、置信区间越小D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( C )A、1/4B、4倍C、7/9D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是( C )A、总方差B、群内方差C、群间方差D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( B )尽可能小A、总体层数B、层内方差C、层间方差D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( D )A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( A )A、分层抽样B、简单随机抽样C、等距(系统)抽样D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P 应选( A )A、85%B、87.7%C、88%D、90%二、多项选择题1、影响抽样误差大小的因素有(ADE )A、总体各单位标志值的差异程度B、调查人员的素质C 、样本各单位标志值的差异程度D 、抽样组织方式E 、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。

根据抽样结果进行推断,下列说法正确的有( ADE )A 、n=200B 、n=30C 、总体合格率是一个估计量D 、样本合格率是一个统计量E 、合格率的抽样平均误差为2.52%3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布( BCE )A 、np ≤5B 、np ≥5C 、n (1–p )≥5D 、p ≥1%E 、n ≥30三、填空题1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。

请列出四种常见的抽样方法: 、 、 、 ,当对全校学生的名单不好获得时,你认为 方法比较合适,理由是 。

四、简答题1、分层抽样与整群抽样有何异同?它们分别适合于什么场合?2、解释抽样推断的含义。

五、计算题1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。

对该日所生产的糖果,给定置信度为95%,试求: (1)平均每包重量的置信区间,若总体标准差为5克; (2)平均每包重量的置信区间,若总体标准差未知; (8125.1,8331.1,2281.2,2622.210,05.09,05.010,025.09,025.0====t t t t );2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。

该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。

为了节约调查费用,样本将尽可能小,试问样本量应该为多大?3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。

(1)试对家庭每天平均看电视时间进行区间估计。

(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05)答案:一、B ,D ,C ,A ,C ;C ,B ,D ,A ,A 。

二、ADE ,ADE ,BCE 。

三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。

四、1、答:都要事先按某一标志对总体进行划分的随机抽样。

不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。

分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。

2、答:简单说,就是用样本中的信息来推断总体的信息。

总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。

五、1、解:n=10,小样本(1)方差已知,由x ±z α/2nσ得,(494.9,501.1)(2)方差未知,由x ±t α/2ns 得,(493.63,502.37)2、解:n=222/1xp p z ∆-⨯⨯)(α=2202.05.05.01.6448⨯⨯=1691 3、解:(1)x ±t α/2ns =6.75±2.131×1625.2=(5.55,7.95)(2)边际误差E= t α/2ns =2.131×1625.2=1.2n=2222/E z σα⨯=2222.15.21.96⨯=17第六章假设检验练习题一、单项选择题1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。

若要检验该机实际运行状况是否符合设计标准,应该采用( C )。

A 、左侧检验B 、右侧检验C 、双侧检验D 、左侧检验或右侧检验2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定元假设,则可认为( C )。

A 、抽样是不科学的B 、检验结论是正确的C 、犯了第一类错误D 、犯了第二类错误3、当样本统计量的观察值未落入原假设的拒绝域时,表示( B )。

A 、可以放心地接受原假设B 、没有充足的理由否定与原假设C 、没有充足的理由否定备择假设D 、备择假设是错误的4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( A )。

A、都减少B、都增大C、都不变D、一个增大一个减小5、关于检验统计量,下列说法中错误的是(B )。

A、检验统计量是样本的函数B、检验统计量包含未知总体参数C、在原假设成立的前提下,检验统计量的分布是明确可知的D、检验同一总体参数可以用多个不同的检验统计量二、多项选择题1、关于原假设的建立,下列叙述中正确的有(CD )。

A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2、在假设检验中,α与β的关系是( CE )。

A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β三、判断分析题(判断正误,并简要说明理由)1、对某一总体均值进行假设检验,H0:X=100,H1:X≠100。

检验结论是:在1%的显著性水平下,应拒绝H0。

据此可认为:总体均值的真实值与100有很大差异。

2、有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。

为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。

那么原假设可以为:H0:P≤1/3。

四、简答题1、采用某种新生产方法需要追加一定的投资。

但若根据实验数据,通过假设检验判定该新生方法能够降低产品成本,则这种新方法将正式投入使用。

(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。

(2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?五、计算题1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。

从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。

假设产品重量服从正态分布。

(1)建立适当的原假设和备择假设。

(2)在α=0.05时,该检验的决策准则是什么? (3)如果x =12.25克,你将采取什么行动? (4)如果x =11.95克,你将采取什么行动?答案:一、1、C 2、C 3、B 4、A 5、B 二、1、CD 2、CE三、1、错误。

“拒绝原假设”只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。

2、错误。

要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P (或男孩所占的比例P*)所以原假设为:H 0:P=3/4(或P ≤3/4);H 1:P >3/4。

也可以是:H 0:P*=1/4(或P ≥1/4);H 1:P*<1/4。

四、1、(1)H 0:x ≥350;H 1:x <350。

(2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。

犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。

五、1、(1)H 0:μ=120;H 1:μ≠12。

(2)检验统计量:Z=nx /0σμ-。

在α=0.05时,临界值z α/2=1.96,故拒绝域为|z|>1.96。

(3) 当x =12.25克时,Z=nx /0σμ-=25/0.61212.25-=2.08。

由于|z|=2.08>1.96,拒绝H 0:μ=120;应该对生产线停产检查。

(4) 当x =11.95克时,Z=nx /0σμ-=25/0.61211.95-=-0.42。

由于|z|=-0.42<1.96,不能拒绝H 0:μ=120;不应该对生产线停产检查。

第七章相关与回归分析一、单项选择题1、下面的关系中不是相关关系的是( D )A 、身高与体重之间的关系B 、工资水平与工龄之间的关系C 、农作物的单位面积产量与降雨量之间的关系D 、圆的面积与半径之间的关系2、具有相关关系的两个变量的特点是( A )A 、一个变量的取值不能由另一个变量唯一确定B 、一个变量的取值由另一个变量唯一确定C 、一个变量的取值增大时另一个变量的取值也一定增大D 、一个变量的取值增大时另一个变量的取值肯定变小 3、下面的假定中,哪个属于相关分析中的假定( B )A 、两个变量之间是非线性关系B 、两个变量都是随机变量C 、自变量是随机变量,因变量不是随机变量D 、一个变量的数值增大,另一个变量的数值也应增大4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为( A )A 、完全相关关系B 、正线性相关关系C 、非线性相关关系D 、负线性相关关系 5、根据你的判断,下面的相关系数取值哪一个是错误的( C )A 、–0.86B 、0.78C 、1.25D 、06、设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着( A ) 绝对值大于0.8A 、高度相关B 、中度相关C 、低相关D 、极弱相关7、在回归分析中,描述因变量y 如何依赖于自变量x 和误差项ε的方程称为( B )A 、回归方程B 、回归模型C 、估计回归方程D 、经验回归方程 8、在回归模型y=01x ββε++中,ε反映的是( C )A 、由于x 的变化引起的y 的线性变化部分B 、由于y 的变化引起的x 的线性变化部分C 、除x 和y 的线性关系之外的随机因素对y 的影响D 、由于x 和y 的线性关系对y 的影响9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误( B )A 、∧y =25–0.75xB 、∧y = –120+ 0.86x C 、∧y =200–2.5x D 、∧y = –34–0.74x10、说明回归方程拟合优度的统计量是( C )A 、相关系数B 、回归系数C 、判定系数D 、估计标准误差11、判定系数R 2是说明回归方程拟合度的一个统计量,它的计算公式为( A )A 、SST SSR B 、SSE SSR C 、SST SSE D 、SSRSST12、已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( A )4854/(4854+146)A 、97.08%B 、2.92%C 、3.01%D 、33.25%13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是( D )A、较高的男子趋于较重B、身高与体重存在低度正相关C、体重较重的男子趋于较高D、45%的较高的男子趋于较重14、下列回归方程中哪个肯定有误( A )A、∧y=15–0.48x,r=0.65 B、∧y= –15 - 1.35x,r=-0.81C、∧y=-25+0.85x,r=0.42 D、∧y=120–3.56x,r=-0.9615、若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R2为( C )A、0.8B、0.89C、0.64D、0.4016、对具有因果关系的现象进行回归分析时( A )A、只能将原因作为自变量B、只能将结果作为自变量C、二者均可作为自变量D、没有必要区分自变量二、多项选择题1、下列现象不具有相关关系的有(ABD )A、人口自然增长率与农业贷款B、存款期限与存款利率C、降雨量与农作物产量D、存款利率与利息收入E、单位产品成本与劳动生产率2、一个由500人组成的成人样本资料,表明其收入水平与受教育程度之间的相关系数r为0.6314,这说明(E )中度A、二者之间具有高度的正线性相关关系B、二者之间只有63.14%的正线性相关关系C、63.14%的高收入者具有较高的受教育程度D、63.14%的较高受教育程度者有较高的收入E、通常来说受教育程度较高者有较高的收入三、判断分析题(判断正误,并简要说明理由)1、一项研究显示,医院的大小(用病床数x反映)和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。

相关文档
最新文档