3-第7章 统计学 参数估计 练习题
《统计学》-第7章-习题答案
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学习题答案参数估计
第5章参数估计●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1)样本均值的抽样标准差等于多少?(2)在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值=25,(1)样本均值的抽样标准差===0。
7906(2)已知置信水平1-=95%,得=1。
96,于是,允许误差是E ==1.96×0.7906=1.5496。
●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本.(3)假定总体标准差为15元,求样本均值的抽样标准误差;(4)在95%的置信水平下,求允许误差;(5)如果样本均值为120元,求总体均值95%的置信区间。
解:(1)已假定总体标准差为=15元,则样本均值的抽样标准误差为===2.1429(2)已知置信水平1-=95%,得=1.96,于是,允许误差是E ==1.96×2.1429=4.2000。
(3)已知样本均值为=120元,置信水平1-=95%,得=1.96,这时总体均值的置信区间为=120±4。
2=可知,如果样本均值为120元,总体均值95%的置信区间为(115。
8,124.2)元。
●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.3 3。
1 6。
2 5.8 2。
3 4。
1 5.4 4。
5 3。
24。
4 2。
0 5。
4 2。
6 6。
4 1.8 3.5 5.7 2。
32。
1 1.9 1.2 5.1 4.3 4。
2 3.6 0。
8 1。
54。
7 1。
4 1.2 2。
9 3。
5 2.4 0.5 3.6 2。
5求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
解:⑴计算样本均值:将上表数据复制到Excel表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到=3。
大学统计学第七章练习题及答案
大学统计学第七章练习题及答案第7章参数估计练习题从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。
样本均值的抽样标准差?x 等于多少? 在95%的置信水平下,边际误差是多少?解:⑴已知??5,n?40,x?25 样本均值的抽样标准差?x??n?540?10? 4⑵已知??5,n?40,x?25,?x?10,1???95% 4?Z?2?? 边际误差某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
假定总体标准差为15元,求样本均值的抽样标准误差;在95%的置信水平下,求边际误差;如果样本均值为120元,求总体均值?的95%的置信区间。
解.已知.根据查表得z?/2= 标准误差:E?Z?2?n?*10? 4?X??n?1549? .已知z?/2= 所以边际误差=z?/2*sn?* 1549= 置信区间:x?Z?2sn?120?1549???,? 1 从一个总体中随机抽取n?100的随机样本,得到x?104560,假定总体标准差??85414,构建总体均值?的95%的置信区间。
Z?? 2Z???96*854142n?? x?Z?.?104560?? 2n?x?Z??.?104560?? 2n置信区间:从总体中抽取一个n?100的简单随机样本,得到x?81,s?12。
构建?的90%的置信区间。
构建?的95%的置信区间。
构建?的99%的置信区间。
解;题意知n?100, x?81,s?12. 置信水平为1???90%,则Z?? 2公式x?zs??81??12 2n?100?81?即81???,?, 则?的90%的置信区间为~ 置信水平为1???95%,z?? 2公式得x?z??s2n=81??12100?81? 即81?=,则?的95%的置信区间为~ 置信水平为1???99%,则Z?? 2 2 s12公式x?z??=?81??0962n100?81?3.即81? 则?的99%的置信区间为利用下面的信息,构建总体均值的置信区间。
统计学第七章、第八章课后题答案
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌.在公布调查结果时给出被调查人数是负责任的表现.这样则可以由此推算出置信度(由后面给出的公式),反之亦然.4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率.也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0。
95的概率覆盖总体参数.5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为其中: 2222)(E z n σα=n z E σα2=▪与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
统计学各章练习
第一章绪论一、判断改错题1、统计学是一门研究现象总体数量方面的方法论科学,所以它不关心,也不研究个别现象的数量特征。
2、社会经济统计学是一门实质性科学。
3、品质指标,是由名称和数值两部分组成的。
4、三个员工的工资不同,因此存在三个变量。
5、质量指标是反映总体质的特征,因此,可以用文字来表述。
6、连续变量的数值包括整数和小数。
7、指标体系是许多指标集合的总称。
8、总体和总体单位是固定不变的。
9、只要有了某个指标,就能对总体进行完整、全面的认识。
10、变量是指可变的数量标志。
11、时点指标均无可加性。
12、总量指标数值随总体范围大小而改变。
13、某厂年计划产量比去年提高8%,实际只提高5%,因此只完成计划的50%。
14、将若干个指标数值相加,即可得到指标体系的数值。
15、强度相对指标越大,说明分布密度越大。
二、多项选择题(在备选答案中,选出二个及以上正确答案)1、下列各项中,属于品质标志的有( )。
A.性别B.年龄C.职务D.民族E.工资2、下列各项中,属于连续变量的有( )。
A. 厂房面积B.职工人数C.产值D.原材料消耗量(单位:千克)E.设备数量3、统计指标按其反映的时间状况不同,有( )。
A.实体指标B.客观指标C.时期指标D.主观指标E.时点指标4、在全国的工业普查中,有( )。
A.工业企业数是数量指标B.设备台数是离散变量C.工业总产值是连续变量D. 每一个工业企业是总体单位E.每个工业企业的职工人数是连续变量5、某市工业企业状况进行调查,得到以下资料,其中统计指标是( )。
A.该市职工人数400000人B.企业职工人数4000人C.该市设备台数75000台D.市产值40亿元E.某企业产值20万元6、商业网点密度=全市商业机构数/全市人口数,它是()。
A.比较相对指标B.强度相对指标C.数量指标D.质量指标E.平均指标7、下列指标中的比例相对指标是()。
A.某厂工人中,技术工人与辅助工人人数之比为4∶5B.某年全国高考录取与报考之比是1∶2C.存款利息率D.家庭收支比E.甲地人均收入是乙地的3倍8、间班组竞赛,结果甲组产量是乙组的2倍,废品总量中甲组占70%,说明()。
第7章 统计学 参数估计 练习题
第7章参数估计练习题一、填空题(共10题,每题2分,共计20分)1.参数估计就就是用_______ __去估计_______ __。
2、点估计就就是用_______ __得某个取值直接作为总体参数得_______ __。
3.区间估计就是在_______ __得基础上,给出总体参数估计得一个区间范围,该区间通常由样本统计量加减_______ __得到。
4、如果将构造置信区间得步骤重复多次,置信区间中包含总体参数真值得次数所占得比例称为_______ __,也成为_______ __。
5.当样本量给定时,置信区间得宽度随着置信系数得增大而_______ __;当置信水平固定时,置信区间得宽度随着样本量得增大而_______ __。
6、评价估计量得标准包含无偏性、_______ __与_______ __。
7、在参数估计中,总就是希望提高估计得可靠程度,但在一定得样本量下,要提高估计得可靠程度,就会_______ __置信区间得宽度;如要缩小置信区间得宽度,又不降低置信程度,就要_______ __样本量。
8、估计总体均值置信区间时得估计误差受总体标准差、_______ __与_______ __得影响。
9、估计方差未知得正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。
10、估计正态总体方差得置信区间时,用_____ __分布,公式为______ __。
二、选择题(共10题,每题1分,共计10分)1.根据一个具体得样本求出得总体均值得95%得置信区间 ( )。
A.以95%得概率包含总体均值B.有5%得可能性包含总体均值C.一定包含总体均值D、要么包含总体均值,要么不包含总体均值2.估计量得含义就是指( )。
A、用来估计总体参数得统计量得名称B 、 用来估计总体参数得统计量得具体数值C 、 总体参数得名称D 、 总体参数得具体数值3. 总体均值得置信区间等于样本均值加减边际误差,其中边际误差等于所要求置信水平得临界值乘以( )。
统计学答案第七章
1 估计量的含义是指()。
A。
用来估计总体参数的统计量的名称B。
用来估计总体参数的统计量的具体数值C。
总体参数的名称D.总体参数的具体数值2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为().A。
无偏性B。
有效性 C.一致性 D.充分性3 根据一个具体的样本求出的总体均值的95%的置信区间()。
A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C。
一定包含总体均值 D.要么包含总体均值,要么不包含总体均值4 无偏估计是指()。
A。
样本统计量的值恰好等于待估的总体参数B。
所有可能样本估计值的数学期望等于待估总体参数C.样本估计值围绕待估总体参数使其误差最小D。
样本量扩大到和总体单元相等时与总体参数一致5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。
A.样本均值的抽样标准差B.样本标准差C。
样本方差D.总体标准差6 当样本量一定时,置信区间的宽度()。
A。
随着置信系数的增大而减小B.随着置信系数的增大而增大C。
与置信系数的大小无关D。
与置信系数的平方成反比7 当置信水平一定时,置信区间的宽度()。
A。
随着样本量的增大而减小B.随着样本量的增大而增大C。
与样本量的大小无关D.与样本量的平方根成正比8 一个95%的置信区间是指()。
A.总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D。
在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数9 95%的置信水平是指()。
A。
总体参数落在一个特定的样本所构造的区间内的概率为95%B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%C。
总体参数落在一个特定的样本所构造的区间内的概率为5%D。
统计学各章习题及答案
统计学习题目录第一章绪论 _________________________________________________ 2第二章数据的收集与整理 _____________________________________ 4第三章统计表与统计图 _______________________________________ 6第四章数据的描述性分析 _____________________________________ 8第五章参数估计 ____________________________________________ 12第六章假设检验 ____________________________________________ 16第七章方差分析 ____________________________________________ 20第八章非参数检验 __________________________________________ 23第九章相关与回归分析 ______________________________________ 26第十章多元统计分析 ________________________________________ 30第十一章时间序列分析 ______________________________________ 34第十二章指数 ______________________________________________ 37第十三章统计决策 __________________________________________ 41第十四章统计质量管理 ______________________________________ 44第一章绪论习题一、单项选择题1。
推断统计学研究(D)。
A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2。
《统计学》课后练习题答案
A.透视表B.合并计算C.单变量求解D.分类汇总
5.小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?()(知识点3.5答案:D)
A.直方图B.散点图C.饼图D.折线图
37
பைடு நூலகம்33.6
130-140
12
10.9
103
93.6
19
17.3
140-150
5
4.5
108
98.2
7
6.4
150-160
2
1.8
110
100.0
2
1.8
合计
110
100
—
—
—
—
A.树苗高度低于110厘米的占总数的39.1%B.树苗高度低于110厘米的占总数的84.5%
C.树苗高度高于130厘米的有19棵D.树苗高度高于130厘米的有103棵
第二章数据的收集与整理
2.1数据的来源
2.2统计调查方案设计
2.3调查方法
2.4调查的组织方式:普查、抽样调查、重点调查、典型调查
2.5抽样的组织方式:简单随机抽样、系统抽样、分层抽样、整群抽样
2.6数据的审定:误差
2.7数据的分组
2.8.编制次数分布表:频数(次数)、频率
习题
一、单项选择题
1.小吴为写毕业论文去收集数据资料,()是次级数据。(知识点:2.1答案:C)
A.指标B.标志C.变量D.标志值
8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
统计学参数估计练习题
统计学参数估计练习题 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#第7章参数估计练习题一、填空题(共10题,每题2分,共计20分)1.参数估计就是用_______ __去估计_______ __。
2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。
3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。
4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。
5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。
6. 评价估计量的标准包含无偏性、_______ __和_______ __。
7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。
8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。
9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。
10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。
二、选择题(共10题,每题1分,共计10分)1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。
A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D. 要么包含总体均值,要么不包含总体均值2.估计量的含义是指( )。
A. 用来估计总体参数的统计量的名称B. 用来估计总体参数的统计量的具体数值C. 总体参数的名称D. 总体参数的具体数值3. 总体均值的置信区间等于样本均值加减边际误差,其中边际误差等于所要求置信水平的临界值乘以( )。
统计学各章节试题
、中位数可反映总体的趋势,四分位差可反映总体的7、以下数字特征不刻画分散程度的是A、极差B、离散系数C、中位数D、标准差8、已知总体平均数为200,离散系数为0.05,则总体方差为A、 B、10 C、100 D、0.19、两个总体的平均数不相等,标准差相等,则A、平均数大,代表性大B、平均数小,代表性大C、两个总体的平均数代表性相同D、无法判断10、某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128元、148元、200元,计算结果均值为元,标准差为A、σ=33B、σ=34C、σ=34.23D、σ=3511、已知方差为 100 ,算术平均数为 4 ,则标准差系数为A、10B、2.5C、25D、无法计算12、有甲乙两组数列,若A、1<21>2,则乙数列平均数的代表性高B、1<21>2,则乙数列平均数的代表性低C、1=21>2,则甲数列平均数的代表性高D、1=21<2,则甲数列平均数的代表性低13、某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为A、右偏B、左偏C、对称D、不能作出结论14、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用A、众数B、中位数C、四分位数D、均值15、如果你的业务是提供足球运动鞋的号码,哪一种平均指标对你更有用?A、算术平均数B、几何平均数C、中位数D、众数三、判断1、已知分组数据的各组组限为:10~15,15~20,20~25,取值为15的这个样本被分在第一组。
()2、将收集到得的数据分组,组数越多,丧失的信息越多。
()3、离散变量既可编制单项式变量数列,也可编制组距式变量数列。
)4、从一个总体可以抽取多个样本,所以统计量的数值不是唯一确定的。
()5、在给定资料中众数只有一个。
统计学习题(抽样分布、参数估计)
统计学习题(抽样分布、参数估计)练习题第1章绪论(略)第2章统计数据的描述2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。
其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。
调查结果如下:4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。
(2)绘制一张条形图,反映学历分布。
2.2为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A 8.269504 7.51773 9.2624117.9148948.411348B 7.447368 8.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。
2.3下面是一个班50个学生的经济学考试成绩:88569179699088718279 988534744810075956092 83646569996445766369 6874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。
(2)用茎叶图将原始数据表现出来。
2.4如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。
男149 161761821310 80 951081414 0 144145151515161681882121 0 21211052121211116817521 0 356462121212121312121 0 2121212121375375383838 8 45566065120 30120 7521女120 3334537437538700 90700 60141516212121211517170 0 0 0 0 0 0 0 5 521 0 1752121214043451217517 8 181818518519195196202021 0 21212121212121333335 0 3636363840474865055(1)按近视度数分别对男女学生进行分组。
应用统计学:参数估计习题及答案
简答题1、矩估计的推断思路如何?有何优劣?2、极大似然估计的推断思路如何?有何优劣?3、什么是抽样误差?抽样误差的大小受哪些因素影响?4、简述点估计和区间估计的区别和特点。
5、确定重复抽样必要样本单位数应考虑哪些因素?计算题1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。
要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少?3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。
根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。
现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少?4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。
试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973)5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下:样本容量(个)平均电流强度(安培)电流强度标准差(安培)合格率(%)甲车间20 1.5 0.8 90乙车间40 1.6 0.6 95试推断:(1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围(2)以同样条件推断其合格率的可能范围(3)比较两车间产品质量6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求:(1)计算样本合格品率及其抽样平均误差(2)以95.45%的概率保证程度对该批产品合格品率和合格品数量进行区间估计。
统计学课后习题答案第七章相关分析与回归分析
统计学课后习题答案第七章相关分析与回归分析(总14页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是≤r≤1 ≤r≤0≤r≤1 D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:=6+ =6000+24x=24000+6x =24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加元D.产量为1千件时,单位成本为元E.产量每增加1千件,单位成本平均减少元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为B.-1 E.-9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A. 家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A. 说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.(y-y c )=最小值B.(y-y c )=0C.(y-y c )2=最小值D.(y-y c )2=0E.(y-y c )2=最大值222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xxxy xy yy xx xy y x ∑-∑⋅∑-∑∑⋅∑-∑=-∑⋅-∑--∑===--∑=σσ17.方程y=a+bxcA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数是估计值18.直线回归方程y=a+bx中的回归系数bcA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在的所有理论值同它的平均值一致和y是函数关系与y不相关与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。
《统计学》-第7章-习题答案
第七章思考与练习参考答案1 •答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在定的范围内变化。
2•答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3•答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数二样本相关系数,「一】。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数R2的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y与自变量X之间存在着近似的线性函数关系,可表示为Y^ 11X t u t,这就是总体回归函数,其中u t是随机误差项,可以反映未考虑的其他各种因素对Y的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:Y?=耳+弭x t。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的-0和-1是未知的参数,表现为常数;而样本回归直线中的'?Q和?i是随机变量,其具体数值随所抽取的样本观测值不同而变动。
贾俊平《统计学》(第5版)课后习题-第7章 参数估计【圣才出品】
抽样标准差为:
x
n
5 0.79 40
(2)估计误差为:
E z /2
n
1.96
5 1.55 40
2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3 周的时间里选取 49 名 顾客组成了一个简单随机样本。
(1)假定总体标准差为 15 元,求样本均值的抽样标准误差。 (2)在 95%的置信水平下,求估计误差。 (3)如果样本均值为 120 元,求总体均值 μ 的 95%的置信区间。
4 / 27
圣才电子书
十万种考研考证电子书、题库视频学习平台大样本,所以总均值 μ 的 90%的置信区间为:
x z /2
n
811.645
12 811.974 100
即(79.026,82.974)。
(2)已知: 0.05,z0.05 2 1.96 。由于 n=100 为大样本,所以总体均值 μ 的
4.20
(3)由于总体标准差已知,所以总体均值 μ 的 95%的置信区间为:
x z /2
n
120 1.96
15 49
120 4.20
即(115.8,124.2)。
3.从一个总体中随机抽取 n =100 的随机样本,得到 x 104560,假定总体标准差
σ=85414,试构建总体均值 μ 的 95%的置信区间。
(3)样本量与边际误差的平方成反比,即可以接受的估计误差的平方越大,所需的
样本量就越小。
二、练习题
1.从一个标准差为 5 的总体中采用重复抽样抽出一个样本量为 40 的样本,样本均值
为 25。
(1)样本均值的抽样标准差 x 等于多少?
(2)在 95%的置信水平下,估计误差是多少?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第7章参数估计
练习题
一、填空题(共10题,每题2分,共计20分)
1.参数估计就是用_______ __去估计_______ __。
2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。
3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。
4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。
5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。
6. 评价估计量的标准包含无偏性、_______ __和_______ __。
7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。
8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。
9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。
10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。
二、选择题(共10题,每题1分,共计10分)
1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。
A.以95%的概率包含总体均值
B.有5%的可能性包含总体均值
C.一定包含总体均值
D. 要么包含总体均值,要么不包含总体均值
2.估计量的含义是指( )。
A. 用来估计总体参数的统计量的名称
B. 用来估计总体参数的统计量的具体数值
C. 总体参数的名称
D. 总体参数的具体数值
3. 总体均值的置信区间等于样本均值加减边际误差,其中边际误差等于所要求置信水平的临界值乘以( )。
A. 样本均值的标准差
B. 样本标准差
C. 样本方差
D. 总体标准差
4.一个95%的置信区间是指( )。
A. 总体参数有95%的概率落在这一区间内
B. 总体参数有5%的概率未落在这一区间内
C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数
D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数
5. 置信系数表达了置信区间的( )。
A. 准确性
B. 精确性
C. 显著性
D. 可靠性
6. 在置信水平不变的条件下,要缩小置信区间,则( )。
A. 需要增加样本量
B. 需要减少样本量
C. 需要保持样本量不变
D. 需要改变统计量的抽样标准差
7. 某地区职工样本的平均工资450元,样本平均数的标准差是5元,该地区全部职工平均工资落在440-460元之间的估计置信度为( )。
A. 0.95
B.0.9545
C. 0.99
D. 0.9973
8. 在其它条件不变的情况下,如果总体均值置信区间半径要缩小成原来的二分之一,则所需的样本容量( )。
A. 扩大为原来的4倍
B. 扩大为原来的2倍
C. 缩小为原来的二分之一
D. 缩小为原来的四分之一
9. 以下哪个不是用公式n s
t x 构造置信区间所需的条件( )。
A. 总体均值已知
B. 总体服从正态分布
C. 总体标准差未知
D. 样本容量小于30
10. 假设正态总体方差已知,欲对其均值进行区间估计。
从其中抽取较小样本后使用的统计量是( )。
A. 正态统计量
B. 2χ统计量
C. t 统计量
D. F 统计量
三、判断题(共10题,每题1分,共计10分)
1. 在其他条件相同时,95%的置信区间比90%的置信区间宽。
( )
2. 比较参数的两个估计量的有效性时,必须保证它们是无偏估计。
( )
3. 用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,因此我们可以说60-80分这个区间以95%的概率包含全班学生平均考试成绩的真值。
( )
4. 在总体均值和总体比例的区间估计中,边际误差由置信水平和统计量的标准差确定。
( )
5. 当正态总体的方差已知时,在小样本条件下,估计总体均值使用的分布是t 分布。
( )
6.有效性是指随着样本量的增大,估计量的值越来越接近被估总体的参数。
( )
7. 在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量。
( )
8. 在样本量一定的条件下,要提高估计的精度,就应降低置信水平。
( )
9. 在其他条件不变的情况下,总体数据的方差越大,估计时所需的样本量就越大。
( )
10.对于非正态总体,在大样本条件下,估计总体均值使用的分布是正态分布。
( )
四、计算题(共6题,每题10分,共计60分)
1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米。
请确定该苗圃中树苗平均高度的置信区间,置信水平95%。
2、从水平锻造机的一大批产品中随机抽取20件,测得其尺寸平均值x =32.58,样本方差2S =0.0966。
假定该产品的尺寸2~(,)X N μσ,2,μσ均未知。
试求2σ的置信度为95%的置信区间。
3、某一金融分析师想要估计纽约证券交易所上市公司中拥有现金资产超过总资产百分之十的上市公司的比例。
(1)他希望达到的估计误差不超过0.10,置信度为90%,请确定他所需的样本容量。
(2)假设他根据(1)所确定的样本容量进行了抽样,并计算得出样本比例为0.13,试构建置信度为90%的总体比例的置信区间。
4、某市交通管理部门拟估计该市机动车未按照规定购买保险的比例。
(1)他们希望估计的允许误差不超过0.02,置信度为95%,请确定所需的样本容量。
(2)假设他根据(1)所确定的样本容量进行了抽样,并计算得出样本比例为0.15,试构建置信度为95%的总体比例的置信区间。
5、强生出租车公司拟进行一项调查,调查在六一儿童节那天出租车的平均行驶里程数。
为此公司抽取了20辆出租车进行调查,测得样本均值545公里,标准差为140公里。
请确定公司所有出租车平均行驶里程的置信区间,置信水平95%。
6、某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为25元,应抽取的样本量是多少?。