统计学课后题

合集下载

统计学课后题答案_吴风庆_王艳明

统计学课后题答案_吴风庆_王艳明

《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。

统计学课后题答案(袁卫_庞皓_曾五一_贾俊平_)

统计学课后题答案(袁卫_庞皓_曾五一_贾俊平_)

版权归wagxjysys所有违者必究第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。

3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。

因此,他们开始检查供货商的集装箱,有问题的将其退回。

最近的一个集装箱装的是2 440加仑的油漆罐。

这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。

装满的油漆罐应为4.536 kg。

要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。

答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。

4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。

这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。

假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。

要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。

答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。

第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。

调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。

统计学课后题目+答案

统计学课后题目+答案

进行测量,得到的重量数据如下:(单位:公斤)
22.6
26.6
23.1
23.5
27.0
25.3
28.6
24.5
26.2
30.4
27.4
24.9
25.8
23.2
26.9
26.1
22.2
28.1
24.2
23.6
假设金属板的重量服从正态分布,在a=0.05 显著水平下,检验该企业生产金属板是否符
合要求。


7
9
9
4
10
8
8
取显著性水平 a=0.05,检验管理者的水平不同是否会导致评分的显著性差异。
7.3 某家电制造公司准备进一批 5 号电池,现有 A、B、C 三个电池生产企业愿意供货,为比
6
较它们生产的电池质量,从每个企业各随机抽取 5 只电池,经实验得其寿命数据如下(单位:
小时):
实验号
电池生产企业
1994 1296
1985
1245
1995 1416
1986
1200
1996 1367
1987
1260
1997 1479
1988
1020
1998 1272
1989
1095
1999 1469
1990
1260
2000 1519
(1)绘制时间序列图描述其形态。 (2)用 5 期移动平均法预测 2001 年的单位面积产量。 (3)采用指数平滑法,分别用平滑系数 a=0.3 和 a=0.5 预测 2001 年的单位面积产量, 分析预测误差,说明用哪一个平滑系数预测更合适? 详细答案: (1)时间序列图如下:

统计学课后习题

统计学课后习题

1.判断题(把" √"或" Ⅹ"填在题后的括号里)(1)重复抽样的抽样误差一定大于不重复抽样的抽样误差。

(Ⅹ)(2)在抽样推断中,全及总体指标值是确定的、唯一的,而样本指标是一个随机变量。

(√)(3)在缺少总体方差的资料时,也可以用样本方差资料来代替,以计算抽样误差。

(√)(4)在其他条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。

(√)(5)抽样估计的优良标准有三个:无偏性、可靠性和一致性。

(Ⅹ)(6)总体参数区间估计必须具备三个要素,即估计值、抽样误差范围和抽样误差的概率度。

(√)2.单选题(1)在抽样调查中,无法避免的误差是(D)A.登记性误差B.系统性误差C.极限误差D.随机误差(2)抽样调查所必须遵循的基本原则是(B)A.准确性原则B.随即原则C.可靠性原则D.灵活性原则。

(3)某工厂连续生产,在一天中每隔1h抽出10min的产品进行检验,这种抽查方式是(B)A.简单随机抽样B.等距抽样C.分层抽样D.整群抽样(4)在简单随机抽样条件下,当抽样平均误差缩小一半时,样本单位数应为原来的。

CA.2倍B.3倍C.4倍D.1/4倍(5)反映抽样指标与全及总体指标之间抽样误差的可能范围的指标是(C)A.概率度 B.抽样误差系数 C.抽样平均误差 D.抽样极限误差。

(6)在抽样推断中,样本容量(D)A.越少越好B.越多越好C.取决于统一的抽样比例D.取决于对抽样推断可靠性的要求3多选题(1)抽样法的基本特点有(ACDE)A.根据部分实际资料对全部总体的数量特征作出估计B.深入研究某些复杂的专门问题 C.按随机原则从全部总体中抽选样本单位 D.调查单位少,调查范围小,了解总体基本情况 E.抽样推断的抽样误差可以事先计算并加以控制(2)抽样估计中的抽样误差(ACE)A.是不可避免要产生的B.是可以通过改进调查方式来消除的C.是可以事先计算出来的D.是只能在调查结束后才能计算的E.其大小是可以控制的(3)在抽样推断中ABD)A.全及总体是唯一确定的B.总体参数只能有一个C.统计量是唯一确定的D.统计量是随机的E.总体参数是随机的(4)要增大抽样估计的置信程度,可采用的方法有(CE)A.增加样本容量B.缩小抽样误差范围C.扩大抽样误差范围D.提高估计精确度E.降低估计精确度(5)从总体中抽取样本单位的具体方法有(ABCD)A.简单随机抽样B.重复抽样C.不重复抽样D.等距抽样E.非概率抽样(6)抽样推断的组织形式有(CDEF)A.重复抽样B.不重复抽样C.随机抽样D.分层抽样E.等距抽样F.整群抽样4计算题(1)某灯泡厂1月份生产灯泡10万只,抽取1%。

统计学课后练习题。部分题目有答案。

统计学课后练习题。部分题目有答案。

第三章统计数据的整理和显示习题二、单项选择题1.统计分组的关键问题是( A >A确定分组标志和划分各组界限 B确定组距和组数C确定组距和组中值 D确定全距和组距4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为(C >b5E2RGbCAP每个组上限与下限的中点值称为组中值,对于开口组的组限是按相邻组的组距来计算的,所以末组开口组的组中值=末组下限+邻组组限/2=200+<200-170)=230p1EanqFDPwA260 B 215 C 230 D 1855.下列分组中按品质标志分组的是( B >品质标志是说明事物的性质或属性特征的,它反映的是总体单位在性质上的差异,它不能用数值来表现。

A人口按年龄分组 B产品按质量优劣分组C企业按固定资产原值分组 D乡镇按工业产值分组6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( C >A简单分组 B平行分组 C复合分组 D再分组7.用组中值代表各组内的一般水平的假定条件是( D > A各组的次数均相等 B各组的组距均相等C各组的变量值均相等 D各组次数在本组内呈均匀分布9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( A >A变量分组 B属性分组 C分组体系 D复合分组10.在频数分布中,频率是指( C >A各组频数之比 B各组频率之比 C各组频数与总频数之比 D 各组频数与各组次数之比11.频数分布用来表明( A >A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度12.在分组时,若有某单位的变量值正好等于相邻组的下限时,一般应将其归在( B >A上限所在组 B下限所在组C任意一组均可 D另设新组13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( B >A正例关系 B反比例关系 C乘积关系 D毫无关系14.统计表的宾词是用来说明总体特征的( C >A标志 B总体单位 C统计指标 D统计对象15.统计表的主词是统计表所要说明的对象,一般排在统计表的( A >A左方 B上端中部 C右方 D下方三、多项选择题1.统计分组的作用在于( BCD >A区分现象的类型 B反映现象总体的内部结构变化C比较现象间的一般水平 D分析现象的变化关系 E研究现象之间数量的依存关系2.指出下表表示的分布数列所属的类型(ABC >A品质数列 B变量数列 C分组数列 D异距数列 E等距数列3.指出下列分组哪些是品质分组( ABCD >A人口按性别分组 B企业按产值多少分组C家庭按收入水平分组 D在业人口按文化程度分组E宾馆按星级分组6.从形式上看,统计表由哪些部分构成(CDE>A总标题 B主词 C纵栏标题 D横行标题 E宾词7.按主词是否分组,统计表可分为( AC >A单一表 B简单表 C分组表 D复合表 E综合表9.统计数据整理的内容一般有( BCE >A对原始数据进行预处理 B对统计数据进行分组C 对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图11.某单位100名职工按工资额分为300以下、300-400、400-600、600-800、800以上等五个组。

统计学课后习题参考答案

统计学课后习题参考答案

第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。

4.试述统计总体和总体单位的关系。

5.标志与指标有何区别何联系。

二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。

()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。

()3、总体单位是标志的承担者,标志是依附于单位的。

()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。

()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。

三、单项选择题1、社会经济统计的研究对象是()。

A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。

A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。

A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。

A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。

A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题(教材第四章P108课后习题答案)1.某村对该村居民月家庭收入进行调查,获取的资料如下:按月收入分组(元)村民户数(户)500~600 600~700 700~800 800~900 900以上20 30 35 25 10合计120 要求:试用次数权数计算该村居民平均月收入水平。

统计学课后习题答案

统计学课后习题答案

1.指出下面的变量哪一个属于分类变量()。

A.年龄B.工资C.汽车产量D.购买商品时的支付方式(现金、信用卡、支票)2.指出下面的变量哪一个属于顺序变量()。

A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)3.指出下面的变量哪一个属于数值型变量()。

A.年龄B.性别C.企业类型D.员工对企业某项改革措施的态度(赞成、中立、反对)4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。

这项研究的总体是()。

A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。

这项研究的样本是()。

A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。

这项研究的参数是()。

A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入7.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。

这项研究的统计量是()。

A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入8.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。

这里的总体是()。

A.IT业的全部从业者B.500个IT从业者C.IT从业者的总收入D.IT从业者的消费支付方式9.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。

这里的“月收入”是()。

《统计学》课后练习题答案

《统计学》课后练习题答案
3.3汇总统计表
3.4统计图的规范
3.5如何用Excel做统计图
习题
一、单项选择题
1.统计表的结构从形式上看包括()、横行标题、纵栏标题、数字资料四个部分。(知识点3.1答案:D)
A.计量单位B.附录C.指标注释D.总标题
2.如果统计表中数据的单位都一致,我们可以把单位填写在()。(知识点3.1答案:C)
A.指标B.标志C.变量D.标志值
8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
9.()表示事物的质的特征,是不能以数值表示的。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
10.在出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中,属于数量指标的有几个()。(知识点:1.7答案:B)
1.统计调查方案的主要内容是( )( )( )( )( )。(知识点2.2答案:ABCDE)
A.调查的目的B.调查对象C.调查单位D.调查时间E.调查项目
2.全国工业普查中( )( )( )( )( )。(知识点2.2答案:ABCE)
A.所有工业企业是调查对象B.每一个工业企业是调查单位C.每一个工业企业是报告单位
频数f
(棵)
频率
(%)
向上累积
向下累积
频数(棵)
频率(%)
频数(棵)
频率(%)
80-90
8
7.3
8
7.3
110
100.0
90-100
9
8.2
17
15.5
102
92.7
100-110

统计学经典课后习题

统计学经典课后习题

第一章一、填空题1.统计这个概念包括三种不同而又密切相关的含义:__________、__________和__________。

2.统计学由于研究对象的不同,可分为__________和__________两大类。

3.标志反映__________的属性和特征,而指标则反映__________的数量特征。

4.统计指标按其所反映的数量特点不同,可分为__________和__________。

5.变量根据变量值连续出现与否,可分为__________和__________。

6.统计数据按其表现形式的不同,可分为绝对数、__________和__________。

二、判断题1.统计总体和总体单位随着统计研究的目的不同是可以相互转化的。

()2.人的年龄是数量指标。

()3.女性是品质标志值。

()4.数量标志值是由许多统计指标的数值汇总而来的。

()5.标志不能用数值表示,而指标都是用数值表示的。

()6.指标是说明总体单位数量特征的名称。

()7.“籍贯”是品质标志的标志值。

()8.标志是说明总体单位数量特征的名称和具体数值。

()三、单项选择题1.一个总体()A.只能有一个标志 C.只能有一个指标C.可以有多个标志D.可以有多个指标2.以产品等级来衡量某种产品质量优劣,则产品等级是()A.数量标志B.品质标志C.数量指标D.质量指标3.某市全部工业企业作为总体。

每个工业企业为总体单位,则每个工业企业全年销售额为()A.数量标志B.品质标志C.数量指标D.质量指标4.下列各项指标中,数量指标为()A.全国人口数B.人口的性别构成C.人口密度D.平均亩产量5.某车间5名工人的日产量分别为20件、21件、18件、24件、19件,这5个数值是()A.指标B.标志C.变量D.标志值E.指标数值6.社会经济统计的研究对象是()A.抽象的数量关系B.社会经济现象的规律性C.社会经济现象的数量特征和数量关系D.社会经济统计认识过程的规律和方法7.社会经济统计是()的有力工具A.解决问题B.克服困难C.进行交流D.认识社会四、简答题1.简述社会经济统计的研究对象及其特点。

统计学---课后习题

统计学---课后习题

1.略2 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。

试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。

并说明几个计算结果之间有何关系?序号123456789101112性别男男男女男男女男女女男男职称工程师技术员技术员技术员技术员工程师工程师技术员技术员工程师技术员技术员(1)P(A) = 4/12 = 1/3(2)P(B) = 4/12 = 1/3(3)P(AB) = 2/12 = 1/6(4)P(A+B) = P(A) + P(B) - P(AB) = 1/3 + 1/3 - 1/6 = 1/23.向两个相邻的军火库发射一枚导弹,如果命中第一个和第二个军火库的概率分别是0.06、0.09 ,而且只要命中其中任何一个军火库都会引起另一个军火库的爆炸。

试求炸毁这两个军火库的概率有多大。

解:此题考查互斥事件的概率,是一个根底题,解题的关键是看清楚军火库只要一个爆炸就可以,所以知军火库爆炸是几个事件的和事件.P(A)=0.06+0.09=0.154.某项飞碟射击比赛规定一个碟靶有两次命中时机(即允许在第一次脱靶后进行第二次射击)。

某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。

求该选手两发都脱靶的概率。

解:设入=第1发命中。

B =命中碟靶。

求命中概率是一个全概率的计算问题。

再利用对立事件的概率即可求得脱靶的概率。

P(B)= P(A)P(B | A) P(A)P(B | A) =0.8 案+ 0.2 0.5 = 0.9 脱靶的概率=1-0.9 = 0.1 或(解法二):P(脱靶)=P(第1次脱靶)>P(第2次脱靶)=0.2 >0.5 = 0.15.某产品的合格率是98%,现有一检查系统,它能以0.98的概率准确的判断出合格品,而对不合格品进行检查时,有0.05的可能性判断错误,该检查系统产生错判的概率是多少?解:考虑两种情况,一种就是将合格品判断错误,概率为98%* (1-0.98) =0.0196另一种情况就是将不合格品判断错误,概率为( 1-98%) *0.05=0.001所以该检查系统产生错判的概率是0.0196+0.001=0.02066.有一男女比例为51:49的人群,一直男人中5%是色盲,女人中0.25%是色盲,现随机抽中了一个色盲者,求这个人恰好是男性的概率?解:A =抽到男性,入2=抽到女性。

统计学课后答案

统计学课后答案

第一章绪论1.社会经济统计学的研究对象是:(A)A社会经济现象的数量方面B.统计工作C.社会经济内在规律D.统计方法2.考察全国的工业企业的情况时,以下标志中属于不变标志的有(A)A.产业的分类B.职工人数C.劳动生产效率D.所有制3.要考察全国居民的人均住房面积,其统计总体是(A)A.全国所有居民户B.全国的住宅C.各省市自治区D.某一居民户4.最早使用"统计学"这一术语的是(B)A.政治算术学派B.国势学派C.社会统计学D.数理统计学派第二章统计数据的收集,整理和显示1.统计的调查对象是(C)A.总体各单位标志值B.总体单位C.现象总体D.统计指标2.我国统计调查体系中,作为主体的是(A)A.经常性抽查调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查3.要对某企业生产设备的实际生产能力进行调查,则企业的“生产设备”是(A)A.调查对象B.调查单位C.调查项目D.报告单位4.下面那些现象事宜采用非全面调查?(ABCD)A.企业经营管理中出现的新情况B.某型号日光灯耐用时数检查C.某地区居民储蓄存款D.某地区森林的木材积蓄量5.抽查调查(abd)A.是一种非全面调查B.是一种非连续性的调查C.可以消除抽样误差D.应遵循随机原则6.洛伦茨曲线(BC)A.是一种向下累计曲线B.可用于反映财富的分布曲线C.用以衡量收入分配公平与否D.越接近对角线基尼系数越大第三章数据分布特征的描述1.由变量数列计算加权算术平均数时,直接体现权数的实质的是(D)A.总体单位数的多少B.各组单位数的多少C.各组变量值的大小D.各组频率的大小2.若你正在筹划一次聚会,想知道该准备多少瓶饮料,你最希望得到所以客人需要饮料数量(a)A.均值B.中位数C.众数D.四分位数3.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350 元,标准差分别为230元和680元,则职工平均收入的代表性(B)A.甲类较大B.乙类较大C.两类相同D.在两类之间缺乏可比性4.假如学生测验成绩记录为优。

统计学课后题

统计学课后题

统计学课后题第二章均值向量和协方差阵的检验1、试谈willks统计量在多元方差分析中的重要意义。

2、形象分析的基本思路是什么?形象又称轮廓图,是将总体样本的均值绘制到同一坐标轴里所得的折线图,每一个指标都表示为折线图上的一点。

形象分析是将两总体的形象绘制到同一个坐标下,根据形象的形状对总体的均值进行比较分析。

第三章聚类分析1、聚类分析的基本思想和功能是什么?聚类分析的核心思想是根据具体的指标对所研究的个体或者对象进行分类,使得同一类中的对象之间的相似性比其他类的对象的相似性更强。

聚类分析不仅可以用来对样品进行分类,也可以用来对变量进行分类。

对样品的分类常称为Q型聚类分析,对变量的分类常称为R型的聚类分析。

聚类分析的目的或功能就是把相似的研究对象归成类,即使类间对象的同质性最大化和类与类间对象的异质性最大化。

2、试述系统聚类法的原理和具体步骤系统聚类的基本思想是:距离相近的样品先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品总能聚到合适的类中。

系统聚类的具体步骤:假设总共有N个样品第一步:将每个样品独自聚成一类,共有N类;第二步:根据所确定的样品“距离”公式,把距离较近的两个样品聚合为一类,其他的样品仍各自聚为一类,共聚成N-1类;第三步:将“距离”最近的两个类进一步聚成一类,共聚成N-2类;。

,以上步骤一直进行下去,最后将所有的样品全聚成一类。

3、试述K-均值聚类的方法原理这种聚类方法的思想是把每个样品聚集到其最近形心类中。

首先随机从数据集中选取 K个点作为初始聚类中心,然后计算各个样本到聚类中的距离,把样本归到离它最近的那个聚类中心所在的类。

计算新形成的每一个聚类的数据对象的平均值来得到新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛。

4、试述模糊聚类的思想方法模糊聚类分析是根据客观事物间的特征、亲疏程度、相似性,通过建立模糊相似关系对客观事物进行聚类的分析方法。

统计学课后题答案

统计学课后题答案

统计学复习笔记第七章参数估计一、思考题1.解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)—致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查人数是负责任的表现。

这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4.解释95%勺置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95% (的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。

5.简述样本量与置信水平、总体方差、估计误差的关系。

1.估计总体均值时样本量n为(z 2)2 2 E zn P—其中:E z2*2.样本量n与置信水平1- a、总体方差工、估计误差E之间的关系为与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

二、练习题1.从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。

《统计学》教材课后练习题

《统计学》教材课后练习题

《统计学》教材课后练习题《统计学》练习题第⼀章绪论练习题:⼀、单项选择题:1.统计有三种涵义,其中是基础。

A.统计学B.统计活动C.统计⽅法D.统计资料2.社会经济统计的基本特点是。

A.数量性B.总体性C.整体性D.同质性3.要了解50个学⽣的学习情况,则总体单位是。

A.50个学⽣B.每⼀个学⽣C.50个学⽣的学习成绩D.每⼀个学⽣的成绩4.⼀个统计总体。

A.只能有⼀个总体B. 只能有⼀个指标C.可以有多个标志D.可以有多个指标5.已知某种商品每件的价格为25元,这⾥的“商品价格”是。

A.指标B.变量C.品质标志D.数量标志⼆、多项选择题:1.当观察和研究某省国有⼯业企业的⽣产活动情况时。

A.该省所有的国有⼯业企业为总体B.该省国有⼯业企业⽣产的全部产品为总体C.该省国有企业的全部资产为总体D. 该省每⼀个国有⼯业企业为总体单位E.该省国有⼯业企业⽣产的每⼀件产品为总体单位2.品质标志表⽰事物的质的特征,数量标志表⽰事物的量的特征,所以。

A.数量标志可以⽤数值表⽰B.品质标志可以⽤数值表⽰C.数量标志不可以⽤数值表⽰D.品质标志不可以⽤数值表⽰E两者都可以⽤数值表⽰3.下列标志中,属于数量标志的有。

A.性别B.⼯种C.⼯资D.民族E.年龄4.连续变量的数值。

A.是连续不断的B.是以整数断开的C.相邻两值之间可取⽆限数值D.要⽤测量或计算的⽅法取得E.只能⽤计数⽅法取得5.下列统计指标中,属于质量指标的是。

A.国内⽣产总值B.平均⼯资C.计划完成程度D.出勤率E.总产量三、简答题:1.统计有哪些涵义?它们之间有什么关系?2.统计研究对象是什么?它有哪些特点?3.统计⼯作过程分为哪⼏个阶段?它们之间有什么联系?4.什么是统计总体和总体单位?总体和单位的关系怎样?5.什么是标志?什么是指标?它们之间有什么区别和联系?四、练习题:1.指出某机械⼯业局所属的下列统计标志中.哪些是品质标志?哪些是数量标志?(1)企业所有制 (2)企业地址 (3)占地⾯积(4)职⼯⼈数 (5)主要产品⽤途(6)設备台数 (7)利润总额2.指出下列指标中哪些是数量指标?那些是质量指标:(1)职⼯⼈数 (2)⼯资总额 (3)劳动⽣产率 (4)单位产品成本 (5)设备利⽤率 (6)设备台数 (7)原材料利⽤率 (8)主要产品产量(9)⼯业增加值3.指出下列总体单位中的品质标志和数量标志:(1)⼤学⽣ (2)⼯⼈ (3)机床 (4)机床⼚4.指出下列变量中哪些是连续变量,哪些是离散变量:(1)学⽣⼈数 (2)学⽣体重 (3)⼯业增加值 (4)电视机产量 (5)汽车耗油量参考答案:⼀、1B 2A 3B 4D 5D⼆、1AD 2AD 3CE 4ACD 5BCD三、略。

统计学课后习题

统计学课后习题

第二章统计数据调查与整理9.对50只灯泡的耐用时数进行测试,所得数据如下:(单位:小时)886 928 999 946 950 864 1050 927 949 8521027 928 978 816 1000 918 1040 854 1100 900866 905 954 890 1006 926 900 999 886 1120893 900 800 938 864 919 863 981 916 818946 926 895 967 921 978 821 924 651 850要求:(1)根据上述资料编制次数分布数列,并计算向上累计和向下累计频数和频率。

(2)根据所编制的次数分布数列,绘制直方图、折线图。

(3)根据图形说明灯泡耐用时数的分布属于何种类型。

最大值=651 最下限=650最小值=1120 最上限=1150全距=1120-651=469组数=5,组距=100组限人数频率%向上累计频数向上累计频率%向下累计频数向下累计频率%650-75010.02 1 0.0250 1750-850 40.08 5 0.149 0.98850-950300.635 0.745 0.9950-1050120.2447 0.9415 0.31050-115030.0650 1 3 0.0610.某服装厂某月每日的服装产量如下表所示。

某服装厂X月X日服装产量表将表中资料编制成组距式分配数列,用两种方式分组,各分为五组,.比较哪一种分组较为合理。

等距式分组(不考虑异常数据)组限频次0-50550-1003100-15012150-2007200-2503异距式分组(考虑异常数据)组限频次休假4产量〈1004100-15012150-2007200-250311.某驾驶学校有学员32人,他们的情况如下表所示:利用表中资料编制以下统计表:(1)主词用一个品质标志分组,宾词用一个品质标志和一个数量标志分三组的宾词平行分组设计表。

统计学课后练习题(长沙理工大学)_图文

统计学课后练习题(长沙理工大学)_图文

第三章数据的图表展示1、为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。

调查结果3.1。

要求:(1)指出上面的数据属于什么类型?答:顺序数据(2)用EXCEL或SPSS制作一张频数分布表?(3)绘制一张条形图,反映评价等级的分布?(4)绘制评价等级的帕累托图?2、为了确定灯泡的使用寿命,在一批灯泡中随机抽取100个进行观测,所得结果如下3.5,要求:(1)利用计算机对上面的数据进行排序?(2)以组距为10进行等距分组,整理成频数分布表?(3)根据分组数据绘制直方图,说明数据分布特点?呈正态分布。

(4)制作茎叶图,并与直方图进行对比。

茎叶图与直方图十分相似。

3、2005年4月北京亚运村汽车交易市场的汽车销售数据如下3.13,要求:(1)画出国产汽车和进口汽车销售量的对比条形图;(2)画出国产汽车和进口汽车销售量的环形图。

4、已知1995-2004年我国国内生产总值指标数据如下3.14,要求:(1)用EXCEL绘制国内生产总值的线图?(2)绘制第一、第二、第三产业国内生产总值线图?(3)根据2004年的国内生产总值及其构成数据,绘制饼图。

第四章数据的概括性度量1、随机抽取25个网络用户,得到他们的年龄数据如4.2。

要求:(1)计算众数、中位数;(2)计算四分位数、平均数和标准差;(3)计算偏态系数和峰态系数;(4)对网民年龄的分布特征进行综合分析;答:从众数、中位数和平均数来看,网民年龄在23~24岁的人占大多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于偏态系数为正值,所以为尖峰分布。

2、一种产品需要人工组装,现有三种可供选择的组装方法。

为检验那种方法更好,随机抽取15个工人,让他们分别用三种方法组装,下面是15个工人分别用三种方法在相同的时间内组装的产品数量,如4.12.要求(1)你准备采用什么样的方法来评价组装方法的优劣?答:应该分别从平均值和标准差两个方面进行评价。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章均值向量和协方差阵的检验1、试谈willks统计量在多元方差分析中的重要意义。

2、形象分析的基本思路是什么?形象又称轮廓图,是将总体样本的均值绘制到同一坐标轴里所得的折线图,每一个指标都表示为折线图上的一点。

形象分析是将两(多)总体的形象绘制到同一个坐标下,根据形象(轮廓图)的形状对总体的均值进行比较分析。

第三章聚类分析1、聚类分析的基本思想和功能是什么?聚类分析的核心思想是根据具体的指标(变量)对所研究的个体或者对象进行分类,使得同一类中的对象之间的相似性比其他类的对象的相似性更强。

聚类分析不仅可以用来对样品进行分类,也可以用来对变量进行分类。

对样品的分类常称为Q型聚类分析,对变量的分类常称为R型的聚类分析。

聚类分析的目的或功能就是把相似的研究对象归成类,即使类间对象的同质性最大化和类与类间对象的异质性最大化。

2、试述系统聚类法的原理和具体步骤(1)系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。

(2)系统聚类的具体步骤:假设总共有N个样品(或变量)第一步:将每个样品(或变量)独自聚成一类,共有N类;第二步:根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其他的样品(或变量)仍各自聚为一类,共聚成N-1类;第三步:将“距离”最近的两个类进一步聚成一类,共聚成N-2类;。

,以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类。

3、试述K-均值聚类的方法原理这种聚类方法的思想是把每个样品聚集到其最近形心(均值)类中。

首先随机从数据集中选取K个点作为初始聚类中心,然后计算各个样本到聚类中的距离,把样本归到离它最近的那个聚类中心所在的类。

计算新形成的每一个聚类的数据对象的平均值来得到新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛。

4、试述模糊聚类的思想方法模糊聚类分析是根据客观事物间的特征、亲疏程度、相似性,通过建立模糊相似关系对客观事物进行聚类的分析方法。

在模糊聚类中,每个样本不再仅属于某一类,而是以一定的隶属度属于每一类。

换句话说,通过模糊聚类分析,可得到样本属于各个类别的不确定性程度,即建立起了样本对于类别的不确定性的描述,这样就更能准确地反映现实世界。

第四章判别分析1、应用判别分析应该具备什么样的条件?判别分析最基本的要求是:分组类型在两组以上;每组案例的规模必须至少在一个以上;解释变量必须是可测量的,才能够计算其平均值和方差,使其能合理地应用于统计函数。

2、试述贝叶斯判别法的思路思想是:假定对研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布,各种统计推断都通过后验概率分布来进行。

将贝叶斯思想用于判别分析,就得到贝叶斯判别。

3、试述费歇判别方法的思想。

费歇判别的思想是投影,将K组P维数据投影到某一个方向,使得它们的投影组和组之间尽可能地分开。

4、什么是逐步判别分析凡具有筛选变量能力的判别方法统称为逐步判别法。

逐步判别法的基本思想是:逐步引入变量,每次引入一个"最重要"的变量,同时也检验先前引入的变量,如果先前引入的变量其判别能力随新引入变量而变不显著,则及时将其从判别式中剔除,直到判别式中的变量都很显著,且剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。

5、简要叙述判别分析的步骤及流程。

判别分析的6个步骤过程:(1)判别分析的对象:这一步骤主要根据判别分析的研究目的定义观测变量。

(2)判别分析的研究设计:主要包括解释变量和被解释变量的选择、估计判别函数所需的样本量和为了验证目的对样本的分割。

(3)假定:推导判别函数的关键假定是解释变量的多元正态性和被解释变量定义的各组的未知但相等的协方差结构。

(4)估计判别模型和评估整体拟合:研究者必须确定估计的方法,然后确定保留的函数个数;根据估计的函数可用多种方法来评估模型拟合。

(5)结果的解释:这个过程主要介绍在判别分析中每个解释变量的相对重要性,主要有标准化判别权重、判别载荷(结构相关系数)、偏F值三种方法确定重要性。

(6)结果的验证:通常采用分割样本或者交叉验证法。

判别分析的流程:研究问题>设计要点>假定>估计判别函数>使用分类矩阵估计预测的精度>判别函数的解释>判别结果的验证第五章主成分分析1、主成分的基本思想是什么在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也称为变量。

这样就产生了如下问题:一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考虑指标的增多增加了问题的复杂性,同时由于各指标均是对同一事物的反映,不可避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹杀事物的真正特征与内在规律。

基于上述问题,人们就希望在定量研究中涉及的变量较少,而得到的信息量又较多。

主成分分析正是研究如何通过原来变量的少数几个线性组合来解释原来变量绝大多数信息的一种多元统计方法。

既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。

一般地说,利用主成分分析得到的主成分与原始变量之间有如下基本关系:1.每一个主成分都是各原始变量的线性组合;2.主成分的数目大大少于原始变量的数目3.主成分保留了原始变量绝大多数信息4.各主成分之间互不相关通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作引向深入。

2、主成分在应用中的主要作用是什么?设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。

3、由协方差阵出发和由相关阵出发求主成分有什么不同?一般而言,对于度量单位不同的指标或是取值范围彼此差异非常大的指标,我们不直接由其协方差矩阵出发进行主成分分析,而应该考虑将数据标准化。

但是,对原始数据进行标准化处理后倾向于各个指标的作用在主成分的构成中相等。

对于取值范围相差不大或是度量相同的指标进行标准化处理后,其主成分分析的结果仍与由协方差阵出发求得的结果有较大区别。

其原因是由于对数据进行标准化的过程实际上也就是抹杀原始变量离散程度差异的过程,标准化后的各变量方差相等均为1,而实际上方差也是对数据信息的重要概括形式,也就是说,对原始数据进行标准化后抹杀了一部分重要信息,因此才使得标准化后各变量在对主成分构成中的作用趋于相等。

由此看来,对同度量或是取值范围在同量级的数据,还是直接从协方差矩阵求解主成分为宜。

第六章因子分析1、因子分析与主成分分析有什么本质不同?主成分分析和因子分析是两种把变量维数降低以便于描述、理解和分析的方法:实际上主成分分析可以说是因子分析的一个特例。

(1)因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成各个变量的线性组合。

(2)主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

(3)主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。

因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

(4)主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因子。

(5)在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。

在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。

(6)和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。

大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾于使用因子分析,并且借助旋转技术帮助更好解释。

而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。

当然,这中情况也可以使用因子得分做到。

所以这种区分不是绝对的。

2、因子载荷a ij的统计定义是什么?它在实际问题分析中的作用是什么?因子载荷a(ij)的统计意义就是第i个变量与第j个公共因子的相关系数即表示X(i)依赖F(j)的份量(比重)。

统计学术语称作权,心理学家将它叫做载荷,即表示第i个变量在第j个公共因子上的负荷,它反映了第i个变量在第j个公共因子上的相对重要性。

在因子分析中,通常只选其中m个(m<p主因子),即根据变量的相关选出第一主因子ƒ1,使其在各变量的公共因子方差中所占的方差贡献为最大,然后消去这个因子的影响,而从剩余的相关中,选出与之不相关的因子,使其在各个变量的剩余因子方差贡献中为最大,如此往复,直到各个变量公共因子方差被分解完毕为止。

第七章对应分析1、试述对应分析的思想方法及特点。

思想:对应分析又称为相应分析,也称R—Q分析。

是因子分子基础发展起来的一种多元统计分析方法。

它主要通过分析定性变量构成的列联表来揭示变量之间的关系。

当我们对同一观测数据施加R和Q型因子分析,并分别保留两个公共因子,则是对应分析的初步。

对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。

它最大特点是能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。

另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。

特点:对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。

它最大特点是能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。

另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。

相关文档
最新文档