最新统计学第四版答案(贾俊平)资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
请举出统计应用的几个例子:
1、用统计识别作者:对于存在争议的论文,通过统计量推出作者
2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的
3、挑战者航天飞机失事预测
请举出应用统计的几个领域:
1、在企业发展战略中的应用
2、在产品质量管理中的应用
3、在市场研究中的应用④在财务分析中的应用⑤在经济预测中的应用
你怎么理解统计的研究内容:
1、统计学研究的基本内容包括统计对象、统计方法和统计规律。
2、统计对象就是统计研究的课题,称谓统计总体。
3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
举例说明分类变量、顺序变量和数值变量:
分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等
顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
定性数据和定量数据的图示方法各有哪些:
1、定性数据的图示:条形图、帕累托图、饼图、环形图
2、定量数据的图示:
a、分组数据看分布:直方图
b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图
c、两个变量间的关系:散点图
d、比较多个样本的相似性:雷达图和轮廓图
直方图与条形图有何区别:
1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。
2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
3、条形图主要用于展示定性数据,而直方图则主要用于展示定量数据。
一组数据的分布特征可以从哪几个方面进行描述:
1、数据的水平,反映数据的集中程度
2、数据的差异,反映各数据的离散程度
3、分布的形状,反映数据分布的偏态和峰态
说明平均数、中位数和众数的特点及应用场合:
平均数也称为均值,它是一组数据相加后除以数据的个数而得到的结果。
平均数是度量数据水平的常用统计量,在参数估计以及假设检验中经常用到。
中位数是一组在数据排序后处于中间位置上的数值,用Me表示。
中位数是用中间位置上的值代表数据水平,其特点是不受极端值影响,在研究收入分配中很有用。
众数与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,其特点是不受极端值的影响,具有不惟一性,一组数据中可能会有一个人众数,也可能会有多个或没有。
为什么要计算离散系数:
极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。
它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。
因此,为消除变量值水平高低和数量单位不同对离散程度的测度值的影响,需要计算离散系数。
举例说明离散型随机变量和连续性随机变量:
离散型随机变量:设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散型随机变量。
包括二项分布、泊松分布、超几何分布,如一定时间内某航空公司接到的订票电话数
连续型概率分布:包括正态分布、均匀分布和指数分布。
叙述正态分布曲线的特点:
正态曲线的图形是关于x=u对称的钟形曲线,且峰值在x=u处。
正态分布的两个参数u和σ一旦确定,正态分布的具体形式也惟一确定,不同参数取值的正态分布构成一个完整的“正态分布族”。
当X的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相交。
④正态随机变量在特定区间上取值的概率由正态曲线下的面积给出,而且其曲线下的总面积等于1
解释中心极限定理的含义:
随着样本量n的增大(通常要求n>=30),不论原来的总体是否服从正态分布,样本均值的概率分布都将趋于正态分布,其分布的期望值为总体均值u,方差为总体方差的1/n。
这一定理可表述为:从均值为u、方差为σ^2的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n>=30),样本均值的分布近似服从均值为u,方差为σ^2/n的正态分布。
说明区间估计的基本原理:
区间估计,是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。
与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出的一个概率度量。
简述评价估计量的标准:
无偏性:它是指估计量抽样分布的期望值等于被估计的总体参数;有效性:它是指估计量的方差尽可能小;
一致性:它是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数
解释置信水平的含义:
置信水平,是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
简述样本量与置信水平、总体方差、估计误差的关系
样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计误差的平方成正比,即允许的估计误差的平方越大,所要求的样本量就越大。
解释原假设和备择假设:
原假设:它通常是研究者想收集证据予以推翻的假设,用H0表示,原假设所表达的含义总是指参数没有变化或变量之间没有关系,等号“=”总放在原假设上。
备择假设:通常指研究者想收集证据予以支持的假设,用H1或Ha表示。
备择假设所表达
的含义是总体参数发生了变化或变量之间有某种关系。
备择假设的形式总是为H1:u≠u0,H1:u<u0或u>u0
第一类错误和第二类错误分别是指什么?
它们发生的概率大小之间存在怎样的关系:第Ⅰ类错误(弃真错误):原假设为真时拒绝原假设时所犯的错误第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设
当样本容量n确定后,当α变小时,则检验的拒绝域变小,相应的接受域会变大,因此β值也就随之变大;相反,若β变小,则α又会变大.
样本量的大小与显著性有怎样的关系:
显著性水平与样本的大小密切相关,相关量越大,检验统计量的值也就越大,显著性水平越小,就越有可能拒绝原假设。
相关分析主要解决哪些问题:
变量之间是否存在关系如果存在关系,它们之间是什么样的关系变量之间的关系强度如何④样本所反映的变量之间的关系能否代表总体变量之间的关系
解释回归模型和估计的回归方程的含义:
回归模型是描述因变量y如何依赖于自变量x和误差项的方程。
回归方程是描述因变量y 的期望值如何依赖于自变量x的方程。
估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。
简述参数最小二乘估计的基本原理:
这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小。
根据这一思想确定直线中未知常数和的方法称为最小二乘法
什么是P值?利用P值进行检验和利用统计量进行检验有什么不同?
如果能把犯第Ⅰ类错误的真实概率算出来,就可以直接用这个概率做出决策。
而不需要管什么事先给定的显著性水平α,这个犯第Ⅰ类错误的真实概率就是P值。
不同:统计量检验是根据事先确定的显著性水平α围成的拒绝域作出决策,不论检验统计量的值是大是小,只要把它落入拒绝域就拒绝原假设H。
否则就不拒绝H。
这样,无论统计量落在拒绝域的什么位置,你也只能说犯第一错误的概率为α,而用P值检验则能把犯第Ⅰ类错误的真实概率算出来。
获得数据的概率抽样方法有哪些
(1)简单随机抽样
简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样
系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。
(3)分层抽样
分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
(4)整群抽样
整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。
(5)多阶段抽样
多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段
进行的抽样方法。
样本量的大小与显著性有怎样的关系
通常在做某种统计推断时,显著性水平要求越高,要达到该显著性水平的样本量越大。
样本量越大,检验统计量的值夜就越大,P值就越小,就越有可能拒绝原假设。
反之则相反
第1章统计和统计数据
1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:
(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?
(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第3章用统计量描述数据
3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。
一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:
5.5
6.6 6.7 6.8
7.1 7.3 7.4 7.8 7.8
(1)计算第二种排队时间的平均数和标准差。
(2)比两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
详细答案:
(1)(岁);(岁)。
(2);。
第一中排队方式的离散程度大。
(3)选方法二,因为平均等待时间短,且离散程度小。
3.3 在某地区随机抽取120家企业,按利润额进行分组后结果如下:
按利润额分组(万元)企业数(个)
300以下19
300~400 30
400~500 42
500~600 18
600以上11
合计120
计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
详细答案:
=426.67(万元);(万元)。
3.4 一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?
详细答案:
通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.5 一种产品需要人工组装,现有3种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。
下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C
164 129 125
167 130 126
168 129 126
165 130 127
170 131 126
165 130 128
最小值162 最小值125 最小值116
最大值170 最大值132 最大值128
(1)从集中度、离散度和分布的形状三个角度的统计量来评价。
从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的
离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程
度都不大,方法C则较大。
(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小
第五章
1.
2
3.
4.
5.
6.
7.
5.8 (1)(3.02%,1
6.98%)。
(2)(1.68%,18.32%)。
5.9 详细答案:(4.06,24.35)。
5.10详细答案: 139。
5.11 详细答案: 57。
5.12 769。
第6章假设检验
6.1 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为
7.25小时,标准差为2.5小时。
据报道,10年前每天每个家庭看电视的平均时间是6.70小时。
取显著性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?
详细答案:
,=3.11,,拒绝,如今每个家庭每天收看电视的平均时间显著地增加了。
6.2 为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。
已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。
在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微
克):
81.6 86.6 80.0 85.8 78.6 58.3 68.7 73.2
96.6 74.9 83.0 66.6 68.6 70.9 71.7 71.6
77.3 76.1 92.2 72.4 61.7 75.6 85.5 72.5
74.0 82.5 87.0 73.2 88.5 86.9 94.9 83.0
根据最近的测量数据,当显著性水平时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?
详细答案:
,=-2.39,,拒绝,该城市空气中悬浮颗粒的平均值显著低于过去的平均值。
6.3 安装在一种联合收割机的金属板的平均重量为25公斤。
对某企业生产的20块金属板进行测量,得到的重量数据如下:
22.6 26.6 23.1 23.5
27.0 25.3 28.6 24.5
26.2 30.4 27.4 24.9
25.8 23.2 26.9 26.1
22.2 28.1 24.2 23.6
假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求?
详细答案:
,,,不拒绝,没有证据表
明该企业生产的金属板不符合要求。
6.4 在对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在
显著性水平下,检验该生产商的说法是否属实?详细答案:
,,,拒绝,该生产商的说法属实。
6.5 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:
操作A操作B
=100 =50
=14.8 =10.4
=0.8 =0.6
对=0.02,检验平均装配时间之差是否等于5分钟。
详细答案:
,=-5.145,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。
6.6 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。
样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。
潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。
原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。
对=0.05的显著性水平,用下列数据检验该假设,并对该广告给予评价。
购买力得分购买力得分个体看后看前个体看后看前
1 6 5 5 3 5
2 6 4 6 9 8
3 7 7 7 7 5
4 4 3 8 6 6
详细答案:
设,。
,=1.36,,不拒绝,广告提高了平均潜在购买力得分。
6.7 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2 对12名员工进行培训。
培训后的测试分数如下:方法1 方法2
56 51 45 59 57 53
47 52 43 52 56 65
42 53 52 53 55 53
50 42 48 54 64 57
47 44 44
两种方法培训得分的总体方差未知且不相等。
在显著性水平下,检验两种方法的培训效果是否有显著差异?
详细答案:
,,,拒绝,两种方法的培训效果是有显著差异。
6.8 为研究小企业经理们是否认为他们获得了成功,在随机抽取100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为39人。
在的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异?
详细答案:
设,。
,,,拒绝,男女经理认为自己成功的人数比例有显著差异。
6.9 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。
研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
旧肥料新肥料
109 101 97 98 100 105 109 110 118 109
98 98 94 99 104 113 111 111 99 112
103 88 108 102 106 106 117 99 107 119
97 105 102 104 101 110 111 103 110 119
取显著性水平,检验:
(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:
①两种肥料产量的方差未但相等,即。
②两种肥料产量的方差未且不相等,即。
(2)两种肥料产量的方差是否有显著差异?
详细答案:
(1)设,。
,,,拒绝,新肥料获得的平均产量显著地高于旧肥料。
(2),拒绝,新肥料获得的平均产量显著地高于旧肥料。
(3),。
,,两种肥料产量的方差有显著差异。
6.10 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。
某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位:克)如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异(a=0.05)。
机器1 2.95 3.45 3.50 3.75 3.48 3.26 3.33 3.20
3.16 3.20 3.22 3.38 3.90 3.36 3.25 3.28
3.20 3.22 2.98 3.45 3.70 3.34 3.18 3.35
3.12
机器2 3.22 3.30 3.34 3.28 3.29 3.25 3.30 3.27
3.38 3.34 3.35 3.19 3.35 3.05 3.36 3.28
3.30 3.28 3.30 3.20 3.16 3.33
详细答案:
,。
=8.28,,拒绝,两部机器生产的袋茶重量的方差存在显著差异。
北师大版中考数学专题复习
第一章 数与式 第一讲 实数
【基础知识回顾】
一、实数的分类:
1、按实数的定义分类: 实数 有限小数或无限循环数
2、按实数的正负分类:
实数
【名师提醒:1、正确理解实数的分类。
如:
2
π
是 数,不是 数, 7
22
是 数,不是 数。
2、0既不是 数,也不是 数,但它是自然数】 二、实数的基本概念和性质
1、数轴:规定了 、 、 的直线叫做数轴, 和数轴上的点是一一对应的,数轴的作用有 、 、 等。
2、相反数:只有 不同的两个数叫做互为相反数,a 的相反数是 ,0的相反数是 ,a 、b 互为相反数⇔
3、倒数:实数a 的倒数是 , 没有倒数,a 、b 互为倒数⇔
4、绝对值:在数轴上表示一个数的点离开 的距离叫做这个数的绝对值。
a =
⎪ ⎪ ⎪
⎪ ⎩
⎪ ⎪ ⎪ ⎪ ⎨ ⎧ ⎩ ⎨ ⎧ ⎪ ⎪ ⎪ ⎩ ⎪ ⎪
⎪ ⎨ ⎧ ⎩ ⎨ ⎧ ⎪ ⎩ ⎪
⎨ ⎧ 正无理数
无理数 负分数 零 正整数 整数 有理数 无限不循环小数 ⎧⎨
⎩⎧⎨⎩正数正无理数零 负有理数负数
(a >0)
(a <0) 0 (a=0)
因为绝对值表示的是距离,所以一个数的绝对值是数,我们学过的非负数有三个:、、。
【名师提醒:a+b的相反数是,a-b的相反数是,0是唯一一个没有倒数的数,相反数等于本身的数是,倒数等于本身的数是,绝对值等于本身的数是】
三、科学记数法、近似数和有效数字。
1、科学记数法:把一个较大或较小的数写成的形式叫做科学记数法。
其中a。