统计学(第三版课后习题答案)
统计学教材部分参考答案第三版
教材习题答案第3章用统计量描述数据3. 2详细答案: 3.2 (])jg =丄5 + 6.6 + ;・ + 7.8 + 7.8 =€3= ?(分钟)9 9徑• 士二空 + @±一 Z12+ …+(7. 8 — 7严 + (7・ 8 二7严 V 9-1 =护器=0.71(分钟)<2)因为两种排队方式的平均数不同.所以用离散系数进行比较。
巧弓彎Ilf io?由于s>s ,表明第〜种排队方式的离做•程度大于笫二种排队方式. <3)选方法二.因为平均等待时间短•且离散程度小。
3.3详细答案:3.3平均数计算过程见下報 按利湎领分组组中值M企业效JG200 〜300 250 19 4 750 300〜400 350 30 10 WO 400〜500 450 42 18 900 500〜600 550 18 9900 600以上 65021 71" 合计12051 200S = §一—=斗翠=426. 6771 1Z03.4详细答案:贞脚按利润额分纽组中值M 1企业数Z(M -JT)1(MP)*/; 200 TOO 250 】931212.3 593033.5 300-400 350 30 5S7&.3176 348.7 400 〜 450 42 则3228600 500〜600 550 18 15 210.3 273 785.2 600以上65011 49 876.3 548639.2 合卄120102 721.51 614 666.7标准差计算过程见下表, £侧一刃7―门 614 666. 7=11& 48通过计算标准化值来判断,Z ^=1 , Z B = 0-5,说明在A 项测试中该应试者比平均分数高出1 个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准化值高于B 项测试, 所以A 项测试比较理想。
3. 5详细答案:3种方法的主要描述统计量如下:(1) 从集中度、离散度和分布的形状三个角度的统计量来评价。
社会统计学第三版第10章课后答案
社会统计学第三版第10章课后答案1.指标是说明总体特征的,标志是说明总体单位特征的,所以()。
(分值: [单选题] *A.标志和指标之间的关系是固定不变的B.标志和指标之间的关系是可以变化的(正确答案)C.标志和指标都是可以用数值表示的D.只有指标才可以用数值表示2.统计最基本的职能是()。
(分值: [单选题] *A.信息职能(正确答案)B.咨询职能C.反映职能D.监督职能3.“统计”一词的三种涵义是()。
(分值: [单选题] *A.统计活动.统计资料和统计学(正确答案)B.统计调查.统计整理和统计分析C.统计设计.统计分析和统计预测D.统计方法.统计分析和统计预测4.统计活动过程一般由四个环节构成,即()。
(分值: [单选题] *A.统计调查.统计整理.统计分析和统计决策B.统计调查.统计整理.统汁分析和统计预测C.统计设计.统计调查.统计审核和统计分析D.统计设计.统计调查.统计整理和统计分析(正确答案)5.调查某市职工家庭的生活状况时,统计总体是()。
(分值: [单选题] *A.该市全部职工家庭(正确答案)B.该市每个职工家庭C.该市全部职工D.该市职工家庭户数6.调查某班50名学生的学习情况,则总体单位是()。
(分值: [单选题] *A.该班50名学生B.该班每一名学生(正确答案)C.该班50名学生的学习情况D.该班每一名学生的学习情况7.工业企业的设备台数、产品产值是()。
(分值: [单选题] *A.连续变量B.离散变量C.前者是连续变量D.前者是离散变量(正确答案)8.对某地区工业企业职工情况进行研究,统计总体是()。
(分值: [单选题] *A.每个工业企业B.该地区全部工业企业C.每个工业企业的全部职工D.该地区全部工业企业的全部职工(正确答案)9.在第四次全国人口普查中()(分值: [单选题] *A.男性是品质标志表现(正确答案)B.人的年龄是指标C.人口的平均寿命是数量标志D.某家庭的人口数是统计指标10.以下岗职工为总体,观察下岗职工的性别构成,此时的标志是()。
医学统计学八年制第三版课后答案
医学统计学八年制第三版课后答案一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
统计学教材课后答案 第三版 袁卫 庞皓 曾五一 贾俊平主编
第四章、参数估计1.简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。
设总体参数θ的估计量有1ˆθ和2ˆθ,如果()1ˆE θθ=,称1ˆθ是无偏估计量;如果1ˆθ和2ˆθ是无偏估计量,且()1ˆD θ小于()2ˆD θ,则1ˆθ比2ˆθ更有效;如果当样本容量n →∞,1ˆθθ→,则1ˆθ是相合估计量。
2.说明区间估计的基本原理答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。
置信水平反映估计的可信度,而区间的长度反映估计的精确度。
3.解释置信水平为95%的置信区间的含义答:总体参数是固定的,未知的,置信区间是一个随机区间。
置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。
4.简述样本容量与置信水平、总体方差、允许误差的关系答:以估计总体均值时样本容量的确定公式为例:()22/22z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。
练习题:●1.解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25,(1)样本均值的抽样标准差σ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2Z 6×0.7906=1.5496。
●2.解:(1)已假定总体标准差为σ=15元,则样本均值的抽样标准误差为x σ15=2.1429(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E=α/2Z 6×2.1429=4.2000。
(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96,这时总体均值的置信区间为±α/2x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
统计学(第三版课后习题答案
(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为:
于是
3.3设A表示“合格”,B表示“优秀”。由于B=AB,于是
=0.8×0.15=0.12
3.4设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。
=0.8×1+0.2×0.5=0.9
脱靶的概率=1-0.9=0.1
或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1
3.11(1) =0.04779
合格率为1-0.04779=0.95221或95.221%。
(2)设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
即: ,K/30≥1.64485,故K≥49.3456。
3.12设X=同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
5.9(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。
5.10(1) , ;(2)1.75±4.27。
5.11(1)10%±6.98%;(2)10%±8.32%。
5.12(4.06,14.35)。
5.1348。
5.14139。
5.1557。
5.3(2.88,3.76);(2.80,3.84);(2.63,4.01)。
5.4(7.1,12.9)。
5.5(7.18,11.57)。
医学统计学第三版习题答案
医学统计学第三版习题答案医学统计学第三版习题答案医学统计学是医学领域中的一门重要学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
而习题是学习医学统计学的重要方式之一,通过解答习题可以帮助我们巩固所学知识,提高分析和解决实际问题的能力。
下面将给出医学统计学第三版习题的答案,希望对大家的学习有所帮助。
第一章:医学统计学概述1. 医学统计学是什么?医学统计学是应用统计学原理和方法研究医学问题的学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
2. 医学统计学的应用领域有哪些?医学统计学的应用领域包括流行病学、临床试验、医学决策分析、质量控制等。
3. 为什么医学统计学对医学研究和临床实践至关重要?医学统计学通过数据的收集和分析,可以帮助医学研究者和临床医生进行科学的研究和决策。
它可以帮助我们了解疾病的发病率和死亡率,评估治疗方法的效果,预测疾病的发展趋势等。
第二章:数据的收集和整理1. 什么是数据?数据是用于描述和表示事物特征、属性或变化的信息。
在医学统计学中,数据可以是疾病患者的年龄、性别、病情等信息。
2. 数据的收集方法有哪些?数据的收集方法包括问卷调查、观察记录、实验、抽样调查等。
3. 数据的整理方法有哪些?数据的整理方法包括数据的录入、清理、编码和校验等。
第三章:描述性统计学1. 描述性统计学的主要内容是什么?描述性统计学主要研究如何对数据进行整理、总结和描述,以便更好地理解和分析数据的特征和规律。
2. 描述性统计学的常用指标有哪些?描述性统计学的常用指标包括频数、频率、平均数、中位数、众数、标准差等。
3. 描述性统计学在医学研究中的应用有哪些?描述性统计学可以帮助医学研究者对疾病的发病率、死亡率、治疗效果等进行描述和分析,为医学研究和临床实践提供科学依据。
第四章:概率与概率分布1. 什么是概率?概率是描述事件发生可能性的数值,它介于0和1之间。
2. 什么是概率分布?概率分布是描述随机变量取值可能性的分布情况,常见的概率分布有正态分布、泊松分布、二项分布等。
(完整版)孙振球第三版研究生医学统计学课后习题答案
医学统计学作业答案(二~四章)第二章三、计算分析题 1.(1) 均数=1.156 (2)标准差=0.2044(3))5566.1~7554.0(96.1=±s x(4)0.8mmol/L 以下者占4.09%; 1.5 mmol/L 以下者占95.35%2. 平均抗体滴度:1:36.833. 08.15=x ;M=14;M 代表性好;95%的参考值范围:<(P 95) 36第三章1.(1)女性血红蛋白的变异程度(CV=0.087)> 红细胞的变异程度(CV=0.069) (2)男性血红蛋白的标准误=0.374;红细胞的标准误=0.0306 (3)健康成年女性红细胞均数95%C.I.为4.144~4.216 (4)成年男女血红蛋白含量不同,t=24.03, P =0.0001(5)男性两项指标均低于标准值,红细胞与标准值比较, t=5.89,P =0.0001 血红蛋白与标准值比较,t=15.23, P =0.00012. 该批药有效成分平均含量为95%C.I.=(101.41~104.59)3. t=1.1429, P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。
4. t=3.71, P =0.001,新药和标准药的疗效差别有统计学意义。
5. (1)对数转换;(2)方差齐性检验,F=3.69, P =0.038, 转换后两总体方差仍不齐;(3)用welch 法校正t 检验:t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。
6.(1)两药平均退热天数之差的95% C.I.为:1.0~1.8天(2)t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义 (3)上述两种方法中(1)因95%C.I.不包括H 0(μ1-μ2=0),也可以说明两药退热天数不同(α=0.05);(2)的检验中可以看出两药退热天数不同,并说明其概率非常小。
统计学(第三版)课后答案 袁卫等主编
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
统计学课后习题答案(统计学 第三版
第1章1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C 32 32D 18 18E 15 15 合计100100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel 表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel 练习题2.1)。
企业经营统计学第三版王艳明课后答案
企业经营统计学第三版王艳明课后答案一、判断题1、统计设计作为一个独立阶段,是由社会经济发展和统计研究的进步所决定的。
[单选题] *对(正确答案)错2、按所包括的工作阶段,统计设计可分为整体设计和专项设计两种。
[判断题] *对错(正确答案)3、统计指标按其表现形式不同,可分为数量指标和质量指标两种。
[判断题] *对错(正确答案)4、统计指标按其说明总体现象的内容不同,可分为考核指标和非考核指标。
[单选题] *对错(正确答案)5、统计指标按其反映事物的性质不同,可分为实体指标和行为指标。
[判断题] *对(正确答案)错6、统计指标按其数据取值依据不同,可分为客观指标和主观指标。
[判断题] *对(正确答案)错7、从形式上看,统计表主要由总标题、横行标题、纵栏标题和指标数值四部分构成。
[单选题] *对(正确答案)错8、统计表设计的一般原则和要求是科学、实用、简明、美观。
[判断题] *对(正确答案)错9、调查单位与报告单位是一致的 [判断题] *对错(正确答案)10、调查时间专指调查工作进行的时间。
[判断题] *对错(正确答案)二、单选题1、统计指标的特点是() [单选题] *A数量性、综合性、具体性(正确答案)B准确性、及时性、全面性C大量性、同质性、差异性D科学性、客观性、社会性2.统计指标体系是()。
[单选题] *A若干个独立的统计指标组成的相互依存的整体B若干个相互联系、相互制约的统计指标组成的整体中查面(正确答案) C一系列相互依存的统计指标组成的整体D一系列互为因果关系的统计指标组成的整体3.总量指标一般表现为()。
[单选题] *A平均数B相对数C绝对数(正确答案)D指数4. 统计设计按所包括的研究对象的范围,可分为()。
[单选题] *A多项设计和单项设计B多项设计和专项设计C整体设计和单项设计D整体设计和专项设计(正确答案)5. 按统计指标在管理工作中的作用不同,可分为()。
统计学课后答案(第3版)第9章相关与回归分析习题答案
第九章 相关与回归分析习题答案一、单选1.C ;2.B ;3.C ;4.D ;5.A ;6.C ;7.B ;8.C ;9.A ;10.C 二、多选1.ACD ;2.AE ;3.AD ;4.ABCD ;5.ACD ;6.AB ;7.ABDE ;8.ACE ;9.AD ;10.ABE 三、计算分析题 1、解:(1)(2)建立线性回归方程xy ∧∧∧+=10ββ,根据最小二乘法得:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ)(由此可得∧1β=0.732,∧0β=-2.01,则回归方程是∧y =-2.01+0.732x(3)当受教育年数为15年时,其年薪的点估计值为:∧y =-2.01+0.732×15=8.97(万元)估计标准误差: 733.0538.0222===-=--=∑∧M S E n S S En y y S i iy )(置信区间为:∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=8.97±2.228×0.733×9167.120917.6151212)(-+=8.97±1.290预测区间为:∑=∧--++±ni i yx x x x nS t y 1202/)()(112α=8.97±2.228×0.733×9167.120917.61512112)(-++ =8.97±2.081 2、解:(1)建立线性回归方程xy ∧∧∧+=10ββ,根据最小二乘法得:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ)(由此可得0093.00=∧β,316.01=∧β,则回归方程是x y 316.00093.0+=∧(3)当GDP 达到16时,其货币供应量的点估计值为:∧y =0.0093+0.316×16=5.065亿元估计标准误差:Sy=22--∑∧n y y i i)(=2-n SSE=MSE =09294.0=0.305置信区间为:∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=5.065±2.228×0.305×21863.135711.11161212)(-+ 3、(1)利用EXCEL 的CORREL 函数计算相关系数r=0.9937.相关系数接近于1,表明农业总产值与农村购买力之间有较强的正线性相关关系。
高等教育出版社《统计学》第三版答案
第1章绪论1什么是统计学怎样理解统计学与统计数据的关系2试举出日常生活或工作中统计数据及其规律性的例子。
3一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此他们开始检查供货商的集装箱有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求1描述总体2描述研究变量3描述样本4描述推断。
答1总体最近的一个集装箱内的全部油漆2研究变量装满的油漆罐的质量3样本最近的一个集装箱内的50罐油漆4推断50罐油漆的质量应为4.536×50226.8 kg。
4“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分选择了1000名消费者进行匿名性质的品尝试验即在品尝试验中两个品牌不做外观标记请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求1描述总体2描述研究变量3描述样本4一描述推断。
答1总体市场上的“可口可乐”与“百事可乐” 2研究变量更好口味的品牌名称3样本1000名消费者品尝的两个品牌4推断两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1. 解1由于表2.21中的数据为服务质量的等级可以进行优劣等级比较但不能计算差异大小属于顺序数据。
2频数分布表如下服务质量等级评价的频数分布服务质量等级家庭数频数频率 A 14 14 B 21 21 C 32 32 D 18 18 E 15 15 合计100 100 3条形图的制作将上表包含总标题去掉合计栏复制到Excel表中点击图表向导→条形图→选择子图表类型→完成见Excel练习题2.1。
即得到如下的条形图02040ABCDE服务质量等级评价的频数分布频率服务质量等级评价的频数分布家庭数频数●2. 解1要求对销售收入的数据进行分组全部数据中最大的为152最小的为87知数据全距为1528765 为便于计算和分析确定将数据分为6组各组组距为10组限以整10划分为使数据的分布满足穷尽和互斥的要求注意到按上面的分组方式最小值87可能落在最小组之下最大值152可能落在最大组之上将最小组和最大组设计成开口形式按照“上限不在组内”的原则用划记法统计各组内数据的个数——企业数也可以用Excel 进行排序统计见Excel练习题2.2将结果填入表内得到频数分布表如下表中的左两列将各组企业数除以企业总数40得到各组频率填入表中第三列在向上的数轴中标出频数的分布由下至上逐组计算企业数的向上累积及频率的向上累积由上至下逐组计算企业数的向下累积及频率的向下累积。
统计学第三版课后答案
统计学第三版答案第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
统计学第三版答案
第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
区分指标与标志,总量指标分类、分配数列、上限不在内原则、各种平均数之间的关系、平均发展指标!计算可能考的公式有:计划完成情况相对指标、结构(比例/比较/强度/动态)相对指标、各种平均数算法、众数、中位数、四分位数、平均差、标准差、标准差系数、偏态和峰度、发展速度和增长速度、总指数(很重要)、平均指标指数、重要经济指数的编制(上证指数、工业产品产量总指数、农副产品收购价格指数)各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100~110 110~120 120~130 130~140 140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40 100.0 ————(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
(3)茎叶图如下:65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 72.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1)茎叶图如下:A班树茎B班数据个数树叶树叶数据个数0 3 59 21 4 4 0448 42 975 122456677789 12 11 976653321106 011234688 9 23 988777665555544433321007 00113449 8 7 6655200 8 123345 6 6 6322209 011456 6 0 10 000 3(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.8 箱线图如下:(特征请读者自己分析)Min-Max25%-75%Median value各城市相对湿度箱线图35455565758595北京长春南京郑州武汉广州成都昆明兰州西安2.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
2.11 x =426.67(万元);48.116=s (万元)。
2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%;(4)95%。
2.14 (1)离散系数,因为它消除了不同组数据水平高地的影响。
(2)成年组身高的离散系数:024.01.1722.4==s v ; 幼儿组身高的离散系数:032.03.713.2==s v ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
2.15 下表给出了一些主要描述统计量,请读者自己分析。
方法A 方法B 方法C 平均 165.6 平均 128.73 平均 125.53 中位数 165 中位数 129 中位数 126 众数 164 众数 128 众数 126 标准偏差 2.13 标准偏差 1.75 标准偏差 2.77 极差 8 极差 7 极差 12 最小值 162 最小值 125 最小值 116 最大值170最大值132最大值1282.16 (1)方差或标准差;(2)商业类股票;(3)(略)。
2.17 (略)。
第3章 概率与概率分布3.1设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/23.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A )的概率()P A 。
考虑逆事件A =“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:()(10.2)(10.1)(10.1)0.648P A =---=于是 ()1()10.6480.352P A P A =-=-=3.3设A 表示“合格”,B 表示“优秀”。
由于B =AB ,于是)|()()(A B P A P B P ==0.8×0.15=0.123.4 设A =第1发命中。
B =命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件的概率即可求得脱靶的概率。
)|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 3.5 设A =活到55岁,B =活到70岁。
所求概率为:()()0.63(|)0.75()()0.84P AB P B P B A P A P A ==== 3.6这是一个计算后验概率的问题。
设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。
P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:6115.050612.030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P +决策者会倾向于采用新的生产管理流程。
3.7 令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。
由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:(1))|()()|()()|()()(332211A B P A P A B P A P A B P A P B P ++= =0.25×0.04+0.30×0.05+0.45×0.03=0.0385 (2)3506.00385.00135.00.030.450.050.300.040.2503.045.0)|(3==++=⨯⨯⨯⨯B A P3.8据题意,在每个路口遇到红灯的概率是p =24/(24+36)=0.4。
设途中遇到红灯的次数=X ,因此,X ~B(3,0.4)。
其概率分布如下表:x i 0 1 2 3 P (X = x i )0.216 0.432 0.288 0.064期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次)3.9 设被保险人死亡数=X ,X ~B (20000,0.0005)。
(1)收入=20000×50(元)=100万元。
要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。
所求概率为:P(X ≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。
所求概率为: P(X >20)=1-P(X ≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E (X ) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X )=50000×(20000×0.0005×0.9995)1/2=158074(元)3.10 (1)可以。
当n 很大而p 很小时,二项分布可以利用泊松分布来近似计算。
本例中,λ= np =20000×0.0005=10,即有X ~P (10)。
计算结果与二项分布所得结果几乎完全一致。
(2)也可以。
尽管p 很小,但由于n 非常大,np 和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X ~N (10,9.995)。
相应的概率为: P (X ≤10.5)=0.51995,P(X ≤20.5)=0.853262。