统计学课后答案
统计学课后答案
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics汽车销售数量N Valid10Missing0 MeanMedianMode10 Std. DeviationPercentiles2550754.2 随机抽取25个网络用户,得到他们的年龄数据如下:19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+×2=。
(3)计算平均数和标准差; Mean=;Std. Deviation= (4)计算偏态系数和峰态系数: Skewness=;Kurtosis=(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K=+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=,取53、分组频数表网络用户的年龄 (Binned)分组后的均值与方差:分组后的直方图:要求:(1)计算120家企业利润额的平均数和标准差。
统计学课后题答案_吴风庆_王艳明
《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。
统计学课后习题答案
统计学课后习题答案附录三:部分习题参考解答老师说这份答案有些错误,慎重参考哈~~第一章(15-16)一、判断题2.答:对。
3.答:错。
实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。
4.答:对。
5.答:错。
描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。
6.答:错。
有限总体全部统计成本太高,经常采用抽样调查,因此也必须使用推断技术。
7.答:错。
不少社会经济的统计问题属于无限总体。
例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。
8.答:对。
二、单项选择题1.A;2.A;3.A;4.B。
三、分析问答题1.答:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。
;定序尺度的数学特征是“”或“”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。
3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。
第二章(45-46)一、单项选择题1.C;2.A;3.A。
二、多项选择题1.A.B.C.D;2.A.B.D;3.A.B.C.三、简答题1.答:这种说法不对。
从理论上分析,统计上的误差可分为登记性误差、代表性误差2.答:统计报表的日常维持需要大量的人力、物力、财力;而且统计报表的统计指标、指标体系不容易调整,对现代社会经济调查来说很不合适。
统计学课后习题答案(全)
<<统计学 >> 课后习题参考答案第四章1. 计划完成相对指标二一8% 100% =102.9%1+5%2. 计划完成相对指标二1一6% 100% =97.9%1—4%3.4.5.解:⑴计划完成相对指标=14防13 100%"5.56%(2)从第四年二季度开始连续四季的产量之和为:10+11 + 12+14=47该产品到第五年第一季 已提前完成任务,提前 完成的天数90•该产品总共提前10个月零15天完成任务。
6.解:计划完成相对指标10 11 12 14-45V 天 14 一10156 230 540 279 325 470 535200 1040.1% 100% =126.75%(2) 156+230+540+279+325+470=2000 (万吨)所以正好提前半年完成计划7.第五章平均指标与标志变异指标1 . X 甲= :.26 27 28 29 30 31 32 3334=309—20 25 28 30 32 34 36 38 40 '1.44X乙二9AD甲二26-30卩27 -30 28-30 29 -30 30-30 |31 -30 32 - 30 亠|33 - 30 叫34 - 309-2.22AD乙二20—31.44” 25—31.44 十2〔8—31.44 屮30—31.44 +|32|— 31.44 + 34卜31.44 + 網 + 31.44 + 38—|31.44 + 4Q — 9= 5.06R 甲=34-26=8R 乙=40-20=20(26一30)2 (27 一30)2 (28一30)2 (29一30)2 (30 一 30)2 ⑶ 一 30)2 (32 一 30)2 (33一 30)2 (34一33)2--------------------------------------------------------------------- 9=2.58(T 乙一(20 -31.44)2 - (25 -31.44)2 (28 —31.44)2 (30 -31.44)2 (32 -31.44)2 (34-31.44)2 (36 -31.44)2 • (38-31.44)2 • (40_31.44)2----------------------------------------------------------------------------------------- 9=6.06 2 58 V 甲二 100%=8.6% 30V 乙二100% =19.3%31.44 所以甲组的平均产量代表性大一些2. 解:计算过程如下表:3. 解:计算过程如下表:X 甲80 77600X 乙=80= 970(元)X 甲=9550 119.480 (件)X 乙二 9660120.8=80(件)V 甲二旦06100%=7.58%119.4V 乙二!08! 100% =8.94%120.8所以甲厂工人的平均产量的代表性要高些4. 解:55 3 65 7 75 18 85 12 95 5=11 =7010=76.4718-7 18-1245 “10=70 上 10 = 76.94185.解:(1)上期的平均计划完成程度为100% =99.67%CT 甲=6568.7580二 9.06 (件)9355'80-10.81(件)3 7 18 12 5 18 -780 110% 700 108% 1000 100% 1500 95%80 700 1000 1500(2)下期的平均计划完成程度为:96 810 1200 1400------------------------------------------ =103.37%96 810 1200 1400110% 107% 101% 103%6解:P =300 _28100% =90.67%300X P二P = 90.67%二P「90.67% 1 -90.67% =0.2910.291V P100% =32.1%0.9067432.604 321.255 506.943 1042884.3兀/t 432.604 321.255 506.943、 4----------- +------------- +------------ ix 102800 2900 2950 丿苗吾第八章1.= 8722.a =600 670 2 .670 840 2 . 840 1020 1 . 1020 900 2 • 900 980 3 980 4030 ?2 2 2 2 2 23.解:全年月平均计划完成程 度为: 303 306 324 310 350 368 410 412 485 463 350 385 303 306 ------ + -------- 101% 102% 435 如00% = 105.85%324 310 350 368 410 412 485 463 350 385 + ------- + -------- + -------- + ------- + -------- + -------- + ------- + ------- + --------- + --------- 110% 105% 106% 98% 112% 105% 120% 97% 102% 113%576 4500 462亠 100% =79.63% 580 620 580 600 - 2 25.解:⑴甲工区上半年建筑安装 工人的月平均工资为:680 620 620 680 680 720 720 690 690 700 700 710 /汇600+ 汇620+ 江640+ 汇645 + ^625+ 汉610 2 2 2 680 620 680 720 690 7002 22乙工区上半年建筑安装工人的月平均工资为:650 670 670 680 “c 680 730 730 655 655 710 一 710 690640 600 620 655 615600 =623.7(元)2 650 + 670 + 680+730 + 655 + 710 +2 2 二 621.6(元)6■解:平均增长速度=4黔1皿7% 2000年该县粮食产量为:500 1 4.67% 10 = 788.7(万吨) 7解:计算过程如下表a y=竺=45.44 n 9则直线趋势方程为:y = a bt1994年的地方财政支出额为:45.44, 4.3 5 =66.94(万元)二次曲线方程为:y = 0.0108x2 + 4.1918x + 24.143过程略)指数曲线方程为:y = 26.996e0.0978x8.解:计算过程如下表原数列趋势图日期9•解:(1)同季平均法求季节比率的过程如下表第一季第二季第三季度第四季合计1987 13 18 311988 5 8 14 18 451989 6 10 16 22 541990 8 12 19 25 641991 15 17 32平均8.5 11.75 15.5 20.75 14.125 季节比率60.2% 83.2% 109.7% 146.9% 100.0%⑵趋势剔除法测定的季节变动如下表第一季第二季第三季度第四季合计19871988 44.94 71.11 123.08 153.191989 48.98 76.92 116.36 154.391990 53.78 76.8 112.59 136.051991平均49.23 74.94 117.34 147.88 389.40校正系数 1.0272214 1.027221366 1.027221366 1.02722137季节比率50.57 76.98 120.54 151.90 400.00第七章统计指数' q i Z。
统计学课后简答题答案
第一章思考题什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论.解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法.推断统计;它是研究如何利用样本数据来推断总体特征的统计方法.统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据.它也是有类别的,但这些类别是有序的.(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值.统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的.实验数据:在实验中控制实验对象而收集到的数据.统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据.时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据.第二章思考题什么是二手资料使用二手资料应注意什么问题与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”.使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源.比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本.每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率.技术含量和成本都比较高.如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样.非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高.它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备.它同样使用市场调查中的概念测试(不需要调查结果投影到总体的情况).除了自填式,面访式和式还有什么搜集数据的办法试验式和观察式等第三章思考题数据预处理内容数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序.分类数据和顺序数据的整理和图示方法各有哪些分类数据:制作频数分布表,用比例,百分比,比率等进行描述性分析.可用条形图,帕累托图和饼图进行图示分析.顺序数据:制作频数分布表,用比例,百分比,比率.累计频数和累计频率等进行描述性分析.可用条形图,帕累托图和饼图,累计频数分布图和环形图进行图示分析.数据型数据的分组方法和步骤分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组.分组步骤:1确定组数2确定各组组距3根据分组整理成频数分布表第4章数据的概括性度量一组数据的分布特征可以从哪几个方面进行测度数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态.怎样理解平均数在统计学中的地位平均数在统计学中具有重要的地位,是集中趋势的最主要的测度,主要适用于数值型数据,而不适用于分类数据和顺序数据.简述四分位数的计算方法.四分位数是一组数据排序后处于25%和75%位置上的值.根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数.第七章思考题估计量:用于估计总体参数的随机变量估计值:估计参数时计算出来的统计量的具体值评价估计量的标准:无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数置信区间:由样本统计量所构造的总体参数的估计区间第8章思考题假设检验和参数估计有什么相同点和不同点答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同.参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的.而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立.什么是假设检验中的显着性水平统计显着是什么意思答:显着性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险.统计显着等价拒绝H0,指求出的值落在小概率的区间上,一般是落在或比更小的显着水平上.什么是假设检验中的两类错误答:假设检验的结果可能是错误的,所犯的错误有两种类型,一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用β表示,所以也称β错误或取伪错误.第10章思考题什么是方差分析它研究的是什么答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显着影响.它所研究的是非类型自变量对数值型因变量的影响.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法答:作两两比较十分繁琐,进行检验的次数较多,随着增加个体显着性检验的次数,偶然因素导致差别的可能性也会增加.而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设.方差分析包括哪些类型它们有何区别答:方差分析可分为单因素方差分析和双因素方差分析.区别:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,而双因素涉及两个分类型自变量.第13章思考题简述时间序列的构成要素.时间序列的构成要素:趋势,季节性,周期性,随机性利用增长率分析时间序列时应注意哪些问题.(1)当时间序列中的观察值出现0或负数时,不宜计算增长率;(2)不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值可能很小,小的增长率背后其隐含的绝对值可能很大.简述平稳序列和非平稳序列的含义.1.平稳序列(stationary series)基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动或虽有波动,但并不存在某种规律,而其波动可以看成是随机的2.非平稳序列 (non-stationary series)是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合.因此,非平稳序列又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列.第14章思考题解释指数的含义.答:指数最早起源于测量物价的变动.广义上,是指任何两个数值对比形成的相对数;狭义上,是指用于测定多个项目在不同场合下综合变动的一种特殊相对数.实际应用中使用的主要是狭义的指数.加权综合指数和加权平均指数有何区别与联系加权综合指数:通过加权来测定一组项目的综合变动,有加权数量指数和加权质量指数.使用条件:必须掌握全面数据(数量指数,测定一组项目的数量变动,如产品产量指数,商品销售量指数等)(质量指数,测定一组项目的质量变动,如价格指数、产品成本指数等)拉式公式:将权数的各变量值固定在基期.帕式公式:把作为权数的变量值固定在报告期.加权平均指数:以某一时期的总量为权数对个体指数加权平均.使用条件:可以是全面数据、不完全数据.因权数所属时期的不同,有不同的计算形式.有:算术平均形式、调和平均形解释零售价格指数、消费价格指数、生产价格指数、股票价格指数.答:零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数.消费价格指数:反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数.生产价格指数: 测量在初级市场上出售的货物(即在非零售市场上首次购买某种商品时) 的价格变动的一种价格指数.股票价格指数:反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数.其单位一般用“点”(point)表示,即将基期指数作为100,每上升或下降一个单位称为“1点”.。
刘照德朱芳芳统计学课后答案
刘照德朱芳芳统计学课后答案1、-2/5角α终边上一点P(-3,-4),则cosα=()[单选题] *-3/5(正确答案)2月3日-0.333333333-2/5角α终边上一点P(-3,-4),则tanα=()[单选题] *2、函数y=ax2+bx+c(a、b、c是常数,a≠0)是()。
[单选题] *正比例函数一次函数反比例函数二次函数3、1. 在实数0、-√3?、√2?、-2中,最小的是()[单选题] *A、-2(正确答案)B、-√3C、0D、√24、已知点A(4,6),B(-4,0),C、(-1,-4),那么()[单选题] *A、AB⊥ACB、AB⊥ACCAB⊥BC(正确答案)D、没有垂直关系5、若m·23=2?,则m等于[单选题] *A. 2B. 4C. 6D. 8(正确答案)6、下列语句中,描述集合的是()[单选题] *A、比1大很多的实数全体B、比2大很多的实数全体C、不超过5的整数全体(正确答案)D、数轴上位于原点附近的点的全体7、下列各角中,是界限角的是()[单选题] *A. 1200°B. -1140°C. -1350°(正确答案)D. 1850°8、28.下列计算结果正确的是()[单选题] *A.(a3)4=a12(正确答案)B.a3?a3=a9C.(﹣2a)2=﹣4a2D.(ab)2=ab29、17.已知的x∈R那么x2(x平方)>1是x>1的()[单选题] * A.充分不必要条件B.必要不充分条件(正确答案)C.充分必要条件D.既不充分也不必要条件10、4.﹣3的相反数是()[单选题] *A.BC -3D 3(正确答案)11、14.命题“?x∈R,?n∈N*,使得n≥x2(x平方)”的否定形式是()[单选题] * A.?x∈R,?n∈N*,使得n<x2B.?x∈R,?x∈N*,使得n<x2C.?x∈R,?n∈N*,使得n<x2D.?x∈R,?n∈N*,使得n<x2(正确答案)12、若39?27?=321,则m的值是()[单选题] *A. 3B. 4(正确答案)C. 5D. 613、49.若(x+2)(x﹣3)=7,(x+2)2+(x﹣3)2的值为()[单选题] *A.11B.15C.39(正确答案)D.5314、下列各式中能用平方差公式的是()[单选题] *A. (x+y)(y+x)B. (x+y)(y-x)(正确答案)C. (x+y)(-y-x)D. (-x+y)(y-x)15、两个有理数相加,如果和小于每一个加数,那么[单选题] *A.这两个加数同为负数(正确答案)B.这两个加数同为正数C.这两个加数中有一个负数,一个正数D.这两个加数中有一个为零16、30.圆的方程+=4,则圆心到直线x-y-4=0的距离是()[单选题] *A.√2(正确答案)B.√2/2C.2√2D.217、48.如图,M是AG的中点,B是AG上一点.分别以AB、BG为边,作正方形ABCD和正方形BGFE,连接MD和MF.设AB=a,BG=b,且a+b=10,ab=8,则图中阴影部分的面积为()[单选题] *A.46B.59(正确答案)C.64D.8118、若3x+4y-5=0,则8?·16?的值是( ) [单选题] *A. 64B. 8C. 16D. 32(正确答案)19、下列计算正确是()[单选题] *A. 3x﹣2x=1B. 3x+2x=5x2C. 3x?2x=6xD. 3x﹣2x=x(正确答案)20、23.若A、B是火车行驶的两个站点,两站之间有5个车站,在这段线路上往返行车,需印制()种车票.[单选题] *A.49B.42(正确答案)C.21D.2021、已知x-y=3,x2-y2=12,那么x+y的值是( ??) [单选题] *A. 3B. 4(正确答案)C. 6D. 1222、下列说法有几种是正确的()(1)空间三点确定一个平面(2)一条直线和直线外一点确定一个平面(3)两条直线确定一个平面(4)两条平行直线确定一个平面[单选题] *A、1B、2(正确答案)C、3D、423、35、下列判断错误的是()[单选题] *A在第三象限,那么点A关于原点O对称的点在第一象限.B在第二象限,那么它关于直线y=0对称的点在第一象限.(正确答案)C在第四象限,那么它关于x轴对称的点在第一象限.D在第一象限,那么它关于直线x=0的对称点在第二象限.24、14、在等腰中,如果的长是的2倍,且三角形周长为40,那么的长是()[单选题] *A.10B.16 (正确答案)C.10D.16或2025、6.下列说法正确的是().[单选题] *A.不属于任何象限的点不在坐标轴上就在原点B.横坐标为负数的点在第二、三象限C.横坐标和纵坐标互换后就表示另一个点D.纵坐标为负数的点一定在x轴下方(正确答案)26、15.一次社会调查中,某小组了解到某种品牌的薯片包装上注明净含量为,则下列同类产品中净含量不符合标准的是()[单选题] *A 56gB .60gC.64gD.68g(正确答案)27、10. 如图所示,小明周末到外婆家,走到十字路口处,记不清哪条路通往外婆家,那么他一次选对路的概率是(? ? ?).[单选题] *A.1/2B.1/3(正确答案)C.1/4D.128、计算(-a)?·a的结果是( ) [单选题] *A. -a?B. a?(正确答案)C. -a?D. a?29、4、已知直角三角形的直角边边长分别是方程x2-14x+48=0的两个根,则此三角形的第三边是()[单选题] *A、6B、10(正确答案)C、8D、230、下列各对象可以组成集合的是()[单选题] *A、与1非常接近的全体实数B、与2非常接近的全体实数(正确答案)C、高一年级视力比较好的同学D、与无理数相差很小的全体实数。
《统计学》课后练习题答案
A.透视表B.合并计算C.单变量求解D.分类汇总
5.小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?()(知识点3.5答案:D)
A.直方图B.散点图C.饼图D.折线图
37
பைடு நூலகம்33.6
130-140
12
10.9
103
93.6
19
17.3
140-150
5
4.5
108
98.2
7
6.4
150-160
2
1.8
110
100.0
2
1.8
合计
110
100
—
—
—
—
A.树苗高度低于110厘米的占总数的39.1%B.树苗高度低于110厘米的占总数的84.5%
C.树苗高度高于130厘米的有19棵D.树苗高度高于130厘米的有103棵
第二章数据的收集与整理
2.1数据的来源
2.2统计调查方案设计
2.3调查方法
2.4调查的组织方式:普查、抽样调查、重点调查、典型调查
2.5抽样的组织方式:简单随机抽样、系统抽样、分层抽样、整群抽样
2.6数据的审定:误差
2.7数据的分组
2.8.编制次数分布表:频数(次数)、频率
习题
一、单项选择题
1.小吴为写毕业论文去收集数据资料,()是次级数据。(知识点:2.1答案:C)
A.指标B.标志C.变量D.标志值
8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
统计学课后习题答案
1.指出下面的变量哪一个属于分类变量()。
A.年龄B.工资C.汽车产量D.购买商品时的支付方式(现金、信用卡、支票)2.指出下面的变量哪一个属于顺序变量()。
A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)3.指出下面的变量哪一个属于数值型变量()。
A.年龄B.性别C.企业类型D.员工对企业某项改革措施的态度(赞成、中立、反对)4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的参数是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入7.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的统计量是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入8.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。
这里的总体是()。
A.IT业的全部从业者B.500个IT从业者C.IT从业者的总收入D.IT从业者的消费支付方式9.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。
这里的“月收入”是()。
统计学课后习题参考答案
第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志与指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题(教材第四章P108课后习题答案)1.某村对该村居民月家庭收入进行调查,获取的资料如下:按月收入分组(元)村民户数(户)500~600 600~700 700~800 800~900 900以上20 30 35 25 10合计120 要求:试用次数权数计算该村居民平均月收入水平。
统计学课后习题答案
第四章 统计描述【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。
试分别计算产量、成本、劳动生产率的计划完成程度。
【解】产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成12.5%。
成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成3.16%。
劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成1.85%。
【4.2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。
【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成26.75%。
(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。
【4.3】我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 【解】(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长25.37%。
统计学课后答案
第一章绪论1.社会经济统计学的研究对象是:(A)A社会经济现象的数量方面B.统计工作C.社会经济内在规律D.统计方法2.考察全国的工业企业的情况时,以下标志中属于不变标志的有(A)A.产业的分类B.职工人数C.劳动生产效率D.所有制3.要考察全国居民的人均住房面积,其统计总体是(A)A.全国所有居民户B.全国的住宅C.各省市自治区D.某一居民户4.最早使用"统计学"这一术语的是(B)A.政治算术学派B.国势学派C.社会统计学D.数理统计学派第二章统计数据的收集,整理和显示1.统计的调查对象是(C)A.总体各单位标志值B.总体单位C.现象总体D.统计指标2.我国统计调查体系中,作为主体的是(A)A.经常性抽查调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查3.要对某企业生产设备的实际生产能力进行调查,则企业的“生产设备”是(A)A.调查对象B.调查单位C.调查项目D.报告单位4.下面那些现象事宜采用非全面调查?(ABCD)A.企业经营管理中出现的新情况B.某型号日光灯耐用时数检查C.某地区居民储蓄存款D.某地区森林的木材积蓄量5.抽查调查(abd)A.是一种非全面调查B.是一种非连续性的调查C.可以消除抽样误差D.应遵循随机原则6.洛伦茨曲线(BC)A.是一种向下累计曲线B.可用于反映财富的分布曲线C.用以衡量收入分配公平与否D.越接近对角线基尼系数越大第三章数据分布特征的描述1.由变量数列计算加权算术平均数时,直接体现权数的实质的是(D)A.总体单位数的多少B.各组单位数的多少C.各组变量值的大小D.各组频率的大小2.若你正在筹划一次聚会,想知道该准备多少瓶饮料,你最希望得到所以客人需要饮料数量(a)A.均值B.中位数C.众数D.四分位数3.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350 元,标准差分别为230元和680元,则职工平均收入的代表性(B)A.甲类较大B.乙类较大C.两类相同D.在两类之间缺乏可比性4.假如学生测验成绩记录为优。
统计学课后习题参考答案
思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3. 目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
统计学课后答案
第一章:数据与统计学思考与练习:思考题:1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.试举出日常生活或工作中统计数据及其规律性的例子。
3.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
4.获取直接统计数据的渠道主要有哪些?5.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
统计学课后答案
第一章总论2. 统计有几种涵义?各种涵义的关系如何?统计的三种涵义是指统计工作、统计资料及统计学。
统计工作是统计的实践活动,统计资料是统计工作的成果,统计学是统计实践活动的科学总结,反过来又指导统计实践。
8. 什么是统计总体、总体单位?总体和单位的关系如何?统计总体是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体。
构成统计总体的每个基本单位或元素称为总体单位。
总体和单位的关系:(1)总体是由单位构成的;(2)总体和总体单位不是固定不变的,而是随着统计任务的不同,可以变换位置;(3)统计总体与总体单位是互为存在条件地联结在一起的,没有总体单位,总体也就不存在了。
10. 什么是标志?标志有几种?分别举例说明。
标志是说明总体单位特征的名称。
标志有品质标志与数量标志之分。
品质标志表示事物的质的特征,是不能用数值表示的,如人的性别、工人的工种等。
数量标志表示事物的量的特征,是可以用数值表示的,如人的年龄、企业的产值等。
第二章统计调查1. 调查对象、调查单位以及填报单位的关系是什么?试举例说明。
调查对象是需要调查的那些社会经济现象的总体。
调查单位是调查对象中所要调查的具体单位,是调查项目的直接承担者,它可能是全部总体单位,也可能是其中的一部分。
填报单位是负责向上报告调查内容的单位,又称报告单位。
调查对象和调查单位在同一次调查中是包含和被包含的关系。
确定调查对象是要划清所要研究的总体界限,确定调查单位是要明确调查标志有谁来承担。
填报单位和调查单位有联系也有区别,二者有时一致,有时不一致。
如工业企业设备普查,调查对象是工业企业设备,调查单位是每台设备,填报单位是每个工业企业。
2. 什么是统计调查?它有哪些分类?统计调查是按照预定的统计任务,运用科学的调查方法,有计划有组织地向客观实际搜集统计资料的过程。
按调查对象包括范围的不同,可以分为全面调查和非全面调查;按调查登记时间的连续性,分为经常性调查和一次性调查;按调查组织方式分为统计报表制度和专门调查;按搜集资料的方法可分为直接观察法、报告法、采访法。
统计学课后答案
第四章 抽样分布与参数估计3.某地区粮食播种面积5000亩,按不重复抽样方法随机抽取了100亩进行实测,调查结果,平均亩产450公斤,亩产量标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量和总产量的置信区间。
解:已知X =450公斤,n =100(大样本),n/N=1/50,11≈-Nn,不考虑抽样方式的影响,用重复抽样计算。
s =52公斤,1-α=95%,α=5%。
这时查标准正态分布表,可得临界值:96.1025.02/==z z α该地区粮食平均亩产量的置信区间是:1005296.14502⨯±=±nsz x α=[439.808,460.192] (公斤) 总产量的置信区间是:[439.808⨯5000,460.192⨯5000] (公斤) =[2199040,2300960](公斤)4.已知某种电子管使用寿命服从正态分布。
从一批电子管中随机抽取16只,检测结果,样本平均寿命为1490小时,标准差为24.77小时。
试以95%的置信度估计这批电子管的平均寿命的置信区间。
解:(1)已知X =1490小时,n =16,s =24.77小时,1-α=95%,α=5%。
这时查t 分布表,可得 2.13145)1(2/=-n t α该批电子管的平均寿命的置信区间是:1677.2413145.214902⨯±=±nst x α=[ 1476.801,1503.199](小时)因此,这批电子管的平均寿命的置信区间在1476.801小时与1503.199小时之间。
6.采用简单随机重复抽样的方法,从2 000件产品中抽查200件,其中合格品190件。
要求:(1)计算合格品率及其抽样平均误差。
(2)以95.45%的置信度,对合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其置信度是多少? 解:(1)合格品率:P=190/200⨯100%=95% 抽样平均误差:np p p )1()(-=σ=0.015(2)%3%95%100015.02%95)(22/02275.02/±=⨯⨯±=±==p Z P Z Z σαα]19601840[]2000%982000%92[(%]98%92[,,的置信区为:件合格品数量,:合格品率的置信区间为=⨯⨯)(3)%64.87)(8764.01,54.1%31.2%100015.0%31.2)(2/2/2/==-==⨯⨯==∆z F Z Z p Z ασααα查表得7.从某企业工人中随机抽选部分进行调查,所得工资分布数列如下:试求:(1)以95.45%的置信度估计该企业工人平均工资的置信区间,以及该企业工人中工资不少于800元的工人所占比重的置信区间;(2)如果要求估计平均工资的允许误差范围不超过30元,估计工资不少于800元的工人所占比重的允许误差范围不超过10%,置信度仍为95.45%,试问至少应抽多少工人? 解(1)通过EXCEL 计算可得: X =816元,n =50人,s =113.77元。
统计学课后习题答案全章节剖析
第二章、练习题及解答2。
为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图.灯泡的使用寿命频数分布表3。
某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1。
已知下表资料:试根据频数和频率资料,分别计算工人平均日产量. 解:计算表根据频数计算工人平均日产量:(件)根据频率计算工人平均日产量:(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
第二章思考题2.1什么是二手资料?使用二手资料应注意什么问题与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。
使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。
2.3除了自填式,面访式和电话式还有什么搜集数据的办法试验式和观察式等2.4自填式,面访式和电话式各自的长处和弱点自填式;优点:1调查组织者管理容易2成本低,可进行大规模调查3对被调查者,可选择方便时间答卷,减少回答敏感问题压力。
缺点:1返回率低2不适合结构复杂的问卷,调查内容有限3调查周期长4在数据搜集过程中遇见问题不能及时调整。
面访式;优点:1回答率高2数据质量高3在调查过程中遇见问题可以及时调整。
缺点:1成本比较高2搜集数据的方式对调查过程的质量控制有一定难度3对于敏感问题,被访者会有压力。
电话式;优点:1速度快2对调查员比较安全3对访问过程的控制比较容易。
缺点:1实施地区有限2调查时间不能过长3使用的问卷要简单4被访者不愿回答时,不易劝服。
2.6如何控制调查中的回答误差对于理解误差,我会去学习一定的心理学知识,对于记忆误差,我会尽量去缩短所涉及的时间范围,对于有意识的误差,我要做好被调查者的心理工作,要遵守职业道德,为被调查者保密,尽量在问卷中不涉及敏感问题。
2.7怎么减少无回答对于随机误差,要提高样本容量,对于系统误差,只有做好准备工作并做好补救措施。
比如说要一百份的问卷回复,就要做好一百二十到一百三十的问卷准备,进行面访式的时候要尽量的劝服不愿意回答的被访者,以小物品的馈赠提高回复率。
第三章思考题3.1数据预处理内容数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。
3.3数据型数据的分组方法和步骤分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。
分组步骤:1确定组数2确定各组组距3根据分组整理成频数分布表3.4直方图和条形图的区别1条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,2直方图各矩形连续排列,条形图分开排列,3条形图主要展示分类数据,直方图主要展示数值型数据。
3.6饼图和环形图的不同饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
3.7茎叶图比直方图的优势,他们各自的应用场合茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。
在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。
第4章数据的概括性度量4.1一组数据的分布特征可以从哪几个方面进行测度?数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
4.2怎样理解平均数在统计学中的地位?平均数在统计学中具有重要的地位,是集中趋势的最主要的测度,主要适用于数值型数据,而不适用于分类数据和顺序数据。
4.3简述四分位数的计算方法。
四分位数是一组数据排序后处于25%和75%位置上的值。
根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。
4.4对于比率数据的平均为什么采用几何平均?在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。
从公式∏+=+=n1iin GG11)()(中也可看出,G就是平均增长率。
4.5简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。
当数据的分布偏斜较大时,使用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4.6简述异众比率、四分位差、方差或标准差的适用场合对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
4.7标准分数有哪些用途?标准分数给出了一组数据中各数值的相对位置。
在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。
它还可以用来判断一组数据是否有离群数据。
4.8为什么要计算离散系数?方差和标准差是反映数据分散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。
因此,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
第六章思考题6.5 自由度:独立变量的个数6.8 中心极限定理:设从均值为μ,方差为σ 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
P308 回归分析主要解决一下几个方面的问题:(1)从一组样本数据出发,确定变量之间的数学关系式。
(2)对一些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的。
(3)利用所求的关系式,根据一个或多个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
P378.1.简述时间序列分析的基本思想。
基本思想:根据系统的有限长度的运行记录(观察数据),发现其中蕴含的规律,建立能够比较精确的反应时间序列中所包含的动态依存关系的数学模型,从而预测出未来的时间序列变量值。
2.什么是指数平滑法?指数平滑法是通过对过去的观测值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。
指数平滑法的预测模型Ft+1=aYt+(1-a)Ft(a为平滑系数,0<a<1)计算题1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制直方图解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计100 100 (3)2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。
整理得到频数分布表如下:40个企业按产品销售收入分组表(2)按题目要求分组并进行统计,得到分组表如下:某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 3.某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;将各组天数除以总天数40,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~3030~3535~4040~4545~5046159610.015.037.522.515.0合计40 100.0直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。