统计学(第六版)贾俊平 课后习题答案

合集下载

统计学课后题答案(袁卫_庞皓_曾五一_贾俊平_)

统计学课后题答案(袁卫_庞皓_曾五一_贾俊平_)

版权归wagxjysys所有违者必究第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。

3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。

因此,他们开始检查供货商的集装箱,有问题的将其退回。

最近的一个集装箱装的是2 440加仑的油漆罐。

这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。

装满的油漆罐应为4.536 kg。

要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。

答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。

4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。

这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。

假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。

要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。

答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。

第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。

调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。

贾俊平第六版统计学课后思考题答案——张云飞

贾俊平第六版统计学课后思考题答案——张云飞

第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计是研究如何利用样本数据来推断总体特征的统计方法。

3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

顺序数据:是只能归于某一有序类别的非数字型数据。

虽然也有列别,但这些类别是有序的。

数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。

4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。

5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。

比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。

在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。

我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。

6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。

顺序变量:一个变量由顺序数据来记录就称为顺序变量。

数值型变量:一个变量由数值型数据来记录就称为数值型变量。

离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。

贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】

贾俊平《统计学》配套题库  【课后习题】详解  第9章~第10章【圣才出品】

第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。

答:列联表是由两个以上的变量进行交叉分类的频数分布表。

列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。

次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。

表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。

而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。

由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。

3.说明计算2χ统计量的步骤。

答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。

贾俊平统计学第一章课后思考题答案

贾俊平统计学第一章课后思考题答案

1.什么是统计学?答:统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法,统计所研究的是来自各领域的数据。

数据收集即取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。

2.解释描述统计和推断统计。

答:数据分析所用的方法可分为描述统计方法和推断统计方法。

(1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。

比如,对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。

这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。

3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

①在分类数据中,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的;②顺序数据也表现为类别,但这些类别之间是有顺序的;③数值型数据具有分类数据和顺序数据的特点,并且还可以进行加、减、乘、除运算。

(2)按照统计数据的收集方法,可以将其分为观测数据和实验数据。

①观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物进行人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据;②实验数据是在实验中通过控制实验对象收集到的数据,自然科学领域的大多数数据都是实验数据。

(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。

①截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;②时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。

2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。

推断统计:研究的是如何利用样本数据来推断总体特征。

3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的,非数字型数据。

顺序数据:只能归于某一有序类别的,非数字型数据。

数值型数据:按数字尺度测量的观察值,结果表现为数值。

按收集方法不同。

分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。

按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。

时间序列数据:在不同时间收集的数据。

4、举例说明总体、样本、参数、统计量、变量这几个概念。

总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。

参数:用来描述总体特征的概括性数字度量。

(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。

(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。

(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。

顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。

变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。

统计学(第六版)贾俊平-课后习题及答案

统计学(第六版)贾俊平-课后习题及答案

目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。

1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。

1.5举例说明总体、样本、参数、统计量、变量这几个概念。

1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。

1.8请举出统计应用的几个例子。

1.9请举出应用统计的几个领域。

1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。

要求:(1)描述总体和样本。

(2)指出参数和统计量。

(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。

1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。

回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。

统计学第四章习题答案-贾俊平

统计学第四章习题答案-贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数.(3)计算销售量的标准差.(4)说明汽车销售量分布的特征。

解:Statistics10Missing0Mean9.60Median10.00Mode10Std。

Deviation4。

169Percentiles25 6.255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数.Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18。

75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0。

75×2=26。

5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1。

080;Kurtosis=0。

773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41—15)÷6=4。

3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待.为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客.得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟.第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8要求:(1)画出第二种排队方式等待时间的茎叶图。

(完整word版)统计学贾俊平课后答案目前最全

(完整word版)统计学贾俊平课后答案目前最全

8.2 一种元件,要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。

已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。

解:H 0:μ≥700;H 1:μ<700 已知:x =680 σ=60由于n=36>30,大样本,因此检验统计量:x z ==-2 当α=0.05,查表得z α=1.645。

因为z <-z α,故拒绝原假设,接受备择假设,说明这批产品不合格。

8.38.4 糖厂用自动打包机打包,每包标准重量是100千克。

每天开工后需要检验一次打包机工作是否正常。

某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a =0.05)?解:H 0:μ=100;H 1:μ≠100 经计算得:x =99.9778 S =1.21221检验统计量:x t =-0.055 当α=0.05,自由度n -1=9时,查表得()29t α=2.262。

因为t <t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。

8.5 某种大量生产的袋装食品,按规定不得少于250克。

今从一批该食品中任意抽取50袋,发现有6袋低于250克。

若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a =0.05)?解:解:H 0:π≤0.05;H 1:π>0.05已知: p =6/50=0.12检验统计量:Z ==2.271当α=0.05,查表得z α=1.645。

因为z >z α,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。

8.68.7 某种电子元件的寿命x(单位:小时)服从正态分布。

现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著地大于225小时(a =0.05)?解:H 0:μ≤225;H 1:μ>225 经计算知:x =241.5 s =98.726检验统计量:x t =0.669 当α=0.05,自由度n -1=15时,查表得()15t α=1.753。

贾俊平《统计学》(第6版)章节题库-第一章至第四章【圣才出品】

贾俊平《统计学》(第6版)章节题库-第一章至第四章【圣才出品】

2.指出下面的变量哪一个属于顺序变量?( ) A.年龄 B.工资 C.汽车产量 D.员工对企业某项改革措施的态度(赞成、中立、反对) 【答案】D 【解析】顺序变量又称为有序分类变量,观测结果表现为某种有序类别的变量。C 项员 工对企业某项改革措施的态度按顺序依次表现为:赞成、中立、反对三种,因此属于顺序变
4.某研究部门准备在全市 200 万个家庭中抽取 2000 个家庭,推断该城市所有职工家 庭的年人均收入。这项研究的总体是( )。
A.2000 个家庭 B.200 万个家庭 C.2000 个家庭的人均收入 D.200 万个家庭的总收入 【答案】B 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为 200 万个家庭。
何利用样本数据来推断总体特征的统计学方法。由此可知 A 项属于推断统计学方法。
12.某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他 调查了 200 名学生,发现他们每月平均生活费支出是 500 元。该研究人员感兴趣的总体是 ( )。
A.该大学的所有学生 B.该校所有大学生的总生活费支出 C.该大学所有的在校本科生 D.所调查的 200 名学生 【答案】C 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。因此题中的总体是“该大学所有的在校本科生”。
8.一家研究机构从 IT 从业者中随机抽取 500 人作为样本进行调查,其中 60%回答他们 的月收人在 5000 元以上,50%回答他们的消费支付方式是用信用卡。这里的总体是( )。
A.IT 业的全部从业者 B.500 个 IT 从业者 C.IT 从业者的总收入 D.IT 从业者的消费支付方式 【答案】A 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为“所有 IT 从业者”。

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下(4)帕累托图(略)。

2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。

(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。

2.72.8(1)属于数值型数据。

2.9(1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.10A 班分散,且平均成绩较A 班低。

2.11 (略)。

2.12 (略)。

2.13 (略)。

2.14 (略)。

2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

(2)5.5=L Q ;12=U Q 。

(3)24=x ;65.6=s 。

(4)08.1=SK ;77.0=K 。

(5)略。

3.3 (1)略。

(2)7=x ;71.0=s 。

(3)102.01=v ;274.02=v 。

(4)选方法一,因为离散程度小。

3.4 (1)x =(万元);M e= 。

统计学课后题答案(袁卫庞皓曾五一贾俊平)

统计学课后题答案(袁卫庞皓曾五一贾俊平)

第1章绪论5.简要说明抽样误差和非抽样误差。

答:统计调查误差可分为非抽样误差和抽样误差。

非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。

抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。

b5E2RGbCAP6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。

因此,他们开始检查供货商的集装箱,有问题的将其退回。

最近的一个集装箱装的是2 440加仑的油漆罐。

这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。

装满的油漆罐应为 4.536 kg。

要求:p1EanqFDPw(1>描述总体;(2>描述研究变量;(3>描述样本;(4>描述推断。

答:(1>总体:最近的一个集装箱内的全部油漆;(2>研究变量:装满的油漆罐的质量;(3>样本:最近的一个集装箱内的50罐油漆;(4>推断:50罐油漆的质量应为4.536×50=226.8kg。

7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。

这场战役因影视明星、运动员的参与以及消费者对品尝实验优先权的抱怨而颇具特色。

假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝实验(即在品尝实验中,两个品牌不做外观标记>,请每一名被测试者说出A品牌或B品牌中哪个口味更好。

要求:DXDiTa9E3d(1>描述总体;(2>描述研究变量;(3>描述样本;(4>描述推断。

答:(1>总体:市场上的“可口可乐”与“百事可乐”(2>研究变量:更好口味的品牌名称;(3>样本:1000名消费者品尝的两个品牌(4>推断:两个品牌中哪个口味更好。

第2章统计数据的描述思考题4. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。

统计学课后答案(贾俊平版)人大出版之欧阳语创编

统计学课后答案(贾俊平版)人大出版之欧阳语创编

第三章节:数据的图表展示 (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。

调查结果如下:B EC C AD C B AE D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B CBCEDBCCBC要求:(1)指出上面的数据属于什么类型。

顺序数据(2)用Excel 制作一张频数分布表。

用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。

用数据分析——直方图制作: (4)绘制评价等级的帕累托图。

逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:152124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126接收 频率E 16 D 17 C 32 B 21 A14要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

统计学第四章习题答案解析贾俊平

统计学第四章习题答案解析贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

贾俊平统计学第六、七章课后习题答案

贾俊平统计学第六、七章课后习题答案

贾俊平统计学第六、七章课后习题答案6.1解:设每个瓶子的灌装量为X,X?为样本均值,样本容量为n。

由于总体X服从正态分布,样本均值X?也服从正态分布,且均值相同,标准差为σ√n =1√9=13所以P(|X??μ|≤0.3)=P(|X??μ|13≤0.313)=2Φ(0.9)?1=2?0.8159?1=0.6318 7.1(1)已知σ=500,n=15,x=8900,1-α=95%,Z2α=1.96x+Z2αnσ=8900+1.96×15500=(8647,9153)(2)已知σ=500,n=35,x=8900,1-α=95%,Z2α=1.96x+Z2αnσ=8900+1.96×35500=(8734,9066)(3)已知n=35,x=8900,s=500,由于总体方差未知,但为大样本,所以可用样本方差来代替总体方差。

置信水平1-α=90%,Z2α=1.645x+Z2αns=8900+1.645×35500=(8761,9039)(4)已知n=35,x=8900,s=500,由于总体方差未知,但为大样本,所以可用样本方差来代替总体方差。

置信水平1-α=99%,Z2α=2.58x +Z2αn s =8900+2.58×35500=(8682,9118)7.2已知n=36,x =3.3167,s=1.6093(1)当置信水平为90%时,Z 2α=1.645x +Z 2αn s =3.3167+1.645×366093.1=3.3167+0.4532=(2.88,3.76)(2)当置信水平为95%时,Z 2α=1.96x +Z 2αn s =3.3167+1.96×366093.1=3.3167+0.544=(2.80,3.84)(3)当置信水平为99%时,Z 2α=2.58Z2αn s =3.3167+2.58×366093.1=3.3167+0.7305=(2.63,4.01)7.3(1)已知总体服从正态分布,但σ未知,n=50为大样本,α=0.05,Z 2α=1.96,根据样本计算可知x =101.32,s=1.63x +Z 2αn s =101.32+1.96×5063.1=101.32+0.45=(100.87,101.77)(2)由所给样本数据可知样本合格率:p=5045=0.9p +Z2αnp p )1(-=0.9+1.9650)9.0-19.0(=0.9+0.08=(0.82,0.98)7.4由样本数据得x =16.13,σ=0.8706,置信水平1-α=99%,Z 2α=2.58x +Zαn σ=16.13+2.58×58706.0=16.13+0.45=(15.68,16.58)7.5、(1)n=44,p=0.51,置信水平为99%由题意,已知n=44,置信水平1-α=99%,因此检验统计量为:,代入数值计算,总体比例π的置信区间为(31.6%,70.4%) (2)n=300,p=0.82,置信水平为95%由题意可得知96.12=αZ检验统计量为:,代入数值计算,总体比例π的置信区间为(77.7%,86.3%) (3)n=1150,p=0.48,置信水平为90%由题意可得知检验统计量为:,代入数值计算,58.22=αZ np p Z P )1(2-±α)704.0,316.0(194.051.044)51.01(51.058.251.0=+=-??p p Z P )1(2-±α)863.0,777.0(043.082.0300)82.01(82.096.182.0=+=-?+645.12=αZ np p Z P )1(2-±α总体比例π的置信区间为(45.6%,50.4%)7.6、(1)由题意已知n=200,当置信水平为90%时,,检验统计量为代入数据计算可得:置信区间为(18.10%,27.90%) (2)当置信水平为95%时,96.12=αZ ,检验统计量为代入数据计算可得:置信区间为(17.17%,28.83%)7.7、由题意已知置信水平为99%,即1-α=99%,则,估计误差E=200,=1000504.0,456.0(024.048.01150)48.01(48.0645.148.0=+=-?+645.12=αZ np p Z P )1(2-±α%)90.27%,10.18(%90.4%23200%)231%(23645.1%23=±=-?±np p Z P )1(2-±α%)83.28%,17.17(%83.5%23200%)231%(2396.1%23=+=-?+58.22=αZ σ则,即应该取样本量为1677.8、(1)由题意可知n=50,p=32/50=0.64,α=0.05,96 .12=αZ 总体中赞成该项改革的户数比例的置信区间为,代入数据计算:即置信区间为(51%,77%)(2)如果小区管理者预计赞成的比例能达到80%,即π=0.80,估计误差不超过10%,即E=10%,α=0.05,96.12=αZ ,应抽取的样本量为即应该抽取62户进行调查7.9(1)x?=21,s=2,n=50,α=0.1χ0.12?2(50?1)=66.3387,χ1?0.12?2(50?1)=33.9303∴(n?1)s 2χα22≤σ2≤(n?1)s 2χ1?α22(50?1)×2266.3387≤σ2≤(50?1)×2233.9303即2.95≤σ2≤5.78.标准差的置信区间为1.72≤σ≤2.4 (2)x?=1.3,s=0.02,n=15,α=0.1167200100058.22222222≈?==E Z n σαnp p Z P )1(2-±α)77.0,51.0(13.064.050)64.01(64.096.164.0=±=-±621.0)80.01(80.096.1)1(22222=-?=-?=E Z n ππαχ0.12?2(15?1)=23.6848,χ1?0.12?2(15?1)=6.5706∴(n?1)s 2χα22≤σ2≤(n?1)s 2χ1?α22(15?1)×0.02223.6848≤σ2≤(15?1)×0.0226.5706标准差的置信区间为0.015≤σ≤0.029 (3)x?=167,s=31,n=22,α=0.1χ0.12?2(22?1)=32.6706,χ1?0.12?2(22?1)=11.5913∴(n?1)s 2χα22≤σ2≤(n?1)s 2χ1?α22(22?1)×312≤σ2≤(22?1)×312标准差的置信区间为24.85≤σ≤41.73。

统计学贾俊平课后习题答案1

统计学贾俊平课后习题答案1

第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。

本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。

本章各节的主要内容和学习要点如下表所示。

章节主要内容学习要点1.1 统计及其应用领域什么是统计学④概念:统计学,描述统计,推断统计。

统计的应用领域④统计在工商管理中的应用。

④统计的其他应用领域。

1.2 数据的类型分类数据、顺序数据、数值型数据④概念:分类数据,顺序数据,数值型数据。

④不同数据的特点。

观测数据和实验数据④概念:观测数据,实验数据。

截面数据和时间序列数据④概念:截面数据,时间序列数据。

1.3 数据来源数据的间接来源④统计数据的间接来源。

④二手数据的特点。

数据的直接来源④概念:抽样调查,普查。

④数据的间接来源。

④数据的收集方法。

调查方案设计④调查方案的内容。

数据质量④概念。

抽样误差,非抽样误差。

④统计数据的质量。

1.4 统计中的几个基本概念总体和样本④概念:总体,样本。

参数和统计量④概念:参数,统计量。

变量④概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。

二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。

2. 描述统计:研究数据收集、处理和描述的统计学分支。

3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。

4. 分类数据:只能归于某一类别的非数字型数据。

5. 顺序数据:只能归于某一有序类别的非数字型数据。

6. 数值型数据:按数字尺度测量的观察值。

7. 观测数据:通过调查或观测而收集到的数据。

8. 实验数据:在实验中控制实验对象而收集到的数据。

9. 截面数据:在相同或近似相同的时间点上收集的数据。

10. 时间序列数据:在不同时间上收集到的数据。

11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。

贾俊平《统计学》考研真题(含复试)与典型习题详解(第6版)

贾俊平《统计学》考研真题(含复试)与典型习题详解(第6版)

目录分析
1.2课后习题详解
1.1复习笔记
1.3典型习题详解
2.2课后习题详解
2.1复习笔记
2.3典型习题详解
3.2课后习题详解
3.1复习笔记
3.3典型习题详解
4.2课后习题详解
4.1复习笔记
4.3典型习题详解
5.2课后习题详解
5.1复习笔记
5.3典型习题详解
6.2课后习题详解
6.1复习笔记
12.1复习笔记
12.3典型习题详解
13.2课后习题详解
13.1复习笔记
13.3典型习题详解
14.2课后习题详解
14.1复习笔记
14.3典型习题详解
作者介绍
谢谢观看
6.3典型习题详解
7.2课后习题详解
7.1复习笔记
7.3典型习题详解
8.2课后习题详解
8.1复习笔记
8.3典型习题详解
9.2课后习题详解
9.1复习笔记
9.3典型习题详解
10.2课后习题详解
10.1复习笔记
10.3典型习题详解
11.2课后习题详解
11.1复习笔记
11.3典型习题详解
12.2课后习题详解
精彩摘录
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 参数是用来描述总体特征的概括性数字度量 不论如何偏斜,中位数总是在众数与算术平均数之间。经验表明,在适度偏斜的情况下,众数与中位数的距 离约为中位数与算术平均数距离的2倍。 概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的可靠程度。 从另一个方面讲,也可以按照要求的精确度,计算必要的样本单位数目。 统计推断的三个中心内容:抽样分布、参数估计和假设检验。 统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数 样本方差:样本数据个数减1后除离差平方和。其中样本数据个数减1,即n-1称为自由度 几何平均数主要用于计算比率的平均 控制抽样误差的主要方法是改变样本量,要求的抽样误差越小,所需要的样本量就越大。 概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

统计学课后答案贾俊平版人大出版

统计学课后答案贾俊平版人大出版

第三章节:数据的图表展示…………………………………………………1 第四章节:数据的概括性度量………………………………………………15 第六章节:统计量及其抽样分布……………………………………………26 第七章节:参数估计…………………………………………………………28 第八章节:假设检验…………………………………………………………38 第九章节:列联分析…………………………………………………………41 第十章节:方差分析…………………………………………………………43 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别表示为:A .好;B .较好;C 一般;D .较差;E.差。

调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求:(1)指出上面的数据属于什么类型。

顺序数据(2)用Excel 制作一张频数分布表。

用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。

用数据分析——直方图制作: (4)绘制评价等级的帕累托图。

逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:接收 频率 E 16D 17C 32 B 21 A 14(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

统计学第四章习题答案解析贾俊平

统计学第四章习题答案解析贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

统计学贾俊平课后习题答案

统计学贾俊平课后习题答案

第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下(4)帕累托图(略)。

2.2(1)频数分布表如下2.32.5(1)排序略。

(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。

2.72.8(1)属于数值型数据。

2.9 (1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

布比A 班分散,且平均成绩较A 班低。

2.11 (略)。

2.12 (略)。

2.13 (略)。

2.14 (略)。

2.15 箱线图如下:(特征请读者自己分析)第3章 数据的概括性度量 3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

(2)5.5=L Q ;12=U Q 。

(3)24=x ;65.6=s 。

(4)08.1=SK ;77.0=K 。

(5)略。

3.3 (1)略。

(2)7=x ;71.0=s 。

(3)102.01=v ;274.02=v 。

(4)选方法一,因为离散程度小。

3.4 (1)x =274.1(万元);M e=272.5 。

(2)Q L =260.25;Q U =291.25。

(3)17.21=s (万元)。

3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1
非概率抽样是指抽取样本时不是依据随机原则, 而是根据研究目的对数据的要求, 采用 某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而 且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为 更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数 据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以 刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜 集过程中遇到问题不能及时调整。 面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充 分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问 题,被访者会有压力。 电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地 区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。 5.请举出(或设计)几个实验数据的例子。 不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。 6.你认为应当如何控制调查中的回答误差? 对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩 短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调 查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。 7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好 各方面的准备工作, 尽量把无回答率降到最低程度。 无回答出现后, 分析武回答产生的原因, 采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调 查者不愿意回答时, 可以通过一定的方法劝服被访者, 还可以通过馈赠小礼品等的方式提高 回收率。
第一章
1.1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2
导论
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均 收入。 1.3 (1)总体是所有 IT 从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。
3
一般 较差 差
32 18 15
(3)绘制一张条形图,反映评价等级的分布。
家庭数目(个)
40 30 20 10 0 好 较好 一般 服务等级的条形图 较差 差 服务等级
(4)绘制评价等级的帕累托图。
40 30
频率
150.00% 100.00% 50.00% 0.00% 一般 较好 较差 差 好 其他
第二章数据的搜集
1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在, 是由别人调查和实验得来的, 并会被我们利用的 资料称为“二手资料” 。 使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、 搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免 错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点, 举例说明什么情况下适合采用概率抽样, 什么情 况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。 每个单位被抽中的概率已知或可 以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽 样的技术含量和成本都比较高。 如果调查的目的在于掌握和研究总体的数量特征, 得到总体 参数的置信区间,就使用概率抽样。
5
销售收入(万元) 30 以下 30 - 35 35 - 40 40 - 45 45 以上 合计 4、直方图
频数 4 6 15 9 6 40
频率% 10 15 37.5 22.5 15 100.0
向上累计频数 4 10 25 34 40 —
向上累计频率% 10 25 62.5 85 100 —
频率(天) 15 10 5 0 30以下 30-35 35-40 40-45 45以上
向上累积频率(%) 2% 7% 13% 27% 53% 71% 84% 94% 97% 100% —
频率(个) 30 25 20 15 10 5 0
120.00% 100.00% 80.00% 60.00% 40.00% 20.00% 0.00%
66 0以 66 下 06 67 70 06 68 80 06 69 90 07 70 00 07 71 10 07 72 20 07 73 30 074 74 0 0以 上
3.3 某百货公司连续 40 天的商品销售额如下: 单位:万元 41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35
30
20
10 data
3.5 答 :频数分布表 灯泡寿命 660 以下 660-670 670-680 680-690 690-700 700-710 710-720 720-730 730-740 740 以上 合计 直方图
频率 累积 %
频率 2 5 6 14 26 18 13 10 3 3 100
第三章
一、思考题 3.1 数据的预处理包括哪些内容? 答:审核、筛选、排序等。
数据的图表搜集
3.2 分类数据和顺序数据的整理和显示方法各有哪些? 答: 分类数据在整理时候先列出所分的类别, 计算各组的频数、 频率, 得到频数分布表,
2
如果是两个或两个以上变量可以制作交叉表。对于分类数据可以绘制条形图、帕累托图、饼 图、环形图等。根据不同的资料或者目的选择不同的图。 对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。可根据需要绘 制条形图、饼图、环形图等。 3.3 数值型数据的分组方法有哪些?简述组距分组的步骤。 答:单变量值分组和组距分组。其中组距分组:第一步,确定组数,组数多少由数据的 多少和特点等决定,一般 5~15 组;第二步,确定各组组距,宜取 5 或 10 的倍数;第三步, 根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。 3.4 直方图和条形图有何区别? 答:1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表 示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义; 2 直方图各矩形连续排列,条形图分开排列;3 条形图主要展示分类数据,直方图主要展示 数值型数据。 3.5 绘制线图应注意问题? 答:时间在横轴,观测值绘在纵轴。一般是长宽比例 10:7 的长方形,纵轴下端一般从 0 开始,数据与 0 距离过大的话用折断符号折断。 3.6 饼图和环形图的不同? 答: 饼图只能显示一个样本或总体各部分所占比例, 环形图可以同时绘制多个样本或总 体的数据系列,其图形中间有个“空洞” ,每个样本或总体的数据系类为一个环。 3.7 茎叶图比直方图的优势,他们各自的应用场合? 答:茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的 信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。 3.8 鉴别图标优劣的准则? 答:P65 明确有答案,我就不写了。 3.9 制作统计表应注意的问题? 答:1,合理安排统计表结构;2 表头一般包括表号,总标题和表中数据的单位等内容; 3 表中的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空 白格;4 在使用统计表时,必要时可在下方加注释,注明数据来源。 二、练习题 3.1 答: (1)表中数据属于顺序数据。 (2)用 Excel 制作一张频数分布表。 服务等级 好 较好 家庭数目(个) 14 21
灯泡寿命(小时) 灯泡寿命的直方图
ห้องสมุดไป่ตู้
从直方图看,数据的分布呈左偏分布。 3.6 答 :频数分布表
K 1
2、确定组距:
lg 100 lg(n) 2 1 1 6.64 ,取 k=7 lg(2) lg 2 0.30103
7
组距=( 最大值 - 最小值)÷ 组数=(61-40)÷7=3,取 3 3、分组频数表(根据实际资料,调整成分 5 个组) 食品重量(g) 43 以下 43 - 46 46 - 49 49 - 52 52 -55 55 - 58 58 以上 合计 频数 3 9 24 19 24 14 7 100 频率% 3 9 24 19 24 14 7 100.0 向上累计频数 4 12 36 55 79 93 100 — 向上累计频率% 3 12 36 55 79 93 100 —
150.00% 100.00% 50.00% 0.00%
频率 累积 %
销售额(万元)
商店40天销售额的直方图
3.4 利用下面的数据构建茎叶图和箱线图。 57 23 35 18 21 21 答:茎叶图 29 47 51 26 46 43 29 23 39 50 41 19 36 28 18 29 52 42 31 28 46 33 28 20
20 10 0
售后服务等级的帕累托图
3.2 某行业管理局所属 40 个企业 2002 年的产品销售收入数据如下: 152 105 117 97 要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: K 1 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取 10 124 119 108 88 129 114 105 123 116 115 110 115 100 87 107 119 103 103 137 138 92 118 120 112 95 142 136 146 127 135 117 113 104 125 108 126
相关文档
最新文档