贾俊平统计学[第六版]思考题解析
贾俊平《统计学》配套题库 【课后习题】详解 第13章~第14章【圣才出品】
二、练习题
1.下表是 1991~2008 年我国小麦产量数据。
年份
小麦产量(万吨) 年份
1991
9595.3
2000
1992
10158.7
2001
1993
10639.0
2002
1994
9929.7
2003
1995
10220.7
2004
1996
11056.9Leabharlann 2005199712328.9
2006
1998
3 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
移动平均值,然后再计算出各比值的季度(或月份)平均值。 (3)季节指数调整。由于各季节指数的平均数应等于 1 或 100%,若根据第 2 步计算
的季节比率的平均值不等于 1 时,则需要进行调整。具体方法是:将第(2)步计算的每个 季节比率的平均值除以它们的总平均值。
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 13 章 时间序列分析和预测
一、思考题 1.简述时间序列的构成要素。 答:时间序列的构成要素分为 4 种,即趋势、季节性或季节变动、周期性或循环波动、 随机性或不规则波动。 (1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长 期趋势; (2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动; (3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或 振荡式变动; (4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈 现出某种随机波动。
2 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
统计学课后题答案(袁卫庞皓曾五一贾俊平)
第1章绪论5.简要说明抽样误差和非抽样误差。
答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述思考题4. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。
5. 怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。
贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】
第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。
答:列联表是由两个以上的变量进行交叉分类的频数分布表。
列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。
次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。
表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。
而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。
由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。
3.说明计算2χ统计量的步骤。
答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
统计学贾俊平-课后思考题和练习题答案
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
解释分类数据,顺序数据和数值型数据答案同举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
(完整版)贾俊平统计学[第六版]思考题答案解析.docx
第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。
2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。
推断统计:研究的是如何利用样本数据来推断总体特征。
3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的,非数字型数据。
顺序数据:只能归于某一有序类别的,非数字型数据。
数值型数据:按数字尺度测量的观察值,结果表现为数值。
按收集方法不同。
分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。
按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间收集的数据。
4、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。
参数:用来描述总体特征的概括性数字度量。
(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。
(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。
(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。
顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。
变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。
统计学第六版贾俊平
精品教材
统计学
拟合优度检验
(例题分析)
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
0 3.0319 6.215 c2
9 - 27
统计量:
r
c2
c (fij eij)2 3.0319
i1 j1
eij
结论:
可以认为广告后各公司产品
0
5.99 8.18 c
市场占有率发生显著变化
9 - 29
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选
“CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域
的百分比,称为百分比分布
行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
总百分比:每一个观察值除以观察值的总个数( fij / n )
9 - 15
精品教材
统计学
百分比分布
(图示)
行百分比
列百分比
总百分比
0.3000
e
36 0.9730 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
Z 检验 Z 检验 c 检验
贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的图表展示)【圣才出品】
②列联表和交叉表
由两个或两个以上变量交叉分类的频数分布表也称为列联表。
二维的列联表(两个变量交叉分类)也称为交叉表。
③比例(构成比)、百分比和比率
比例是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或
二、品质数据的整理与展示 1.分类数据的整理与图示 分类数据本身就是对事物的一种分类,为对数据及其特征有一个初步的了解,在整理时 首先列出所分的类别,然后计算出每一类别的频数、频率或比例、比率等,形成一张频数分 布表,最后根据需要选择适当的图形进行展示。 (1)频数与频数分布 ①频数与频数分布 频数又称为次数,是各组占有的单位个数,将总体所有单位按一定标志进行归类排列, 称为频数分布。频数(频率)愈大的组所对应的标志值,它对于总体标志平均水平所起的作 用也愈大;反之,频数(频率)愈小的组所对应的标志值对于总体标志平均水平所起的作用
总体)的构成或结构。将比例乘以 100 得到的结果称为百分比,用%表示。比率是样本(或
总体)中各不同类别数据之间的比值,其比值可能大于 1。
(2)分类数据的图示
统计图是统计数据直观的表现形式,可以将复杂的数据用生动的图形表现出来,因而绘
制并使用好统计图就成为统计分析的基本功。常见的分类数据展示图形有条形图、帕累托图、
三、数值型数据的整理与展示 1.数据分组
4 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
(1)数据分组的概念和目的 数据分组是根据统计研究的需要,为了观察数据的分布特征,将原始数据按照某种标准 划分成不同的组别,分组后的数据称为分组数据。经分组后再计算出各组中数据出现的频数, 就形成了一张频数分布表。在分组时,如果按照性别、质量等级等定性指标分组,称为按品 质标志分组;如果按照数量或数值等定量指标分组,称为按数量标志分组。 (2)数据分组的方法 ①单变量值分组:把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量 值较少的情况下使用; ②组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。适用于连续变量或变 量值较多的情况。 (3)分组和编制频数分布表的具体步骤 ①确定组数 一般情况下,一组数据所分的组数不应少于 5 组且不多于 15 组,即 5≤K≤15。实际应 用时,可根据数据的多少和特点及分析的要求来确定组数。 ②确定各组的组距 组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数 来确定,即组距=(最大值-最小值)÷组数。 注意:为便于计算,组距宜取 5 或 10 的倍数,而且第一组的下限应低于最小变量值, 最后一组的上限应高于最大变量值。 ③根据分组整理成频数分布表 (4)组距分组的注意事项
统计学(第六版)贾俊平-课后习题及答案
目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
贾俊平统计学第三章课后思考题答案
一、思考题1.数据的预处理包括哪些内容?答:数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。
(1)数据审核就是检查数据中是否有错误。
对于通过调查取得的原始数据,主要从完整性和准确性两个方面去审核;对于通过其他渠道取得的二手数据,则应着重审核数据的适用性和时效性(2)数据筛选是根据需要找出符合特定条件的某类数据。
(3)数据排序是按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。
除此之外,排序还有助于对数据检查纠错,以及为重新归类或分组等提供方便。
2.分类数据和顺序数据的整理和图示方法各有哪些?答:(1)分类数据的整理方法:首先列出分类数据所分的类别,然后计算出每一类别的频数、频率或比例、比率等,即可形成一张频数分布表。
图示方法:条形图、帕累托图、饼图和环形图。
(2)顺序数据的整理方法:首先按照一定的顺序将数据进行分类,然后计算出每一类别的频数、比例、百分比、比率等,对于顺序数据,除了可使用分类数据的整理和图示技术外,还可以计算累积频数和累积频率(百分比)。
图示方法:条形图、饼图、帕累托图、累积频数分布图和环形图。
3.数值型数据的分组方法有哪些?简述组距分组的步骤。
答:(1)数据分组的方法有单变量值分组和组距分组两种。
①单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且变量值较少的情况下使用;②在连续变量或变量值较多的情况下,通常采用组距分组。
它是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。
(2)组距分组步骤①确定组数。
组数的确定应以能够显示数据的分布特征和规律为目的。
一般情况下,一组数据所分的组数不应少于5组且不多于15组,即5≤K≤15;②确定各组的组距。
组距是一个组的上限与下限的差。
组距可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数;③根据分组编制频数分布表。
贾俊平第六版统计学课后思考题目解析
贾俊平第六版统计学课后思考题目解析第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据:是只能归于某一有序类别的非数字型数据。
虽然也有列别,但这些类别是有序的。
数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。
4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。
比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。
在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。
我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。
6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。
顺序变量:一个变量由顺序数据来记录就称为顺序变量。
数值型变量:一个变量由数值型数据来记录就称为数值型变量。
统计学贾俊平课后习题答案
附录:教材各章习题答案第1 章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000 个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT 从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2 章数据的图表展示2.1 (1)属于顺序数据。
(2)频数分布表如下服务质量等级评价的频数分布3)条形图(略)4)帕累托图(略)2.2 (1)频数分布表如下402)某管理局下属40 个企分组表2.3 频数分布表如下某百货公司日商品销售额分组表2.4茎叶图如下茎叶数据个数1 8 8 93 2 0 1 1 3 3 6 8 8 8 9 9 912 3 13 5 6 95 4 1 2 36 67 6 50 1 2 74箱线图(略) 2.5 ( 1)排序略(2)频数分布表如下1数分布34)茎叶图如下茎叶65 66 67 68 5 5 6 6 6 7 7 8 8 8 8 9 970 7169720 1 2 2 5 6 7 8 9 973 3 5 674 1 4 72.6(1)频数分布表如下按重量分组频率/包40~42 242~44 344~46 746~48 1648~50 1752~52 1052~54 2054~56 856~58 1058~60 460~62 3合计100 (2)直方图(略)。
(3)食品重量的分布基本上是对称的2.7(1)频数分布表如下按重量误差分组频数/个10~20 020~30 530~40 740~50 850~60 1360~70 970~80 680~90 2合计50 2)直方图(略)2.8 (1)属于数值型数据( 2 )分组结果如下分组天数/天-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60( 3 )直方图(略)。
贾俊平第六版统计学课后思考题答案——张云飞
第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据:是只能归于某一有序类别的非数字型数据。
虽然也有列别,但这些类别是有序的。
数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。
4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。
比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。
在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。
我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。
6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。
顺序变量:一个变量由顺序数据来记录就称为顺序变量。
数值型变量:一个变量由数值型数据来记录就称为数值型变量。
离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。
贾俊平《统计学》(第6版)章节题库-第五章至第七章【圣才出品】
第5章概率与概率分布一、单项选择题1.一项试验中所有可能结果的集合称为()。
A.事件B.简单事件C.样本空间D.基本事件【答案】C【解析】在同一组条件下,对某事物或现象所进行的观察或实验称作试验,观察或试验的结果称作事件。
如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件或者简单事件。
一个试验中所有的简单事件的全体称为样本空间或基本空间。
2.每次试验可能出现也可能不出现的事件称为()。
A.必然事件B.样本空间C.随机事件D.不可能事件【答案】C【解析】随机事件是指在同一组条件下,每次试验可能出现也可能不出现的事件,也叫偶然事件。
必然事件是指在同一组条件下,每次试验一定出现的事件。
不可能事件是指在同一组条件下,每次试验一定不出现的事件。
3.抛3枚硬币,用0表示反面,l 表示正面,其样本空间为Ω=()。
A.{000,001,010,100,011,101,110,111}B.{l,2,3}C.{0,1}D.{01,10}【答案】A【解析】样本空间为一个试验中所有的简单事件的全体。
抛3枚硬币,每抛一次都是由0和1组成的一个三位数的组合,所有的组合构成了样本空间,即{000,001,010,100,011,101,110,111}。
4.随机抽取一只灯泡,观察其使用寿命t ,其样本空间为Ω=()。
A.{0t =}B.{0t <}C.{0t >}D.{0t ≥}【答案】D【解析】一个试验中所有的简单事件的全体称为样本空间或基本空间。
灯泡的使用寿命样本空间为Ω={0t ≥}。
5.观察一批产品的合格率p ,其样本空间为Ω=()。
A.{01p <<}B.{01p ≤≤}C.{1p ≤}D.{0p ≥}【答案】B【解析】一个试验中所有的简单事件的全体称为样本空间或基本空间。
产品的合格率样本空间为Ω={01p ≤≤}。
6.抛掷一枚硬币,观察其出现的是正面还是反面,并将事件A 定义为:事件A=出现正面,这一事件的概率记作P(A)。
(完整word版)统计学贾俊平课后答案目前最全
8.2 一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。
解:H 0:μ≥700;H 1:μ<700 已知:x =680 σ=60由于n=36>30,大样本,因此检验统计量:x z ==-2 当α=0.05,查表得z α=1.645。
因为z <-z α,故拒绝原假设,接受备择假设,说明这批产品不合格。
8.38.4 糖厂用自动打包机打包,每包标准重量是100千克。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a =0.05)?解:H 0:μ=100;H 1:μ≠100 经计算得:x =99.9778 S =1.21221检验统计量:x t =-0.055 当α=0.05,自由度n -1=9时,查表得()29t α=2.262。
因为t <t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。
8.5 某种大量生产的袋装食品,按规定不得少于250克。
今从一批该食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a =0.05)?解:解:H 0:π≤0.05;H 1:π>0.05已知: p =6/50=0.12检验统计量:Z ==2.271当α=0.05,查表得z α=1.645。
因为z >z α,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。
8.68.7 某种电子元件的寿命x(单位:小时)服从正态分布。
现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著地大于225小时(a =0.05)?解:H 0:μ≤225;H 1:μ>225 经计算知:x =241.5 s =98.726检验统计量:x t =0.669 当α=0.05,自由度n -1=15时,查表得()15t α=1.753。
统计学贾俊平课后习题答案完整版
统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
统计学第四章习题答案解析贾俊平
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
统计学课后习题第六章-贾俊平等
第六章统计量及其抽样分布6。
1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从的正态分布,由正态分布,标准化得到标准正态分布:z=~,因此,样本均值不超过总体均值的概率P为:====2—1,查标准正态分布表得=0。
8159因此,=0。
63186。
2 =====0。
95查表得:因此n=436。
3 ,,……,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Z n是来自总体N(0,1)的样本,则统计量2分布,记为χ2~ χ2(n)服从自由度为n的χ因此,令,则,那么由概率,可知:b=,查概率表得:b=12.596。
4 在习题6。
1中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得解:更加样本方差的抽样分布知识可知,样本统计量:此处,n=10,,所以统计量根据卡方分布的可知:又因为:因此:则:查概率表:=3。
325,=19。
919,则=0。
369,=1.88。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。
2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。
推断统计:研究的是如何利用样本数据来推断总体特征。
3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的,非数字型数据。
顺序数据:只能归于某一有序类别的,非数字型数据。
数值型数据:按数字尺度测量的观察值,结果表现为数值。
按收集方法不同。
分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。
按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间收集的数据。
4、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。
参数:用来描述总体特征的概括性数字度量。
(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。
(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。
(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。
顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。
变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。
离散型变量:只能取有限个、可数值的变量。
(企业个数、产品数量)连续型变量:可以在一个或多个区间中取任何值的变量。
(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。
市场调查、人口普查等。
8、请举出应用统计学的几个领域。
社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。
第二章:1、什么是二手资料?使用二手资料需要注意些什么?什么是二手资料:已经存在的;跟研究内容有关的;别人所做的调查或研究;会被我们利用的,资料。
注意:需要进行评估:考虑原始数据收集人、收集目的、收集途径、收集时间及数据来源。
2、比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样:以一定的入样概率,按照一定的随机性原则选取样本(即样本被选中的概率已知或可计算);技术含量高、成本高。
用于描述性、解释性、推断性研究;研究目的在于掌握对象总体的数字特征,得到总体参数的置信区间。
非概率抽样:不按照入样概率和随机性原则,而按照方便、滚雪球或配额等抽样形式选取样本;技术含量低、成本低、时效快、操作简便。
用于探索性研究;研究目的在于发现问题,为更深入的数量分析提供准备。
下面题目(略)2.3 除了自填式,面访式和电话式还有什么搜集数据的办法试验式和观察式等2.4 自填式,面访式和电话式各自的长处和弱点自填式;优点:1 调查组织者管理容易2 成本低,可进行大规模调查3 对被调查者,可选择方便时间答卷,减少回答敏感问题压力。
缺点: 1 返回率低2 不适合结构复杂的问卷,调查内容有限3调查周期长4 在数据搜集过程中遇见问题不能及时调整。
面访式;优点:1 回答率高2 数据质量高3 在调查过程中遇见问题可以及时调整。
缺点:1 成本比较高2搜集数据的方式对调查过程的质量控制有一定难度3对于敏感问题,被访者会有压力。
电话式;优点:1 速度快2 对调查员比较安全3 对访问过程的控制比较容易。
缺点:1 实施地区有限2调查时间不能过长3使用的问卷要简单4 被访者不愿回答时,不易劝服。
2.6 如何控制调查中的回答误差对于理解误差,学习一定的心理学知识,记忆误差,缩短所涉及的时间范围,有意识误差,做好被调查者的心理工作,要遵守职业道德,为被调查者保密,尽量在问卷中不涉及敏感问题。
2.7 怎么减少无回答对于随机误差,要提高样本容量,对于系统误差,只有做好准备工作并做好补救措施。
比如说要一百份的问卷回复,就要做好一百二十到一百三十的问卷准备,进行面访式的时候要尽量的劝服不愿意回答的被访者,以小物品的馈赠提高回复率。
第三章:1、 数据的预处理包括哪些内容? 数据审核:从完整性和准确性方面调查原始数据(完整性:单位、个体是否遗漏;准确 性:检查错误、异常值) 数据筛选:根据需要找出符合特定条件的某类数据。
数据排序:按一定顺序将数据排列,体现数据特征或趋势。
2、 分类数据和顺序数据的整理和图示方法各有哪些? 分类数据:整理:制作频数分布表,用比例、百分比、比率进行描述性分析。
图示:条形图、帕累托图、饼图。
顺序数据::整理:制作频数分布表,用比例、百分比、比率进行描述性分析。
图示:累积频数、累计频率分布图、环形图、条形图、帕累托图、饼图。
3、 数值型数据的分组方法有哪些?简述组距分组的步骤。
分组方法:单变量分组:把每一个变量值做为一组(只适合离散型变量,变量值较少)组距分组:将全部变量值依次划分为若干区间,一个区间变量值做为一组。
( 组距分组又分为:等距分组、异距分组 )分组步骤:确定组数( 5,15);确定各组组距( 5 倍数;组距 >最大变量值 - 最小变量值);根据分组整理成频数分布表。
4、 直方图与条形图有何区别?1、 条形图用于展示分类数据;直方图用于展示数值型数据。
2、 条形图用长度表示个类别频数,宽度固定(无意义) 长度表每组频数(或频率) ,宽度为组距(有意义) 3、 条形图各矩形分开排列,直方图各矩形连续排列。
5、 绘制线图应注意哪些问题? 时间在横轴,观测值在纵轴;横轴纵轴长度比例大概为 数据与 0 距离过大的话用折断符。
6、 饼图与环形图有什么不同?饼图:只能绘制一个样本或总体各部分的比例。
条形图:可以同时绘制多个样本或总体各部分的比例。
中间有一空洞,每个样本或总体 数据表现为一个环。
7、 茎叶图与直方图相比有什么优点?他们的应用场合是什么? 茎叶图在给出数据分布情况的同时,又能给出每一个原始数据(保留了原始数据的信 息);直方图用于大批量数据,茎叶图用于小批量数据。
8、鉴别图标优劣的准则有哪些?显示数据、强调数据间的比较、有对图形的统计描述和文字描述、避免歪曲、把读者注意力集中于数据内容上、服务于一个明确的目的。
8、 制作统计表应注意哪几个问题合理安排统计表结构; 表头一般包括表号,总标题和表中数据的单位等内容; 表中的上下两条横线一般用粗线,中间的其他用细线; 在使用统计表时,必要时可在下方加注释,注明数据来源。
公式:组中值 =(上限 +下限) /2第四章:1、 一组数据的分布特征可以从哪进几个方面进行测度?可以从以下三方面进行测度:集中趋势:反映个数据向其中心值的靠拢或集中程度; 离散程度:反映各数据远离其中心值的趋势; 分布形状:数据分布的峰态和偏态;2、 怎样理解平均数在统计学中的地位?平均数在统计学中具有重要地位:是集中趋势的最主要测度,是一组数据的重心所在; 是数据误差相互;直方图用面积表示各组频数,分组数据具有连续性) 10:7;纵轴下端一般从 0 开始,抵消的结果,利用了全部数据信息,具有无偏性;只适用于数值型数据,不适用于分类或顺序数据。
3、简述四分位数的计算方法:四分位数是一组数据排序后处于25%^ 75%位置上的值。
具体计算方法是:n/4 ;3n/4 4、对于比例数据的平均为什么采用几何平均?对于比例数据采用几何平均比采用算数平均更合理。
n(1 G)n(1GJi 15、简述众数、中位数和平均数的特点和应用场合。
众数:主要用于分类数据集中趋势的度量;是一组数据的峰值;优点:不受极值的影响。
缺点:具有不唯一性;只有数据量较大时才有效果中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制;优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。
平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。
优点:利用了所有数据信息;数据误差相互抵消,具有无偏性;缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。
6、简述异众比率、四分位差、方差或标准差的应用场合。
异众比率:分类数据的离散程度测度;四分位差:顺序数据的离散程度测度;方差:数值型数据的离散程度测度7、标准分数有哪些用途?标准分数:Xi- X /s 即:(变量值减去其平均数)/标准差标准分数给出了一组数据中各数据的相对位置(其离平均数的距离用标准差衡量)用途:在对多个具有不同量纲的变量进行处理时,需要对变量进行标准化处理;检查一组数据中是否有离群值。
8、为什么要计算离散系数?离散系数=标准差/平均数原因:方差和标准差反映的是数据离散程度的绝对值:一方面,受原变量值自身水平高低的影响(与变量平均数大小有关);另一方面,与原变量值得计量单位有关,计量单位不同,离散程度也不同。
因此,为消除变量值水平高低和变量值单位对离散程度的影响,要计算离散系数。
9、测度数据分布形状的统计量有哪些?峰态系数、偏态系数。
斥民、■、、>:第六章:1、什么是统计量?为什么要引进统计量?统计量为什么不含任何未知参数?定义:设(X1,X2……Xn)是从总体X中抽取的容量为n的样本,如果由此构造一个函数T( X1,X2……Xn),不依赖于任何未知参数,则称函数T( X1,X2……Xn)是一个统计量。
为什么:为了使统计推断成为可能。
2、什么是次序统计量?设(X1,X2……Xn)是从总体X中抽取的容量为n的样本,,若样本(X1,X2……Xn)是满足如下条件的函数:每当样本得到一个观测值x1,x1 …… xn 时,其由小到大的排序中, 第i个值x(i)就作为次序统计量Xi的观测值,而X(1),X(2)……X(n)就称为次序统计量。
3、什么是充分统计量?统计加工过程中一点信息都不损失的统计量称为充分统计量。
4、什么是自由度?独立变量的个数。
5、简述三个重要分布及正态分布间的关系。
卡方分布:设X1,X2,……Xn是n个相互独立的随机变量,且Xi~N(0,1),则X=X1A2+……+Xn^2为服从以n为自由度的卡方分布。
F 分布:设X~XA2(m),YA2~XA2(n),且X,Y 相互独立,记Z=X/m/Y/n,贝U Z~F(m,n) Z 分布:设X~N(0,1),Y~XA2(n),且X,Y 相互独立,记T=X/(Y/n)A(1/2), 有T~t(n)6、什么是抽样分布?样本统计量(随机变量)的概率分布是一种理论概率分布。