统计学(第五版)课后答案
统计学第五版贾俊平版课后答案
![统计学第五版贾俊平版课后答案](https://img.taocdn.com/s3/m/ca5c3b1b5f0e7cd18425365c.png)
统计学第五版贾俊平版课后题答案(部分)第7章抽样与参数估计7.1(1)已知: EMBED Equation.3 , EMBED Equation.3 , EMBED Equation.3。
, EMBED Equation.3 , EMBED Equation.3样本均值的抽样标准差 EMBED Equation.3。
(2)估计误差 EMBED Equation.3。
7.2(1)已知: EMBED Equation.3 , EMBED Equation.3 , EMBED Equation.3。
, EMBED Equation.3 , EMBED Equation.3。
样本均值的抽样标准差 EMBED Equation.3。
(2)估计误差 EMBED Equation.3(3)由于总体标准差已知,所以总体均值 EMBED Equation.3 的95%的置信区间为:,即(115.8,124.2)。
EMBED Equation.37.3已知: EMBED Equation.3 , EMBED Equation.3 , EMBED Equation.3。
, EMBED Equation.3 , EMBED Equation.3由于总体标准差已知,所以总体均值 EMBED Equation.3 的95%的置信区间为:,即(87818.856,121301.144)。
EMBED Equation.37.4(1)已知: EMBED Equation.3 , EMBED Equation.3 , EMBED Equation.3。
, EMBED Equation.3 , EMBED Equation.3由于 EMBED Equation.3 为大样本,所以总体均值 EMBED Equation.3 的90%的置信区间为:,即(79.026,82.974)。
EMBED Equation.3。
(2)已知: EMBED Equation.3 , EMBED Equation.3由于 EMBED Equation.3 为大样本,所以总体均值 EMBED Equation.3 的95%的置信区间为:,即(78.648,83.352)。
统计学(第五版)课后答案
![统计学(第五版)课后答案](https://img.taocdn.com/s3/m/6832bd0d9b89680202d82593.png)
Std. Deviation
4.169
Percentiles
25
6.25
50
10.00
75
12.50
4.2随机抽取25个网络用户,得到他们的年龄数据如下:
19
15
29
25
24
23
21
38
22
18
30
20
19
19
16
23
27
22
34
24
41
20
31
17
23
要求;(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
再求样本标准差: =√84/7 = 3.4641
于是,μ的置信水平为1-α的置信区间是 ,
已知1-α=25,n = 8,则α=0.05,α/2=0.025,查自由度为n-1 = 7的 分布表得临界值 2.45
所以,置信区间为:10±2.45×3.4641÷√7
7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得
解:H0:μ≥700;H1:μ<700已知: =680 =60
由于n=36>30,大样本,因此检验统计量: = =-2
当α=0.05,查表得 =1.645。因为z<- ,故拒绝原假设,接受备择假设,说明这批产品不合格。
8.3某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产?
= =(100.89,101.91)
(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。
统计学第五版课后习题答案(完整版)
![统计学第五版课后习题答案(完整版)](https://img.taocdn.com/s3/m/645265976529647d27285273.png)
统计学(第五版)课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学第五版课后答案(贾俊平)之欧阳德创编
![统计学第五版课后答案(贾俊平)之欧阳德创编](https://img.taocdn.com/s3/m/dc4669abf46527d3250ce08c.png)
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2 随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)4.3 某银行为缩短顾客到银行办理业务等待的时间。
统计学第五版课后题答案李金昌
![统计学第五版课后题答案李金昌](https://img.taocdn.com/s3/m/a75abd01ae45b307e87101f69e3143323968f502.png)
统计学第五版课后题答案李金昌第1章绪论 1 .试述数据、数据库、数据库系统、数据库管理系统的概念。
答:( l )数据( Data ) :叙述事物的符号记录称作数据。
数据的种类存有数字、文字、图形、图像、声音、正文等。
数据与其语义就是不可分的。
解析在现代计算机系统中数据的概念就是广义的。
早期的计算机系统主要用作科学计算,处置的数据就是整数、实数、浮点数等传统数学中的数据。
现代计算机能够存储和处置的对象十分广为,则表示这些对象的数据也越来越繁杂。
数据与其语义就是不可分的。
500 这个数字可以表示一件物品的价格是 500 元,也可以表示一个学术会议参加的人数有 500 人,还可以表示一袋奶粉重 500 克。
( 2 )数据库( DataBase ,缩写 DB ) :数据库就是长期储存在计算机内的、存有非政府的、可以共享资源的数据子集。
数据库中的数据按一定的数据模型非政府、叙述和储存,具备较小的冗余度、较低的数据独立性和易扩展性,并可向各种用户共享资源。
( 3 )数据库系统( DataBas 。
Sytem ,缩写 DBS ) :数据库系统就是所指在计算机系统中导入数据库后的系统形成,通常由数据库、数据库管理系统(及其开发工具)、应用领域系统、数据库管理员形成。
解析数据库系统和数据库就是两个概念。
数据库系统就是一个人一机系统,数据库就是数据库系统的一个组成部分。
但是在日常工作中人们常常把数据库系统缩写为数据库。
期望读者能从人们讲话或文章的上下文中区分“数据库系统”和“数据库”,不要引发混为一谈。
( 4 )数据库管理系统( DataBase Management sytem ,简称 DBMs ) :数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。
DBMS 的主要功能包含数据定义功能、数据压低功能、数据库的运转管理功能、数据库的创建和保护功能。
解析 DBMS 就是一个大型的繁杂的软件系统,就是计算机中的基础软件。
统计学(第五版)课后答案
![统计学(第五版)课后答案](https://img.taocdn.com/s3/m/b728fe25a45177232f60a255.png)
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics汽车销售数量N Valid 10Missing 0 Mean 9.60 Median 10.00 Mode 10 Std. Deviation 4.169 Percentiles 25 6.2550 10.0075 12.504.2 随机抽取25个网络用户,得到他们的年龄数据如下:19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K=+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄(Binned)分组后的均值与方差:分组后的直方图:4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:要求:(1)计算120家企业利润额的平均数和标准差。
统计学贾俊平-课后思考题和练习题答案
![统计学贾俊平-课后思考题和练习题答案](https://img.taocdn.com/s3/m/7b6d299433d4b14e84246829.png)
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
解释分类数据,顺序数据和数值型数据答案同举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学第五版课后练答案
![统计学第五版课后练答案](https://img.taocdn.com/s3/m/f3a730b777232f60dccca1b0.png)
统计学第五版课后练答案(7-8章)(总11页)-本页仅作为预览文档封面,使用时请删除本页-第七章 参数估计(1)x σ==(2)2x z α∆= 1.96=某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x σ==(2)在95%的置信水平下,求估计误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×=(3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:22x z x z αα⎛-+ ⎝=()120 4.2,120 4.2-+=(,)22x z x z αα⎛-+ ⎝=104560±=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝= (1)构建μ的90%的置信区间。
2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(,)(2)构建μ的95%的置信区间。
2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(,) (3)构建μ的99%的置信区间。
2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(,)(1)2x z α±=25 1.96±=(,) (2)2x z α±=119.6 2.326±=(,)(3)2x z α±=3.419 1.645±=(,)(1)2x z α±=8900 1.96±=(,)(2)2x z α±=8900 1.96±=(,)(3)2x z α±=8900 1.645±=(,) (4)2x z α±=8900 2.58±=(,)某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36解:(1)样本均值x =,样本标准差s=1α-=,t=2z α=0.05z =,2x z α±=3.32 1.645±=(,)1α-=,t=2z α=0.025z =,2x zα±3.32 1.96±=(,)1α-=,t=2z α=0.005z =,2x z α±3.32 2.76±(,)x t α±=10 2.365±某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
统计学第五版课后答案(贾俊平)之欧阳法创编
![统计学第五版课后答案(贾俊平)之欧阳法创编](https://img.taocdn.com/s3/m/4e9eaa1858f5f61fb6366656.png)
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5 3、分组频数表网络用户的年龄 (Binned)4.3 某银行为缩短顾客到银行办理业务等待的时间。
统计学第五版课后答案(贾俊平)之欧阳术创编
![统计学第五版课后答案(贾俊平)之欧阳术创编](https://img.taocdn.com/s3/m/0991ee68d0d233d4b14e69e0.png)
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2 随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
统计学第五版(贾俊平)课后习题答案
![统计学第五版(贾俊平)课后习题答案](https://img.taocdn.com/s3/m/6be5980a5a8102d276a22fb9.png)
300~ 350 400
30 -13520652.3 1036628411.8
400~ 450 42 500
533326.9 12442517.1
500~ 550 600
18
33765928.7 4164351991.6
600以上 650 11 122527587.627364086138.8 合计 — 120 38534964.451087441648.4
7.8已知:总体服从正态分布,但未知,为小样本,,。 根据样本数据计算得:,。 总体均值的95%的置信区间为: ,即(7.11,12.89)。
7.9已知:总体服从正态分布,但未知,为小样本,,。 根据样本数据计算得:,。 从家里到单位平均距离的95%的置信区间为: ,即(7.18,11.57)。
7.10(1)已知: ,,,。 由于为大样本,所以零件平均长度的95%的置信区间为: ,即(148.87,150.13)。 (2)在上面的估计中,使用了统计中的中心极限定理。该定理表明: 从均值为、方差为的总体中,抽取容量为的随机样本,当充分大时(通 常要求),样本均值的抽样分布近似服从均值为、方差为的正态分布。
7.13已知:总体服从正态分布,但未知,为小样本,,。 根据样本数据计算得:,。 网络公司员工平均每周加班时间的90%的置信区间为: ,即(10.36,16.76)。
7.14(1)已知:,,,。 总体总比例的99%的置信区间为: ,即(0.32,0.70); (2)已知:,,,。 总体总比例的95%的置信区间为: ,即(0.78,0.86); (3)已知:,,,。 总体总比例的90%的置信区间为: ,即(0.46,0.50)。
500~600 550 18 9900
600以上 650 11 7150
大学统计学第五版习题答案
![大学统计学第五版习题答案](https://img.taocdn.com/s3/m/c0d0675ea200a6c30c22590102020740be1ecdaa.png)
大学统计学第五版习题答案大学统计学第五版习题答案统计学作为一门重要的学科,对于各个领域的研究和实践都具有重要的意义。
在大学学习统计学时,习题是巩固知识、提高能力的重要途径。
大学统计学第五版是一本经典的教材,其中的习题涵盖了各个知识点,对于学生来说是一次很好的训练机会。
下面将给出一些大学统计学第五版习题的答案,希望对学生们的学习有所帮助。
第一章:统计学导论1. 样本容量的确定答案:样本容量的确定需要考虑到以下几个因素:总体大小、总体方差、置信水平和允许的误差范围。
一般来说,总体大小越大,样本容量越小;总体方差越大,样本容量越大;置信水平越高,样本容量越大;允许的误差范围越小,样本容量越大。
第二章:统计学数据的描述1. 描述性统计的应用答案:描述性统计是对数据进行整理、总结和分析的方法。
它可以帮助我们了解数据的特征、趋势和分布情况。
在实际应用中,描述性统计可以用于制定市场调研报告、分析销售数据、评估产品质量等方面。
第三章:概率1. 概率的计算答案:概率的计算可以通过频率法和几何法来进行。
频率法是通过实验或观察来估计事件发生的可能性,即事件发生的次数除以总次数。
几何法是通过对样本空间和事件发生的区域进行几何分析来计算概率。
第四章:离散型随机变量和概率分布1. 二项分布的应用答案:二项分布是离散型随机变量的一种常见分布。
它适用于只有两个可能结果的实验,如抛硬币、生男生女等。
在实际应用中,二项分布可以用于预测产品合格率、判断市场需求等方面。
第五章:连续型随机变量和概率分布1. 正态分布的性质答案:正态分布是连续型随机变量的一种常见分布。
它具有对称性、钟形曲线和均值和标准差唯一确定等性质。
正态分布在实际应用中非常广泛,例如用于身高体重的统计、质量控制等方面。
第六章:抽样分布和点估计1. 置信区间的计算答案:置信区间是用于估计总体参数的范围。
计算置信区间时需要考虑样本容量、样本均值、样本标准差和置信水平等因素。
统计学第五版课后答案(贾俊平)之欧阳术创编
![统计学第五版课后答案(贾俊平)之欧阳术创编](https://img.taocdn.com/s3/m/fcc65ec2192e45361166f5c7.png)
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:StatisticsMissing0Mean9.60Median10.00Mode10Std. Deviation 4.169Percentiles25 6.255010.007512.504.2 随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 最小值)÷ 组数=(4115)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
统计学第五版第八章课后习题答案
![统计学第五版第八章课后习题答案](https://img.taocdn.com/s3/m/a9905c79f46527d3240ce08c.png)
H 0:p1 - p2 0
α = 0.05 n1 = n2 =11000 p1=0.95%, p2=1.72% 临界值(s): Z =1.645 Z=-0.77%/0.001466=-4.98<-1.645 决策:在 α = 0.05的水平上拒绝 H 0 。 结论: 服用阿司匹林可以降低心脏病发生率。
Z 1.645
8.12 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款 数额不能超过60万元。随着经济的发展,贷款规模有增大的趋势。 银行经理想了解在同样项目条件 下,贷款的平均规模是否明显地超 过60万元,还是维持着原来的水平。 一个n=144的随机样本被抽出,测得 x=68.1万元,s=45。用 α =0.01的显著性水平,采用p值进行检验。 解: H 0 : μ ≤60 H 1 : μ >60 α = 0.01,n = 144, x =68.1,s=45 临界值(s):1% 检验统计量: Z
甲法:31 34 29 32 35 38 34 30 29 32 31 26 乙法:26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时 间有无显著差别(α =0.05)? 解: 正态总体,小样本,σ²未知但相同,独立样本t检验 H 0 : 甲 -乙 = 0 H1 : 甲 - 乙 ≠ 0
H1 : p1 - p2 0
8.14 某工厂制造螺栓,规定螺栓口径为7.0cm,方差为0.03cm。 今从一批螺栓中抽取80个测量其口径,得平均值为6.97cm,方差 为0.0375cm。假定螺栓口径为正态分布,问这批螺栓是否达到规 定的要求 (a=0.05)?
1.样本均值的检验 α = 0.05 , n = 80 临界值(s): Z 1.96 2 在-1.96~1.96之间接受;否则拒绝。 检验统计量: Z=(6.97-7)/(0.173/8.94)= -1.55∈(-1.96,1.96) 决策:在 α = 0.05的水平上接受 H 0 。 结论: 这批螺栓口径均值达到规定的要求。
袁卫 曾五一 贾俊平统计学第五版课后习题 答案
![袁卫 曾五一 贾俊平统计学第五版课后习题 答案](https://img.taocdn.com/s3/m/b133341dfad6195f312ba6c3.png)
各章练习题答案第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1)茎叶图如下:(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.8 箱线图如下:(特征请读者自己分析)2.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
统计学教材(贾俊平版)课后习题详细答案
![统计学教材(贾俊平版)课后习题详细答案](https://img.taocdn.com/s3/m/be7d6f2983c4bb4cf7ecd1eb.png)
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学第五版第三章课后习题答案
![统计学第五版第三章课后习题答案](https://img.taocdn.com/s3/m/9ecc4b5e580216fc700afdb7.png)
3.5(1)
11
3.5(2)
12
3.5(3)
灯泡使用寿命大 都在690-700小 时,占所有测试 灯泡的26%, 18%在700-710 小时,在680730小时内的灯 泡占所有灯泡的 81%。
13
681-729
3.5(4) 茎叶图:
的映中茎 更的区叶 为状域图 直况为反 观比 映 详频 了 细数 灯 。分 泡
布小使 直时用 方内寿 图,命 反所的 映反集
14
3.6 (1)频数分布表:
15
(2)频数分布直方图:
(3)袋装食品每 袋重量大多分布在 45-55之间,其中 在45-50内的数量 最多,占37%,在 50-55内的食品占 34%,55-60的占 18%,40-45的占 8%,分布在60-65 内的所占比例最小, 占3%。
30
3.14 (1)国内生产总值线图:
31
(2)第一、二、三产业国内生产总值线图:
32
(3)2004年的国内生产总值及其构成数据 饼图:
我国国内生产总值从 1995年到2004年逐年 递增,其中第二产业增 速较快,其次是第三产 业,第一产业增速最慢。 我国2004年国内生产 总值第二产业所占比重 最大,达到53%,第 三产业其次,占32%; 第一产业所占比重最小, 只有15%。
33
3.15 箱线图:
34
如图所示:这几个城市中,相对湿度最低的 为长春,在40以下;相对湿度最高的为广 州,在85以上。平均相对湿度最高的为广 州,达到80以上;最低的为兰州,只有50。 平均相对湿度在60以下的城市有北京、长 春和兰州;在60到70之间的有郑州和西安; 平均相对湿度在70以上的城市有南京、武 汉、广州、成都和昆明。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics汽车销售数量N Valid10Missing0MeanMedianMode10Std. DeviationPercentiles2550754.2 随机抽取25个网络用户,得到他们的年龄数据如下:1915292524 2321382218 3020191916 23272234244120311723要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+×2=。
(3)计算平均数和标准差; Mean=;Std. Deviation=(4)计算偏态系数和峰态系数: Skewness=;Kurtosis=(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:()lg25lg() 1.398111 5.64lg(2)lg20.30103nK=+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷组数=(41-15)÷6=,取53、分组频数表网络用户的年龄 (Binned)分组后的均值与方差:分组后的直方图:4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:要求:(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:Statistics企业利润组中值Mi(万元)N Valid120Missing0 MeanStd. DeviationSkewnessStd. Error of Skewness KurtosisStd. Error of Kurtosis4.9 一家公司在招收职员时,首先要通过两项能力测试。
在A 项测试中,其平均分数是100分,标准差是15分;在B 项测试中,其平均分数是400分,标准差是50分。
一位应试者在A 项测试中得了115分,在B 项测试中得了425分。
与平均分数相比,该应试者哪一项测试更为理想解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
Z A =x x s -=11510015-=1;Z B =x x s -=42540050-= 因此,A 项测试结果理想。
4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量为什么均值不相等,用离散系数衡量身高差异。
(2)比较分析哪一组的身高差异大 成年组 幼儿组平均 平均 标准差 标准差离散系数 离散系数幼儿组的身高差异大。
从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差σ=86414,构建总体均值μ的95%的置信区间。
解: 已知n =100,x =104560,σ = 85414,1-=95% ,由于是正态总体,且总体标准差已知。
总体均值在1-置信水平下的置信区间为 104560 ± ×85414÷√100= 104560 ±从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫ ⎪⎝⎭置信区间为:22x z x z n n αα⎛-+ ⎝,n 100 (1)构建μ的90%的置信区间。
2z α=0.05z =,置信区间为:(×,81+×)=(,)(2)构建μ的95%的置信区间。
2z α=0.025z =,置信区间为:(×,81+×)=(,)(3)构建μ的99%的置信区间。
2z α=0.005z =,置信区间为:(×,81+×)=(,) 利用下面的信息,构建总体均值的置信区间(1)x =25,σ=,n=60,置信水平为95% (2)x =,s=,n=75,置信水平为95%(3)x =,s=,n=32,置信水平为90%解:∵∴ 1) 1-=95% ,其置信区间为:25±×÷√60= 25± 2) 1-=98% ,则=, /2=, 1-/2=,查标准正态分布表,可知: 其置信区间为: ±×÷√75= ±3) 1-=90%, 其置信区间为: ±×÷√32= ±某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据求该校大学生平均上网时间的置信区间,置信水平分别为95%。
解:(1)样本均值x =,样本标准差s=; (2)抽样平均误差: 重复抽样:x σ=n n ≈=6= 不重复抽样:x σ=1N n N n -⋅-1N n N n -≈⋅-=7500367500136-⋅- =×0.995=×=(3)置信水平下的概率度:1α-=,t=2z α=0.025z =(4)边际误差(极限误差):2x x x t z ασσ∆=⋅=⋅ 1α-=,2x x x t z ασσ∆=⋅=⋅=0.025x z σ⋅重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=×=不重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=×=(5)置信区间: 1α-=,重复抽样:(),x x x x -∆+∆=()3.320.525,3.320.525-+=(,)不重复抽样:(),x x x x -∆+∆=()3.320.441,3.320.441-+=(,)从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10、8、12、15、6、13、5、11.,求总体均值μ的95%的置信区间解:本题为一个小样本正态分布,σ未知。
先求样本均值:= 80÷8=10再求样本标准差:= √84/7 =于是 ,μ的置信水平为1-α的置信区间是,已知1-α=25,n = 8,则α=,α/2=,查自由度为n-1 = 7的分布表得临界值所以,置信区间为: 10±×÷√77.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。
现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(g)包数96~98 98~100 100~102 102~104 104~1062 3 34 7 4合计50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的95%的置信区间。
解:大样本,总体方差未知,用z 统计量x z =()0,1N 样本均值=,样本标准差s=置信区间:22x z x z αα⎛-+ ⎝ 1α-=,2z α=0.025z =2x z x z αα⎛-+ ⎝=101.4 1.96 1.96⎛-+ ⎝=(,) (2)如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。
解:总体比率的估计大样本,总体方差未知,用z 统计量z =()0,1N 样本比率=(50-5)/50=置信区间:22p z p z αα⎛ -+ ⎝ 1α-=,2z α=0.025z =22p z p z αα⎛ -+ ⎝=0.9 1.96 1.96⎛ -+ ⎝ =(,) 某小区共有居民500户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间(2)若小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调查解:1)已知N=50,P=32/50=,α=,α/2 = ,则置信区间:P±√{P(1-P)/N}= ±√×50= ±×=±2)已知丌= , E = , α=,α/2 = ,则N= ²丌(1-丌)/E²= ²××÷²≈62已知某炼铁厂的含碳量服从正态分布N(,²),现在测定了9炉铁水,其平均含碳量为,如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为解:已知μ0=,σ²=²,N=9,=,这里采用双侧检验,小样本,σ已知,使用Z统计。
假定现在生产的铁水平均含碳量与以前无显著差异。
则,H0 :μ = ; H1 :μ≠α=,α/2 = ,查表得临界值为计算检验统计量: =决策:∵Z值落入接受域,∴在=的显著性水平上接受H0。
结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为。
8.2 一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。
解:H0:μ≥700;H1:μ<700 已知:x=680 σ=60由于n=36>30,大样本,因此检验统计量:xz==-2当α=,查表得zα=。
因为z<-zα,故拒绝原假设,接受备择假设,说明这批产品不合格。
某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270公斤。
这种化肥是否使小麦明显增产解:已知μ0 =250,σ = 30,N=25,x =270 这里是小样本分布,σ已知,用Z 统计量。
右侧检验,α =,则Zα=提出假设:假定这种化肥没使小麦明显增产。
即 H0:μ≤250 H1: μ>250计算统计量: Z = (x-μ0)/(σ/√N)= (270-250)/(30/√25)= 结论:Z统计量落入拒绝域,在α =的显著性水平上,拒绝H0,接受H1。
决策:有证据表明,这种化肥可以使小麦明显增产。
10..1从3个总体中各抽取容量不同的样本数据,结果如下。