天津大学、应用统计学离线作业及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计学
要求:
1.独立完成,作答时要写明所选题型、题号
2.题目要用A4大小纸张,手写作答后将每页纸张拍照或扫描为图片形式
3.提交方式:请以图片形式打包压缩上传,请确保上传的图片正向显示
4.上传文件命名为“中心-学号-姓名-科目.rar”
5.文件容量大小:不得超过10MB。
一、计算题(请在以下题目中任选2题作答,每题25分,共50分)
1、下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。
总评分月薪/美元总评分月薪/美元
2.62800
3.23000
3.43100 3.53400
3.63500 2.93100
2、某一汽车装配操作线完成时间的计划均值为2.2分钟。
由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持2.2分钟的标准是很重要的。
一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。
在0.05的显著性水平下检验操作线是否达到了
2.2分钟的标准。
96 .1
2
=
α
μ
3、设总体X的概率密度函数为
2
(ln)
2,0
(,)2x
0,0
x
x
f x
x
μ
μπ
-
-
⎧
>
=
≤
⎩
其中μ为未知参数,n X
X
X,...,
,
2
1是来自X的样本。
(1)试求1
3
)
(+
=μ
μ
g的极大似然估计量)
(gˆμ;(2)试验证)
(gˆμ是)
(μ
g的无偏估计量。
4、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。
若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要?
5、根据下表中Y与X两个变量的样本数据,建立Y与X的一元线性回归方程。
Y ij
f X 5101520
y
f
1200081018 140343010
f
34111028
x
6、假定某化工原料在处理前和处理后取样得到的含脂率如下表:
处理前0.1400.1380.1430.1420.1440.137
处理后0.1350.1400.1420.1360.1380.140
假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。
7、某茶叶制造商声称其生产的一种包装茶叶平均每包重量不低于150克,已知茶叶包装重量服从正态分布,现从一批包装茶叶中随机抽取100包,检验结果如下:
每包重量(克)包数(包)f x xf
x-(x-)2f
148—14910148.51485-1.832.4
149—15020149.52990-0.812.8 150—15150150.575250.2 2.0 151—15220151.53030 1.228.8
合计100--15030--76.0
要求:(1)计算该样本每包重量的均值和标准差;
(2)以99%的概率估计该批茶叶平均每包重量的置信区间(t
0.005
(99)≈2.626);
(3)在ɑ=0.01的显著性水平上检验该制造商的说法是否可信(t
0.01
(99)≈2.364)(4)以95%的概率对这批包装茶叶达到包重150克的比例作出区间估计
(Z
0.025
=1.96);
(写出公式、计算过程,标准差及置信上、下保留3位小数)
8、一种新型减肥方法自称其参加者在第一个星期平均能减去至少8磅体重.由40名使用了该种方法的个人组成一个随机样本,其减去的体重的样本均值为7磅,
样本标准差为3.2磅.你对该减肥方法的结论是什么?(α=0.05,μ
α/2=1.96, μ
α
=1.647)
9、某地区社会商品零售额资料如下:
年份零售额(亿
元)y
t t2ty t t2ty
199821.51121.5-525-107.5 199922.02444-39-66 200022.53967.5-11-22.5 200123.0416921123 200224.05251203972 200325.0636150525125合计138.0219149507024
要求:1)用最小平方法配合直线趋势方程:
2)预测2005年社会商品零售额。
(a,b及零售额均保留三位小数,
10、某商业企业商品销售额1月、2月、3月分别为216,156,180.4万元,月初职工人数1月、2月、3月、4月分别为80,80,76,88人,试计算该企业1月、2月、3月各月平均每人商品销售额和第一季度平均每月人均销售额。
(写出计算过程,结果精确到0.0001万元\人)
二、简答题(请在以下题目中任选2题作答,每题25分,共50分)
1.区间估计与点估计的结果有何不同?
答:点估计是使用估计量的单一值作为总体参数的估计值;区间估计是指定估计量的一个取值范围都为总体参数的估计。
2.解释抽样推断的含义。
答:简单说,就是用样本中的信息来推断总体的信息。
总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。
3.统计调查的方法有那几种?
答:三种主要调查方式:普查,抽样调查,统计报表。
实际中有时也用到重点调查和典型调查。
4.时期数列与时点数列有哪些不同的特点?
5.为什么要计算离散系数?
答:离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。
对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。
为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
离散系数的作用主要是用于比较不同总体或样本数据的离散程度。
离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
6.简述普查和抽样调查的特点。
答:普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点:(1)普查通常具有周期性。
(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。
(3)普查的数据一般比较准确,规划程度也较高。
(4)普查的使用范围比较窄。
抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。
它具有以下几个特点:(1)经济性。
这是抽样调查最显著的一个特点。
(2)时效性强。
抽样调查可以迅速、及时
地获得所需要的信息。
(3)适应面广。
它适用于对各个领域、各种问题的调查。
(4)准确性高。
7.简述算术平均数、几何平均数、调和平均数的适用范围。
答:几何平均数主要适用于比率的平均。
一般地说,如果待平均的变量x与另外两个变量f和m 有fx=m 的关系时,若取f为权数,应当采用算术平均方法;若取m 为权数,应当采用调和平均方法。
8.假设检验的基本依据是什么?
根据所获得的样本,运用统计分析方法对总体的某种假设作出拒绝或接受的判断。
大数定理和实际推断原理:小概率事件在一次抽样中是不可能发生的。
9.表示数据分散程度的特征数有那几种?
答:全距(又称极差),方差和标准差,交替标志的平均数和标准差,变异系数,标准分数。
10.回归分析与相关分析的区别是什么?
答:1、在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y 处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的;
2、相关分析中,x与y都是随机变量,而在回归分析中,y是随机变量,x可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定x是非随机的;
3、相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由回归方程进行数量上的预测和控制。
11.在统计假设检验中,如果轻易拒绝了原假设会造成严重后果时,应取显著性
水平较大还是较小,为什么?
答:取显著性水平较小,因为如果轻易拒绝了原假设会造成严重后果,那就说明在统计假设检验中,拒绝原假设的概率要小,而假设检验中拒绝原假设的概率正是事先选定的显著性水平α
12.加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没
变,则总平均数的变动情况可能会怎样?请说明原因。
13.解释相关关系的含义,说明相关关系的特点。
答:变量之间存在的不确定的数量关系为相关关系。
相关关系的特点:一个
变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。
通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。
14.为什么对总体均值进行估计时,样本容量越大,估计越精确?
答:因为总体是所要认识的研究对象的全体,它是具有某种共同性质或特征的许多单位的集合体.总体的单位数通常用N来表示,N总是很大的数.样本是总体的一部分,它是从总体中随机抽取出来、代表总体的那部分单位的集合体.样本的单位数称为样本容量,通常用n表示。
样本容量n越大,就越接近总体单位数N,样本均值就越接近总体均值,对总体均值进行估计时,估计越精确。