统计学原理 - 1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文案大全
1某公司48名工人某年月平均生活费支出(元)如下,试根据此资料编制组距式分布数列。

并绘制直方图。

352、312、336、257、408、321、234、268、204、358、270、466、328、347、369、349、397、386、318、382、430、300、484、289、523、476、315、377、294、458、326、365、492、209、446、446、302、277、548、334、400、424、282、308、371、363、337、302
解:统计分组
(1)组数7lg 322.31log log 12
10
N 10
≈+=+=N K (2)507
204548=-==
K R d (3)确定组限
最小组的下限从最小值204向下延伸4个单位确定为200,最高组的上限从最大值548向上延伸2个单位确定为550.
(4)计算各组次数或频率形成分布数列
直方图略
2、试根据如下资料绘制茎叶图。

72、75、60、52、65、90、95、85、76、86
92、63、75、53、87、77、69、85、86、64
63、66、71、78、84、98、79、62、57、76
茎叶
5 2 3 7
6 0 2 3 3 4 5 6 9
7 1 2 5 5 6 6 7 8 9
8 4 5 5 6 6 7
9 0 2 5 8
文案大全
文案大全
3、算术平均数、中位数和众数三者之间有何关系?
(1)如果数据的分布是对称的,则众数、中位数、和均值完全相等O e M M X ==
(2)如果数据是左偏分布O e M M X << (3)如果数据是右偏分布O e M M X >>
(4)当数据分布的偏斜程度不是很大时,算术平均数到众数的距离是算术平均数到中位数距离的3倍。

即:
)(3e o M X M X -=-
4、选择题
(1)不同数列的标准差不能简单进行对比,这是因为不同数列的(A ,D )
A 平均数不同
B 标准差不同
C 个体数不同
D 计量单位不同
(2)某居民区家庭人口数的分布资料如下:
家庭人口数(人) 1 2 3 4 5 6 7 户 数(户) 10 50 80 60 30 20 10 该居民区家庭人口数的中位数是:(C)
A 130户
B 130.5户
C 3人
D 4人
文案大全
(3)变量数列中出现次数最多的值是(D)
A 算术平均数
B 调和平均数
C 中位数
D 众数 6、为了了解大学生每月生活费用支出情况,某省在全省高校中随机抽取了250名学生进行调查,调查得样本资料如下:
试计算:(1)250名学生的平均生活费用月支出额;(2)月生活费用的中位数和众数;(3)月生活费用的标准差。

解:
(1)=244
(2)中位数所在组200—250
18
.24350110
30-12520021
=⨯+=⨯-+≈-d f S N
L M m m e
(3)
文案大全
91
.24050)
90110()20110(20
110200)
()(111
0=⨯-+--+
=⨯-+--+
≈+--i
f f f f f f L M
7、某信息传呼台两名接线员5天中每天接呼次数资料如下: A 接线员 120 108 76 184 165 B 接线员 94 68 113 55 99
从日均次数的代表性和接线次数和日分布的均衡性角度作简要评价和分析。

解:
B 接线员日均次数的代表性较好
8、某投资银行的年利率按复利计算,10年的年利率分别是有一年为7%,有3年为8%,有四年为10% ,有两年为11%,试求平均年利率。

解:
%
29.109%)
111(%)110(%)108(%)107(10
2
431212
1
=⨯⨯⨯=
∑⨯⋅⋅⋅⨯⨯=F F
N F F G N
X X X X 平均年利率为9.29% 1、选择题
(1)要求估计量的数学期望等于被估计的总体指标的真值,
文案大全
称为( C )
A 一致性
B 有效性
C 无偏性
D 充分性 (2)在不放回抽样下,样本均值得方差等于( c )
A 2
σ B S 2
C 1
-- 2
N n N n σ D
22σ
(3)置信区间的长度越短,估计的精度则( a )。

A.越高
B.越低
C.与长短无关
D.无法判定
(4)若1ˆθ
和2ˆθ均为总体指标θ的无偏估计量,下列哪种情况表示1ˆθ
比2ˆθ更有效(c ) A θθθ==)
()(21ˆˆE E B Var(1ˆθ) > Var(2ˆθ) C Var(1ˆθ
) < Var(2ˆθ) D MSE(1ˆθ)< MSE(2ˆθ) 2、影响样本容量的因素有哪些?
(1)总体中个体之间的差异程度。

即总体方差)1(2
P P -或σ。

总体方差越大,所需的样本容量越大;反之,总体方差越小,所
需的样本容量越小。

(2)允许误差d 的大小。

允许误差越小,估计的精确度越高,则所需的样本容量越大;反之,允许误差越大,估计的精确度越低,则所需的样本容量越小。

(3)估计的可靠性高低。

估计的可靠性越高,所需的样本容量越大;反之,估计的可靠性越低,所需的样本容量越小。

(4)抽样方式。

在其他条件相同的情况下,采用重置抽样方式比采用不重置抽样方式所需的样本容。

文案大全
3、如果总体方差未知,在确定样本容量时,应如何? 在实践中,估计样本量时若2
σ未知,可根据以下方法来确定2
σ:第一,根据历史资料已有的方差代替;第二,在正式抽样调查之前,开展一次试验性调查,根据试验性调查所得资料加以估计;第三,如果有多次实验结果或多个历史方差,则根据最大的方差来代替总体方差计算样本量。

4、 解:
5.3=x s 2=1.457 201.0=x σ 9.31.3<<μ
5、解:
X =2.12 S= ()1
2
--∑n X X =0.2239
=X ±t 2
αn
S
因此总体均值95%的置信区间为( 1.96,2.28)
6、某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。

文案大全
35=x s=4.5
∆ =z 2
αn
S =
总体均值95%的置信区间为(34.146, 35.854)
7、 (1) 解:
S=11.3772
=X ±z 2
αn
S =76.6±2
该校学生英语测试的平均成绩的置信区间为( 73.32 , 78.87) (2)
大样本情形下总体比例P 的置信区间为:
文案大全

平均成绩在80分以上的学生所占的比重为(0.38 ,
0.58)
2.均值比较的T 检验分几种类型?
独立样本均值的T 检验和配对样本均值的T 检验
3.解: H 0:,H 1: 样本比例 检验统计量
接受原假设认为50%的消费者是中学生 4.略 5. 解:
从两种工艺条件下生产的产品中各抽取100个样本属于独立样本。

H 0: μ1=μ2 , H 1: μ1≠μ2
))
1(,)
1((2
2
n
P P Z p n
P P Z p -+--αα
文案大全
502.1-100
5
.2810028286-280)
-(-)-(2
2
2
22
1212121=+=
+=
n s n s x x Z μμ
,接受原假设,两种工艺条件下生产产品的强力无显著差异。

6. 解
已知:小样本,正态分布,方差相等,x 1=20.1 x 2=19.8 s 12=0.17 s 22=0.14。

)05.0(=α,,
H 0: μ1=μ2 , H 1: μ1≠μ2
2
)1()1(212
1
221121-+-+-=
--n n s n s n s n n =0.4282
2973.14282.06
1
818.191.201
1
2
1
2
1=⨯+-=
+
-=
s
n n x x t
对于给定的显著性水平α=0.05,查t 分布表可得t 0.025(12)=2.1788 ,由于|t |=1.2973<2.1788=t 0.025(12),所以应接受原假设。

认为甲、乙两台机器加工的产品平均直径无显著差异。

7.某企业生产三种不同口味的点心,为了分析不同性别的消费者的口味偏好,随机抽取了110名消费者进行调查,在品尝三种不同口味的点心后陈述其偏好,结果如下表所示:
文案大全
在显著性水平0.05下,检验性别是对口味的偏好是否有显著差异?
解:性别与口味不相关:0H
性别与口味相关:1H
根据公式),,2,1;,,2,1(c j r i n
n n f j
i ij ==⨯=
⋅⋅可计
算得在原假设成立的条件下的期望分布表如下:
0794.22)-(ij
2
2
==

ij
ij ij f f n χ
当显著性水平为0.05时,929.5)2(2
2=>
αχχ,检验结果表
明性别与口味相关,性别是对口味的偏好是有显著影响。

文案大全
文案大全
第六章
1.方差分析的基本原理是什么?
总偏差平方和可分解为组间方差与组内方差。

组间方差即水平间的方差,该方差既有由于水平均值不同而引起的系统性误差,又有随机误差存在。

如果H 0成立,水平间的方差就只包含随机误差,没有由于均值的不同而导致的系统性差异,此时,组间方差与组内方差均是随机误差,他们的取值就应该接近,比值应该接近于1;相反若H 0不成立,水平间的方差既包含随机误差,又有系统性误差,组间方差大于组内方差,二者的比值也显著的大于1,当大到超过某一临界值时,就可认为水平均值之间存在差异。

2.说明单因素方差分析中SST 、SSE 、SSA 的含义及三者之间的关系。

SST 总离差平方和,是全部试验的每一观察值X ij 对其总平均数X 的离差平方总和。

SST=
2
)(∑∑-X X ij
∑∑-=2)(i ij X X SSE ,为各行观察值对各该行平均数
(组平均数)的离差平方和的总和,反映的是水平内部,或组内观察值的离散状况,称其为组内平方和或组内方差,反映了由于随机误差的作用而在数据X ij 中引起的波动。

∑∑∑-=-=22)()(X X k X X SSA i i i 为组平均数对
总平均数的离差平方和,反映的是组间差异,其中既包括随机因素,也包括系统因素,称其为组间平方和或水平项离差平方和。

SSA SSE SST +=
3,4,5,6题可进行软件操作,略
第七章
1.什么是相关关系?
当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定范围内变化,变量间的这种具有不确定性的相互关系,称为相关关系。

2.相关分析与回归分析有何联系与区别?
相关分析与回归分析有着密切的联系。

相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度,只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。

可以这样说,相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。

区别:(1)相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化
(2)相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量
(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。

3.什么是总体回归函数?什么是样本回归函数?它们之间有什么联系和区别?
若用Y表示因变量,其主要受自变量X的影响,则Y和X之间的总体回归函数可表示为:
β
α+
μ
Y
=X
+
文案大全
文案大全
α和β为未知参数,也叫回归系数,μ为随机误差项。

在实际应用中,由于无法取得Y 和X 的全部数值,一般需要用样本资料来估计两变量数量关系,根据样本资料拟合的回归模型称为样本回归模型,一元线性样本回归模型可表示为:
e X Y ++=βα
ˆˆ α
ˆ和βˆ分别是总体回归系数α和β的估计值,e 为参差,是随机误差μ的估计值,是实际值与估计值之间的差额。

4.如何识别多重共线性?
在遇到下列情况之一时往往表明多重共线性存在。

(1)回归模型的F 检验通过,而有的回归系数的t 检验未通过。

(2)模型中增加或删除一个自变量,回归系数的估计值有较大的变化。

(3)回归系数估计值的符号与实际经济判断的相反。

(4)简单相关系数矩阵中,两个自变量之间的相关系数值较大。

通常,简单相关系数r>0.7时,应考虑有多重共线性存在。

5.设销售收入X 为自变量,销售成本Y 为因变量。

现已根据某百货公司12个月的有关资料计算出以下数据:(单位:万元)
88.64773.425053)(2==-∑X X X t 8.54925
.262855)(2==-∑Y Y Y t
∑=--09.334229))((Y Y X X t t
解(1)
文案大全
⎪⎩

⎨⎧==---==⨯-=-=∑∑79.073.42505309.334229)())((ˆ37.4088.64779.08.549ˆˆ2
x x y y x x x y ββ
α
销售收入每增加1元,销售成本即增加0.79元。

(2)9999.0)
()())((2
2
=----=∑∑∑y y x x y y x x r t t t t
2571
.510
25
.262855)9998.01(2
2
2
2
2
=⨯-=
-=
-=
-=
∑n SSE n e n Q S i
y
回归估计的标准误=2.2928
(3)H 0: H 1:
)10(2/ˆαβt t >拒绝原假设
(4)假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间。

文案大全
∑--++⋅-±2
202/0)
()(11)2(ˆx x x x n S n t Y i y α
4489
.573
.425053)88.647800(12112928.22281.2)()(1
1)2(2
2
2
02/=-++⨯⨯=--+
+⋅-∑x x x x n S n t i y
α因此95%的置信区间为
6.略 7.略
文案大全
3. 平均发展速度的计算有哪两种方法?各有什么特点?如何正确使用?
平均发展速度是时间数列中各期环比发展速度的平均数,表明事物在一定时期内逐期平均发展变化的程度。

平均发展速度的计算方法有几何平均法和方程法两种。

几何平均法又称为水平法。

这是因为用这种方法计算平均发展速度的出发点是要求在期初水平(0a )的基础上,按平均发展速度发展所达到的理论期末水平(n
x a 0)与同期按各年实际发展速度发展所达到的实际期末水平(n a )保持一致,即x 必须满足关系式:
n n
a x a =0
由此可见,几何平均法(即水平法)的特点是侧重于考察最末一期的发展水平,可以直接用期末水平比期初水平计算
方程法又称为累计法。

这是因为用方程法计算平均发展速度,侧重于考察时间数列各期发展水平的累计总量,用方程法平均发展速度推算出的各期理论水平之和等于各期的实际水平之和。

因此,方程法适宜于基建投资总额、植树造林总面积等侧重于观察全期累计总量指标平均发展速度的计算 。

5. 常用趋势模型有哪几种?如何正确选择使用?
a 直线趋势模型:bt a t T +=)(
文案大全
b 指数曲线趋势模型:t
ab t T =)( c 二次曲线趋势模型:2
)(ct bt a t T ++= d 修正指数曲线趋势模型:t
ab k t T +=)( e 龚珀茨曲线趋势模型:t
b ka t T =)( f 逻辑曲线趋势模型:t
ab
k t T +=
1
)( 首先,根据观察数据绘制散点图,从而发现其数量变化规律,根据图形的变化特点确定适当的趋势模型。

其次,可根据时间数列本身的变动特点,通过计算相应的指标来确定趋势模型。

对于时间数列,若其观测值的逐期增长量大致相同,可采用直线趋势模型;若其二级增长量即逐期增长量的逐期增长量大致相同,可采用二次曲线趋势模型;若其环比发展速度大致相同,可采用指数曲线趋势模型;若其对数的逐期增长量的环比发展速度大致相同,可采用龚珀茨曲线模型;若其倒数的逐期增长量的环比发展速度大致相同,可采用逻辑曲线模型。

8. 某企业9月份职工人数资料如下:
试求该企业9月份的平均职工人数。

文案大全
252
30
52268
274922742607226025092250200...)2...22(
1
2111232121=⨯++⨯++⨯++⨯+=
+++⨯+++⨯++⨯+=
---n n n
n f f f f a a f a a f a a a
9. 解:
第二季度平均商品库存额
17.59)14/()2
605565255(
=-+++=a 第二季度商品流转次数=
10.解:
平均增长量=1000/5=200 平均发展速度=
平均增长速度=6.96%
11. (2001年为原点) 2012年t=11,代入方程得2012年产值=
12.
文案大全
13.
(1)第19个月的营业额=(58.6+64.5+66.2)/3=63.1万元(2)建立趋势方程
第19个月t=19
文案大全
综合指数因素分析体系和平均数指数因素分析体系 5.解:
%180280
504
01
1==
=
∑∑q p q
p k pq 504-280=224
%25.131384
504
1
01
1==
=∑∑q p q p k p 504-384=120
%14.137280
384
01
0q ==
=
∑∑q
p q p k 384-280=104
6.解:
%24.147674400
993000
01
1==
=
∑∑q p q
p k pq
993000-674400=318600
%28.119832500
993000
1
011==
=
∑∑q p q p k p
993000-832500=160500
%44.123674400
832500
01
0q ==
=
∑∑q
p q p k
832500-674400=158100
7.解:
75000
0=∑q
p 870011=∑q p
83200
01
0==
∑∑q
p k q
p q
(1)%1167500
8700
01
1==
=
∑∑q
p q p k pq 8700-7500=1200(万元)
(2)%93.1107500
8300
00
0==
=
∑∑q
p q p k k q q 8300-7500=800(万元)
(3)%57.1048300
8700
1
011==
=
∑∑q
p q p k p 8700-8300=400(万元)
8. 解:
(1)K pq =
∑∑0
1
1q
p q p =
2250
2170
96.44% K p =∑∑1
1
11
1q
p K q p p
=
2725
2170
79.63%
q
=
∑∑0
1
0q
p q p =
2250
2725
=121.11% (2)∑11q p -∑00q p =-80 ∑11q p -∑10q p =-555
∑1
q p -∑0
q p =475
销售额报告期比基期下降3.56%,绝对额下降80元,这是因为由于销售量报告期比基期上升12.11% ,使得销售额上升元和由于价格报告期比基期下降%,而使销售额下降555元的结果。

9.解:
可变构成指数=
00
111f f X
f f X ∑∑=
33
.383346
.3838=100.13%
1
1
1
f f X
∑-
f f X
∑= 5.13
结构影响指数=
00
110f f X
f f X ∑∑=
33
.383338
.3615=94.31%
1
1
f f X
∑-
f f X
∑=-217.95
固定结构指数=
10
111f f X
f f X ∑∑=
38
.361546
.3838=106.17%
1
1
1
f f X
∑-
1
1
f f X ∑=223.08
10.解:
可变构成指数=
00
111f f X
f f X ∑∑=
39
.5118
.48=93.76% 1
1
1
f f X
∑-
f f X
∑= -3.21(元/件)
结构影响指数=
00
110f f X
f f X ∑∑=
39
.5127
.52=101.72% 1
1
f f X
∑-
f f X
∑=0.88
固定结构指数=
10
111f f X
f f X ∑∑=
27
.5218
.48=92.18% 1
1
1
f f X
∑-
1
1
f f X ∑=-4.09。

相关文档
最新文档