统计学总复习资料
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
即全体职工考试成绩区间范围在73.66—80.3分之间。
(3)重复抽样条件下,若其它条件不 变,将允许误差范围缩小一半,应抽取 的职工数为:
n
t 2 2
2 x
22 10.542 (3.34)2
159
2
(重复抽样条件下抽样单位数的计算)
例2 某企业共有职工1000人。企业准备 实行一项改革,在职工中征求意见,采取不 重复抽样方法随机抽取200人作为样本,调 查的结果显示,有150人表示赞成该项改革, 有50人反对。试以95%(t=1.96)的置信 水平确定赞成改革的人数比例的置信区间。
159 .2元
例4 2008年某月份甲、乙两农贸市场某农产品价格及 成交量、成交额的资料如下:
品种
甲 乙 丙 合计
价格 (元/公斤)
1.2 1.4
1.5 -
甲市场成交额 (万元)
1.2 2.8 1.5
5.5
乙市场成交量 (万公斤)
2 1 1
4
请计算说明该农产品哪一个市场的平均价格比较高。
答案
学生人数 (人)
4
各组学生人数 占总人数比重(%)
10.0
60---70
6
15.0
70---80
12
来自百度文库
30.0
80---90
15
37.5
90---100
3
合计
40
7.5 100.0
(2)分组标志为“成绩”,其类型是数量标志。 分组方法是变量分组中的组距分组,而且是开口式分组。 该班学生的考试成绩的分布呈两头小,中间大的“正态分 布”形态。
该企业职工中赞成改革的人数比例的置信区间 上限为: p p 75% 5.37% 80.37%
下限为: p p 75% 5.37% 69.63%
即以95%的的置信水平确定赞成改革的人数比例在 69.63%-80.37%之间
第六章 相关与回归分析(13﹪)
1、相关分析的基本内容(步骤)。 2、相关系数的计算及相关程度的判断。 3、相关分析与回归分析的联系与区别。 4、计算题考核类型介绍。
f
40
(x x)2 f 4440 10.54(分)
f
40
x
n
10.54 1.67 40
x t x 2 1.67 3.34
全体职工考试成绩区间范围是:
下限= x x 77 3.34 73.66(分)
上限= x x 77 3.34 80.(3 分)
甲市场平均价格
H
m
m x
1.2 1.2
5.5 2.8 1.4
1.5 1.5
1.375元
乙市场平均价格x
x f f
1.2 2 1.411.51 1.325元 4
显然甲市场的平均价格要高于乙市场
例5:有两个班参加统计学考试,甲班的平均分数81 分,标准差9.9分,乙班的考试成绩资料如下:
2985
要求确定: 1.第四组上限 2.第二组下限 3.第六组的次数 4.第五组的频率5.第三组的组距 6.两个开口组的组中值 7.数据8000元应属于哪一组?
第三章 数据分布特征的测定(17﹪)
1、平均指标的特点和作用。 2、应用平均指标应注意的问题。 3、强度相对数与算术平均数的异同。 4、变异指标的作用及变异系数的应用条件。 5、标志变异指标与平均指标的关系。
《统计学》总复习题
第一章 统计总论(9﹪)
1、统计学的研究对象及特点。 2、“统计”一词的涵义及其相互关系 3、统计总体与总体单位的辨别与区分。 4、时期指标和时点指标的不同特点。 5、指标与标志的区别与联系。 6、四种“量”的尺度的使用。
7、计算题考核类型介绍。
例 某企业计划规定2008年的劳动生产率要比2007年提 高4%,某种产品成本比 2007年降低5%,实际执行结果是劳 动生产率提高了5%,产品成本降低了6%, 求计划完成程度 相对指标。
例1 某企业2000年上半年产量(千件)与单位成本 (元/件)资料如下:
月份 1 2 3 4 5 6
产量(千件) 2 3 4 3 4 5
单位成本(元/件) 73 72 71 73 69 68
要求: (1)建立直线回归方程(单位成本为自变量x),并 指出产量每增加1000件时,单位成本下降多少? (2)当产量为6,000件时,单位成本为多少?
f
因为甲班学生平均成绩为81分,平均成绩不同,不 能直接用标准差来衡量它们平均数代表性的高低,而 要计算其变异系数(标准差系数),通过变异系数大 小来说明其平均数代表性的大小。
2、甲乙两班的标准差系数分别为:
v甲 x
v乙
x
解:已知n=200, N=1000, t=1.96
根据抽样结果计算的赞成改革的人数比例为:p 150 75%
根据公式:
200
p
p(1 p) (1 n )
n
N
75% (1 75%) (1 200 )
200
1000
=0.0274=2.74%
△p= t×x =1.96×0.0274=0.0537=5.37%
第二章 统计数据的搜集与整理(13﹪)
1、典型调查、重点调查和抽样调查的异同。 2、一个完整的统计调查方案包含的主要内容。 3、统计整理的概念及作用。 4、统计分组及其作用。 5、分配数列的概念及构成要素。 6、变量分配数列的编制方法与步骤。
计算题考核类型介绍。
计算题类型
按成绩分组(分) 60以下 60-70 70-80 80-90 90-100 合计
学生人数(人) 4 10 20 14 2 50
要求:(1)计算乙班的平均分数和标准差; (2)比较哪个班的平均分数更有代表性。
1、乙班学生平均成绩、标准差分别为:
x
xf f
x
x
f
=9.80
合计
426
5000 21000
4624 30268
340000 1481000
= n xy x y 6 1481000 426 21000
b= n x2 ( x)2
6 30268 4262
= 8886000 8946000 181608 181476
=-454.5
68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87
要求:
(1)根据资料按成绩分成 5组: 60分以
下,60-70分,70-80分,80-90分,90- 100分,并根据分组整理成变量分配数列;
例2 某地2005年农村家庭户平均收入情况如下表:
按户年平均收入水平分组(元)
3000以下 3000-4000 4000-5000 5000-6000 6000-7000 7000-8000 8000-9000 9000以上
合计
户数(户)
100 250 340 470 850 630 215 130
要求: (1)将该班学生分为不及格、及格、中、良、
优五组,编制一张次数分配表。 (2)指出分组标志及类型;分组方法的类型;
分析该班学生考试成绩分布情况。
分析:本题目主要的考核点是变量数列的编制、 统计标志及类型、统计分组及次数分布的特征。
解:(1)40名学生成绩的统计分布表:
按学生成绩 分组 60以下
考试成绩(分) 职工人数(人) 比重(%)
60以下
3
7.5
60-70
6
15
70-80
15
37.5
80-90
12
30
90-100
4
10
合计
40
100
(主要考核第三章统计分组和变量数列的编制)
(2)根据次数分配数列计算样本平均数和标准 差(第四章平均指标和变异指标的计算)
x xf 3 55 6 65 15 75 12 85 4 95 77(分)
解:劳动生产率计划完成情况为: =〔 (100%+5%)/(100%+4%)〕×100%
=〔 105%/104%〕×100%=100.96%
产品成本计划完成情况为: =〔 (100%-6%)/(100%-5%)〕×100% = (94%/95%)×100%=98.95%
计算结果说明该企业2008年劳动生产率比上年超额0.96 % 完成计划,某种产品单位成本比上年超额1.05 %完成计划。
起重量(吨)
x
40 25 10 5 合计
起重机台数构成(%)
f
f
10 20 30 40
100
x f
f
4 5 3 2
14
依据资料请求出该工地各种起重机总平均起重量是多少?
平均起重量
x
f
f
4010%+25 20%+10 30%+5 40%
14吨
例题3.某工厂50个工人的月工资及工资总额如下:
a= y
-b
x
=
y
n
-b
x
n
=
21000 6
+454.5×
426 6
=35769.5
y倚x的直线回归方程式为: y =35769.5-454.5x 斜率b的含义是:
当产量 x 每增加1000件(即一个单位)时,单位成本 平均下降454.5元。
(2)当产量 y = 6000件时,由 y = 35769.5-454.5x 可知
6、计算题考核类型介绍。
例1、两个农场种植小麦,产量如下: 甲农场60﹪的麦田亩产500kg,其余的亩 产600 kg,乙农场40﹪的麦田亩产500kg, 其余的亩产600 kg, 请比较两个农场小 麦总平均产量。
在直接掌握各组标志值和各组频率 (比重)的条件下,计算加权算术平均 数,将各组标志值乘以相应的频率即可。
(2)根据整理后的变量数列,以95.45% (t=2)的概率保证程度推断全体职工业务考 试成绩的区间范围;
(3)若其它条件不变,将允许误差范围缩 小一半,应抽取多少名职工?
解:这道题是一道综合题目,它同时要用到第三、
四及第五章所学内容。
(1)根据抽样结果和要求整理成如下分配数列:
40名职工考试成绩分布
v甲 v乙 说明甲班平均分数代表性强
第四章 抽样推断(16﹪)
1、抽样推断及其特点。 2、抽样误差及影响抽样(平均)误差
大小的主要因素。 3、抽样平均误差与抽样极限误差的区
别与联系。 4、抽样推断的组织形式。
5、计算题考核类型介绍。
例1:某单位按简单随机重复抽样方式抽取40 名职工,对其业务情况进行考核,考核成绩资料 如下:
技 术 月工资(元) 工资总额(元) 工人数(人)
级别
x
m
m/x
1
1 460
7 300
5
2
1 520
22 800
15
3
1 600
28 800
18
4
1 700
17 000
10
5
1 850
3 700
2
合计
-
79 600
50
试计算50名工人的月平均工资是多少。
工人月平均工资
m
m x
7960 50
解(1)拟建立的直线回归方程为 y=a+bx 应求出a、b
计算表如下:
月份
单位成本(元/件) x
产量(件)y
x2
xy
1
73
2000
5329
146000
2
72
3000
5184
216000
3
71
4000
5041
284000
4
73
3000
5329
219000
5
69
4000
4761
276000
6
68
单位成本 x = 35769.5 y = 35769.5 6000 =65.50(元/件)
454.5
454.5
即当产量为6000件时,单位成本平均下降65.50元。
x=
∑x
f ∑f
甲农场的总平均产量 =500×60﹪+600×40﹪=540 kg
乙农场的总平均产量 =500×40﹪+600×60﹪=560 kg
结果表明,虽然两个农场单产水平相同, 但由于受比重权数的影响,致使乙农场的
总平均产量超过甲农场。
例题2.某建筑工地上,各种起重机起重量和起重机台数 构成资料如下:
例1:某班40名学生统计学考试成绩分别为: 57 89 49 84 86 87 75 73 72 68 82 97 81 67 81 54 79 87 95 76 60 90 65 76 72 70 86 85 75 71 89 89 64 57 83 81 78 87 72 61
学校规定:60分以下为不及格,60─70 分为及格,70─80分为中,80─90分为良, 90─100分为优。
(3)重复抽样条件下,若其它条件不 变,将允许误差范围缩小一半,应抽取 的职工数为:
n
t 2 2
2 x
22 10.542 (3.34)2
159
2
(重复抽样条件下抽样单位数的计算)
例2 某企业共有职工1000人。企业准备 实行一项改革,在职工中征求意见,采取不 重复抽样方法随机抽取200人作为样本,调 查的结果显示,有150人表示赞成该项改革, 有50人反对。试以95%(t=1.96)的置信 水平确定赞成改革的人数比例的置信区间。
159 .2元
例4 2008年某月份甲、乙两农贸市场某农产品价格及 成交量、成交额的资料如下:
品种
甲 乙 丙 合计
价格 (元/公斤)
1.2 1.4
1.5 -
甲市场成交额 (万元)
1.2 2.8 1.5
5.5
乙市场成交量 (万公斤)
2 1 1
4
请计算说明该农产品哪一个市场的平均价格比较高。
答案
学生人数 (人)
4
各组学生人数 占总人数比重(%)
10.0
60---70
6
15.0
70---80
12
来自百度文库
30.0
80---90
15
37.5
90---100
3
合计
40
7.5 100.0
(2)分组标志为“成绩”,其类型是数量标志。 分组方法是变量分组中的组距分组,而且是开口式分组。 该班学生的考试成绩的分布呈两头小,中间大的“正态分 布”形态。
该企业职工中赞成改革的人数比例的置信区间 上限为: p p 75% 5.37% 80.37%
下限为: p p 75% 5.37% 69.63%
即以95%的的置信水平确定赞成改革的人数比例在 69.63%-80.37%之间
第六章 相关与回归分析(13﹪)
1、相关分析的基本内容(步骤)。 2、相关系数的计算及相关程度的判断。 3、相关分析与回归分析的联系与区别。 4、计算题考核类型介绍。
f
40
(x x)2 f 4440 10.54(分)
f
40
x
n
10.54 1.67 40
x t x 2 1.67 3.34
全体职工考试成绩区间范围是:
下限= x x 77 3.34 73.66(分)
上限= x x 77 3.34 80.(3 分)
甲市场平均价格
H
m
m x
1.2 1.2
5.5 2.8 1.4
1.5 1.5
1.375元
乙市场平均价格x
x f f
1.2 2 1.411.51 1.325元 4
显然甲市场的平均价格要高于乙市场
例5:有两个班参加统计学考试,甲班的平均分数81 分,标准差9.9分,乙班的考试成绩资料如下:
2985
要求确定: 1.第四组上限 2.第二组下限 3.第六组的次数 4.第五组的频率5.第三组的组距 6.两个开口组的组中值 7.数据8000元应属于哪一组?
第三章 数据分布特征的测定(17﹪)
1、平均指标的特点和作用。 2、应用平均指标应注意的问题。 3、强度相对数与算术平均数的异同。 4、变异指标的作用及变异系数的应用条件。 5、标志变异指标与平均指标的关系。
《统计学》总复习题
第一章 统计总论(9﹪)
1、统计学的研究对象及特点。 2、“统计”一词的涵义及其相互关系 3、统计总体与总体单位的辨别与区分。 4、时期指标和时点指标的不同特点。 5、指标与标志的区别与联系。 6、四种“量”的尺度的使用。
7、计算题考核类型介绍。
例 某企业计划规定2008年的劳动生产率要比2007年提 高4%,某种产品成本比 2007年降低5%,实际执行结果是劳 动生产率提高了5%,产品成本降低了6%, 求计划完成程度 相对指标。
例1 某企业2000年上半年产量(千件)与单位成本 (元/件)资料如下:
月份 1 2 3 4 5 6
产量(千件) 2 3 4 3 4 5
单位成本(元/件) 73 72 71 73 69 68
要求: (1)建立直线回归方程(单位成本为自变量x),并 指出产量每增加1000件时,单位成本下降多少? (2)当产量为6,000件时,单位成本为多少?
f
因为甲班学生平均成绩为81分,平均成绩不同,不 能直接用标准差来衡量它们平均数代表性的高低,而 要计算其变异系数(标准差系数),通过变异系数大 小来说明其平均数代表性的大小。
2、甲乙两班的标准差系数分别为:
v甲 x
v乙
x
解:已知n=200, N=1000, t=1.96
根据抽样结果计算的赞成改革的人数比例为:p 150 75%
根据公式:
200
p
p(1 p) (1 n )
n
N
75% (1 75%) (1 200 )
200
1000
=0.0274=2.74%
△p= t×x =1.96×0.0274=0.0537=5.37%
第二章 统计数据的搜集与整理(13﹪)
1、典型调查、重点调查和抽样调查的异同。 2、一个完整的统计调查方案包含的主要内容。 3、统计整理的概念及作用。 4、统计分组及其作用。 5、分配数列的概念及构成要素。 6、变量分配数列的编制方法与步骤。
计算题考核类型介绍。
计算题类型
按成绩分组(分) 60以下 60-70 70-80 80-90 90-100 合计
学生人数(人) 4 10 20 14 2 50
要求:(1)计算乙班的平均分数和标准差; (2)比较哪个班的平均分数更有代表性。
1、乙班学生平均成绩、标准差分别为:
x
xf f
x
x
f
=9.80
合计
426
5000 21000
4624 30268
340000 1481000
= n xy x y 6 1481000 426 21000
b= n x2 ( x)2
6 30268 4262
= 8886000 8946000 181608 181476
=-454.5
68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87
要求:
(1)根据资料按成绩分成 5组: 60分以
下,60-70分,70-80分,80-90分,90- 100分,并根据分组整理成变量分配数列;
例2 某地2005年农村家庭户平均收入情况如下表:
按户年平均收入水平分组(元)
3000以下 3000-4000 4000-5000 5000-6000 6000-7000 7000-8000 8000-9000 9000以上
合计
户数(户)
100 250 340 470 850 630 215 130
要求: (1)将该班学生分为不及格、及格、中、良、
优五组,编制一张次数分配表。 (2)指出分组标志及类型;分组方法的类型;
分析该班学生考试成绩分布情况。
分析:本题目主要的考核点是变量数列的编制、 统计标志及类型、统计分组及次数分布的特征。
解:(1)40名学生成绩的统计分布表:
按学生成绩 分组 60以下
考试成绩(分) 职工人数(人) 比重(%)
60以下
3
7.5
60-70
6
15
70-80
15
37.5
80-90
12
30
90-100
4
10
合计
40
100
(主要考核第三章统计分组和变量数列的编制)
(2)根据次数分配数列计算样本平均数和标准 差(第四章平均指标和变异指标的计算)
x xf 3 55 6 65 15 75 12 85 4 95 77(分)
解:劳动生产率计划完成情况为: =〔 (100%+5%)/(100%+4%)〕×100%
=〔 105%/104%〕×100%=100.96%
产品成本计划完成情况为: =〔 (100%-6%)/(100%-5%)〕×100% = (94%/95%)×100%=98.95%
计算结果说明该企业2008年劳动生产率比上年超额0.96 % 完成计划,某种产品单位成本比上年超额1.05 %完成计划。
起重量(吨)
x
40 25 10 5 合计
起重机台数构成(%)
f
f
10 20 30 40
100
x f
f
4 5 3 2
14
依据资料请求出该工地各种起重机总平均起重量是多少?
平均起重量
x
f
f
4010%+25 20%+10 30%+5 40%
14吨
例题3.某工厂50个工人的月工资及工资总额如下:
a= y
-b
x
=
y
n
-b
x
n
=
21000 6
+454.5×
426 6
=35769.5
y倚x的直线回归方程式为: y =35769.5-454.5x 斜率b的含义是:
当产量 x 每增加1000件(即一个单位)时,单位成本 平均下降454.5元。
(2)当产量 y = 6000件时,由 y = 35769.5-454.5x 可知
6、计算题考核类型介绍。
例1、两个农场种植小麦,产量如下: 甲农场60﹪的麦田亩产500kg,其余的亩 产600 kg,乙农场40﹪的麦田亩产500kg, 其余的亩产600 kg, 请比较两个农场小 麦总平均产量。
在直接掌握各组标志值和各组频率 (比重)的条件下,计算加权算术平均 数,将各组标志值乘以相应的频率即可。
(2)根据整理后的变量数列,以95.45% (t=2)的概率保证程度推断全体职工业务考 试成绩的区间范围;
(3)若其它条件不变,将允许误差范围缩 小一半,应抽取多少名职工?
解:这道题是一道综合题目,它同时要用到第三、
四及第五章所学内容。
(1)根据抽样结果和要求整理成如下分配数列:
40名职工考试成绩分布
v甲 v乙 说明甲班平均分数代表性强
第四章 抽样推断(16﹪)
1、抽样推断及其特点。 2、抽样误差及影响抽样(平均)误差
大小的主要因素。 3、抽样平均误差与抽样极限误差的区
别与联系。 4、抽样推断的组织形式。
5、计算题考核类型介绍。
例1:某单位按简单随机重复抽样方式抽取40 名职工,对其业务情况进行考核,考核成绩资料 如下:
技 术 月工资(元) 工资总额(元) 工人数(人)
级别
x
m
m/x
1
1 460
7 300
5
2
1 520
22 800
15
3
1 600
28 800
18
4
1 700
17 000
10
5
1 850
3 700
2
合计
-
79 600
50
试计算50名工人的月平均工资是多少。
工人月平均工资
m
m x
7960 50
解(1)拟建立的直线回归方程为 y=a+bx 应求出a、b
计算表如下:
月份
单位成本(元/件) x
产量(件)y
x2
xy
1
73
2000
5329
146000
2
72
3000
5184
216000
3
71
4000
5041
284000
4
73
3000
5329
219000
5
69
4000
4761
276000
6
68
单位成本 x = 35769.5 y = 35769.5 6000 =65.50(元/件)
454.5
454.5
即当产量为6000件时,单位成本平均下降65.50元。
x=
∑x
f ∑f
甲农场的总平均产量 =500×60﹪+600×40﹪=540 kg
乙农场的总平均产量 =500×40﹪+600×60﹪=560 kg
结果表明,虽然两个农场单产水平相同, 但由于受比重权数的影响,致使乙农场的
总平均产量超过甲农场。
例题2.某建筑工地上,各种起重机起重量和起重机台数 构成资料如下:
例1:某班40名学生统计学考试成绩分别为: 57 89 49 84 86 87 75 73 72 68 82 97 81 67 81 54 79 87 95 76 60 90 65 76 72 70 86 85 75 71 89 89 64 57 83 81 78 87 72 61
学校规定:60分以下为不及格,60─70 分为及格,70─80分为中,80─90分为良, 90─100分为优。