统计学综合培训资料

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
频数 13 12
苹果 康柏 盖特伟 IBM 帕科特
2.2品质数据的整理与显示
定类数据整理与显示知识点:
▪ 条形图 和圆饼图是描述频数或百分比分布已经经过 汇总的定类数据的图形方法。 ▪ 组别同数据种类关系一致 ▪ 频数总和与数据集中项目总数相同:相对频数总和为 1.00;百分比频数总和为100。 ▪ 条形图、柱形图的长度或高度代表频数,其宽度都相 同。
(均匀分布
2.3数量数据的整理与显示
审计时间数据频数分布
审计时间(天) 10-14 15-19 20-24 25-29 29-34 合计
频数 4 8 5 2 1 20
2.3数量数据的整理与显示
(二)相对频数分布和百分比频数分布
每组相对频数=每组的频数/ n n是数据的个数
每组的百分比频数=相对频数*100
百分比频数 26 24 10 18 22 100
2.2品质数据的整理与显示
▪ 定类数据的图示 1)条形图(Bar chart)、柱形图
帕科特 盖特伟
苹果 0
频数
5
10
频数 15
频数
15
10 频数
5
0 苹果 康柏 盖特伟 IBM 帕科特
2.2品质数据的整理与显示
2)圆饼图(Pie chart)
11 9
3) 百分比频数(Precentage):将比例乘以100,用%表示。 4) 比率(Ratio):各不同类别的数量的比值。
比例与比率的区别。
2.2品质数据的整理与显示
公司 苹果 康柏 盖特威-2000 IBM 帕科特.贝尔 合计
发生频数 13 12 5 9 11 50
相对频数 0.36 0.34 0.10 0.18 0.22 1.00
甲城市家庭对住房状况的评价
回答类别
甲城市
非常不满意 不满意 一般 满意 非常满意
合计
户数
(户 )
百 分比
( %)
向上累积
户数
百分 比
24
8
24
8
108
36
132
44
93
31
225
75
45
15
270
90
30
10
300
100
300
100
向下累积
户数
百分 比
300
100
276
92
168
56
75
25
30
10
13
第一步:确定组数
▪ 根据数据集大小确定。Sturgesdes的经验公式 ▪ 本例中N=20,可以取组数为5。
2.3数量数据的整理与显示
第二步:组距的确定。组距(Class width)是一个组上限 与下限的差。
近似组距=(数据最大值—数据最小值)/ 组数
▪ 组限: 下限——确定分配给该组可能的最小数据值; 上限——确定分配给该组可能的最大数据值。
审计时间(天) 相对频数
百分比频数
10-14
0.20
20
15-19
0.40
40
20-24
0.25
25
25-29
0.10
10
30-34
0.05
5
合计
2.2品质数据的整理与显示
2. 定序数据的整理与显示 ▪ 累积频数和累积频率 1)累积频数(Cumulative frequencies):就是将各类 别的频数逐级累加。 向上累加:从类别顺序开始的一方向最后一方累 加频数; 向下累加:从类别顺序的最后一方向开始一方累 加频数。
2.2品质数据的整理与显示
Session2 THEME:Descriptive Statistics (一)数据的整理与显示
2.1数据的预处理
数据的审核与筛选 原始数据的审核:完整性、准确性 二手数据的审核:适用性和及时性
数据的排序
(一)数据的整理与显示
2.2品质数据的整理与显示
• 定类数据的整理与显示 ▪ 频数与频数分布
1)频数:也称次数,是落在各类别中的数据个数; 频数分布:用数据概括表的形式来列示若干个互
不重叠分组中每组数据出现的次数
2.2品质数据的整理与显示
例:由购买50台计算机的样本数据得到的频数分布表:
公司
发生频数
相对频数
百分比频数
苹果
13
0.36
26
康柏
12
0.34
24
盖特威-2000
5
0.10
10
IBM
107 114 115 117 117 118 122 122 122 130
2.3数量数据的整理与显示
将上述数据采用单变量分组如下表:
零件数(个)
频数(人) 零件数(个)
107
1
118
114
1
122
百度文库115
1
130
117
2
频数(人)
1 3 1
只适用于离散变量且变量值较少的情况。
2.3数量数据的整理与显示
9
0.18
18
帕科特.贝尔
11
0.22
22
合计
50
1.00
100
2.2品质数据的整理与显示
2) 比例(Proportion):总体中各个部分的数量占总体 数量的比重,通常用于反映总体的构成或结构。又可以 称为相对频数。
N1 N2 N3 N4 ………….,Nk
比例:Ni/N。
比例的性质含义。
2.2品质数据的整理与显示
2.2品质数据的整理与显示
2)累积频率或百分比(Cumulative percentages):就是将各 类别的百分比逐级累加起来。分向上和向下累积两种方法。
▪ 定序数据的图示 1)累积频数分布图。 2)环形图。
频率
15 10 5 0
1
直方图
150.00%
100.00% 50.00% 频率 .00% 累积 %
2.3数量数据的整理与显示
在本例中,每组的组距近似为: (33—12)/ 5=4.2
采用5作为组宽 因此,分组为:10-14,15-19,20-24,25-29,30-34
2.3数量数据的整理与显示
分组中的其他问题:
▪ 分组的不重不漏原则 ▪ 上组限不在内 ▪ 开口组 ▪ 等距分组和不等距分组 ▪ 频数密度=频数/组距 ▪ 组中值=(下限值+上限值)/2
▪ 组距分组:将全部变量值依次划分若干区间,并将这一 区间的变量值作为一组。步骤如下:
1)确定互不重叠分组的个数。 2)确定每组的组距 3)确定组限
▪ 建议分组数目:5-20个。
2.3数量数据的整理与显示
例:年终审计时间用时(天)

14 19 18 15 15 18 17 20 27
• 22
23 22 21 33 28 14 18 16
2
3
4
5 其他
接收
1 2 3 4 5
2.3数量数据的整理与显示
(一)频数分布 1. 数据的分组:将数据按某种标准化分成不同的组。再 进行频数统计,形成频数分布表。
▪ 单变量值分组:把每一个变量值作为一组。 例:某企业10名工人日加工零件数(个)如下:
117 122 107 117 130 115 122 114 118 122 排序:
相关文档
最新文档