统计学 频次分布与图示法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15 4 24
14 2 20
13 2
18
12 3
16
11 4
13
10 2
8
91
6
82
5
71
3
61
2
51
1
因为张三的14分高于13.5,而 14分有两人,因此:
(2÷2)+18=19
19÷30×100=0.633×100=63.3
大约有63.3%的人≤14分,有 37%的人高于14分
3.3 根据给定的百分等级计算对应的百分数
1
28 5 24 28 18 9 7 18
总数 251 125 103 84 229 116 145 558
平均数 66.7 53.6 57.6 61.5 60.2 49.4 57.7 49.6
标准差 16.6 17.3 16.2 15.6 16.0 15.2 17.4 16.1
… 50 … 5 1 总数 平均数 标准差
百分等级(Percentile rank) 代表的就是在比较组中, 某个分数及其以下所占的百分数。 寻找百分等级的步骤: 1. 将所有数据按照大小整理成频次分布表。表 中呈现的是每个分数出现的次数。
搜集的原始数据如下:
5 20 6 19 18 17 7 8 16 15 17 8 15 14 10 11 15 11 12 14 15 13 12 11 11 12 13 11 10 9
ຫໍສະໝຸດ Baidu
3.7 图示法
将两个次数分布加以比较,绘制的图形称为统计图(graph), 它不能代替数据处理,但是对思考和讨论有视觉帮助。
3.7.1 图示法的误用
哎呀,差别好大!
100
90
100
80
70
80
60
60
50
40
40
30
20
20 10
0 ABC
0
A
B
C
3.7.2 称名变量
条图(bar graph) 用来表示称名变量或顺序变量量表 数据的统计图
30
25
20
15
10
5
0
1
2
3
4
5
6
7
8
起点位置
图3.6 在一个小城镇调查389个家庭中儿童人数的频次分布
频次
140
138
120
100
92
80
60
51
46
40 29 20
0
19
9
4
1
1 2 3 4 56 7 8 9
家庭中儿童人数
图3.6 描述一个离散分布的比率量表的直方图
3.7.4 等距和比率变量-------直方图
图3.4 在1946-1983
年间,美国发现有 275例狂犬病。在 1966年到1983年间 只发现12例,归功 于狂犬疫苗。
160
140
136
120
100
80
60
40
20 11
10
1
0
11
9
蝙蝠 红猫 猫
狗 狐狸 臭鼬
3.7.3 顺序变量
图2.5 马在环形跑道中8个不同起点开始比赛所获胜次数
获胜次数
第3章 频次分布与图示法
3.1 将数据整理成频次分布表
假设心理教研室对某班进行了一次自恋的测验, 张三的得分是14分,但是张三不知道怎样解释这个 分数,只知道,得分越高,自恋倾向越严重。
单独一个分数本身并无意义,只有和某一标准进 行比较才有意义。张三知道全班有一半以上的同学 得分≤13分。这无形中就使用了百分位数作为参照 标准。
3.5 分组频次分布表
表3-4
心脏舒张压的分组频次分布表
分组
f
93~95
1
90 ~92
0
87~89
0
84~86
0
81~83
2
78 ~80
10
75~77
3
72~74
13
69~71
13
66 ~68
20
63~65
28
60~62
19
57~59
6
54~56
0
51~53
3
表3-5 美国1989和1990两年,8 个年龄组艾滋病案例分组次数 分布表
2
13 2 18
12
///
3
12 3
16
11
//// 实4 下限13.5 11 4 13
10
//
2
10 2
8
9
/
1
91
6
8
//
2
82
5
7
/
1
71
3
6
/
1
5
/
1
61
2
51
1
被试总人数
张三得14分, 低于14分的 有18人
分数X f 累积次数f
20 1 30
19 1 29
18 1 28
17 2 27
16 1 25
6
6-8
24
3-5
18
不 同 缺勤 天 数
频
16
次
的 个体 数
14
1 5-
25
22
1 2-
14
3
12
9 9-
11
6
6 6-
8
24
10
3 3-
5
15
2
13
8
1
17
0
11
6
4
2
0
01 2
4
7
10
1
15
2
3
0
图3.8 使用等宽分组描述出勤天数的直方图
不同 缺勤天数 频 次
的 个体数
1 5 - 25 22
1 2-14
3
9 - 11
年龄(岁) 1989(f) 1990(f)
≥60 50~59 40~49 30~39 20~29 10~19
5~9 0~4 总计
1049 1290
2518 3013
7640 10026
16260 19772
6992 8338
149
208
89
120
533
622
N=35230 N=43339
3.6 探索性数据分析
表3-1 自恋测验中所获得的30个分数的频次分布表与累积次数分布表
分数X 登记次数 次数
分数X f 累积次数f
20
/
1
20 1 30
19
/
实1 上限14.5 19 1 29
18
/
1
18 1 28
17
//
2
17 2 27
16
/
1
16 1 25
15
////
4
15 4 24
14
//
2
14 2
20
13
//
若已知张三的百分等级是63.33,计算原始分数 1. 百分等级×总人数=累积次数 f
0.633 ×30=19.0
从表中可以看出累积次数 为19的分数高于13.5而低 于14.5,因此可 确定张三 为14分
X f 累积f 15 4 24 14 2 20 13 2 18
3.4 百分等级和参照组
表3-3 8个学生和专业学校组在米勒类比测验上的百分位数和原始分数
表3-6 包含数据分析的一个茎叶图
90 8 15 7 178 6 003447 5 0225678 4 1157889 3 02359 2 138 17
17 21 23 28 30 32 33 35 39 41 41 45 47 48 48 49 50 52 52 55 56 57 57 60 60 63 64 64 57 57 60 60 63 64 64 67 71 77 78 81 85 90
百分位数 物 农 理学
医生社社语法 学物科工言学
百分位数
99
93 89 92 88 90 81 87 84
99
95
91 86 83 87 85 76 84 79
95
…
………………… …
50
68 54 57 61 61 50 59 49
….. … … … … … … … …
5
39 26 30 37 32 22 29 25