社会统计学(卢淑华),第二章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
年龄 人数
cf↑
cf↓
15
3
3
18
16
6
9
15
18
9
18
9
计量资料频数表的编制
计量资料频数表的编制
一般情况下,样本含量小于30的统计资料 无须编制频数表,但对于大样本含量的资料, 编制频数表有利于进一步的统计分析、且频 数表本身也具有统计描述的作用.
编制频数表的步骤
编制频数表的步骤
一般 8- 15 之间
156.3 144.8 148.5 147.1 148.1 148.1 143.5 145.0 143.1 149.8 136.1
续例
步骤如下: R=160.8-129.4=31.4。 组段数=10;组距=R/10=3.14≈30(cm);按要
求确定每一组段上下限。 分组统计每一组段的频数,编制频数表。
第一组段包括极小值,最后 一组段包括极大值,除最后 一组段可同时标出上下限, 其他组段只标出下限。
求出极差
确定组段数
确定组距
列出各个组段
极差即最大值 与最小值之差
组距=R/组段数, 但一般取一方便 计算的数字
确定每 一组段 频数 选
根据变量值大小 把各观察单位归 入各个组段
编制频数表步骤流程图
丼例
某地 13 岁女孩 118 人的身高(cm)资料
143.7 142.5 145.7
144.9 145.5 139.3
152.2 149.5 144.8
145.0 141.1 147.5
146.4 150.6 140.5
141.2 140.9 139.9
138.5 146.2 146.8 142.3 150.9 145.5
人数
2 4 5 3 2 1 17
六、标志变异指标
测定离散趋势,考察资料的分散特征
1、异众比率
N f
m0
N
非众值的比例越小,则众值的代表性越大。例
2、极差 R=观察最大值-观察最小值 例
3、四分互差 Q=Q75–Q25例1 例2
4、方差、 σ与标准差
未分组
1)根据原始资料 2 ( xi x )2 标准差 = 2
138.5 160.8 * 139.9 154.6
145.2 155.2 148.7 148.7
146.8 138.9 139.5 153.2
148.9 140.9 140.6 146.5
151.8 150.7 144.5 132.5
145.6 148.6 142.9 146.8
144.6 137.5 143.5 150.0 143.5 146.5
频数分布表的用途
频数分布表的用途
揭示数值变量频数分布的类型和特征 作为陈述资料的形式 便于发现一些特大或特小的可疑值 便于进一步的统计分析
计量资料频数分布的类型和特征
计量资料频数分布的类型和特征
分布类型
对称分布:各组段的频数以中间组段为中心,左右两侧基本对称 偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少
注意:统计表的分组科学性问题
判断:学校对最喜爱体育项目调查:
项目名称 球类 田径 游泳 赛车
人数 150 100 60 70
百分比 60 30 20 20
判断:学生成绩变化调查
开学初
成绩
%
好
10
中
80
差
10
提高
60 80 75
期末 下降
10 10 10
不变
30 10 15
三、统计图
圆瓣图。反映所占比例;使用于定类; 条形图。定类:离散长条;定序:紧挨
续例
计量资料频数分布表
身高组段 (1) 129~ 132~ 135~ 138~ 141~ 144~ 147~ 150~ 153~ 156~
159~162 合计
118 例 13 岁女孩身高(cm)资料频数表。 频数 (2) 2 2 8 20 26 25 20 9 3 2 1 118
组中值 (3) 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 —
均值= ni xi N
分组数据:以中心值来代替变量值,但有误差 例。
例:
调查某地6户农民家庭和5户干部家庭,每 户人数如下:
农民家庭:6;4;4;8;6;3; 干部家庭; 4;2;3;3;5; 求均值。
例:青年人每年阅读书本数调查,求均 值。
书数
2-4 5-7 8-10 11-13 14-16 17-19 总数
4、中位值=L+X
某农村妇女初婚年龄
年龄
频次
例:
频率
16-18
30
18-20
50
20-22
20
求中位值 注意:真实组界的问题
30% 50% 20%
cf↑
30% 80% 100%
3、均值
适用于定距变量,能综合反映频次、次序、数值 大小变化
未分组数据 1)直接累加:算术平均 例 2)根据频次:加权平均
分布特征
集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势
离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都 有频数分布,而不是所有频数分布在集中位置的趋势。
五、集中值
三种方法找集中值: 频次;居中;平均; 想一想:社会经济生活中有哪些集中值? 1、众值M0 频数最多的变量值,适合于单峰对称。 2、中位值Md 数据序列中央位置之值。 未分组数据: 1)根据原始资料求中位值 奇数时:中位值=(N+1)/2
二、统计表
统计表的制作 要注意的问题: 1、标题、内容简明 2、统计栏数多时,要加编号 3、数字填写要求:位数对准,同栏数字、小数位
要一致,相同数字不可以写“同上”,无数字栏 用 “—”,缺资料“…” 4、表中数字用同一单位时,标在右上角 5、表的左右两端不封闭 判断 练习:分别制作定类、定序、定距变量统计表
第二讲
单变量统计描述
一、分布
(xi ni)
x的要求:
n:频次分布
(1)完整性
P:概率分布
(2)互斥性
%:百分比分布
如: 性别 xi 人数ni
男
5
女
6
例:某校学生的父亲职业
职业
n
p
%
干部
110
0.200
20.0
工人
152
0.276
27.6
农民
228
0.524
52.4
总数
550
1.000
100.0
143.7 146.7 139.2 142.6 143.5 131.5 138.9 152.3 141.8 150.8 146.3 142.5
143.8 149.5 147.5 140.3 138.5 142.5
143.3 147.2 135.4 138.1 138.1 137.9 129.4 * 148.6 149.8 135.5 147.5
举例说明计量资料频数表的编制过程
151.3 142.0 144.5 139.1 143.8 143.9 135.4 142.1 136.5 143.3 135.4 141.2
ຫໍສະໝຸດ Baidu
134.1 141.3 139.8 144.5 140.5 141.5 147.8 149.8 145.0 157.6 149.8 146.4
长条或离散长条;宽度无意义; 直方图。紧挨长条;宽度有意义;适用
于定距;高度:频次密度=频次/组距 折线图。直方图顶点中心相连;要计算
组中心值。
看一看,这是一个什么东东?
90
80
70
60
50
东部
40
西部
30
北部
20
10
0 第一季度 第二季度 第三季度 第四季度
四、频数统计
cf↑:向上累计。小于某一数字的频数 cf↓:向下累计。大于某一数字的频数
N
2)根据频次分布:
1
N
ni • xi2 ( ni • xi )2
例:
N
偶数时:中位值=中间位置左右两位数的平均值为中位 值。
2)根据频次分布求中位值
未分组资料:
首先确定中位值的位置( 利用cf ↑ ),第二步找中位值。 分组资料 : 四步求值 方法 1、找50%区间 2、找上界U、下界L;U%—L% 3、求累计50%的变量值X
X 50% L% U L U % L%