社会统计学-卢淑华(第4版)-第2章x

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(三) 定距变量
统计分组的步骤(等距、重合、组距式分组)
第四:计数。 以0.03作为组距的分组情况。 1.265-1.295;1.295-1.325,…… 1.255-1.285;1.285-1.315,……
1.245-1.275;1.275-1.305,……
(三) 定距变量
身高
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565
1
99 99
1.55 1
1 100 100
— 100 100 — —
向下累计
人数 频率
100 100
99
99
95
95
88
88
66
66
42
42
18
18
8
8
2
2
1
1


向上累计:由低到高,上限以下 向下累计:由高到低,下限以上
思考:360体 您本次开机共用时1分10秒,击败了全国12%
的电脑……
关于统计分组的个人认识
100.00
(三) 定距变量
统计分组的步骤(等距、重合、组距式分组)
第一:确定组数。经验公式 k=1+lgn/lg2 k =1+lg100/lg2=7.64
第二:确定组距。 组距 =(最大值-最小值)/组数 =(1.56-1.27)/10=0.029
原则:以5或10的倍数作为组距。本例选择:0.03 第三:确定组限。 要求:第一组下限要小于所有数据的最小值,最后一组上限要 大于所有数据的最大值 原则:以5或10的倍数作为组限。
样 本 20 0 1 1 1
样 本 31 0 0 1 1
样 本 41 1 0 0 1
多选项分类法
• P26 例2 • P27 例3
3、加权平均法
P28 例4
(二)定序变量
喜爱程度 很反感 不爱看 一般 爱看 非常爱看 总数
表2-7 单位对武打片的反映统计 频次 3 10 10 9 7 39
百分比(%) 7.69 25.64 25.64 23.08 17.95
合计
表2.11 100名儿童身高统计分组表
组中值 人数
频率
向上累计 人数 频率
1.28 1
1
1
1
1.31 4
4
5
5
1.34 7
7
12 12
1.37 22 22 34 34
1.40 24 24 58 58
1.43 24 24 82 82
1.46 10 10 92 92
1.49 6
6
98 98
1.52 1
第2章 单变量描述统计分析
第1节 统计分组
按品质标志分组
统计分组
按数量标志分组
单项式分组 组距式分组
等距、不等距 重合、不重合
一、分布(distribution)
• 变量各种可能取值及其出现的次数或频 次,又称频次分布。
频数、频次、次数(frequency)
二、统计表
家庭结构 核心家庭 直系家庭 联合家庭
60.0 50.0 40.0 30.0 20.0 10.0
0.0 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012
第一产业
第二产业
第三产业
三次产业构成比
数据描述的数值方法
核心家庭 直系家庭 联合家庭 其他
图2.1 家庭结构分布图
条形图 bar
90-94 75-79 60-64 45-49 30-34 15-19
0-4 0
20000
按 年 龄 和
40000
60000
80000
100000
120000
120 80 40 0
100名儿童身高向上累计直方图
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565
其他 总数
表2.5 家庭结构的频次分布
频次
百分比(%)
1050
49.30
720
33.80
110
5.16
250
11.74
2130
100.00
多选项二分法
abc d e
样 本 1 √√√ × √
样 本 2×
× √√√
样 本 3√× × √ √
样 本 4√√× × √
多选项二分法
abc d e
样 本 11 1 1 0 1
120 80 40 0
100名儿童身高向下累计直方图
1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565
父亲身高(800名)
频次
百分比(%)
1050
49.30
720
33.80
110
5.16
250
11.74
2130
100.00
Mo=“核心家庭”
(二)定序 表2.7 P29
表2-7 单位对武打片的反映统计
喜爱程度
频次
百分比
很反感
3
7.69
不爱看
10
25.64
一般
10
25.64
爱看
9
23.08
母亲身高(800名)
父亲体重(800名)
母亲体重(800名)
350
300
250
200
150
100
50
0
1992年
2008年
分年龄别的死亡率
0岁 1-4岁 5-9岁 10-14岁 15-19岁 20-24岁 25-29岁 30-34岁 35-39岁 40-44岁 45-49岁 50-54岁 55-59岁 60-64岁 65-69岁 70-74岁 75-79岁 80-84岁 85-89岁 90及以上
原则:统计分组没有对错,只有好坏。
开口组实际中应用更广。 极端值,extreme 判断va依lue据:发生概率非常小,后果很严重 911事 2004印度洋海啸 飞机件失事、英法核潜艇相撞、美、俄卫星相撞 ,股灾,亚洲金融危机
饼图(Pie) 250, 12%
110, 5%
720, 34%
1050, 49%
数据描述的数值方法
集中趋势
均值 中位数 众数
第2节
离散程度 分布的形状
极差 四分位距 方差和标准差 离散系数
Biblioteka Baidu
偏态 峰度
第3节
第二节:集中趋势的测量
一、众数(Mode) 概念 :出现次数最多的标志值 计算 (一)定类数据 表2.5 P24
家庭结构 核心家庭 直系家庭 联合家庭
其他 总数
表2.5 家庭结构的频次分布
相关文档
最新文档