第二章-统计表和统计图
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计表和统计图
统计表一般格式
表 2-1
消费构成 食品 衣着
燃料 住房 用品及其他 交通通讯 文化生活服务 总支出
2002、2006年六运调查点人均消费支出构成统计表
2002年 2006年
(山西省,2007,7)
钱数(元)
占总支出百分比(%)
钱数(元) 占总支出百分比(%)
2006年比2002 年增长倍数
家庭结构 核心家庭 直系家庭
百分比(%) 49.3 33.8
联合家庭
其 他 总和百分数 (统计总数)
5.2
11.7 100.0 (2130)
统计表——定类变量
有关意愿、原因等社会调查中,可供选择的答
案类别数目,有时与变量的数目不相等。
例1:问卷中“你认为人生最大的乐趣是什么”
(1)事业上有成就(2)美满的婚姻(3)经 历丰富
9
10 11 总和
153.35~156.35
156.35~159.35 159.35~161.35
153.85
155.85 157.85 —
3
2 1 118
0.025
0.017 0.008 1.000
统计图
根据变量层次可选择不同的统计图
定类变量:圆瓣图、条形图
定序变量:条形图
定距变量:直方图、折线图
工厂规模(人数) 频 次
1—5 (0.5—5.5)
6—10 11—20 21—30 30—35
统计表——定距变量
对于连续型变量,无法使每一个取值对应一个确定的频次 或百分比。解决方法是将变量值分为若干个区间和组。例 如结婚年龄。 在实际中要考虑如下问题:组数、等距分组与非等距分组、 分点精度。
离散型数据;连续性数据。
50 40 人 30 数 20 10 0
甲 乙 丙 丁
(2)表示数据多少的方式不同。
等级
长短或高低表示数据的多少和大小;用面积表示。
注意:等距分组数据仍可用矩形高度直接表示频数
(3)坐标轴上标尺分点意义不同。 分类轴;刻度值。 (4)间隔
有间隔,但无意义;无任何间隙。
统计表——定类变量
变量1(第一项):A B C D 变量2(第二项):A B C D 变量3(第三项):A B C D
表2-4 100个人购房因素统计表
价格适中 第一项 第二项 第三项 累积人次 20 40 -60
上班近 60 30 -90
交通方便 -10 -10
购物方 便 20 20 100 140
图3-5 某车间工人日加工零件数的直方图
© ý £ Ë Ê ¨È ý £ µ Ê Æ
10 15 20 25 0 5
3. 20 « ¡ « ¡ « ¡ « ¡ « ¡ « ¡ 00 5. 5. 5. 90 « ¡ 30 60 6. « ¡ « ¡ « ¡ 20 50 80 10 40 70 3. 3. 4. 4. 4. 5.
4
2 0
图3-6 某车间工人日加工零件数的折线图
%
例如:对有意义的词汇,小学一年级至初中三年级学 生视觉、听觉记忆再现率的情况。
70 60 50 40 百 分 比 30 20 10 0 一 二 三 四 年 五 级 六 初一 初二 初三
视觉记忆 听觉记忆
图2-5 有意义的材料再现率比较线形图
累计图和累计表
频 次 7
百分比 17.9
爱看
一般 不爱看 反 感 总 数
9
10 10 3 39
23.1
25.6 25.6 7.7 99.9
统计表——定距变量
定距变量:连续型变量和离散型变量。
离散型变量制表方法同定序变量。但是,当如果变量值的
变化幅度过大,一一列举,势必形成很长的分类,且每类 分类中的频次又变得很少,这时需要采用组距式统计表。
统计图和统计表告诉我们某一变量值(或
某一组)所对应的频次是多少。有时我们
需要了解小于某一变量值或者大于某一变
量值的总共频次是多少,这时要用到累计
图和累计表。
累计图和累计表
表2-5 家庭子女数频次分布与累计频次分布
家庭子女数
频次
cf↑
cf ↓
0
1 2 3 4
第二章 单变量统计描述分析 第一节 分布、统计表和统计图
王 荣
分布
指的是一个概念或变量,它的各个情况出现的次数或频 次,又称频次分布。 分布形式一般为:(X1,n1)(X2,n2)(X3, n3)......(Xn,nn) 如:家庭结构的分布: (核心家庭,105)(直系家庭,72)(联合家庭,11) (其他,25) n不同名称也不同:频次分布、百分比分布,概率分布。 注意变量取值的完备性和互斥性。
Xa=60/300=0.2 Xb=90/300=0.3 Xc=10/300=0.03 Xd=140/300=0.47
统计表——定类变量
表2-4 100个人购房因素统计表
A价格 适中 第一项 (5分) 20
B上班 近 60
C交通方 便 --
D购物方 便 20
第二项 (3分)
第三项 (1分) 累积人次
标明组界 1—2 3—4 5—6 7—8 真实组界 0.5—2.5 2.5—4.5 4.5—6.5 6.5—8.5
统计表——定距变量
统计表——定距变量
统计表——定距变量
统计表——定距变量
统计表——定距变量
表 2-2 118例13岁女孩身高资料统计表
组号 1 2 3 4 5 6 7 8 真实组界值 129.35~132.35 132.35~135.35 135.35~138.35 138.35~141.35 141.35~144.35 144.35~147.35 147.35~150.35 150.35~153.35 中心值 130.85 133.85 136.85 139.85 142.85 145.85 148.85 151.85 频次统计 频次 2 2 8 20 26 25 20 9 相对频次 0.017 0.017 0.068 0.170 0.220 0.212 0.170 0.076
40
-60
30
-90
10
-10
20
100 140
Xa=( 5³20+3³40)/100=2.2 Xb=( 5³60+3³30)/ 100=3.9 Xc=( 3³10)/ 100=0.3 Xd=( 5³20+3³20+1³100)/ 100=2.6 Xb >Xd > Xa > Xc
统计表——定序变量
763.1 120.0
36.2 5.7
1237.6 226.9
30.7 5.6
1.62 1.89
140.9 58.9
170.0 81.0 773.2 2107.0
6.7 2.8
8.1 3.8 36.7 100.0
233.5 765.7
250.2 172.0 1144.4 4030.0
5.8 19.0
定序变量统计表制作内容、方法同定类变量。值
得注意的是,定序变量的取值有大小、高低之分, 因此在制作时应该保留其变化趋势。
统计表——定序变量
例如某电影厂为了解群众对武打片是否爱看,将喜爱程度 分为五等:非常爱看、爱看、一般不爱看、反感。
表 2.7 xx单位对武打片的反映统计
喜爱程度 非常爱看
统计表和统计图
变量层次:定类变量 定序变量 定距变量 定比变 量 注意:社会统计学中一般将定距、定比变量都当做定 距变量处理。
层次 运算符 =≠ < > +- ³÷ 定类 √ 定序 √ √ 定距 √ √ √ 定比 √ √ √ √
统计表——定类变量
定类变量
表2-2 家庭结构的百分比统计表
(xx地,1985,6)
横轴各直条一般按统计指标由大到小排列,也可按事物本
身的自然顺序排列。 各直条的宽度要一致,各直条应有相等的间隔,其宽度一 般与直条的宽度相等或为直条宽度的一半。 图形区域中条形顶端和下端尽量少用数据标签。 调节过长条形方法。一种方法是调整图尺,改变刻度或采 用断裂;另一种是折叠。
统计图—直方图
男 女
图2-2 某年级操行评定结果条形图
4.5
õ Ö ³ Ð
4
ß Ö · Ð ¾ ¿ ± Æ
ó ³ ´ ¨
3.5 3 2.5 2 1.5 1 0.5 0
À Î Ê À ³ é Ö ¯ ¶ Ô À ´ ± ¾ µ × Â Ã Ó Î µ Ä ¾ ¯ · æ À É Î ú ² ¿ ¡ ¢ ± ¾ Ê Ð µ Ä Ð Â Î Å ² ¢ ² ¼ » µ
统计图—直方图
ì º · Ï ° û Æ ¼ ý Ê µ Ö (10 12 /L)
组织图
20 15 10 5 0 60 63 66 69 72 75 78 81 84 87 90 96 99
统计图—直方图
非等距直方图
条形图和直 方图有什么 区别?
条形图与直方图的区别
60
(1)描述的数据不同。
统计图—圆瓣图
其他 12%
联合家庭 5%
核心家庭 直系家庭 联合家庭 其他 核心家庭 49%
直系家庭 34% 图2-1 家庭结构分布图
统计图—圆瓣图
其他 12% 核心家庭 直系家庭 联合家庭 其他 核心家庭 49%
联合家庭 5%
直系家庭 34% 图2-1 家庭结构分布图
统计图—圆瓣图
其他 12% 联合家庭 5% 核心家庭 直系家庭 联合家庭 其他
统计表——定类变量
表2-3 人生最大乐趣统计表
人生乐趣 事业上有成就 婚姻美满
频 次
百分比
经历丰富
事业上有成就且婚姻美满 事业上有成就且经历丰富
婚姻美满且经历丰富
统计总数
统计表——定类变量
例2 你在购房中,主要考虑哪些因素? A 价格适中 B 上班近 C交通方便 D 购物方便 请从中选择三项:第一项: 第二项: 第三项:
ù Ô Ë Ú µ ¤ Î » º Í ³ ¡ Õ ¬ Ç ø Ó Ð Î Þ » ¼ Õ ß
例: 图2-3 众的影响
三项影响较大的SARS信息对不同文化程度民
误差条形图
100 80
× (g) å Ö Ì
60 40 20 0 A B ຫໍສະໝຸດ Baidu Ñ Ó ø Ë ×
图2-27 四种营养素喂养小白鼠三周后所增体重(克)
6.2 4.5 28.2 100.0
1.65 13.0
1.47 2.12 1.48 1.91
资料来源:《中国统计年鉴》,中国统计出版社,2006。
统计表和统计图
几点说明:
“—”表示数据不存在,“......”表示数据缺失。 统计表中小数点对齐。 一般要有合计一栏。频率合计时有时可能不是 100%,考虑四舍五入。 0——1000,1000——2000上组界不包括在内的 约定。
C
D
分段条形图
60 50
¿ Ñ Ç ô Ð Ô Â Ê £ ¤
ä Ë Æ û £ ¤
© ¤ £ ¨£ Ê £ Ô Â ô Ð Ñ
40 30 20 10 0 Ï À Ð Ö Ë È ± Ô ² Ö ´ À ´ Ç
图2-26 老、中、青三代的结核菌素阳性率与强阳性率(%)
统计图—条形图
绘制条图注意事项 纵轴的刻度必须从“0”开始,否则会改变各对比组间的比 例关系。
横轴:数据分组
纵轴:频次、频率或者频次密度、频率密 度。 等距分组数据:矩形的高度可以直接表示 频数(或频率)。非等距分组数据需要用 频次(或频率)密度表示,这时矩形的面 积表示各组的频数(或频率)。
统计图—直方图
统计图—直方图
频 14 数 人 12 ( )
10 8 6 4 2 0 ∥ 105 110 115 120 125 130 135 140 按零件数分组(个)
核心家庭 49%
直系家庭 34% 图2-1 家庭结构分布图
统计图—圆瓣图
核心家庭 直系家庭 联合家庭 其他
其他 联合家庭 12% 5%
核心家庭 49%
直系家庭 34% 图2-1 家庭结构分布图
统计图—条形图
条形图:主要用于表示离散型数据资料。 可分为:简单条形图、分组条形图(复式)、分段条
形图,误差线条形图,分段条形图。
60 50
百分比 %
40 30 20 10 0 核心家庭 直系家庭 联合家庭 其他
单式条形图
60 50 40 人 30 数 20 10 0
甲 乙 丙 丁
图形
尺度线
基线
等级
图2-1 某年级操行评定结果条形图
复式条形图
35 30 25 人 数 20 15 10 5 0 甲 乙 等级 丙 丁
统计图—折线图
折线图:把直方图顶部的中点(组中值)用直线段
连接起来就是折线图。 多用于连续性资料,凡欲表示两个变量之间的函 数关系,或描述某种现象在时间上的发展趋势, 或一种现象随另一种现象变化的情形。
统计图—直方图
(个)频数 30
14
12 10 8 6
25 20 15 10 5 105 110 115 120 125 130 135 140 日加工零件数(个) 0