简明统计学教程2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:50名学生成绩
第1步:确定组的个数:2的k次方法则。 第2步:确定组距或组宽:i≥(H-L)/k。 第3步:确定各组组限 第4步:把数据记入各组。 第5步:数出每组中项目个数
绘制
2.2 频数分布描述--直方图(histogram)
2.2 频数分布描述--直方图(histogram)
上章复习-变量
居住地 社会阶层 月收入
A 成都 中上层 10000
B 南京 上层
20000
C 上海 下层
3000
D 北京 中下层 6000
E 广州 中层
10000
…
平均每月到健身房
健身次数
体重(kg)
10
65
10
70
0
70
0
67
5
75
上章复习-次数、频率与概率
上章复习-数据的收集
1)来自公开发表资料中的数据 2)实验设计的数据 3)调查数据 4)观察数据
折线图和直方图作用类似,但可以比较 多个频数分布。
绘制
2.2 频数分布描述—累积频数折线图 (cumulative frequency polygon)
2.2 频数分布描述—累积频数折线图 (cumulative frequency polygon)
累积频数分布折线图可以了解低于某一 个值的频数是多少,如低于78分的人有 多少。
2.3 其它-定量- 散点图(scatter plot)
2.3 其它-定量- 散点图(scatter plot)
如果数据集中包含非常多的点(例如, 几千个点),那么散点图便是最佳图表 类型。但在点状图中显示多个序列看上 去非常混乱。
绘制
2.3 其它-定量-对数图 (logarithmic chart)
2.3 其它-定性-条形图和柱形图(bar chart )
图形中的条形可以水平放置(条形图), 也可以垂直放置(柱形图)。
可以在一个图表中同时表示和比较多个 时间序列数据各个时期的变化情况。
绘制
直方图与条形图/柱形图区别。 虽然我们可以用条形图来近似地模拟直
方图, 但它不是严格意义上的直方图。
统计学-2
描述数据:频数分布与图形表示
上章复习
统计学可分为哪两种? 总体 样本 个体 定性变量 / 定量变量 离散变量 / 连续变量 定类 / 定序 / 定距 / 定比 次数、频率与概率 数据的收集
上章复习-总体、样本、个体
为了了解学生对食堂饭菜价格、分量和口味的意见, 学生会对200名学生进行了问卷调查。
2008年分数段; 企业123的12个月产量
40 35 30 25 20 15 10 5 0
1 2 3 4 5 6 7 8 9 10 11 12
企业1 企业2 企业2改革后
2.3 其它-定量-线图(line chart)
2.3 其它-定量-线图(line chart)
经常用来描述时间序列数据,用以反映 某些指标或变量随时间的变化趋势,有 时也称为时间序列图(time series plot)。时间序列图实际上是散点图图 的一种。
横轴通常分为等距区间。(区间可以不 等距,但只有等距分组的直方图才能直 观反映数据分布特征。)
绘制
2.2 频数分布描述--茎叶图
2.2 频数分布描述--茎叶图 (stem-and-leaf plot)
频数分布表可以了解:分数变化范围; 集中趋势。但会损失一些详细信息,如 最高分和最低分,每一个真实值,每一 组数据的具体分布情况。
X轴上按比例标出每组上限,在Y轴上按 比例标出相应累积频数。
绘制
应用:Lorenz curve
Lorenz curve
作业
课后练习1、2、3、4
2.3 其它-定性-饼图(pie chart)
适合表示分组数量在总体中的比例。 绘制
2.3 其它-定性-条形图和柱形图(bar chart )
可以将多个时间序列图绘制在同一张图 表中。
绘制
2.3 其它-定性-面积图(area chart)
面积图与折线图非常相似,不过它们是 在折线下的区域中显示不同颜色。
绘制
2.3 其它-定量-盒型图
(box plot, box-and-whisker plot)
2.3 其它-定量-盒型图
(box plot, box-and-whisker plot)
茎叶图以打头数字作为茎,尾随数字Байду номын сангаас 为叶。茎叶图在数据量不是很大时,既 显示了完全的原始数据,又显示了数据 分布的形状。
绘制
2.2 频数分布描述--频数折线图 (frequency polygon)
2.2 频数分布描述--频数折线图 (frequency polygon)
连接组中值与每组频数的交点,组中值 为每组上下限的平均数。如例一中的一 组的组中值=(60-50)/2+50=55。
可以了解上下四分位数、中数、极值、 数据分布的范围和形式、数据得异常值 等。
绘制:Q3、Q2、Q1、IQR、1.5*IQR
内部范围(Inner fences):内部上限=Q3+ 1.5×IQR;内部下限=Q1-l 5×IQR
外部范围(Outer fenccs):外部上限=内部上 限+1.5IQR;外部下限=内部下限-1.5IQR
上章复习-课后练习
课后练习
引言
描述统计学是以某种信息化的方式组织、 概括和展示数据的方法。 利用表格、图 形、少数汇总数字来描述一组数据的全 貌,反映事物的特征、规律及发展趋势。
2.1 数据的预处理
数据审核 数据排序 数据筛选 数据透视表
2.2 频数分布描述--频数分布表 (frequency distribution )
不是反映绝对数值的变化,而是反映数 值增长率的变动趋势,如各种经济指标 的环比变化速度等。
环比
例:中国石油股价
绘制
作业
课后练习
第1步:确定组的个数:2的k次方法则。 第2步:确定组距或组宽:i≥(H-L)/k。 第3步:确定各组组限 第4步:把数据记入各组。 第5步:数出每组中项目个数
绘制
2.2 频数分布描述--直方图(histogram)
2.2 频数分布描述--直方图(histogram)
上章复习-变量
居住地 社会阶层 月收入
A 成都 中上层 10000
B 南京 上层
20000
C 上海 下层
3000
D 北京 中下层 6000
E 广州 中层
10000
…
平均每月到健身房
健身次数
体重(kg)
10
65
10
70
0
70
0
67
5
75
上章复习-次数、频率与概率
上章复习-数据的收集
1)来自公开发表资料中的数据 2)实验设计的数据 3)调查数据 4)观察数据
折线图和直方图作用类似,但可以比较 多个频数分布。
绘制
2.2 频数分布描述—累积频数折线图 (cumulative frequency polygon)
2.2 频数分布描述—累积频数折线图 (cumulative frequency polygon)
累积频数分布折线图可以了解低于某一 个值的频数是多少,如低于78分的人有 多少。
2.3 其它-定量- 散点图(scatter plot)
2.3 其它-定量- 散点图(scatter plot)
如果数据集中包含非常多的点(例如, 几千个点),那么散点图便是最佳图表 类型。但在点状图中显示多个序列看上 去非常混乱。
绘制
2.3 其它-定量-对数图 (logarithmic chart)
2.3 其它-定性-条形图和柱形图(bar chart )
图形中的条形可以水平放置(条形图), 也可以垂直放置(柱形图)。
可以在一个图表中同时表示和比较多个 时间序列数据各个时期的变化情况。
绘制
直方图与条形图/柱形图区别。 虽然我们可以用条形图来近似地模拟直
方图, 但它不是严格意义上的直方图。
统计学-2
描述数据:频数分布与图形表示
上章复习
统计学可分为哪两种? 总体 样本 个体 定性变量 / 定量变量 离散变量 / 连续变量 定类 / 定序 / 定距 / 定比 次数、频率与概率 数据的收集
上章复习-总体、样本、个体
为了了解学生对食堂饭菜价格、分量和口味的意见, 学生会对200名学生进行了问卷调查。
2008年分数段; 企业123的12个月产量
40 35 30 25 20 15 10 5 0
1 2 3 4 5 6 7 8 9 10 11 12
企业1 企业2 企业2改革后
2.3 其它-定量-线图(line chart)
2.3 其它-定量-线图(line chart)
经常用来描述时间序列数据,用以反映 某些指标或变量随时间的变化趋势,有 时也称为时间序列图(time series plot)。时间序列图实际上是散点图图 的一种。
横轴通常分为等距区间。(区间可以不 等距,但只有等距分组的直方图才能直 观反映数据分布特征。)
绘制
2.2 频数分布描述--茎叶图
2.2 频数分布描述--茎叶图 (stem-and-leaf plot)
频数分布表可以了解:分数变化范围; 集中趋势。但会损失一些详细信息,如 最高分和最低分,每一个真实值,每一 组数据的具体分布情况。
X轴上按比例标出每组上限,在Y轴上按 比例标出相应累积频数。
绘制
应用:Lorenz curve
Lorenz curve
作业
课后练习1、2、3、4
2.3 其它-定性-饼图(pie chart)
适合表示分组数量在总体中的比例。 绘制
2.3 其它-定性-条形图和柱形图(bar chart )
可以将多个时间序列图绘制在同一张图 表中。
绘制
2.3 其它-定性-面积图(area chart)
面积图与折线图非常相似,不过它们是 在折线下的区域中显示不同颜色。
绘制
2.3 其它-定量-盒型图
(box plot, box-and-whisker plot)
2.3 其它-定量-盒型图
(box plot, box-and-whisker plot)
茎叶图以打头数字作为茎,尾随数字Байду номын сангаас 为叶。茎叶图在数据量不是很大时,既 显示了完全的原始数据,又显示了数据 分布的形状。
绘制
2.2 频数分布描述--频数折线图 (frequency polygon)
2.2 频数分布描述--频数折线图 (frequency polygon)
连接组中值与每组频数的交点,组中值 为每组上下限的平均数。如例一中的一 组的组中值=(60-50)/2+50=55。
可以了解上下四分位数、中数、极值、 数据分布的范围和形式、数据得异常值 等。
绘制:Q3、Q2、Q1、IQR、1.5*IQR
内部范围(Inner fences):内部上限=Q3+ 1.5×IQR;内部下限=Q1-l 5×IQR
外部范围(Outer fenccs):外部上限=内部上 限+1.5IQR;外部下限=内部下限-1.5IQR
上章复习-课后练习
课后练习
引言
描述统计学是以某种信息化的方式组织、 概括和展示数据的方法。 利用表格、图 形、少数汇总数字来描述一组数据的全 貌,反映事物的特征、规律及发展趋势。
2.1 数据的预处理
数据审核 数据排序 数据筛选 数据透视表
2.2 频数分布描述--频数分布表 (frequency distribution )
不是反映绝对数值的变化,而是反映数 值增长率的变动趋势,如各种经济指标 的环比变化速度等。
环比
例:中国石油股价
绘制
作业
课后练习