简明统计学教程PPT教学课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基础上确定总体的某些特征的方法。
2020/12/10
3
描述方式
数字度量 表格 图形
散点图(scatter plots):探究两事物之间的 关系
线形图(line graph):表示事物的发展变化 的趋势
条形图(bar charts):描述离散性统计事项
圆形图(circle graph),又叫饼图(pie): 最适合描述百分比关系。
2020/12/10
4
数字度量-集中量数与差异量数
一组变量的次数分布,一般至少有两个方面的基 本特征:
中心位置
➢ 用以度量一组数据的集中趋势,指数据分布中大量数 据向某方向集中的程度。中心位置用以描述它们的中 心位于何处,故对其数量化描述称为位置度量数或集 中量数(measures of central tendency)。
2020/12/10
9
图1-4 态度变化趋势图
图表
35 30
25
20
15
人数
10
5
0
非常不尽职 不尽职
不置可否 尽职
非常尽职
图1-5 各组人数分布图
1 2 3 4 5 6 7
2020/12/10
10
图1-6 各组人数分布图
总体、样本、个体
总体(population)问题所涉及的所有可能的个人、物体 或度量的集合。一般来说这些事物应该具有某种共同的特 征。
统计学-1 绪论
2020/12/10
1
为什么学习统计学
国家统计局成都调查队发布数据显示,去年成都 城镇居民人均可支配收入为27193.65元,较上年 增长13.63%,扣除物价因素,实际增长10.32%。
——网易财经
某研究机构研制出一种能提高5岁幼儿阅读能力的 游戏产品,该产品能在使用3个月之后提高幼儿的 阅读能力,请设计一个实验验证这种游戏产品的 作用。
离散性
➢ 离散性反映一组数据的分散程度,即次数分布的离散
程度,或称离中趋势(dispersion),指数据分布中
数据彼此分散的程度。
2020/12/10
5
数字度量-集中量数
算术平均数 加权平均数 中数 众数
2020/12/10
6
数字度量-差异量数
全距 百分位差、四分位差 方差 标准差
定序变量
用来测量对象的等级和顺序。数据类别是互斥的和穷尽的,
数据的类别排序依据特有性质决定 。
定距变量
通过一些常定的测量单位,在测量尺度的点之间划分出相 等的间距。其结果不仅可以显示类别间的等级顺序,还显
示它们间的确切距离。 只能加减,不能乘除。
定比变量
一般不作区别。除了有量的大小、相等单位之外,还有绝 对零点。可以进行四则运算。
变量的具体取值称为变量值。统计 数据就是统计变量的某些取值。
2020/12/10
13
变量-1-分类还是数值
1.定性变量 /属性变量
2. 定量变量
A)离散变量只能取某些特定的值,取值之间通常存 在间距,通常通过计数得到。
B)连续变量可以遍取某一区域中任何值,通常通过 测量得到。
2020/12/10
2020/12/10
P11 图1.1
16
变量-2-例-10个大学生对拉美裔的态度
学生
得分
Rose
98
Mike
96
定距
…….
95
100=极端偏见
94
22
21
20
15
11
2020/12/10
Ben
6
17
变量-2-例-ຫໍສະໝຸດ Baidu0个大学生对拉美裔的态度
学生
等级
定序
Rose Mike
1=最多偏见 2=第二
…….
杰出教授 教授 副教授 助理教授 高级讲师 讲师 助教
对教授的态度
非常赞许 赞许 有点赞许 中立 有点不赞许 不赞许 非常不赞许
20
变量-4-收集方法
观测数据:在没有对事物进行人为控制的 条件下得到,有关社会经济现象的统计数 据几乎都是观测数据。
实验数据:在实验中控制实验对象而收集 到的数据,自然科学领域的大多数数据都 是实验数据。
统计量:描述样本特征的概括性数字度量, 如x—,s,比例等。统计量是根据样本数据 计算出来的一个量,是不包含未知总体参 数的样本的函数。
2020/12/10
12
变量
变量:说明现象某种特征的概念。 其特点是从一次观察到下一次观察
会呈现出差别或变化,如“商品销售额”、 “受教育程度”、“产品质量等级”等都 是变量。
2020/12/10
7
图表
员工对主管尽职情况 的评定
人数
①非常不尽职
9
②不尽职
30
③不置可否
10
④尽职
25
⑤非常尽职
6
总计
80
2020/12/10
8
图表
35
30
25
20
15
人数
10
5
0
0
2
4
6
35 30
图1-3 人数与效率相关图
25 20
15
10 5
0
人数
非常不尽职 不置不可尽否职 非常尽尽职职
2020/12/10
21
变量-5-数据与时间的关系
截面数据:在相同或近似的时间点上收集 的数据,通常在不同空间上获得,如2010 年我国各地区的GDP数据。
样本(sample)所研究问题的总体的一部分。目的在于为 我们所实验或观察,以达到“从局部推断总体”。
个体(individual)/总体单位构成总体的每 个基本单元。
2020/12/10
11
参数和统计量
参数:描述总体特征的概括性数字度量, 常用希腊字母表示。如μ、σ比例π等。参数 通常是未知的常数,需要根据样本来估计。
2020/12/10 ——2007年心理学研究生入学试题
2
定义和分类
统计学(statistics)是收集、处理、分析、解释数 据,并从数据中得出结论的科学。 。
描述统计学(descriptive statistics)是以某种信 息化的方式组织、概括和展示数据的方法。
推断统计学(inferential statistics)是在样本的
P7 表1.1
14
变量-2-观察方法
计数变量(count variable)
就是计算个数的数据,它表示具有某种属性事 物的个数。
测量变量(measurement variable)
借助于一定的工具或一定的测量标准而获得的 数据。
2020/12/10
15
变量-3-测量水平
定类变量
用来测量对象类别。数据类别是互斥的和穷尽的,数据的 类别不存在逻辑顺序。
3=第三
4=第四
5=第五
6=第六
7=第七
8=第八
9=第九
2020/12/10
Ben
10=最少偏见
18
变量-2-例-10个大学生对拉美裔的态度
定类
对拉美裔的态度 频数
1=有偏见
5
2=包容
5
合计
10
2020/12/10
19
变量-2-例-定序和定距
尺度值 等级
1 2 3 4 5 6 7
2020/12/10
2020/12/10
3
描述方式
数字度量 表格 图形
散点图(scatter plots):探究两事物之间的 关系
线形图(line graph):表示事物的发展变化 的趋势
条形图(bar charts):描述离散性统计事项
圆形图(circle graph),又叫饼图(pie): 最适合描述百分比关系。
2020/12/10
4
数字度量-集中量数与差异量数
一组变量的次数分布,一般至少有两个方面的基 本特征:
中心位置
➢ 用以度量一组数据的集中趋势,指数据分布中大量数 据向某方向集中的程度。中心位置用以描述它们的中 心位于何处,故对其数量化描述称为位置度量数或集 中量数(measures of central tendency)。
2020/12/10
9
图1-4 态度变化趋势图
图表
35 30
25
20
15
人数
10
5
0
非常不尽职 不尽职
不置可否 尽职
非常尽职
图1-5 各组人数分布图
1 2 3 4 5 6 7
2020/12/10
10
图1-6 各组人数分布图
总体、样本、个体
总体(population)问题所涉及的所有可能的个人、物体 或度量的集合。一般来说这些事物应该具有某种共同的特 征。
统计学-1 绪论
2020/12/10
1
为什么学习统计学
国家统计局成都调查队发布数据显示,去年成都 城镇居民人均可支配收入为27193.65元,较上年 增长13.63%,扣除物价因素,实际增长10.32%。
——网易财经
某研究机构研制出一种能提高5岁幼儿阅读能力的 游戏产品,该产品能在使用3个月之后提高幼儿的 阅读能力,请设计一个实验验证这种游戏产品的 作用。
离散性
➢ 离散性反映一组数据的分散程度,即次数分布的离散
程度,或称离中趋势(dispersion),指数据分布中
数据彼此分散的程度。
2020/12/10
5
数字度量-集中量数
算术平均数 加权平均数 中数 众数
2020/12/10
6
数字度量-差异量数
全距 百分位差、四分位差 方差 标准差
定序变量
用来测量对象的等级和顺序。数据类别是互斥的和穷尽的,
数据的类别排序依据特有性质决定 。
定距变量
通过一些常定的测量单位,在测量尺度的点之间划分出相 等的间距。其结果不仅可以显示类别间的等级顺序,还显
示它们间的确切距离。 只能加减,不能乘除。
定比变量
一般不作区别。除了有量的大小、相等单位之外,还有绝 对零点。可以进行四则运算。
变量的具体取值称为变量值。统计 数据就是统计变量的某些取值。
2020/12/10
13
变量-1-分类还是数值
1.定性变量 /属性变量
2. 定量变量
A)离散变量只能取某些特定的值,取值之间通常存 在间距,通常通过计数得到。
B)连续变量可以遍取某一区域中任何值,通常通过 测量得到。
2020/12/10
2020/12/10
P11 图1.1
16
变量-2-例-10个大学生对拉美裔的态度
学生
得分
Rose
98
Mike
96
定距
…….
95
100=极端偏见
94
22
21
20
15
11
2020/12/10
Ben
6
17
变量-2-例-ຫໍສະໝຸດ Baidu0个大学生对拉美裔的态度
学生
等级
定序
Rose Mike
1=最多偏见 2=第二
…….
杰出教授 教授 副教授 助理教授 高级讲师 讲师 助教
对教授的态度
非常赞许 赞许 有点赞许 中立 有点不赞许 不赞许 非常不赞许
20
变量-4-收集方法
观测数据:在没有对事物进行人为控制的 条件下得到,有关社会经济现象的统计数 据几乎都是观测数据。
实验数据:在实验中控制实验对象而收集 到的数据,自然科学领域的大多数数据都 是实验数据。
统计量:描述样本特征的概括性数字度量, 如x—,s,比例等。统计量是根据样本数据 计算出来的一个量,是不包含未知总体参 数的样本的函数。
2020/12/10
12
变量
变量:说明现象某种特征的概念。 其特点是从一次观察到下一次观察
会呈现出差别或变化,如“商品销售额”、 “受教育程度”、“产品质量等级”等都 是变量。
2020/12/10
7
图表
员工对主管尽职情况 的评定
人数
①非常不尽职
9
②不尽职
30
③不置可否
10
④尽职
25
⑤非常尽职
6
总计
80
2020/12/10
8
图表
35
30
25
20
15
人数
10
5
0
0
2
4
6
35 30
图1-3 人数与效率相关图
25 20
15
10 5
0
人数
非常不尽职 不置不可尽否职 非常尽尽职职
2020/12/10
21
变量-5-数据与时间的关系
截面数据:在相同或近似的时间点上收集 的数据,通常在不同空间上获得,如2010 年我国各地区的GDP数据。
样本(sample)所研究问题的总体的一部分。目的在于为 我们所实验或观察,以达到“从局部推断总体”。
个体(individual)/总体单位构成总体的每 个基本单元。
2020/12/10
11
参数和统计量
参数:描述总体特征的概括性数字度量, 常用希腊字母表示。如μ、σ比例π等。参数 通常是未知的常数,需要根据样本来估计。
2020/12/10 ——2007年心理学研究生入学试题
2
定义和分类
统计学(statistics)是收集、处理、分析、解释数 据,并从数据中得出结论的科学。 。
描述统计学(descriptive statistics)是以某种信 息化的方式组织、概括和展示数据的方法。
推断统计学(inferential statistics)是在样本的
P7 表1.1
14
变量-2-观察方法
计数变量(count variable)
就是计算个数的数据,它表示具有某种属性事 物的个数。
测量变量(measurement variable)
借助于一定的工具或一定的测量标准而获得的 数据。
2020/12/10
15
变量-3-测量水平
定类变量
用来测量对象类别。数据类别是互斥的和穷尽的,数据的 类别不存在逻辑顺序。
3=第三
4=第四
5=第五
6=第六
7=第七
8=第八
9=第九
2020/12/10
Ben
10=最少偏见
18
变量-2-例-10个大学生对拉美裔的态度
定类
对拉美裔的态度 频数
1=有偏见
5
2=包容
5
合计
10
2020/12/10
19
变量-2-例-定序和定距
尺度值 等级
1 2 3 4 5 6 7
2020/12/10