四单变量的描述统计离散趋势分析和集中趋势分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用于定序和定距变量
团结 信赖 6创造 挑战
众数的特点:不唯一性
精品文档
欢迎下载
欢迎使用
团结信赖
• 原始数据:4、5、7、8、19(无众值)
• 原始数据:4、5、7、5、5、16(一个众值)
• 原始数据:4、4、5、7、7、9(两个众值)
团结 信赖 7创造 挑战
例1:非连续取值
团结 信赖 8创造 挑战
解:根据平均数的计算 公式有:
X= X 200 20岁 N 10
团结 信赖 2创3 造 挑战
cf
w
• L:中位数组的下限
• f:中位数组的频数
• w:中位数组的组距 (U-L)
• cf:低于中位数组下 限的累加次数
• n:全部个案数
• Md位置=n/2 (上下 各50%的位置)
团结 信赖 1创7 造 挑战
例:分组数据:
• 首先将各组的次数累加起来 • 求中位数的位置: • Md位置=n/2 =212/2=106 • 第106个位置在 25-35之间
量,但不可用于定类变量。
团结 信赖 1创1 造 挑战
(1)未分组数据求中位数: Md位置= n 1 2
(2)中位数=中间位置的值 注意:先找位置,再找中位数 将各个个案由低至高排列起来,居序列中央位
置的个案值就是中位值。
团结 信赖 1创2 造 挑战
(1)、个案数为奇数
【精例品1文】档 :甲地欢迎的下5载户人家欢的迎使人用数为:团结2,信赖4,3,6,8, 求中位值。
来代表全体变量的问题,这个典型的变量值或
特征值就称作集中值或集中趋势。
★ 众值(Mode) ——定类层次
★ 中位值(Median)——定序层次
★ 均值(Mean) ——定距层次
团结 信赖 5创造 挑战
一、众数(mode)
1、出现频次最多的变量值; 2、众数的不唯一性; 3、主要应用于定类变量,当然也可以
团结 信赖 3创造 挑战
单变量描述统计
• 精在品文统档计分析中欢迎,下是载否可以欢找迎出使用一个有代团表结信性赖的数值来说 明变量的分布,反映资料的集中或差异情况?
• 集中趋势测量,就是以一个数值来代表变量的资料分布, 反映的是变量值向中心值聚集的程度,也就是说以这一 个数值(或称典型值)来估计或预测每一个研究对象的 数值时发生的错误总数在理论上是最小的。
团结 信赖 1创4 造 挑战
(3)频数分布表
【例3】根据下表求中位值。
成 频 累计频次 绩 次 cf 甲 85 500 乙 195 415 丙 210 220 丁 10 10 N 500 500
解:Md位置
= N+1 = 500+1
2
2
=250.5 中位值Md=乙
团结 信赖 1创5 造 挑战
2、分组数据
• 精根品文据档统计欢表迎中下载的累积欢迎百使用分比,团结找信赖出含有 50%的区间
• 找出含有50%区间的上界值U,下界值L, 上界累计百分数U%,下界累计百分数 L%以及组距等信息
• 根据线段对应成比例的原理,计算出累计 百分比为50%的变量值
团结 信赖 1创6 造 挑战
Md
L
n 2
f
四单变量的描述统计离散趋势 分析和集中趋势分析
1
知识点: 两个维度——七个统计量数
数据的简化
集中趋势
众值
中位数
均值
离散程度
异众比率 四分位差
方差与标准差
团结 信赖 2创造 挑战
学习要求
1、精品集文档中趋势欢迎各下载测量法欢迎的使计用 算方团法结信;赖 2、集中趋势各测量法的特点和应用; 3、离散程度各测量法的计算方法; 4、离散程度各测量法的特点与应用;
• 离散趋势测量(Measures of dispersion)就是用一个值 表示数据之间的差异情况。
• 离散趋势测量法和集中趋势测量法具有互补作用。在进 行统计分析时,既要测量变量的集中趋势,也要测量离 散趋势。
团结 信赖 4创造 挑战
集中趋势测量/分析
精品文档
欢迎下载
欢迎使用
团结信赖
集中趋势测量:用某一个典型的变量值或特征值
例2 分组数据
精品文档
欢迎下载
收入(元)
欢迎使用
f
500-699
10
700-899
65
900-1099
126
1100-1299
158
1300-1499
141
1500-1699
40
总数
550
团结信赖
Cf↑
10 75
211 369 510 550
Cf↓
550 540
475 339 181 40
团结 信赖 9创造 挑战
解:Md的位置=
N=+1 =53+1
2
2
中位值Md=4
排序2,3,4,6,8
团结 信赖 1创3 造 挑战
(2)个案数为偶数
精品文档
欢迎下载
欢迎使用
团结信赖
【例2】:乙地的6户人家的人数为:2,4,3,6,8,
5求中位值。
解:Md的位置=
N+1 2
=
6+2=13.5
Md= 4 5=4.5 2
排序2,3,4, 5, 6,8
2、仅适用于定距变量,不适用于定类和 定序;
团结 信赖 2创1 造 挑战
1、未分组数据
(精1品)文档简单原欢迎始下载资料求欢迎均使用值 团结信赖
X x n 团Fra Baidu bibliotek 信赖 2创2 造 挑战
均值的计算——未分组数据
【例5】某班10名学生年龄 分别为20、21、19、19、 20、20、21、22、18、 20岁,求他们的平均年 龄。
合计 N 100
解:Md位置=50;
从累积频数cf栏找到中位数位 置所在组为“300-400”
引入公式:
Md=L+
N2 -cf
w
f
300 50 30 100 =350
40
团结 信赖 2创0 造 挑战
三、均值
精品文档
欢迎下载
欢迎使用
团结信赖
1、均值的定义:总体各单位取值之和除
以总体单位数目。
团结 信赖 1创8 造 挑战
• 分组变量看作是一组连续的数值
精品文档
欢迎下载
欢迎使用
团结信赖
10
25
?
35
94 12 106
124
30
团结 信赖 1创9 造 挑战
【例4】: 根据下表数据求中位值。
收入(元) 职工数 Cf 100-200 10 10 200-300 20 30 300-400 40 70 400-500 30 100
• 从分布来看,众数是具有明显集中趋势点 的数值,一组数据分布的最高峰点所对应 的数值及为众数。
团结 信赖 1创0 造 挑战
二、中位值(Median)
1、精品把文档一组数欢迎据下载按顺序欢迎排使用列,处团结于信中赖 间位置 的那个数值就是中位值。
Md
50%
50%
2、主要应用于定序变量,也可用于定距变
团结 信赖 6创造 挑战
众数的特点:不唯一性
精品文档
欢迎下载
欢迎使用
团结信赖
• 原始数据:4、5、7、8、19(无众值)
• 原始数据:4、5、7、5、5、16(一个众值)
• 原始数据:4、4、5、7、7、9(两个众值)
团结 信赖 7创造 挑战
例1:非连续取值
团结 信赖 8创造 挑战
解:根据平均数的计算 公式有:
X= X 200 20岁 N 10
团结 信赖 2创3 造 挑战
cf
w
• L:中位数组的下限
• f:中位数组的频数
• w:中位数组的组距 (U-L)
• cf:低于中位数组下 限的累加次数
• n:全部个案数
• Md位置=n/2 (上下 各50%的位置)
团结 信赖 1创7 造 挑战
例:分组数据:
• 首先将各组的次数累加起来 • 求中位数的位置: • Md位置=n/2 =212/2=106 • 第106个位置在 25-35之间
量,但不可用于定类变量。
团结 信赖 1创1 造 挑战
(1)未分组数据求中位数: Md位置= n 1 2
(2)中位数=中间位置的值 注意:先找位置,再找中位数 将各个个案由低至高排列起来,居序列中央位
置的个案值就是中位值。
团结 信赖 1创2 造 挑战
(1)、个案数为奇数
【精例品1文】档 :甲地欢迎的下5载户人家欢的迎使人用数为:团结2,信赖4,3,6,8, 求中位值。
来代表全体变量的问题,这个典型的变量值或
特征值就称作集中值或集中趋势。
★ 众值(Mode) ——定类层次
★ 中位值(Median)——定序层次
★ 均值(Mean) ——定距层次
团结 信赖 5创造 挑战
一、众数(mode)
1、出现频次最多的变量值; 2、众数的不唯一性; 3、主要应用于定类变量,当然也可以
团结 信赖 3创造 挑战
单变量描述统计
• 精在品文统档计分析中欢迎,下是载否可以欢找迎出使用一个有代团表结信性赖的数值来说 明变量的分布,反映资料的集中或差异情况?
• 集中趋势测量,就是以一个数值来代表变量的资料分布, 反映的是变量值向中心值聚集的程度,也就是说以这一 个数值(或称典型值)来估计或预测每一个研究对象的 数值时发生的错误总数在理论上是最小的。
团结 信赖 1创4 造 挑战
(3)频数分布表
【例3】根据下表求中位值。
成 频 累计频次 绩 次 cf 甲 85 500 乙 195 415 丙 210 220 丁 10 10 N 500 500
解:Md位置
= N+1 = 500+1
2
2
=250.5 中位值Md=乙
团结 信赖 1创5 造 挑战
2、分组数据
• 精根品文据档统计欢表迎中下载的累积欢迎百使用分比,团结找信赖出含有 50%的区间
• 找出含有50%区间的上界值U,下界值L, 上界累计百分数U%,下界累计百分数 L%以及组距等信息
• 根据线段对应成比例的原理,计算出累计 百分比为50%的变量值
团结 信赖 1创6 造 挑战
Md
L
n 2
f
四单变量的描述统计离散趋势 分析和集中趋势分析
1
知识点: 两个维度——七个统计量数
数据的简化
集中趋势
众值
中位数
均值
离散程度
异众比率 四分位差
方差与标准差
团结 信赖 2创造 挑战
学习要求
1、精品集文档中趋势欢迎各下载测量法欢迎的使计用 算方团法结信;赖 2、集中趋势各测量法的特点和应用; 3、离散程度各测量法的计算方法; 4、离散程度各测量法的特点与应用;
• 离散趋势测量(Measures of dispersion)就是用一个值 表示数据之间的差异情况。
• 离散趋势测量法和集中趋势测量法具有互补作用。在进 行统计分析时,既要测量变量的集中趋势,也要测量离 散趋势。
团结 信赖 4创造 挑战
集中趋势测量/分析
精品文档
欢迎下载
欢迎使用
团结信赖
集中趋势测量:用某一个典型的变量值或特征值
例2 分组数据
精品文档
欢迎下载
收入(元)
欢迎使用
f
500-699
10
700-899
65
900-1099
126
1100-1299
158
1300-1499
141
1500-1699
40
总数
550
团结信赖
Cf↑
10 75
211 369 510 550
Cf↓
550 540
475 339 181 40
团结 信赖 9创造 挑战
解:Md的位置=
N=+1 =53+1
2
2
中位值Md=4
排序2,3,4,6,8
团结 信赖 1创3 造 挑战
(2)个案数为偶数
精品文档
欢迎下载
欢迎使用
团结信赖
【例2】:乙地的6户人家的人数为:2,4,3,6,8,
5求中位值。
解:Md的位置=
N+1 2
=
6+2=13.5
Md= 4 5=4.5 2
排序2,3,4, 5, 6,8
2、仅适用于定距变量,不适用于定类和 定序;
团结 信赖 2创1 造 挑战
1、未分组数据
(精1品)文档简单原欢迎始下载资料求欢迎均使用值 团结信赖
X x n 团Fra Baidu bibliotek 信赖 2创2 造 挑战
均值的计算——未分组数据
【例5】某班10名学生年龄 分别为20、21、19、19、 20、20、21、22、18、 20岁,求他们的平均年 龄。
合计 N 100
解:Md位置=50;
从累积频数cf栏找到中位数位 置所在组为“300-400”
引入公式:
Md=L+
N2 -cf
w
f
300 50 30 100 =350
40
团结 信赖 2创0 造 挑战
三、均值
精品文档
欢迎下载
欢迎使用
团结信赖
1、均值的定义:总体各单位取值之和除
以总体单位数目。
团结 信赖 1创8 造 挑战
• 分组变量看作是一组连续的数值
精品文档
欢迎下载
欢迎使用
团结信赖
10
25
?
35
94 12 106
124
30
团结 信赖 1创9 造 挑战
【例4】: 根据下表数据求中位值。
收入(元) 职工数 Cf 100-200 10 10 200-300 20 30 300-400 40 70 400-500 30 100
• 从分布来看,众数是具有明显集中趋势点 的数值,一组数据分布的最高峰点所对应 的数值及为众数。
团结 信赖 1创0 造 挑战
二、中位值(Median)
1、精品把文档一组数欢迎据下载按顺序欢迎排使用列,处团结于信中赖 间位置 的那个数值就是中位值。
Md
50%
50%
2、主要应用于定序变量,也可用于定距变