常用统计参数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/6/14
.
30
2、几何平均数的应用条件
一组实验数据中有少数数据偏大或者偏 小,数据的分布呈偏态时;
心理物理学实验中,用等距和等比量表 测量所获得的数据;
一组数据彼此间差异较大,几乎是按一 定的比例关系变化时,如教育研究中教 育经费的增加、学校每年的招生人数等。
2020/6/14
.
31
Mean = 51.7
0
N = 664.00
25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0 75.0 80.0 85.0
BB
100
Std. Dev = 10.39
Mean = 37.3
0
N = 644.00
20.0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0 75.0 80.0
17
2020/6/14
.
17
3、次数分布表中数的计算
A、求N/2,找出N/2即中数所在的分组区 间;
B 、 求 N/2 所 在 区 间 以 下 各 区 间 的 次 数 和 (即中数所在组区间下限以下的累加次 数),记作Fb;
C、计算N/2–Fb的值; D、求位于N/2点的值
2020/6/14
.
18
仅仅用平均数能不能反映这组数据的所有特 性?为什么?
2020/6/14
.
44
3、标准差的性质
一组数据的每一个观测值都加上一个常 数C,其标准差不变。
一组数据的每一个观测值都乘以一个常 数C,其标准差为原标准差乘以常数C。
2020/6/14
.
45
证明并思考
试证明上述标准差的性质并思考在每种 情况下数据分布形态的变化。
离散量:反映一组数据离散趋势或离散 程度的统计量,用来表示一组数据的分 散情况。
次数分布的两个基本特征:中心位置与 离散性
2020/6/14
.
35
图例
2020/6/14
.
36
绝对 差异量
离散量的种类
离散量
方
差 全平
与 距均
标
差
准
差
标准分数
差
异 相对差
系
异量
数
2020/6/14
.
37
(一)全距
3、几何平均数的计算
X g n X1 X2 Xn (A)
Xg
n1
Xn X1
(B)
2020/6/14
.
32
上式中,n代表数据的个数;
几何平均数有两种情况:一种是实验直 接观测值的平均数(如心理物理实验中
所获得的数据,此时用公式A,P36);
一种是指数据的平均变化率(如人口的 增长率、学习能力的进步率等,此时用 公式B)。
中随机抽取的容量相同的样本,所计算 出的算术平均数与其他集中量指标相比, 抽样误差较小。
2020/6/14
第二章:常.用统计参数
12
6、算术平均数应用的局限
易受极端数据的影响。 若有模糊不清的数据,则无法计算平均
数。 凡不同质的数据不能计算平均数。(同
质数据是指用同一个观测手段,采用相 同的观测标准,能反映某一问题的同一 方面特质的数据。)
学算术平均数常用代表变量的字母上加
一“—”来表示,如 X , Y
2020/6/14
.
6
2、算术平均数的计算
假设一变量X共有n个观测值,则变量X的
平均数为:
n
X X1 X 2 ... X n i1 X i
n
n
n
Xi通常可简写为 Xi
i 1
2020/6/14
.
7
3、算术平均数的性质
在一组数据中每个观测值与平均数之差 (离均差)的总和等于0。
52.5-
55 3
0.100
23.3
57.5-
60 3
0.100
33.3
62.5-
65 4
0.133
46.6
67.5-
70 4
0.133
59.9
72.5-
75 8
0.267
86.6
77.5-
80 3
0.100
96.6
82.5-
85 1
0.034
100.0
总和
N=30 1.000
(Σ) 2020/6/14
2、标准分数的计算
Z Xi X S
其中:Xi代表原始分数
X 为一组数据的平均数
S为标准差。
2020/6/14
n
n
2020/6/14
.
39
平均差的应用
平均差是用来表示一组数据离散程度的 较好的差异量数,反应灵敏,确定严密。
缺点是在计算时要取绝对值,不利于代 数方法的运算;也不利于进一步的统计 分析。
2020/6/14
.
40
(三)方差与标准差
1、基本定义
方差(Variance):也叫变异数、均方,是 每个观测值与该组数据的平均数之差平方后 和的均值,即离均差平方和的平均数。
复,按以下方法计算中数: 1)当数据的个数为奇数时,取位于中间
的那个数即第(N+1)/2个数为中数; 2)当数据的个数为偶数时,取第N/2个和
第N/2+1个数的平均数为中数。
2020/6/14
.
15
C、如果位于数据序列中间的是几个重复数据, 则按以下方法计算中数:
1)把重复数据视作某一区间上的几个连续的数;
能取中数作为集中趋势的代表值; C.当需要快速估计一组数据的代表值时,也常用中
数。
2020/6/14
.
23
(三)众数
1、众数:又叫范数,密集数,通常数等, 常用符号Mo表示,是指一组数据中出 现次数最多的那个数(Mode)。
2020/6/14
.
24
2、众数的计算
求众数最简单的方法是通过直接观察找 出粗略众数。
S
Xi X
n
2020/6/14
.
42
练习
试推导用原始数据计算方差和标准差的公
式。
S 2
X
2 i
n
2
X n
i
S
X
2 i
n
X n
i
2
2020/6/14
.
43
计算并思考
计算下列四组数据的平均数,并找出每组数据 的最大值和最小值:
A.7、7、8、8、8、9、9 B.4、5、7、8、9、11、12 C.1、4、7、8、9、12、15 D. 1、8、8、8、8、8、15 思考:这四组数据有什么不同?
.
21
4、中数的意义与应用
优点:计算简单,容易理解。 不足:反应不够灵敏;受抽样的影响较
大,不稳定;也不能作进一步的代数运 算。
2020/6/14
.
22
4、中数意义与应用
应用:中数一般不经常使用,但在下列情况 下,中数可以较好地反映数据的集中趋势:
A.当一组观测结果中出现两极端数据时; B.当次数分布的两端数据或个别数据不清楚时,只
2020/6/14
.
46
4、方差与标准差的意义
方差与标准差是表示一组数据离散程度 的最好指标,具有以下优点:
反应灵敏,每个数据取值的变化,方差与 标准差都会随之变化;
有一定的计算公式严密确定; 容易计算并适合代数运算;
2020/6/14
.
47
4、方差与标准差的意义
受抽样变动的影响小; 具有可加性,因此可以分解并确定出属于
年龄
2020/6/14
.
3
一、集中量数
集中量:即表现一组数据的集中趋势或 集中程度,代表一组数据的中心位置的 统计量。
2020/6/14
.
4
集中量
算
几
术 中众
何
平 数数
平
均
均
数
数
加权平均数
2020/6/14
.
5
(一)算术平均数
1、算术平均数:一般简称为平均数或均数 (Mean),一组数据的总和除以数据的 总个数所得的商就是算术平均数。
全距:即一组数据中最大值与最小值的 差。常用大写字母R表示。 (Range=Max-Min)
用全距表示一组数据的离散程度是非常 粗略和不准确的。
2020/6/14
.
38
(二)平均差
平均差:每一个观测值与平均数的距离 的和的平均。用AD(average deviation) 表示。
ADXi Xxi
反应灵敏。观测数据中任何一个数值的 变化都能通过算术平均数反应出来。
确定严密。只要是同一组数据,计算出 来的算术平均数不受计算者、时间、地 点等因素的影响。
2020/6/14
.
11
5、算术平均数的意义与优点
简明易解。原理简单易懂,计算简便易 行。
符合代数方法进一步演算。 较少受抽样变动的影响。从同一个总体
样本方差和总体方差的计算方法和含义是一 致的,但符号不同,前者用S2表示 ,后者用 σ2表示。
标准差(Standard deviation):即方差的平 方根,样本方差常用符号S或SD表示,总体 方差则用σ表示。
2020/6/14
.
41
2、方差与标准差的计算公式
2
S2
Xi X
n
2
也可以用公式求出理论众数,皮尔逊经 验法是常用的计算正态分布数据理论众 数的方法,其公式为:
Mo=3Md-2M
2020/6/14
.
25
3、众数的应用
众数的缺点同中数一样,其应用也因此受 到限制,通常是在无法计算平均数的情 况下,用以了解一组数据的集中情况, 如存在极端数据、有模糊数据、有不同 质数据等。
2020/6/14
.
33
练习
一研究阅读能力随阅读遍数变化的实验结果如下: 第一遍,理解成分为40% 第二遍,理解成分为52% 第三遍,理解成分为65% 第四遍,理解成分为75% 第五遍,理解成分为86% 第六遍,理解成分为97% 求阅读能力随阅读遍数的平均增加比率。
2020/6/14
.
34
二、离散量
2020/6/14
.
13
(二)中数
1、中数,又叫中位数,符号为Md或Mdn ( Median ) , 指 的 是 位 于 一 组 数 据 中 较大一半与较小一半中间位置的那个数。
中数可能是观测数据中的某一个,也可 能根本不是原有的数。
2020/6/14
.
14
2、未分组数据中数的计算
A、将数据依值的大小排序 B、如果位于数据序列中间的几个数不重
n
n
n
Xi C X C n
3 X i C C X i C X
2020/6/14
n
n.
9
4、次数分布表算术平均数的计算
X fXc f
f为各组的次数
X
为
c
各组的组中值
2020/6/14
.
10
5、算术平均数的意义与优点
算术平均数是应用最普遍的一种集中量 数,是“真值”的渐近、最佳估计值。
2020/6/14
.
27
2、加权平均数的计算
XW
Wi Xi Wi
2020/6/14
.
28
3、加权平均数的应用
大学课程成绩的计算 大学生综合测评成绩的计算 不同分实验(调查)结果的会合 等等
2020/6/14
.
29
(五)几何平均数
1、几何平均数(geometric mean):又 叫对数平均数,符号记作Mg或 X g 。
第二章:常用统计参数
主讲:任杰
.
统计量
统计量:反映一组数据(样本)统计特 征的数字。
参数:反映总体的统计特征的数字叫参 数。
统计量和参数的统计意义是相同的,计 算原理和方法也是相同的,只是在指代 不同对象时叫法不同,表示方法不同。
2020/6/14
.
2
200
200
100
Std. Dev = 10.63
N2Fb
MdLmd
•i fmd
2020/6/14
.
19
其中: Lmd为N/2所在区间的精确下限 i为组距 fmd 为中数所在区间的次数
2020/6/14
.
20
组别
42.5-
组中值 次数 (Xc) (f)
45 1
相对次数
0.033
上限以下累 积百分数
3.3
47.5-
50 3
0.100
13.3
2)根据B步骤的计算方法,中数落在哪一个数 上,则该数的中点就是此一列数据的中数;
3)如果中数落在两个重复数据之间,则前一个 重复数据的精确上限或后一个数据的精确下 限即为要求的中数。
2020/6/14
.
16
2、4、5、7、8、9、9、11、13 2、4、5、5、7、8、9、9、11、13 2、4、5、5、8、9、9、9、11、12、13 2、4、5、5、8、9、9、9、11、12、13、
不同来源的变异性,并可进一步说明每种 变异对总结果的影响,是以后统计推论部 分常用的统计特征数。
2020/6/14
.
48
(四)标准分数及其应用
1、标准分数(Standard Score):又称基 分数或Z分数,是以标准差为单位表示 一个分数在团体中所处位置的相对位置 量数。
2020/6/14
.
49
2020/6/14
.
26
(四)加权平均数
1、加权平均数是用来表示不同比重数据、 或平均数的平均数,用 X W 或Mw表示。
当数据的比重不同时,如果直接用算术 平均数来表示该组数据的集中趋势,就 不够科学和准确,这时就要用权数 (weight),即该数据在整个数据总体 中的相对重要性来计算平均数。
在一组数据中,每一个观测值都加上一 个常数C,则所得平均数为原来的平均 数加上常数C。
在一组数据中,每一个观测值都乘以一 个常数C,则所得平均数为原来的平
8
证明
1 X i X X i X X i n X
Xi Xi 0
2 X i C X i C X i nC