spss平均数、标准差与变异系数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(四)在资料服从正态分布的条件下,资 在资料服从正态分布的条件下, 料中约有68.26%的观测值在平均数左右一 料中约有68.26%的观测值在平均数左右一 倍标准差( 倍标准差( 范围内;约有95.43% x ±S)范围内;约有95.43% ±2S) 2S)
的观测值在平均数左右两倍标准差( 的观测值在平均数左右两倍标准差(
σ = ∑(x −x) / N
2 2
由于 样本方差 带有原观测单位的 平方 单位, 单位,在仅表示一个资料中各观测值的变异 程度而不作其它分析时 , 常需要与平均数 将平方单位还原, 配合使用 ,这 时应 将平方单位还原,即应 求出样本方差的平方根。 求出样本方差的平方根。统计学上把样本方 的平方根叫做样本标准 记为S 差 S2 的平方根叫做样本标准 差,记为S, 即:
我们还可以采用将离均差平方的办法来解决离均 差有正、有负,离均差之和为零的问题。 差有正、有负,离均差之和为零的问题。 先将各 个离 均差平方,即 ( 均差平方, 差平方和 , 即 )2 ,再求 离均 x−x

2 简称平方和 记为SS; 平方和, (x − x),简称平方和,记为SS;
由 于 离差平方和 常 随 样 本 大 小 而 改 变 ,为 了 消 除 样 本大小 的 影 响 , 用平方和 除 以 样 本 大 小, 即 ∑ (x − x)2 / n,求出离均差平方和的平均数 ;
G = n x1 ⋅ x2 ⋅ x3 L xn = (x1 ⋅ x2 ⋅ x3 L xn )
1 n
为了计算方便, 为了计算方便,可将各观测值取对数后相 加除以n 加除以n,得lgG,再求lgG的反对数,即得G lgG,再求lgG的反对数 即得G 的反对数, 值,即
1 G = lg [ (lg x1+ lg x2 + L+ lg xn )] n
一、算术平均数 算术平均数是指资料中各观测值的总和除 算术平均数是指资料中各观测值的总和除 以观测值个数所得的商,简称平均数或均数 平均数或均数, 以观测值个数所得的商,简称平均数或均数, 记为。 记为。 算术平均数可根据样本大小及分组情况而 采用直接法或加权法计算。 采用直接法或加权法计算。
(三)平均数的基本性质 1、样本各观测值与平均数之差的和为零, 样本各观测值与平均数之差的和为零, 即离均差之和等于零。 离均差之和等于零。
标准差的特性 (一)标准差的大小,受资料中每个观测值的影 标准差的大小, 响,如观测值间变异大,求得的标准差也大,反之则 如观测值间变异大,求得的标准差也大, 小。 (二)在计算标准差时,在各观测值加上或减去 在计算标准差时, 一个常数,其数值不变。 一个常数,其数值不变。 (三)当每个观测值乘以或除以一个常数a,则所 当每个观测值乘以或除以一个常数a 得的标准差是原来标准差的a倍或1/a倍 得的标准差是原来标准差的a倍或1/a倍。
(3—15) 15)
注意,变异系数的大小,同时受平均数和 标准差两个统计量的影响,因而在利用变异系 数表示资料的变异程度时,最好将平均数和标 准差也列出。
平均数、标准差与变异系数 平均数、
第一节 平均数
平均数是统计学中最常用的统计量,用来表明 平均数是统计学中最常用的统计量, 资料中各观测值相对集中较多的中心位置。 资料中各观测值相对集中较多的中心位置。平均数 主要包括有: 主要包括有: 算术平均数( 算术平均数(arithmetic mean) mean) 中位数(median) 中位数(median) 众数(mode) 众数(mode) 几何平均数( 几何平均数(geometric mean) mean) 调和平均数( 调和平均数(harmonic mean) mean)
−1
四、众 数 资料 中出现次数最多的那个观测值或次 数最多一组的组中值,称为众数,记为M 数最多一组的组中值,称为众数,记为M0。
五、调和平均数 资料中各观测值倒数的 算术平均数 的倒 称为调和平均数,记为H 数,称为调和平均数,记为H,即 1 1 (3—8) H= 1 1 1 =1 1 1 ( + x2 + L xn ) n ∑ x n x1 调和平均数主要用于反映畜群不同阶段的 平均增长率或畜群不同规模的平均规模。 平均增长率或畜群不同规模的平均规模。
范围内;约有99.73%的观测值在平均数左 范围内;约有99.73%的观测值在平均数左 x 右三倍标准差( 右三倍标准差( ±3S) x 围内。也就是 3S) 范 围内。 说全距近似地等于6倍标准差,可用(全距/6) 说全距近似地等于6倍标准差,可用(全距/6) 来粗略估计标准差。 来粗略估计标准差。
2
/ n −1 称 为 均 方
( mean square缩写为MS),又称样本方差, square缩写为 缩写为MS) 又称样本方差 样本方差, 记为S 记为S2,即 S 2=
( x − x) 2 / n − 1 ∑
相应的总体参数叫 总体方差 , 记为σ 对于有限总体而言, 记为σ2。对于有限总体而言,σ2的 计算公式为: 计算公式为:
为了解决离均差有正 、有负,离均差之 有负, 和为零的问 题 , 可先求 离 均 差的绝 对 值 并 将 各 离 均 差 绝对 值 之 和 除以 观 离差, 测 值 个 数 n 求 得 平 均 绝 对 离差,即 Σ| x − x |/n。 |/n。虽然平均绝对离差可以表示资 料中各观测值的变异程度 ,但由于平均绝对 使用很不方便, 离差包含绝对值符号 ,使用很不方便,在统 计学中未被采用。 计学中未被采用。
S=
( x − x) 2 ∑ n −1
由于
(x − x) = ∑(x2 − 2xx + x 2 ) ∑
= ∑x2 − 2x∑x + nx 2
= ∑x − 2
2
2
(∑x) n
∑x ) 2 + n(
n
= ∑x 2 −
(∑x)2 n
所以( 11)式可改写为: 所以(3-11)式可改写为:
S=
∑ x) 2 ∑x − n
三、几何平均数
n 个观测值相乘之积开 n 次方所得的方 几何平均数, 称为几何平均数 记为G 根,称为几何平均数,记为G。它主要应用于畜 牧业、水产业的生产动态分析, 牧业、水产业的生产动态分析,畜禽疾病及药 物效价的统计分析 。 如畜禽 、水产养殖的 增 长率,抗体的滴度,药物的效价, 长率,抗体的滴度,药物的效价,畜禽疾病的 潜伏期等, 潜伏期等,用几何平均数比用算术平均数更能 代表其平均水平。其计算公式如下: 代表其平均水平。其计算公式如下:
为了使所得的统计量是相应总体参数的无 偏 估计量,统计学证明, 估计量,统计学证明,在求离均差平方和的平均 数时,分母不用样本含量n,而用自由度 n-1, 数时,分母不用样本含量n 于是,我们 采 用统计量 于是, 的变异程度。 的变异程度。 统计量

(x − x)2 / n −1表示资料
∑ ( x − x)
全距(极差)是表示资料中各观测值变异 全距(极差) 程度大小最简便的统计量。 程度大小最简便的统计量。但是全距只利用了 资料中的最大值和最小值, 资料中的最大值和最小值,并不能准确表达资 料中各观测值的变异程度,比较粗略。当资料 料中各观测值的变异程度,比较粗略。 很多而又要迅速对资料的变异程度作出判断时, 很多而又要迅速对资料的变异程度作出判断时, 可以利用全距这个统计量。 可以利用全距这个统计量。
对于同一资料: 对于同一资料:
算术平均数>几何平均数> 算术平均数>几何平均数>调和平均数
上述五种平均数,最常用的是算术平均数。 上述五种平均数,最常用的是算术平均数。
第二节 标准差
一、标准差的意义 用平均数作为样本的代表,其代表性的强 用平均数作为样本的代表, 弱受样本资料中各观测值变异程度的影响。 弱受样本资料中各观测值变异程度的影响。仅 用平均数对一个资料的特征作统计描述是不全 面的,还需引入一个表示资料中观测值变异程 面的, 度大小的统计量。 度大小的统计量。
第三节 变异系数
变异系数是衡量资料中各观测值变异 程度的另一个统计量 。 标 准差与平均数的比值称为 变异系数, 变异系数, 记为C 记为C·V。 变异系数可以消除单位 和 (或)平 均数不同对两个或多个资料变异程度比较 的影响。 的影响。
变异系数的计算公式为: 变异系数的计算公式为:
S C ⋅V = ×100% x
x
)作为总体平均
数(µ)的估计量,并已证明样本平均数是总体平 的估计量, 均数µ的无偏估计量。 均数µ的无偏估计量。
二、中位数 将资料内所有观测值从小到大依次排列,位 将资料内所有观测值从小到大依次排列, 于中间的那个观测值,称为中位数,记为Md。 于中间的那个观测值,称为中位数,记为Md。 当观测值的个数是偶数时, 当观测值的个数是偶数时,则以中间两个观 测值的平均数作为中位数。当所获得的数据资料 测值的平均数作为中位数。 呈偏态分布时,中位数的代表性优于算术平均数。 呈偏态分布时,中位数的代表性优于算术平均数。 中位数的计算方法因资料是否分组而有所不 同。
n
∑(xi − x) = 0
i =1
或简写成
∑(x
− x) = 0
式中,N表示总体所包含的个体数。 式中, 表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参 数时,则称此统计量为该总体参数的无偏估计量 无偏估计量。 数时,则称此统计量为该总体参数的无偏估计量。 统计学中常用样本平均数( 统计学中常用样本平均数(
2 (
n −1
(3-12) 12)
相应的总体参数叫总体标准差 相应的总体参数叫总体标准差,记 总体标准差, 为σ。对于有限总体而言,σ的计算公式 对于有限总体而言, 为:
σ=
∑(x − µ)
2
/N
(3-13) 13)
在统计学中,常用样本标准差S 在统计学中,常用样本标准差S估计 总体标准差σ 总体标准差σ。
为 了 准 确 地 表示样本内各个观测值的变 先会考虑到以平均数为标准, 异程度 ,人们 首 先会考虑到以平均数为标准, 求出各个观测值与平均数的离差,( 求出各个观测值与平均数的离差,( ), 称为离均差。 离均差。 称为− x x 离均差 虽然离均差能表示一个观测值偏离平均数的 性质和程度,但因为离均差有正、 性质和程度,但因为离均差有正、有负 ,离均 为零, 差之和 为零,即( x − x ) = 0 ,因 而 不 能 用离均差之和Σ 用离均差之和Σ( x − x)来 表 示 资料中所有 观测值的总偏离程度。 观测值的总偏离程度。
相关文档
最新文档