食品实验分析与设计·第三章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上一张 下一张 主 页
退 出
3.1.5 调和平均数(harmonic mean)
资料中各观测值倒数的 算术平均数 的倒数,
称为调和平均数,记为H,即
H 1
1 n 1 ( x1
1 x2
x1n )
1 n
1
1 x
(3—8)
集中趋势的度量
例:用某药物救治12只中毒的小鼠,它们的存活天 数记录如下:8、8、8、10、10、7、13、10、9、 14,另有两只一直未死亡,求平均存活天数。
上一张 下一张 主 页
退 出
Βιβλιοθήκη Baidu
集中趋势的度量
平均数主要包括有: 算术平均数(arithmetic mean) 中位数(median) 众数(mode) 几何平均数(geometric mean) 调和平均数(harmonic mean)
集中趋势的度量
3.1.1 算术平均数(arithmetic mean)
所以还需引入度量资料中观测值变异程度大小的统计量。
常用的表示变异程度的统计量有全距、方差、标准差
和变异系数。
3.2.1 全距(Range)
全距(极差)是表示资料中各观测值变异程度大小最简便 的统计量。 R=Max-Min R值越大,平均数的代表性越差。但是全距只利用了资
料中的最大值和最小值,没有充分利用全部资料,并不
能准确表达资料中各观测值的变异程度,是比较粗略的。 当资料很多而又要迅速对资料的变异程度作出判断 时,可以利用全距这个统计量。
上一张 下一张 主 页 退 出
3.2.2 方差(Variance) 为 了 准 确 地 表示样本内各个观测值的 变异程度 ,人们 首 先会考虑到以平均数为 标准,求出各个观测值与平均数的离差, (x x) ,称为离均差。 虽然离均差能表示一个观测值偏离平均数 的性质和程度,但因为离均差有正、有负 , 离均差之和为零,即Σ( x x )= 0 ,因 而 x)来 表 示 资料 x 不 能 用离均差之和Σ( 中所有观测值的总偏离程度。
M d Lmd
i n ( C) fm 2
3 100 341.5 ( 40) 31 2 342.5
3.1.3 几何平均数(geometric mean)
n 个观测值相乘之积开 n 次方所得的方根,称为 几何平均数,记为G。
它主要应用于科学研究中的动态分析,如微生物 的增长率、人口的增长率、药物效价、抗体滴度等等。 能够消弱数据中个别过分偏大值的影响。所以用几何 平均数比用算术平均数更能代表其平均水平。其计算 公式如下:
上一张 下一张 主 页
退 出
设某一资料包含n个观测值: x1、x2、…、xn,
则样本平均数可通过下式计算:
x1 x 2 x n x n
x
i 1
n
i
(3-1)
n
x 其中, i :第i个观察值或变数, n:观察值或变数 n 的个数, ∑:求和符号(sigma) xi 表示从第一个观 i 1 n 测值x1累加到第n个观测值xn。当 xi 在意义上已明 i 1 确时,可简写为Σx,(3-1)式可改写为:
上一张 下一张 主 页 退 出
为了解决离均差有正 、有负,离均差 之和为零的问 题 , 可先求 离 均 差的 绝 对 值 并 将 各 离 均 差 绝对 值 之 和 除以 观 测 值 个 数 n 求 得 平 均 绝 对 离差,即Σ| x |/n。虽然平均绝对离差 x 可以表示资料中各观测值的变异程度 , 但由于平均绝对离差包含绝对值符号 , 使用很不方便,在统计学中未被采用。
1
上一张 下一张 主 页
退 出
集中趋势的度量
例:某奶牛场在1995-1998年各年度的存栏数见表,
求其年平均增长率。
3.1.4 众 数(mode)
资料中出现次数最多的那个观测值或 次数最多一组的组中值,称为众数,记为
M0。
!!有的资料可出现多个众数,即多个数具有相同
的最高频数;有的资料没有众数,即所有数出现的频 数都相同。
f1x1 f 2 x2 f k xk x f1 f 2 f k
fi xi fx i 1 k f fi上一张 下一张
i 1
(3-2)
主 页 退 出
xi 式中: —第i 组的组中值; f i —第i 组的次数;
k
—分组数 第i 组的次数fi是权衡第i组组中值xi在资料 中所占的比重大小,因此将fi 称为是xi的 “权”,加权法也由此而得名。 【例】 100听罐头净重(单位:kg)资料整 理成次数分布表如下,求其加权数平均数。
的平均数时,如果样本含量不等,也应采用加 权法计算。
上一张 下一张 主 页 退 出
【例】 某牛群有黑白花奶牛 1500头,其平均体 重为750 kg ,而另一牛群有黑白花奶牛1200头, 平均体重为725 kg,如果将这两个牛群混合在 一起,其混合后平均体重为多少? 此例两个牛群所包含的牛的头数不等,要 计算两个牛群混合后的平均体重,应以两个牛 群牛的头数为权,求两个牛群平均体重的加权 平均数,即
家畜的大多数数量性状都是正态分布,因此算 术平均数是最常用的,也是最重要的。
但是当分布不对称时,呈偏态时,用算术平均 数则难以表示资料的集中趋势。
集中趋势的度量
3、中位数
适用于非参数检验,如卡方检验。
4、几何平均数和调和平均数
适用于右偏态分布。
偏态:是指大部分数值落在平均数的哪一边,若 分配较多的集中在低数的方面视为正偏态,或称 为右偏态
i 1
(x
x) 0
退 出
上一张 下一张 主 页
(2)样本各观测值与平均数之差的平方和为 最小,即离均差平方和为最小。
(x - x )2 < (xi- a)2
i
i 1 i 1
n
n
(常数a≠ x)
2
或简写为:
( x x )
<
(x )
2
所以:平均数是与各个观察值最接近的数值。
H 1 1 (1 / 8 1 / 8 1 / 9 1 / 14 ) 12
11.14 由于数据极端右偏态,用调和平均 数较为合理。
集中趋势的度量
各个集中趋势度量指标之间的关系
1.在完全对称分布情况下,算数平均数、中位数
和众数三者相等。
集中趋势的度量
2、算术平均数
适用于正态分布资料。
(3-4)
退 出
上一张 下一张 主 页
集中趋势的度量
例: 现有一窝仔猪的出生重资料为:1.4,1.0, 1.3,1.2,1.6kg,试求其中位数。 解:首先排序:1.0,1.2,1.3,1.4, 1.6;
(n+1)/2=(5+1)/2=3;Md=X3=1.3 如果增加一头仔猪,出生重为1.8kg,计算中位数: n/2=6/2=3 (n/2)+1=3+1=4;
第三章 平均数、标准差 与变异系数
3.1 平均数(mean,average)
在数理统计中,平均数是用来反映一组变数的 集中趋势,即变数分布的中心位置。用来与另一资 料相比较。 不同的平均数适合于不同的数据资料。
例如:不同国家、地区、种族之间身高、体重等
的比较;不同品种的家畜、家禽之间生产 性能的比较
G x1 x2 x3 xn ( x1 x2 x3 xn )
n
1 n
(3-6)
上一张 下一张 主 页
退 出
为了计算方便,可将各观测值取对数后相加
除以n,得lgG,再求lgG的反对数,即得G值, 即
1 G lg [ (lg x1 lg x2 lg xn )] n
n=10
上一张 下一张 主 页
退 出
那么
x ∑ 528.5 52.85(kg) x n 10
10位同学的平均体重为52.85 kg。 2. 加权法
加权法,即计算时先将各个变数乘上它的权数, 再经过总和,然后除以权数的总合,称为加权平均数。 对于样本含量 n≥30 以上且已分组的资料,可以在次 数分布表的基础上采用加权法计算平均数,计算公式 k 为:
采用将离均差平方的办法来解决离均差有正、
上一张 下一张 主 页 退 出
fx 750 1500 725 1200 738.89(kg ) x 2700 f
即两个牛群混合后平均体重为738.89 kg。 三.算数平均数的基本性质
(1)样本各观测值与平均数之差的和为零,即
离均差之和等于零。
n
( xi x ) 0 或简写成
x
11
8,4,16,12,22,17,6,14,6,5
乙 14,8,11,9,11,12,10,14,13,8 110
上一张 下一张 主 页
11
退 出
从以上统计结果可知:
离散趋势的度量
◈ 甲、乙两品种的平均产仔数相同,都是11头。
从平均数来看,两个品种没有差异。
◈ 进一步观察各个变数,二者变异程度并不相同。
Md=(X3+X4)/2=(1.3+1.4)/2=1.35
集中趋势的度量
对于次数分布的资料,公式如下:
M d Lmd
i n ( C) fm 2
(3-5)
Lmd:中位数所在组的组下限; fm:中位数所在组的次数; C:从第一组到中位数所在组前一组的累计次数 n:样本含量; i:组距; 例:表2-3
x x
n
上一张 下一张 主 页 退 出
Σ的性质
例:对食品科学专业2004级1班10位同学的体重进行 测定,测定结果分别为50.0、52.0、53.5、56.0、58.5、 60.0、48.0、51.0、50.5、49.0(kg),求其平均数。 由于 Σx=50.0+52.0+53.5+56.0+58.5 +60.0+48.0+51.0+50.5+49.0 =528.5,
上一张 下一张 主 页
退 出
(1)当观测值个数n为奇数时,第(n+1)/2位置
的观测值,即x(n+1)/2为中位数:
Md=
x( n1) / 2
(3-3)
(2)当观测值个数为 偶 数 时 , 第n/2和第
(n/2+1)位置的两个观测值之和的1/2为中
位数,即:
Md
x n / 2 x( n / 21) 2
一、定义
一组资料中,所有观测值的总和除以其个数所 得到的商,称为算术平均数,简称平均数或均数。 是最常用的一种集中趋势度量指标。 样本的平均数记为 x 总体平均数记为
二、计算
算术平均数可根据样本大小及分组情况而 采用直接法或加权法计算。 1.直接法 主要用于样本含量n≤30以下、未经分组资 料平均数的计算。
3 10 26 31 17 8 2 1 1
上一张 下一张 主 页 退 出
利用加权法计算平均数公式计算:
fx (3311 334 3 33710 ... 3581) 342.67( g ) x 100 f
100听罐头每听净重的加权平均数为342.67 g。
注意: 计算若干个来自同一总体的样本平均数
甲:最小为4,最大为22;乙:最小为8,最大为14
甲的变异程度大于乙
甲的平均数的代表性小于乙的平均数 所以,应该测定其变异程度
离散趋势的度量
1.如果各个变数相同或者变异程度比较小,则平 均数能够代表整个样本。 2.如果各个变数的变异程度比较大,则平均数的代 表性就小。 因此,单靠平均数不能全面、正确地了解样 本。也不能了解平均数作为样本的变异程度。
上一张 下一张 主 页
退 出
表2-3 100听罐头净重的次数分布
组限 组中值(x) 次数(f)
329.5-
331.0
1
332.5335.5338.5341.5344.5347.5350.5353.5356.5-
334.0 337.0 340.0 343.0 346.0 349.0 352.0 355.0 358.0
复
习
• 集中趋势(平均数)有哪几种表示 方式? • 算术平均数的性质
3.2 变异数
变异数的意义 用平均数作为样本的代表,其代表性的强弱受样本资料
中各观测值变异程度的影响。仅用平均数对一个资料的特
征作统计描述是不全面的,因为即使两个样本的平均数相 同,但是样本内变数的变异程度不一定相同。 产仔数 甲 总和 110
所以:平均数代表这个样本的集中趋势。
上一张 下一张 主 页
退 出
3.1.2 中位数 (median)
将资料内所有观测值由小到大依次排列,
位于中间的那个观测值,称为中位数,记
为Md。
当观测值的个数是偶数时,则以中间
两个观测值的平均数作为中位数。当所获
得的数据资料呈偏态分布时,中位数的代
表性优于算术平均数。