[课件]第二章数据资料的类型及其特征PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章数据资料的类型及 其特征
主要内容
ຫໍສະໝຸດ Baidu
• 资料的分类 • 统计表与统计图 • 数据资料的统计描述
资料的分类
计量资料 数量性状资料 计数资料
统计次数
资 料
质量性状资料
量化
评分法
半定 量(等级) 资料:如兽 医中疗效可 分为“无 效”、“好转”、“显效”等。
生物科学中统计表格的基本要求
• • • • • “三线”表:线条数、线型、在页面中的宽度及排列。 表序号及标题 标目 数字 数据的衡量单位
2)加权法 适用于频率和频数资料。计算公式为:
fix i fx f x f x f x 11 22 k k i 1 x k f fk f 1f 2 f i
i 1 k
在这里, fi是频率或频数 xi是观察值
【例2.2】假定有AA、Aa、aa三中基因型,它们的频率分别 是0.35、0.55、0.1,值分别是14、9、4,求这三种基因型的平 均基因型值。
1 1 H 1 1 1 1 1 1 ( ) n x x x n x 1 2 n
中位数和众数
算数平均数、几何平均数及调和平均数的Excel计算。 Excel1
资料变异程度的度量
• • • • • 极差 离均差平方和 方差 标准差 变异系数
标准差(方差)
标准差的意义: • 标准差或方差是一组资料变异程度的度量值。
表2 奶牛体细胞数与产奶量损失的关系
白细胞数(万/mL) 15-50 一个奶区损失(%) 3 一头牛损失(%) 6 全群牛损失(%) 5
50-100
100-500
11
26
10
16
12
20
常用统计图
• • • • • • • 条形图 圆图 饼图 线图 折线图 标题 纵横两轴的刻度问题
7 6 5
百万头
2 2 ( x x ) ( x 2 x x x ) 2
2 2 x 2 x x n x
2 ( x ) x 2 x 2 n ( ) n n 2
2 ( x ) 2 x n
对于频率或频数资料:
S (x x)2 n1
2 ( x ) /N
统计中,用样本方差估计总体方差,样本标准差估计总 体标准差。
• 上面的公式中,分子是离均差平方和,通常记为SS;分母 是自由度,通常记为df。 • 自由度就是在计算某一统计数过程中,观察值的个数减去 约束条件数。 • 为了计算上的简化,SS可以按下面方法化简:
n i
【例2.1】 某种公牛站测得10头成年公牛的体重分别为500、
520、535、560、585、600、480、510、505、490 (kg),求其平均体重。 由于
Σx=500+520+535+560+585+600+480+510+505+490=
5285 n=10
x 5285 ∑ x 528 .5(kg) n 10
4 3 2 1 0 奶牛 黄牛 水牛
图1 云南省牛的存栏数
0.25 2.9 奶牛 黄牛 水牛 5.8
图2 云南省牛的存栏数(百万头)
奶牛 水牛 黄牛
图3 云南省的牛存栏数(百万头)
Body weight
135 125 115 105 95 85 75 65 55 45 35 25 15 5 0 5 10 15 20 25 30 35 40 45 50 55 60 日龄(d) Age 第1组 第2组 第5组 第2组 第4组
• 它通常与算数平均数一起使用,反映平均数的代表性。
• 当平均数相同时,标准差越大,平均数的代表性越差,
反之,代表性越好。
方差和标准差的基本公式: 样本方差:
2 2 S ( x x ) / n 1
总体方差:
2 2 ( x ) / N
方差的平方根就是标准差,相应的样本及总体标准差是:
x fx 0 . 35 14 0 . 55 9 0 . 1 4 10 . 25 f 0 . 35 0 . 55 0 . 1
【例2.3】今测得10人(男)的体重(kg)数据如下: 58,60,58,60,60,73,60,68,75,73。计算这10 人的平均体重。 此例中,58kg有2人,60kg有4人,68kg有1人,73kg有2 人,75kg有1人。用加权法计算10人的平均体重:
体重(g)
图4 不同试验组鹌鹑体重生长曲线
30 25 20
频数
15 10 5 0 0 10 20 体重(kg) 30 40 50
图5 126只母羊体重分布图
数据资料的统计描述
• 平均数 • 标准差(方差) • 变异系数
平均数的种类
算数平均数 几何平均数 中位数(中数) 众数 调和平均数
• • • • •
算数平均数的意义、计算及性质
• 意义:算数平均数等于若干变数(观察值)之和除以变数 个数的商。所以,它是这组变数的一个代表值。 • (样本平均数的)计算: 1)直接法 主要用于样本含量n≤30以下、未经分组资料平均数的计 算。 设某一资料包含n个观测值:x1、x2、…、xn,则样本平 均数
x x 1 x 2 n 1 x i n n x
几何平均数
• n个观测值相乘之积开n次方所得的方根,称为几何平均数, 记为G。 • 它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病 及药物效价的统计分析。
n G x x x x ( x x x x ) 1 2 3 n 1 2 3 n
1 n
调和平均数
• 资料中各观测值倒数的算术平均数的倒数,称为调和平均 数,记为H。 • 调和平均数主要用于反映畜群不同阶段的平均增长率或畜 群不同规模的平均规模。
fx 2 58 4 60 1 68 2 73 1 75 x 64 . 5 ( kg ) f 2 3 2 2 1
算数平均数的性质
• 样本各观测值与平均数之差的和为零,即离均差之和等于 零。 • 样本各观测值与平均数之差的平方和为最小,即离均差平 方和为最小。
主要内容
ຫໍສະໝຸດ Baidu
• 资料的分类 • 统计表与统计图 • 数据资料的统计描述
资料的分类
计量资料 数量性状资料 计数资料
统计次数
资 料
质量性状资料
量化
评分法
半定 量(等级) 资料:如兽 医中疗效可 分为“无 效”、“好转”、“显效”等。
生物科学中统计表格的基本要求
• • • • • “三线”表:线条数、线型、在页面中的宽度及排列。 表序号及标题 标目 数字 数据的衡量单位
2)加权法 适用于频率和频数资料。计算公式为:
fix i fx f x f x f x 11 22 k k i 1 x k f fk f 1f 2 f i
i 1 k
在这里, fi是频率或频数 xi是观察值
【例2.2】假定有AA、Aa、aa三中基因型,它们的频率分别 是0.35、0.55、0.1,值分别是14、9、4,求这三种基因型的平 均基因型值。
1 1 H 1 1 1 1 1 1 ( ) n x x x n x 1 2 n
中位数和众数
算数平均数、几何平均数及调和平均数的Excel计算。 Excel1
资料变异程度的度量
• • • • • 极差 离均差平方和 方差 标准差 变异系数
标准差(方差)
标准差的意义: • 标准差或方差是一组资料变异程度的度量值。
表2 奶牛体细胞数与产奶量损失的关系
白细胞数(万/mL) 15-50 一个奶区损失(%) 3 一头牛损失(%) 6 全群牛损失(%) 5
50-100
100-500
11
26
10
16
12
20
常用统计图
• • • • • • • 条形图 圆图 饼图 线图 折线图 标题 纵横两轴的刻度问题
7 6 5
百万头
2 2 ( x x ) ( x 2 x x x ) 2
2 2 x 2 x x n x
2 ( x ) x 2 x 2 n ( ) n n 2
2 ( x ) 2 x n
对于频率或频数资料:
S (x x)2 n1
2 ( x ) /N
统计中,用样本方差估计总体方差,样本标准差估计总 体标准差。
• 上面的公式中,分子是离均差平方和,通常记为SS;分母 是自由度,通常记为df。 • 自由度就是在计算某一统计数过程中,观察值的个数减去 约束条件数。 • 为了计算上的简化,SS可以按下面方法化简:
n i
【例2.1】 某种公牛站测得10头成年公牛的体重分别为500、
520、535、560、585、600、480、510、505、490 (kg),求其平均体重。 由于
Σx=500+520+535+560+585+600+480+510+505+490=
5285 n=10
x 5285 ∑ x 528 .5(kg) n 10
4 3 2 1 0 奶牛 黄牛 水牛
图1 云南省牛的存栏数
0.25 2.9 奶牛 黄牛 水牛 5.8
图2 云南省牛的存栏数(百万头)
奶牛 水牛 黄牛
图3 云南省的牛存栏数(百万头)
Body weight
135 125 115 105 95 85 75 65 55 45 35 25 15 5 0 5 10 15 20 25 30 35 40 45 50 55 60 日龄(d) Age 第1组 第2组 第5组 第2组 第4组
• 它通常与算数平均数一起使用,反映平均数的代表性。
• 当平均数相同时,标准差越大,平均数的代表性越差,
反之,代表性越好。
方差和标准差的基本公式: 样本方差:
2 2 S ( x x ) / n 1
总体方差:
2 2 ( x ) / N
方差的平方根就是标准差,相应的样本及总体标准差是:
x fx 0 . 35 14 0 . 55 9 0 . 1 4 10 . 25 f 0 . 35 0 . 55 0 . 1
【例2.3】今测得10人(男)的体重(kg)数据如下: 58,60,58,60,60,73,60,68,75,73。计算这10 人的平均体重。 此例中,58kg有2人,60kg有4人,68kg有1人,73kg有2 人,75kg有1人。用加权法计算10人的平均体重:
体重(g)
图4 不同试验组鹌鹑体重生长曲线
30 25 20
频数
15 10 5 0 0 10 20 体重(kg) 30 40 50
图5 126只母羊体重分布图
数据资料的统计描述
• 平均数 • 标准差(方差) • 变异系数
平均数的种类
算数平均数 几何平均数 中位数(中数) 众数 调和平均数
• • • • •
算数平均数的意义、计算及性质
• 意义:算数平均数等于若干变数(观察值)之和除以变数 个数的商。所以,它是这组变数的一个代表值。 • (样本平均数的)计算: 1)直接法 主要用于样本含量n≤30以下、未经分组资料平均数的计 算。 设某一资料包含n个观测值:x1、x2、…、xn,则样本平 均数
x x 1 x 2 n 1 x i n n x
几何平均数
• n个观测值相乘之积开n次方所得的方根,称为几何平均数, 记为G。 • 它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病 及药物效价的统计分析。
n G x x x x ( x x x x ) 1 2 3 n 1 2 3 n
1 n
调和平均数
• 资料中各观测值倒数的算术平均数的倒数,称为调和平均 数,记为H。 • 调和平均数主要用于反映畜群不同阶段的平均增长率或畜 群不同规模的平均规模。
fx 2 58 4 60 1 68 2 73 1 75 x 64 . 5 ( kg ) f 2 3 2 2 1
算数平均数的性质
• 样本各观测值与平均数之差的和为零,即离均差之和等于 零。 • 样本各观测值与平均数之差的平方和为最小,即离均差平 方和为最小。