计量资料的统计描述PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原则: (1)第一组包含最小的观察值,最后一组包含最大的
观察值。 (2)组和组之间不能互相包含。
(3)x表示数据,则 下限 x 上限
5.归组计数,做频数分布表。
7
编制频数表步骤流程图
一般 8- 15 之间
第一组段包括极小值,最后 一组段包括极大值,除最后 一组段可同时标出上下限, 其他组段只标出下限。
统计表 统计图 统计指标
2
举例说明计量资料频数表的编制过程
例2-2、某市2005年100名18岁女孩身高(cm)资料如下: 165.1 169.6 163.0 166.5 160.9 156.6 169.3 165.9 162.0 165.3 165.1 164.0 159.9 171.2 169.1 168.0 160.6 157.1 162.5 165.8 161.5 166.3 168.5 167.1 161.0 159.0 167.3 157.2 163.7 163.1 166.1 167.5 166.0 158.5 161.2 167.5 158.2 154.7 155.6 168.2 162.8 163.6 164.2 161.8 160.7 173.6 159.8 158.0 159.4 158.2 166.2 166.1 156.8 166.6 161.5 162.0 160.6 164.3 161.9 167.2 170.2 160.4 163.0 163.5 162.9 167.4 162.2 162.7 169.7 159.9 165.2 169.0 162.3 164.6 163.4 170.6 162.8 163.1 164.0 161.2 161.0 161.3 165.0 160.4 168.9 165.0 164.2 165.2 162.6 164.5 161.5 162.6 158.3 165.1 170.5 166.8 165.8 164.5 167.5 162.8
16 32 52 71 86 95 99 100
累计频率(%)(5) 2.00 6.00
16.00 32.00 52.00 71.00 86.00 95.00 99.00 100.00
4
编制步骤如下:
1. 求极差(R)
也称为全距,是资料中最大值和最小值之差。 本例: R=173.6-154.7=18.9(cm)
3
组段 (1) 频数(2)
154~
2
156~
4
158~
10
160~
16
162~
20
164~
19
166~
15
168~
9
170~
4
172~
1
合计
100
频率(%)(3) 2.00 4.00
10.00 16.00 20.00 19.00 15.00
9.00 4.00 1.00 100.00
累计频数(4) 2 6
计量ቤተ መጻሕፍቲ ባይዱ料
统计描述 统计推断
计数资料
统计描述 统计推断
等级资料
统计描述
统计推断
1
第二章 计量资料的统计描述
统计描述(statistical description)
是指采用统计图、统计表、统计指标等形式来对资料 的数量特征和分布规律作出测定和描述的一种方法。
统计描述是统计分析的最基本内容 统计描述的三种形式:
(1) 直接法
n
X
xi
i1
x1 x2 xn
n
n
(2) 加权法 又称频数表法,适用于频数表资料。
当观察例数较时用。
k
fixi
X i1
k
fi
f1x1 f 2x2 f k xk f1 f2 fk
i 1
9
频数分布表的用途: 揭示数值变量频数分布的类型和特征 分布的类型 分布特征 作为大样本数据的陈述形式 便于发现一些特大或特小的可疑值 便于进一步的统计分析
10
计量资料频数分布的类型和特征
分布类型
正态分布:各组段的频数以中间组段为中心,左右两侧基本对称 偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少
分布特征
集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势
离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都 有频数分布,而不是所有频数分布在集中位置的趋势。
第二节 描述集中趋势的指标
集中趋势常用平均数(average)来描述。 是一组数据典型或有代表性的值。 趋向于落在根据数据大小排列的数据的中心,因此可以用 于度量集中位置(位置指标)
算术均数 几何均数 中位数
12
第二节 描述集中趋势的指标
算数均数(mean) 简称均数 适用条件:对称分布,尤其是正态分布或近似正态分布 表示:总体均数用μ表示;样本均数用 表示 意义:描述一组同质资料的平均水平。 计算方法: 直接法 间接法(频数表法)
13
1、算术均数(arithmetic mean)
几何均数( geometric mean )
适用条件: 等比或等积资料 对数正态分布资料
表示:G 计算方法:
直接法 加权法
15
几何均数(geometric mean)
计算方法 1.直接法:适用于样本量较小的计量资料。
2.间接法:加权法,适用于样本量较大的计量资料,如频数 表资料。
16
例 100 名受试者接种某疫苗三周后,抗体测定结果如下表第(1)栏 和第(2)栏,求平均抗体滴度。
抗体滴 度 (1) 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计
求出极差
确定组段数
确定组距
列出各个组段
极差即最大值 与最小值之差
组距=R/组段数, 但一般取一方便 计算的数字
确定每一组段频数 选
根据变量值大小 把各观察单位归 入各个组段
频数
计量资料频数分布图
100名18岁女孩身高的频数分布图
25 20 15 10 5 0
155 157 159 161 163 165 167 169 171 173 身高(cm)
。
2.确定组数
原则:即简化资料又不影响反映资料的规律性, 一般8-15组。
本例:选择10组
5
3.确定组距
组距为每组的上限与下限之差。 实际中 组距=R/(预计的组数)
本例:组距=18.9/10=1.89 调整为2 注明:1)尽量取较整齐的数值最为组段的端点。
2)组距以相等为宜。
6
2.360~
4.确定组段的上下限
观察值。 (2)组和组之间不能互相包含。
(3)x表示数据,则 下限 x 上限
5.归组计数,做频数分布表。
7
编制频数表步骤流程图
一般 8- 15 之间
第一组段包括极小值,最后 一组段包括极大值,除最后 一组段可同时标出上下限, 其他组段只标出下限。
统计表 统计图 统计指标
2
举例说明计量资料频数表的编制过程
例2-2、某市2005年100名18岁女孩身高(cm)资料如下: 165.1 169.6 163.0 166.5 160.9 156.6 169.3 165.9 162.0 165.3 165.1 164.0 159.9 171.2 169.1 168.0 160.6 157.1 162.5 165.8 161.5 166.3 168.5 167.1 161.0 159.0 167.3 157.2 163.7 163.1 166.1 167.5 166.0 158.5 161.2 167.5 158.2 154.7 155.6 168.2 162.8 163.6 164.2 161.8 160.7 173.6 159.8 158.0 159.4 158.2 166.2 166.1 156.8 166.6 161.5 162.0 160.6 164.3 161.9 167.2 170.2 160.4 163.0 163.5 162.9 167.4 162.2 162.7 169.7 159.9 165.2 169.0 162.3 164.6 163.4 170.6 162.8 163.1 164.0 161.2 161.0 161.3 165.0 160.4 168.9 165.0 164.2 165.2 162.6 164.5 161.5 162.6 158.3 165.1 170.5 166.8 165.8 164.5 167.5 162.8
16 32 52 71 86 95 99 100
累计频率(%)(5) 2.00 6.00
16.00 32.00 52.00 71.00 86.00 95.00 99.00 100.00
4
编制步骤如下:
1. 求极差(R)
也称为全距,是资料中最大值和最小值之差。 本例: R=173.6-154.7=18.9(cm)
3
组段 (1) 频数(2)
154~
2
156~
4
158~
10
160~
16
162~
20
164~
19
166~
15
168~
9
170~
4
172~
1
合计
100
频率(%)(3) 2.00 4.00
10.00 16.00 20.00 19.00 15.00
9.00 4.00 1.00 100.00
累计频数(4) 2 6
计量ቤተ መጻሕፍቲ ባይዱ料
统计描述 统计推断
计数资料
统计描述 统计推断
等级资料
统计描述
统计推断
1
第二章 计量资料的统计描述
统计描述(statistical description)
是指采用统计图、统计表、统计指标等形式来对资料 的数量特征和分布规律作出测定和描述的一种方法。
统计描述是统计分析的最基本内容 统计描述的三种形式:
(1) 直接法
n
X
xi
i1
x1 x2 xn
n
n
(2) 加权法 又称频数表法,适用于频数表资料。
当观察例数较时用。
k
fixi
X i1
k
fi
f1x1 f 2x2 f k xk f1 f2 fk
i 1
9
频数分布表的用途: 揭示数值变量频数分布的类型和特征 分布的类型 分布特征 作为大样本数据的陈述形式 便于发现一些特大或特小的可疑值 便于进一步的统计分析
10
计量资料频数分布的类型和特征
分布类型
正态分布:各组段的频数以中间组段为中心,左右两侧基本对称 偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少
分布特征
集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势
离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都 有频数分布,而不是所有频数分布在集中位置的趋势。
第二节 描述集中趋势的指标
集中趋势常用平均数(average)来描述。 是一组数据典型或有代表性的值。 趋向于落在根据数据大小排列的数据的中心,因此可以用 于度量集中位置(位置指标)
算术均数 几何均数 中位数
12
第二节 描述集中趋势的指标
算数均数(mean) 简称均数 适用条件:对称分布,尤其是正态分布或近似正态分布 表示:总体均数用μ表示;样本均数用 表示 意义:描述一组同质资料的平均水平。 计算方法: 直接法 间接法(频数表法)
13
1、算术均数(arithmetic mean)
几何均数( geometric mean )
适用条件: 等比或等积资料 对数正态分布资料
表示:G 计算方法:
直接法 加权法
15
几何均数(geometric mean)
计算方法 1.直接法:适用于样本量较小的计量资料。
2.间接法:加权法,适用于样本量较大的计量资料,如频数 表资料。
16
例 100 名受试者接种某疫苗三周后,抗体测定结果如下表第(1)栏 和第(2)栏,求平均抗体滴度。
抗体滴 度 (1) 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计
求出极差
确定组段数
确定组距
列出各个组段
极差即最大值 与最小值之差
组距=R/组段数, 但一般取一方便 计算的数字
确定每一组段频数 选
根据变量值大小 把各观察单位归 入各个组段
频数
计量资料频数分布图
100名18岁女孩身高的频数分布图
25 20 15 10 5 0
155 157 159 161 163 165 167 169 171 173 身高(cm)
。
2.确定组数
原则:即简化资料又不影响反映资料的规律性, 一般8-15组。
本例:选择10组
5
3.确定组距
组距为每组的上限与下限之差。 实际中 组距=R/(预计的组数)
本例:组距=18.9/10=1.89 调整为2 注明:1)尽量取较整齐的数值最为组段的端点。
2)组距以相等为宜。
6
2.360~
4.确定组段的上下限