计量资料的统计描述PPT

合集下载

计量资料统计描述

计量资料统计描述
• 几何均数(geometric mean)
• 中位数和百分位数(median percentile) 以上统称为平均数(average)常用于描述一组变量 值的集中位置,代表其平均水平或是集中位置的特征 值。
36
第37页/共138页
一、算术均数
2024/8/7
(arithmetic mean)
7
第8页/共138页
一、频数分布表
2024/8/7
(2)确定组段数和组距 • 确定组段数:
n>100,10~15组;n<100,8~10组 • 确定组距:
• 组距可以相等也可以不相等,一般采用等距分组,
• 组距=极差/组数 例1 1.99/10≈2,故组距=2mmol/L
8
第9页/共138页
一、频数分布表
第30页/共138页
中介值细胞区域出异常白细胞峰
第31页/共138页
由大量白血病细胞出现形成的单一峰
第32页/共138页
第33页/共138页
红细胞分布直方图
第34页/共138页
第35页/共138页
第36页/共138页
第二节 集中趋势的描述
2024/8/7
• 算术均数(arithmetic mean)
极大值或极小值通常将均数拉向自己
2024/8/7
46
第47页/共138页
二、几何均数
2024/8/7
(geometric mean)
• 定义:有些医学资料,如抗体滴度、细菌计数等,其频数 分布明显偏态,各观察值之间呈倍数变化(等比关系), 此时宜用几何均数反映其平均增减倍数。
• 计算方法:
• 直接法
• 加权法
• 应用:等比资料或对数正态分布资料

医学统计学计量资料的统计描述

医学统计学计量资料的统计描述
位置的水平,多个百分位数结合使用,可以用来 描述资料的离散趋势和确定医学参考值范围。
正确应用集中趋势指标
• 算数均数:适用于单峰对称分布资料; • 几何均数:适用于变量值呈等比级数关系和呈对
数正态分布的资料; • 中位数和百分位数:适用于任何分布的资料,但
在样本含量较少时不稳定,越靠两端越不稳定; • 中位数在抗极端值的影响方面,比均数具有较好
• 计算公式: Q= QU - QL = P75 - P 25 • 意义: Q值越大,说明变异程度越大。
• 特点:包括了居于中间位置50%的变量值,该指
标比全距稍稳定,但仍未考虑每个观察值。
某传染性疾病的潜伏期(天)
平均偏差(mean difference)
• 定义:各观察值偏离平均数的绝对平均差距 • 计算公式:
差、标准差。
极差(range)
• 表示法:R • 定义:一组资料中最大值与最小值之差。
• 计算公式: R = max-min
• 意义:反映个体变异范围的大小。R越大,变异度(离
散程度)越大, R甲=188-142=46、R乙=166-158=8
• 优点:计算简便,概念清晰,如说明传染病、食物中毒 的最长、最短潜伏期等
125.5296
若应用算术均数为:
问题:
• 为什么表达该资料的平均水平宜用几何均 数?
• 几何均数适用条件是什么? • 何种情况不宜计算几何均数? • 利用频数表计算几何均数时应注意什么?
几何均数的应用
• 几何均数适用于变量值呈等比级数关系和呈对数 正态分布的资料;有些呈轻度偏态分布的资料经 过对数变换后呈对称分布的资料。
• 算术均数 • 几何平均数 • 中位数 • 众数
算术均数(mean)

统计学第二章计量资料的统计描述

统计学第二章计量资料的统计描述
数据。同时,还需要对数据进行质量控制和预处理,以消除误差和异常值的影响。
02
统计数据整理与展示方法
数据清洗与预处理技巧
80%
缺失值处理
根据数据的分布情况和实际背景 ,选择合适的缺失值填充方法, 如均值、中位数、众数等。
100%
异常值处理
采用箱线图、散点图等方法识别 异常值,并根据实际情况选择删 除、替换或保留。
分类
根据测量水平的不同,计量资料可分为离散型和连续型两类。离 散型数据只能取整数值,如人口数、医院床位数等;连续型数据 则可以取实数范围内的任何值,如身高、体重等。
计量资料特点分析
数值性
计量资料以数值形式表示,具有数量化的特点,便 于进行数学运算和统计分析。
连续性
连续型计量资料在实数范围内可以取任意值,数据 分布的连续性使得统计推断更为精确。
06
统计图表在数据可视化中应用
常见统计图表类型介绍
条形图(Bar Chart)
用于展示分类数据之间的比较,横轴表示分类,纵轴表示数量或比例。
折线图(Line Chart)
用于展示时间序列数据或连续性数据的趋势变化,横轴表示时间或类 别,纵轴表示数量或比例。
散点图(Scatter Plot)
用于展示两个变量之间的关系,横轴和纵轴分别表示两个变量,点的 位置表示变量的取值。
一组观察值中出现次数最多的数。
计算方法
应用场景
中位数计算需先将数据排序,然后取中间 位置的数;众数计算则是统计各数值出现 的次数,取出现次数最多的数。
适用于各种类型的数据,尤其适用于偏态 分布数据。中位数和众数对极端值不敏感 ,因此能较好地反映数据的集中趋势。
不同集中趋势指标比较
算术平均数、中位数和 众数都是描述数据集中 趋势的指标,但各有特 点。

1计量资料统计描述(08硕)

1计量资料统计描述(08硕)
(1)意义:一组性质相同的观察值在数量上的平均水平。 意义:一组性质相同的观察值在数量上的平均水平。 意义 (2)表示:µ(总体) 表示: 总体) 表示 样本) x(样本)
(3)计算:直接法、间接法。 计算:直接法、间接法。 计算 计算机计算 (4)特征:∑(X- x 特征: )=0 估计误差之和为 。 估计误差之和为0。 特征 (5)应用:正态分布或近似正态分布 应用: 应用 (6)注意:合理分组,才能求均数,否则没有意义。 注意:合理分组,才能求均数,否则没有意义。 注意
M=51天 (QR=28.5天) 天 天
3.标准差和方差(Standard deviation and variance) 标准差和方差( 标准差和方差 ) 总体方差 总体标准差 样本标准差
σ2 = ∑
( X − µ)2 N
σ=
∑ (X − µ)
N
2
S=
∑(X − X)
n −1
2
样本标准差的简化计算公式: 样本标准差的简化计算公式: 例数较少 频数表资料
∑ X 2 − (∑ X )2 / n n −1
S=
S=
∑ fX 2 − (∑ fX)2 / ∑ f ∑ f −1
甲组5名同龄男孩的身高值 名同龄男孩的身高值( ) 例2-5 甲组 名同龄男孩的身高值(cm) X X2 90 8100 95 9025 100 10000 105 11025 110 12100 ΣX = 500 ΣX 2 = 50250
(1)单位不同时组间变异程度的比较 )
表 体脂与胆固醇的变异系数 指标 体脂( ) 体脂(%) 胆固醇( 胆固醇(mmol)
x
18.90 4.84
S 5.80 1.04
CV 30.69 21.40

【学习课件】第三章计量资料的描述性统计

【学习课件】第三章计量资料的描述性统计
涄銳
111111111 看看
2021/7/9
30
凧譽筦棋莟尫辍枖质鏝頵蹏恋 壶煘涓存欘霣鑄滽靈觠征鼜烤
盋嘈
•1 •2 •3 •4 •5 • 6男女男男女 • 7古古怪怪古古怪怪个 • 8vvvvvvv •9 •
2021/7/9
31
嵵鹄婳駨駢汻溩峥熉枨狳苾澯 盡蹕弇敮琾殅朗跙鐮逖檌諾骝
鞙榥
• 古古怪怪广告和叫姐 姐
2021/7/9
37
薞庬靤鱿碐僿繫笽鴍搧澵贩碰 忐點僲龗截趡旻罈笝试馐捔寰
洁閪
• 11111
• 该放放风放放风放放 风方法


• • 共和国规划
2021/7/9
38
• •
看空 快尽快快 见间 空快将尽 看接 间尽见快 见口 进快快尽
即 空将尽快 可 间尽快尽
辫鄹篕殶 汒毃窆磮 孋潎劎梋 謗往糯仆 轛尕笷靂 媴罆魁鍋 誗咭鴕鉙 珮搐詩擷 秴俙绑頧 祜扞牧緤
2021/7/9
23
第三节 离散程度的指标
当为频数表资料时,公式如下:
方差S2是标准差S的平方值。标准差(或方差)越大,表 示观察值的分布越分散,反之,标准差(或方差)越 小,表示观察值的分布越集中。实际应用时常以均数 ±标准差的写法综合观察值的集中和离散特征。
2021/7/9
24
第三节 离散程度分和呵呵呵呵呵呵斤斤计较666555555555555555555555655888845555555555555554555555555544444545om牛牛文档分4.250P5
4.260
(7-6):(4.260-4.250)=(6.05-6):(P5-4.250)
解得:P5=4.2505 (1012/L)

医学统计学PPT课件

医学统计学PPT课件

验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100

N=5万 → X =118.6cm
• 特点:1)不可避免性

第二讲计量资料的统计描述

第二讲计量资料的统计描述

几何均数( mean) 几何均数(geometric mean)
G = n X1X2 LXn 1 ∑lg X lgG = (lg X1 + lg X2 +L+ lg Xn ) = n n lg X 1 ∑ 几何均数: 几何均数:变量 G = lg n 对数值的算术均 对数值的算术均 lg 表 以 为 的 数 数的反对数。 示 10 底 对 ; 的反对数。
2×57.5 + 5×60.5 +L+1×84.5 9311 X= = = 71.62(次 分) 2 + 5 +L+1 130
2、应用
适用于对称分布, 均数适用于对称分布,特别 是正态分布资料。 是正态分布资料。
几何均数( mean) 二、 几何均数(geometric mean) 可用于反映一组经对数 可用于反映一组经对数 转换后呈对称分布或正态分 转换后呈对称分布或正态分 布的变量值在数量上的平均 水平。 水平。
130名健康成年男子脉搏 名健康成年男子脉搏( 表2-1 130名健康成年男子脉搏(次/分)的频数分布表
脉搏组段 (1) 56~ 59~ 62~ 65~ 68 68~ 71~ 74~ 77~ 80~ 83~85 合 计 频数, f (3) 频率(%) (4)= (3)/N 累积频数 (5)=(3)↓ 累积频率 (6)=(5)/N
是否为对称分布?
50 45 40 35 30 25 20 15 10 5 0 2.45 3.05 3.65 4.25 4.85 5.45 6.10
频 数
变量

(2)偏态分布 : )
1)正偏态分布(右偏态分布):右侧的组段数多于 )正偏态分布(右偏态分布):右侧的组段数多于 ): 左侧的组段数,频数向右侧拖尾。 左侧的组段数,频数向右侧拖尾。

计量资料的统计描述

计量资料的统计描述

频数表法
i Px Lx ( nx% f L ) fx
其中
Lx 第x百分位数所在组段下限
i 组距
f x 第x百分位数所在组段的频数
f 第x百分位数所在组段前一组的累计频数
L
[案例4-10] 根据表4-4,计算P25 、P75 。
p25 i L ( n.x % f L ) fx
均数
几何均数 中位数
平均数量水平
平均增减倍数 位次居中的观察值 水平
对称分布,尤其是正 态分布 等比、对数正态分布 偏态、分布不明确、 分布末端无确定值
百分位数 ( Percentile,Px )
观察值从小到大排列,处于第x百分位位 置上的数值,用 Px 表示。一个百分位数将全 部数据分成两部分,有x%的数据小于Px,有 (100-x)%的数据大于Px
0.6021 2.7093 7.2246 15.5051 23.4806 21.0720 16.8574 86.9977(
f ilg xi
)
1 lg 4 3 lg 8 lg 256 1 86.9977 G lg ( lg ( ) 54 1 3 7 50
滴度倒数 xi
(3)
频数 fi
(2)
lgxi
(4)
fi lgxi
(5)
1/4 1/8 1/16 1/32 1/64 1/128 1/256 合 计
1 3 6 10 13 10 7 50 (
fi
4 8 16 32 64 128 256 ) -
0.6021 0.9031 1.2041 1.5051 1.8062 2.1072 2.4082 -
141.5 151.1 144.6 151.8 149.5 153.6 140.5 150.3 141.3 153.9 140.8 141.8 140.7 151.4 139.1 145.8 148.4 136.5

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
11111,11111,11111 中位数是50%位的数值,其为百分位数的特殊形式。
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不

2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S

医学统计学--第二章 计量资料的统计描述

医学统计学--第二章  计量资料的统计描述

4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51
2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86
4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02
3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70
1
lg X ) lg (
n
1
ቤተ መጻሕፍቲ ባይዱ
lg10 lg 20 lg 40 lg 40 lg160 ( ) 34.8 5
(2)加权法 公式:
G lg (
1
f lg X f
)
例2-5 69例类风湿关节炎(RA)患者血清EBV-VCAlgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均 抗体滴度。
三、频数表和频数分布图用途
1.描述频数分布的 类型 (1)对称分布 :若 各组段的频数以频数 最多组段为中心左右 两侧大体对称,就认 为该资料是对称分布
25
20 15
Æ µ Ê ý
10 5
0
2.45
3.05
3.65
4.25
4.85
5.45
6.10
Ñ Ç × µ ¹ ´ £ mmol/L£ ª å Ü ¨Ì ¼ ¨ ©
G 公式: X 1 X 2 X n
n

G lg
1
lg X ) (
n
例2-4 某地5例微丝蚴血症患者治疗七年后用间接 荧光抗体试验测得其抗体滴度倒数分别为,10, 20,40,40,160,求几何均数。
G 10 20 40 40 160 34.8
5
G lg

计量资料的统计描述

计量资料的统计描述
医学参考值范围的制定方法
*
选择适当的百分范围。
正态分布法计算医学参考值范围。 单侧: 双侧:
百分位数法计算医学参考值范围。
百分位数法与正态分布法
*
前者适合任何分布类型的资料,实际中最为常用。后者仅适用于正态分布资料,则结果不稳定。后者的结果比较稳定。
三、频数分布表的用途
*
可代替繁杂的原始资料,便于进一步分析。
01
01
02
03
04
便于观察数据的分布类型。
便于发现资料中某些远离群体的特大或特小的可疑值。
当样本含量较大时,可用各组段的频率作为概率的估计值。
02
03
04
图2-2 115名正常成年女子的血清转氨酶的频数分布 右偏态分布或正偏态分布 图2-3 101名正常人的血清肌红蛋白的频数分布 左偏态分布或负偏态分布
第二节 集中趋势的描述
平 均 数(average)
*
平均数是描述一组观察值集中位置和平均水平的统计指标。常用的平均数包括: 算数均数(mean) 几何均数(geometric mean)
中位数(median)和百分位数(percentile)
算 数 均 数
*
直接法 加权法 均数的应用 适用用于对称分布或偏度不大的资料,能够很好的反映数据的集中位置和平均水平。 算数均数容易受到频数分布尾端极大或极小值的影响。
01
02
03
101名正常成年女子的血清总胆固醇
直接法:
加权法:
几何均数(geometric mean)
观察值间按倍数变化的资料可以计算几何均数(G)以描述其平均水平。
01
计算公式为:
02
加权法为:
03

医学统计学:计量资料的统计描述

医学统计学:计量资料的统计描述

方差、标准差计算方法和意义
方差
指各数据与均数之差的平方和的平均 数,用于反映数据的术平方根,用于衡量数据偏 离均数的程度。标准差越大,数据分 布越离散。
变异系数在医学研究中应用
变异系数
指标准差与均数之比,用于比较不同单位或不同均数水平下数据的离散程度。在医学研究中,常用于评价不同指 标或不同人群间的变异程度。
分类
根据测量水平不同,可分为离散型计量资料和连续型计量资料。离散型计量资 料只能取整数值,如人口数、医院床位数等;连续型计量资料可以取实数范围 内的任何值,如身高、体重等。
计量资料特点分析
01
数值性
计量资料以数值形式表示,具有明 确的数量特征。
可比性
同类计量资料之间可以进行比较, 如不同人群的身高、体重等。
众数
一组观察值中出现次数最多的数。
应用场景
常用于描述无明显集中趋势或分布规 律资料的集中趋势,如一些分类数据 的统计描述。
04 离散程度指标解读
极差、四分位数间距计算及意义
极差
指一组数据中最大值与最小值之差, 用于反映数据的波动范围。计算简单, 但易受极端值影响。
四分位数间距
指第三四分位数与第一四分位数之差, 用于反映中间50%数据的离散程度。 较极差更稳定,不易受极端值影响。
常用统计描述方法介绍
频数分布表与直方图
通过分组和计数的方式展示数 据的分布情况,适用于连续型
变量。
集中趋势描述
包括算术均数、几何均数和中 位数等,用于描述数据的平均 水平或中心位置。
离散程度描述
包括标准差、方差和四分位数 间距等,用于描述数据的波动 范围或离散程度。
偏态与峰态描述
通过偏态系数和峰态系数等描 述数据的偏态和峰态特征,反

计量资料的统计描述

计量资料的统计描述

4.66 4.28 3.83 4.20 5.24 4.02 4.33 3.76 4.81 4.17 3.96 3.27
4.61 4.26 3.96 4.23 3.76 4.01 4.29 3.67 3.39 4.12 4.27 3.61
4.98 4.24 3.83 4.20 3.71 4.03 4.34 4.69 3.62 4.18 4.26 4.36
M
x
n
2
x
n
2
1
2
4
百分位数(percentile)
0%
PX
M 即50%分位数就是中位数
100%
27
1.直接计算法
28
例2-9 对某医院细菌性痢疾治愈者的住院天数统计, 119名患者的住院天数从小到大的排列如下, 试求第5百分位数和第99百分位数
患 者 1 2 3 4 5 6 7 8 116 117 118 119 住院天数 1 1 2 2 2 3 4 4 39 40 40 42
3.77 4.20 4.36 3.07 4.89 3.97 4.28 3.64 4.66 4.04 4.55 4.25
4.63 3.91 4.41 3.52 5.03 4.01 4.30 4.19 4.75 4.14 4.57 4.26
4.56 3.79 3.89 4.21 4.95 3.98 4.29 3.67 4.69 4.12 4.56 4.26
第一篇 基本统计方法
1
第二章 计量资料的统计描述
Descriptions of Measurement Data
2
Chapt 2
Frequency distribution
Description of central tendency

第02章 计量资料的统计描述课件

第02章 计量资料的统计描述课件

组段数 5;组距 10分
表2.1 某医院产科某月顺产婴儿出生身长(单位:cm) 48 48 47 42 53 49 45 50 48 52 49 57 46 48 46 42 49 51 50 51 56 42 59 49 48 52 42 49 55 53 51 45 47 47 47 50 48 51 51 53 46 47 57 45 46 51 46 51 47 51 55 47 52 47 48 54 47 54 49 44 53 54 45 48 44 48 42 47 48 50 55 50 53 56 49 50 56 41 53 53 49 44 49 48 45 52 52 46 54 50 44 53 49 47 48 45 51 45 50 53
(1)直接法—根据样本含量的奇偶选择公式
n为奇数时 n为偶数时
M X ( n1) 2
1
M
2
X(n) 2
X ( n 1) 2
例2-6:9只大鼠存活天数如下: 4,10,7,3,15,2,9,13,>60 则这9只大鼠的平均存活天数为多少天?
排序:2,3, 4, 7, 9,10 ,13, 15, >60 故这9只大鼠的平均存活天数为9天。
-
二、频数分布图
图2.1 100名顺产婴儿出生身长的频数分布
频数
三、频数表和频数分布图用途
1、描述频数分布的类型
25 20 15 10
5 0
图 2 - 2 101 名 正 常 成 年 女 子 血 清 总 胆 固 醇 的 频 数 分 布
血 清 总 胆 固 醇(mmol/L)
对称分布:各组段的频数以频数最多组段为中心左右两侧大体对称。
PX

计量资料的统计描述

计量资料的统计描述

2021/11/14
图2-3 负偏态分布 医学统计学
例:某院出院患者住院天数的频数表
组段(天) 频数(f)
0-

6
5-
21
10-
14
15-
13
20-
6
25-
2
30-
3
35-
1
40及以上 13
合计
79
2021/11/14
医学统计学
第二节 集中趋势的描述
平均数指标的概念和作用 概念:平均数表示一组同质计量数据集中趋势
4.划计并计数:变量(x)归为L ≤x<U(见
表2-1) 2021/11/14
医学统计学
表2-1 101名正常成年女性血清总胆固醇频数表
组段 频数(f)
2.3-
1
2.6-
3
2.9-
6
3.2-
8
3.5-
17
3.8-
20
4.1-
17
4.4-
12
4.7-
9
5.0-
5
5.3-
2
5.6- 5.9 1
合计
101
2021/11/14
医学统计学
例2-1 从某单位1999年的职工体检资料中获得 101名正常成年女子的血清总胆固醇
(mmol/L )的测量结果
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.5 2.7 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.8 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1) 直接法
n
X

xi
i1

x1 x2 xn
n
n
(2) 加权法 又称频数表法,适用于频数表资料。
当观察例数较时用。
k
fixi
X i1

k
fi
f1x1 f 2x2 f k xk f1 f2 fk
i 1
3
组段 (1) 频数(2)
154~
2
156~
4
158~
10
160~
16
162~
20
164~
19
166~
15
168~
9
170~
பைடு நூலகம்
4
172~
1
合计
100
频率(%)(3) 2.00 4.00
10.00 16.00 20.00 19.00 15.00
9.00 4.00 1.00 100.00
累计频数(4) 2 6
算术均数 几何均数 中位数
12
第二节 描述集中趋势的指标
算数均数(mean) 简称均数 适用条件:对称分布,尤其是正态分布或近似正态分布 表示:总体均数用μ表示;样本均数用 表示 意义:描述一组同质资料的平均水平。 计算方法: 直接法 间接法(频数表法)
13
1、算术均数(arithmetic mean)
16 32 52 71 86 95 99 100
累计频率(%)(5) 2.00 6.00
16.00 32.00 52.00 71.00 86.00 95.00 99.00 100.00
4
编制步骤如下:
1. 求极差(R)
也称为全距,是资料中最大值和最小值之差。 本例: R=173.6-154.7=18.9(cm)
求出极差
确定组段数
确定组距
列出各个组段
极差即最大值 与最小值之差
组距=R/组段数, 但一般取一方便 计算的数字
确定每一组段频数 选
根据变量值大小 把各观察单位归 入各个组段
频数
计量资料频数分布图
100名18岁女孩身高的频数分布图
25 20 15 10 5 0
155 157 159 161 163 165 167 169 171 173 身高(cm)
分布特征
集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势
离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都 有频数分布,而不是所有频数分布在集中位置的趋势。
第二节 描述集中趋势的指标
集中趋势常用平均数(average)来描述。 是一组数据典型或有代表性的值。 趋向于落在根据数据大小排列的数据的中心,因此可以用 于度量集中位置(位置指标)
统计表 统计图 统计指标
2
举例说明计量资料频数表的编制过程
例2-2、某市2005年100名18岁女孩身高(cm)资料如下: 165.1 169.6 163.0 166.5 160.9 156.6 169.3 165.9 162.0 165.3 165.1 164.0 159.9 171.2 169.1 168.0 160.6 157.1 162.5 165.8 161.5 166.3 168.5 167.1 161.0 159.0 167.3 157.2 163.7 163.1 166.1 167.5 166.0 158.5 161.2 167.5 158.2 154.7 155.6 168.2 162.8 163.6 164.2 161.8 160.7 173.6 159.8 158.0 159.4 158.2 166.2 166.1 156.8 166.6 161.5 162.0 160.6 164.3 161.9 167.2 170.2 160.4 163.0 163.5 162.9 167.4 162.2 162.7 169.7 159.9 165.2 169.0 162.3 164.6 163.4 170.6 162.8 163.1 164.0 161.2 161.0 161.3 165.0 160.4 168.9 165.0 164.2 165.2 162.6 164.5 161.5 162.6 158.3 165.1 170.5 166.8 165.8 164.5 167.5 162.8
原则: (1)第一组包含最小的观察值,最后一组包含最大的
观察值。 (2)组和组之间不能互相包含。
(3)x表示数据,则 下限 x 上限
5.归组计数,做频数分布表。
7
编制频数表步骤流程图
一般 8- 15 之间
第一组段包括极小值,最后 一组段包括极大值,除最后 一组段可同时标出上下限, 其他组段只标出下限。

2.确定组数
原则:即简化资料又不影响反映资料的规律性, 一般8-15组。
本例:选择10组
5
3.确定组距
组距为每组的上限与下限之差。 实际中 组距=R/(预计的组数)
本例:组距=18.9/10=1.89 调整为2 注明:1)尽量取较整齐的数值最为组段的端点。
2)组距以相等为宜。
6
2.360~
4.确定组段的上下限
抗体滴 度 (1) 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计
9
频数分布表的用途: 揭示数值变量频数分布的类型和特征 分布的类型 分布特征 作为大样本数据的陈述形式 便于发现一些特大或特小的可疑值 便于进一步的统计分析
10
计量资料频数分布的类型和特征
分布类型
正态分布:各组段的频数以中间组段为中心,左右两侧基本对称 偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少
计量资料
统计描述 统计推断
计数资料
统计描述 统计推断
等级资料
统计描述
统计推断
1
第二章 计量资料的统计描述
统计描述(statistical description)
是指采用统计图、统计表、统计指标等形式来对资料 的数量特征和分布规律作出测定和描述的一种方法。
统计描述是统计分析的最基本内容 统计描述的三种形式:
几何均数( geometric mean )
适用条件: 等比或等积资料 对数正态分布资料
表示:G 计算方法:
直接法 加权法
15
几何均数(geometric mean)
计算方法 1.直接法:适用于样本量较小的计量资料。
2.间接法:加权法,适用于样本量较大的计量资料,如频数 表资料。
16
例 100 名受试者接种某疫苗三周后,抗体测定结果如下表第(1)栏 和第(2)栏,求平均抗体滴度。
相关文档
最新文档