第二章 计量资料的统计描述

合集下载

统计背诵版(三份整合)

统计背诵版(三份整合)

统计学资料背诵版一、单选题:第二章:计量资料的统计描述1、描述一组偏态分布资料的变异度,以四分位数间距指标较好。

2、用均数和标准差可以全面描述正态分布资料的特征。

3、各观察值均加(或减)同一数后标准差不变。

4、比较某地1~2岁和5~5.5岁儿童身高的变异程度,宜用变异系数。

5、偏态分布宜用中位数描述其分布的集中趋势。

6、各观察值同乘以一个不等于0的常数后,变异系数不变。

7、正态分布的资料,均数等于中位数。

8、对数正态分布是一种右偏态分布(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)9、横轴上,标准正态曲线下从0到2.58的面积为49.5%10、当各观察值呈倍数变化(等比关系)时,平均数宜用几何均数。

第三章:总体均数的估计与假设检验1、均数的标准误反映了样本均数与总体均数的差异。

2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明越有理由认为两总体均数不同。

3、甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S 12、X2和S22,则理论上由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,丨X-μ丨≥t0.05/2,vS X的概率为5%5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围为74±1.96×46、关于以0为中心的t分布,叙述错误的是相同时,丨t丨越大,P越大。

7、在两样本均数比较的t检验中,无效假设为两总体均数相等。

8、两样本均数比较作t检验时,分别取以下检验水准,犯第二类错误概率最小的是α=0.309、正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率等于β,而β未知。

10、关于假设检验,说法正确的是采用配对t检验还是两样本t检验是由试验设计方案所决定的。

计量的统计描述2016-07-01

计量的统计描述2016-07-01


i50 f50
(n 2
fL)
例2-10 某地118名链球菌咽喉炎患者的潜伏期频数表见表2-6第(1)、(2)栏, 求中位数及第25 、第75 百分位数。
天数
人数 f
累计频数
累计频率(%)
(1)
(2)
12~
4
24~
17
36~
32
48~
24
60~
18
72~
12
84~
5
96~
4
108~
2
(3)
(4)
fX 2
(5)=(2)×(3)2
20.10 37.07 114.70 198.98 346.74 521.67 401.03 313.27 227.53 148.21 106.92 57.67 2493.89
计数资料频数分布表
人流次数
(1)
0 1 2 3 4 5 6 合计
人数
(2)
402 330 232 118
第三节 描述离散趋势
(变异(variation)指标)
反映数据的离散度( Dispersion )。即 个体观察值的变异程度。常用的指标有:
1. 极差(Range) (全距) 2. 百分位数与四分位数间距
Percentile and Quartile range 3. 方差 Variance 4. 标准差Standard Deviation 5. 变异系数 Coefficient of Variation
三、频数表和图的用途 1、描述频数分布的类型
对称分布:各组段的频数以频数最多组 段为中心左右两侧大体对称;
偏态分布:频数最多组段不在中心位置, 其两侧组段数不对称。

统计学第二章计量资料的统计描述

统计学第二章计量资料的统计描述
数据。同时,还需要对数据进行质量控制和预处理,以消除误差和异常值的影响。
02
统计数据整理与展示方法
数据清洗与预处理技巧
80%
缺失值处理
根据数据的分布情况和实际背景 ,选择合适的缺失值填充方法, 如均值、中位数、众数等。
100%
异常值处理
采用箱线图、散点图等方法识别 异常值,并根据实际情况选择删 除、替换或保留。
分类
根据测量水平的不同,计量资料可分为离散型和连续型两类。离 散型数据只能取整数值,如人口数、医院床位数等;连续型数据 则可以取实数范围内的任何值,如身高、体重等。
计量资料特点分析
数值性
计量资料以数值形式表示,具有数量化的特点,便 于进行数学运算和统计分析。
连续性
连续型计量资料在实数范围内可以取任意值,数据 分布的连续性使得统计推断更为精确。
06
统计图表在数据可视化中应用
常见统计图表类型介绍
条形图(Bar Chart)
用于展示分类数据之间的比较,横轴表示分类,纵轴表示数量或比例。
折线图(Line Chart)
用于展示时间序列数据或连续性数据的趋势变化,横轴表示时间或类 别,纵轴表示数量或比例。
散点图(Scatter Plot)
用于展示两个变量之间的关系,横轴和纵轴分别表示两个变量,点的 位置表示变量的取值。
一组观察值中出现次数最多的数。
计算方法
应用场景
中位数计算需先将数据排序,然后取中间 位置的数;众数计算则是统计各数值出现 的次数,取出现次数最多的数。
适用于各种类型的数据,尤其适用于偏态 分布数据。中位数和众数对极端值不敏感 ,因此能较好地反映数据的集中趋势。
不同集中趋势指标比较
算术平均数、中位数和 众数都是描述数据集中 趋势的指标,但各有特 点。

医学统计学 第二章 计量资料的统计描述

医学统计学 第二章 计量资料的统计描述

肌红蛋白含量
人数
0~
2
5~
3
10~
7
15~
9
20~
10
25~
22
30~
23
35~
14
40~
9
45~50
2
18
人数
25 20 15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
医学统计学 第二章 计量资料的统计 描述
计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值:
X1,X2,X3,……,Xn
n为样本例数(样本大小、样本含量)
2
统计描述——描述其分布规律 1、用频数分布表(图)
要求:大样本 如 n〉30
2、用统计指标 描述 集中趋势 离散趋势
6
➢制表步骤 了解分布
1. 求极差(range) 极差也称全 距,即最大值和最小值之差,记作R。 本例
R 5 .7 1 2 .3 5 3 .3 6 ( m m o l/L )
7
2.确定组距(i) :
组段数通常取组 10-15组 本例组距
i 3 .3 6 /1 0 0 .3 3 6 0 .3 0
累计频率(%) (4)
0
402
402
35.80
1
330
732
65.18
2
232
964
85.84
3
118
1082
96.35
4
27

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
11111,11111,11111 中位数是50%位的数值,其为百分位数的特殊形式。
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不

2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S

计量资料的统计描述

计量资料的统计描述

第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。

(2)频数分布的类型。

(3)频数分布表的用途。

2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。

算术均数、几何均数、中位数。

3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。

极差、四分位数间距、方差、标准差、变异系数。

(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。

二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。

常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。

(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。

对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。

如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。

对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。

制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。

min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。

确定组段和组距。

每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。

3.写出组段,逐一划记。

频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。

(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。

1.算术均数算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。

第二章 计量资料的统计描述

第二章 计量资料的统计描述
全距(R ):即极差,最大值与最小值之差。
意义:越大说明离散程度越大 优点:计算简单 缺点:不能全面反映资料的离散程度;不稳定,易受 极端值影响
(二)四分位数间距(Quartile interval)
四分位数间距( Q ):将一组资料分为四等份,上四分位数QU(P75) 与下四分位数QL(P25)之差。
(四)众数(mode)
• 众数是指一组观察值中出现次数最多的那个数值。一组观察 值可以有多个众数,也可以没有众数。众数只有在数据量较 大时才有意义。众数不受极端值大小的影响,但它掩盖的信 息经常比它揭示的要多。
• 例2-1资料中有频数最大为4的6个众数,分别为131、133、135、13 8、142、145(g/L);当列成表2-1的频数分布时,由于“138~” 组的频数为21最大,因此众数为该组的组中值141.5(g/L)。
不但反映研究指标数值的稳定性和均匀性,而且反映集中 性指标的代表性。
三组同性别同年龄儿童的体重如下:
x 甲组:26 28 30 32 34 甲 = 30Kg x 乙组:24 27 30 33 36 乙 = 30Kg x 丙组:26 29 30 31 34 丙 = 30Kg
(一)全距(Range)
集中趋势和离散趋势是揭示数据分布的类型和正
确进行统计描述与统计推断的前提。
(三)异常值的识别
频数表有助于发现极小或极大的异常值。 在频数表的两端连续出现几个组段的频数为0后,又
出现一些极小值或极大值,应怀疑这些资料的准确 性,需对这些数据进一步核对和复查,若发现错误, 及时改正。
(四)有利于进一步对资料进行 统计描述与分析
2 (xi )2
N
s2

xi
x2

第二章统计描述

第二章统计描述

G ' lg1(
fi lg Xi ) lg1(
1 0.6021 4 0.9031
1 2.709Байду номын сангаас )
fi
40
lg1(67.1282) 48 40
G 1: 48
中位数(median, M)
适合于表达偏态资料、或分布不明的资料的平 均水平,尤其适合于表达只知数据的个数、但 部分较大或较小数据的具体数值未准确知道的 资料的平均水平。
血清总胆固醇 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~
7.0~7.5 合计
频数f 1 8 9 23 25 17 9 6 2 1
101
fx 2.75 26 33.75 97.75 118.75 89.25 51.75 37.5 13.5 7.25 478.25
13
174
单侧正常值范围的上限为 1.81
14
188
(mol/L)。
1.69~
4
192
1.93~
4
196
2.17~
1
197
2.42~
2
199
2.66~
0
199
2.90~3.14
1
200
3.四分位数间距(quartile interval, Q)
Q=P75-P25
Q=QU-QL
优缺点:用四分位数间距作为描述数据分布离散 程度的指标,比极差稳定,但仍未考虑到每个数 据的大小,常用于描述偏态频数分布以及分布的 一端或两端无确切数值资料的离散程度。
第1四分位数记作Q1,第2、第3四分位数,分别记作 Q2、Q3;第1百分位数,记作P1。同理,还有第2、第 3、 ···、第99百分位数,分别记作P2、P3、 ···、P99。

医学统计学:计量资料的统计描述

医学统计学:计量资料的统计描述

方差、标准差计算方法和意义
方差
指各数据与均数之差的平方和的平均 数,用于反映数据的术平方根,用于衡量数据偏 离均数的程度。标准差越大,数据分 布越离散。
变异系数在医学研究中应用
变异系数
指标准差与均数之比,用于比较不同单位或不同均数水平下数据的离散程度。在医学研究中,常用于评价不同指 标或不同人群间的变异程度。
分类
根据测量水平不同,可分为离散型计量资料和连续型计量资料。离散型计量资 料只能取整数值,如人口数、医院床位数等;连续型计量资料可以取实数范围 内的任何值,如身高、体重等。
计量资料特点分析
01
数值性
计量资料以数值形式表示,具有明 确的数量特征。
可比性
同类计量资料之间可以进行比较, 如不同人群的身高、体重等。
众数
一组观察值中出现次数最多的数。
应用场景
常用于描述无明显集中趋势或分布规 律资料的集中趋势,如一些分类数据 的统计描述。
04 离散程度指标解读
极差、四分位数间距计算及意义
极差
指一组数据中最大值与最小值之差, 用于反映数据的波动范围。计算简单, 但易受极端值影响。
四分位数间距
指第三四分位数与第一四分位数之差, 用于反映中间50%数据的离散程度。 较极差更稳定,不易受极端值影响。
常用统计描述方法介绍
频数分布表与直方图
通过分组和计数的方式展示数 据的分布情况,适用于连续型
变量。
集中趋势描述
包括算术均数、几何均数和中 位数等,用于描述数据的平均 水平或中心位置。
离散程度描述
包括标准差、方差和四分位数 间距等,用于描述数据的波动 范围或离散程度。
偏态与峰态描述
通过偏态系数和峰态系数等描 述数据的偏态和峰态特征,反

2计量资料的统计描述指标介绍

2计量资料的统计描述指标介绍

2计量资料的统计描述指标介绍计量资料的统计描述指标是对数据集合进行概括和描述的方法,可帮助我们了解数据的分布、集中趋势和离散程度,以及可能存在的异常值。

常用的统计描述指标包括均值、中位数、众数、极差、标准差、方差、四分位数和百分位数等。

1. 均值(Mean):均值是一组数据的总和除以数据的个数。

均值可以反映数据的集中程度,但容易受到异常值的影响。

2. 中位数(Median):中位数是一组数据按大小排序后,位于中间位置的数值。

中位数可以反映数据的中间位置,不受异常值的影响。

3. 众数(Mode):众数是一组数据中出现次数最多的数值。

众数可以反映数据集中的特点。

4. 极差(Range):极差是一组数据的最大值与最小值之差。

极差可以反映数据的全面分布。

5. 标准差(Standard Deviation):标准差测量数据的离散程度。

标准差越大,数据的离散程度越大。

6. 方差(Variance):方差是标准差的平方。

方差可以反映数据的离散程度,但单位是原数据的平方。

7. 四分位数(Quartiles):四分位数将一组数据按大小排序后,分为四等分,分位点分别是Q1(25%分位点)、Q2(中位数)和Q3(75%分位点)。

四分位数可以帮助我们了解数据集的分布情况。

8. 百分位数(Percentiles):百分位数是将一组数据按大小排序后,分为100等分,每个等分对应一个百分位数。

百分位数可以帮助我们了解数据的分布情况,例如第75百分位数表示排在该位置的数据值大约有75%的数据小于它。

这些统计描述指标都是通过对数据进行运算得出的,可以帮助我们了解数据的分布情况和特点。

在实际应用中,我们可以根据具体的问题选取适当的统计描述指标进行分析,帮助我们更好地理解数据。

同时,还需要注意统计描述指标的局限性,例如均值容易受到异常值的影响,中位数和众数不能反映数据的离散程度等,因此在使用时需要结合具体情况进行综合分析。

计量资料的统计描述

计量资料的统计描述

例4-2-3:利用表4-2-1计算某社区101名 正常成年女子的血总胆固醇的均数。
X 1´ 2.45 3´ 2.75 L1´ 5.75 409.75 4.06(mmol/L) 1 3L 1 101
(二)几何均数 几何均数(geometric mean G)适用于观 察值变化范围跨越多个数量级的资料。 几何均数适用于成等比级数的资料,特别是 对数正态分布资料。
例4-2-5:2004年某社区52例慢性肝炎患者的 HBsAg滴度数据如表4-2-3。试计算滴度的几何 均数。
(三)中位数 中位数(median M)是将变量值从小到 大排列,位置居于中间的那个变量值, 称为中位数。可用于各种分布的定量资 料,特别是偏态分布资料和开囗资料 (一端或两端无确切数值的资料)。
S CV ´ 100% X
S为标准差,X 为均数。
(公式4-2-15)
(六)运用变异指标的注意事项
1.变异指标表示变量值的变异程度或离散趋势,常与集中指 标平均数结合运用,说明变量值集中的位置与离散程度。 2.变异指标种类虽多,但任一变异指标,其值大表示变异大, 数值参差不齐;值小表示变异小,数值比较集中在平均数 周围。比较两个或几个同类事物的变异,要用同一变异指 标。 3.正态分布资料宜用均数与标准差描述集中与离散趋势。有 了均数与标准差就可根据正态分布理论将频数分布描绘出 来。偏态分布资料宜用中位数及四分位数间距、极差等描 述其集中趋势和变异程度。 4. 比较几组资料的变异程度,若各组资料的单位不全相同, 或均数相差悬殊时,宜用变异系数描述其变异程度。
(四) 百分位数 将频数等分为十或一百的分位数称十分位 数或百分位数 。 百分位数的符号为Px,X代表第X百分位。 一个百分位数Px将全部变量值分为两部分, 在不包含Px的全部变量值中有x%的变量 值比它小,(100-x)%变量值比它大。

第02章 计量资料的统计描述课件

第02章 计量资料的统计描述课件

组段数 5;组距 10分
表2.1 某医院产科某月顺产婴儿出生身长(单位:cm) 48 48 47 42 53 49 45 50 48 52 49 57 46 48 46 42 49 51 50 51 56 42 59 49 48 52 42 49 55 53 51 45 47 47 47 50 48 51 51 53 46 47 57 45 46 51 46 51 47 51 55 47 52 47 48 54 47 54 49 44 53 54 45 48 44 48 42 47 48 50 55 50 53 56 49 50 56 41 53 53 49 44 49 48 45 52 52 46 54 50 44 53 49 47 48 45 51 45 50 53
(1)直接法—根据样本含量的奇偶选择公式
n为奇数时 n为偶数时
M X ( n1) 2
1
M
2
X(n) 2
X ( n 1) 2
例2-6:9只大鼠存活天数如下: 4,10,7,3,15,2,9,13,>60 则这9只大鼠的平均存活天数为多少天?
排序:2,3, 4, 7, 9,10 ,13, 15, >60 故这9只大鼠的平均存活天数为9天。
-
二、频数分布图
图2.1 100名顺产婴儿出生身长的频数分布
频数
三、频数表和频数分布图用途
1、描述频数分布的类型
25 20 15 10
5 0
图 2 - 2 101 名 正 常 成 年 女 子 血 清 总 胆 固 醇 的 频 数 分 布
血 清 总 胆 固 醇(mmol/L)
对称分布:各组段的频数以频数最多组段为中心左右两侧大体对称。
PX
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频数表(频数分布):表示各组及它们对应 的组频数的表格称为频数表或频数分布。
2015/8/10
计量资料的统计描述
4
频数表编制
1.
2.
3. 4. 5.
计算极差(全距):极差( R)= 最大 值-最小值 确定组数、组距:组距 =R/组数, 医 学上组数一般在8-15组 确定组限:组限[下限~上限] 计算组中值 划记记数
2015/8/10
计量资料的统计描述
16
举例:

计算5个同学的平均成绩,93,92,95, 94,91
92 93 95 94 91 X 93 5
2015/8/10
计量资料的统计描述
17
2.加权法(weighting method):

根据频数表计算均数的一种方法。当变 量值个数较多时,可先将原始数据列成 频数表,然后再做计算。
计量资料的统计描述
23
1.直接法:
G n X1 X 2 X n
写成对数形式 :
lg X lg X 1 lg X 2 lg X n 1 G lg lg n n
1

2015/8/10
计量资料的统计描述
24
举例:
一、概念 医学参考值范围(reference value range)又称正常值范围(normal range), 是指正常人的解剖、生理、生化、免疫 等各种数据的波动范围。

习惯上是确定包括95%的人的界值
计量资料的统计描述 47
2015/8/10
二、医学参考值范围的测定方法
1. 选择足够数量的正常人作为参照样本 一般至少在120例以上 2. 对选定的正常人进行准确的测定 3. 决定取单侧范围还是双侧范围值 4. 选择适当的百分范围 若主要目的在于减少假阳性(确诊病人),参考 值范围要取大一些,若目的是减少假阴性(初 筛病人)参考值范围要减小一些。
160~
170~ 180~190
20
11 3
36
47 50
165
175 185
145 1 155 15 165 20 175 11 185 3 X 165 50
2015/8/10 计量资料的统计描述 19
举例:

测得5个人的血清滴度的倒数分别为2,4, 8,16,32,求平均滴度
缺点:不稳定,只能粗略说明变量的变 动范围

2015/8/10
计量资料的统计描述
36
二、四分位间距(Q)
把数据按顺序排列,取中间50%的观察值 的数据范围即为四分位间距 Q=P75-P25
四分位间距大,说明数据变异越大,反之, 说明数据变异程度小。 四分位间距较极差稳定,但仍没应用的每 一个具体观察值。

M Xn X n / 2 n 为偶数时, ( 1) 2 2
举例:2,4,5,6,7,8的中位数为5.5
计量资料的统计描述 29

2015/8/10
2.频数表法:
iM n M L ( f ) fm 2


其中 L、i、f 分别为 M 所在组段的下 限、组距和频数, f 为M所在组段之前 各组段的累积频数。 举例:以上面数据为例 M=160+160/17*(52/2-25)=169.41
44
(三)标准正态分布

标准正态分布是均数为0,标准差为1的 正态分布,对于任何参数μ 和σ 的正态 分布,都可以通过一个简单变量变换化 成标准正态分布,即
u
2015/8/10
X

45
计量资料的统计描述
(四)正态分布的应用

见书22页例题:3-2
2015/8/10
计量资料的统计描述
46
第五节 医学参考值范围
四、变异系数(CV)

适用于均数相差较大或单位不同的几组 数据的变异程度的比较
S CV 100% X

特点:消除了单位的影响
2015/8/10
计量资料的统计描述
40
第四节 正态分布及应用
(一)图形
2015/8/10
计量资料的统计描述
41
2015/8/10
计量资料的统计描述
42
(二)特征
计量资料的统计描述 30
2015/8/10
百分位数(percentile)PX

将N个观察值从小到大依次排列,再分 成100等份,对应于X%位的数值即为 第X百分位数。中位数是百分位的特殊形 式。
适用:用于任何频数分布的资料

2015/8/10
计量资料的统计描述
31
计算
nx% f L Px L ix fx

60 70 80 90 100 10 75 80 85 150

2015/8/10
计量资料的统计描述
34
第三节 离散趋势
1. 2. 3. 4.
描述离散趋势的指标: 极差(全距) 四分位间距 方差、标准差 变异系数
2015/8/10
计量资料的统计描述
35
一、极差(R)

极差大说明变异程度大,反之说明变异 程度小 R=最大值-最小值
2015/8/10 计量资料的统计描述 48
二、医学参考值范围的测定方法
5.估计参考值范围的界限
百分位数法 正态分布法
两种方法的比较:
百分位数法:适合于任何分布类型的资料,但不稳定 正态分布法:正态分布的资料,比较稳定
2015/8/10 计量资料的统计描述 49
百分范围 (%) 95 99
X1 f1 X 2 f 2 X n f n fX X f1 f 2 f n f

其中X1、X2……Xn分别为各组段的组中值, 即本组段的上限与下限之和除以2
计量资料的统计描述 18
2015/8/10
举例:
身高 140~ 150~ 频数f 1 15 累积频数 1 16 组中值X 145 155
样本方差
S
2

X X n 1

2
S
2
2
X X
2
2
n n 1

样本标准差
S
X X
n 1
S
S
2 X X
2
n n 1
fX fX
2
2
n n 1
2015/8/10
计量资料的统计描述
39
计量资料的统计描述 5
2015/8/10
2015/8/10
计量资料的统计描述
6
2015/8/10
计量资料的统计描述
7
2015/8/10
计量资料的统计描述
8频数Βιβλιοθήκη 布的两个特征:集中趋势 集中位置的描述,即大多数数值落在什么 位置。 离散趋势 离散趋势是描述一组数据的变异程度或偏 离集中位置的程度(参差不齐的程度)
11
第二节 集中趋势

我们用平均数 (average) 来描述集中趋
势,平均数是描述一组观察值集中位置
或平均水平的统计指标
2015/8/10
计量资料的统计描述
12
平均数

算术均数 几何均数 中位数
计量资料的统计描述 13


2015/8/10
(一)算术均数(arithmetic mean)

算术均数:简称均数,用于说明一组观 察值集中位置或平均水平,是描述计量 资料的一种最常用的方法。

以均数为中心对称,均数处最高; 2 个参数 N(μ ,σ ),μ 是位置参数, σ 是变异参数 正态曲线下面积: μ ±1.96σ 范 围 内 的 面 积 是 9 5 % , μ ±2.58σ 范围内的面积是99%
2015/8/10
计量资料的统计描述
43
2015/8/10
计量资料的统计描述

如上例: G 5 2 4 8 16 32 8
1
lg 2 lg 4 lg 8 lg16 lg 32 G lg 5 1 lg 2 2 lg 2 3lg 2 4 lg 2 5lg 2 lg 5 15lg 2 1 lg lg lg 8 8 5
总体均数用μ 表示,样本均数用 X 表示。 适用条件:正态分布的资料

2015/8/10
计量资料的统计描述
14
算术均数的计算方法: 直接法


加权法
2015/8/10
计量资料的统计描述
15
1.直接法
当样本中变量值个数不多时,将变量 值相加再除以变量值个数(样本含量), 即得均数。
X 1 X 2 X n X X n n
L:Px所在组段的下限 ix:Px所在组段的组距 fx:Px所在组段的频数 fL:Px所在组段之前各组段的累积频数
2015/8/10 计量资料的统计描述 32
平均数应用条件:
算术均数可以用于正态资料的平 均水平的描述 几何均数可以用于呈倍数变化的 数据,即经过对数转换后符合正态 的资料 中位数应用于任何分布类型的资 料
计量资料的统计描述
主要内容:
1. 2.
3.
4. 5.
频数表 集中趋势 离散趋势 正态分布及应用 医学参考值范围
2015/8/10
计量资料的统计描述
2
第一节 频数分布

频数表的绘制、直方图

频数分布的特点 频数分布的类型
频数分布的用途
计量资料的统计描述 3
相关文档
最新文档