【医学统计学】第4章 定量资料的描述(12-17)

合集下载

医学统计学第四章 定量资料的统计描述

医学统计学第四章 定量资料的统计描述

¾
¾
8
③ 统计各组频数
采用计算机或手工划记汇总,得到各组段相 应的频数。
9
根据这些数据编制成的频数表能显示出这组数据分布的特征
表4.2 组段(cm) (1) 0.980~ 1.110~ 1.240~ 1.370~ 1.500~ 1.630~ 1.760~ 1.890~ 2.020~ 2.150~ 2.280~2.410 合计 频数( f ) (2) 5 5 7 14 19 29 15 12 6 4 4 120 2005年某市120名9岁男孩肺活量(L)频数分布 频率(%) (3) 4.17 4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00 累计频数 (4) 5 10 17 31 50 79 94 106 112 116 120 — 累计频率(%) (4) 4.17 8.33 14.17 25.83 41.67 65.83 78.33 88.33 93.33 96.67 100.00 —
−1
lg 4 + lg 8 + ... + lg 64 ) = lg −1 (1.2041) = 16 ( 5

该5份血清的平均滴度为1:16。
28
2.频数表法(加权法)

当资料中出现相同观察值的个数较多时,或资料 为频数表资料,则用加权法计算几何均数。 变量及频数如下,符合几何均数的适用条件: X1,X2,… Xk f1 , f2,… fk 则几何平均数G为:
X1, X2, ⋅⋅⋅, Xk:频数表资料中各组段的组中值; f1, f2, ⋅⋅⋅, fk:相应组段的频数。
23
表4.2 120名9岁男孩肺活量均数的计算

定量资料的统计描述

定量资料的统计描述

例:求下表中血清铁含量的5%、 95%位数
从表2-2可判断出5%位于“10~”这个 组段:
px = L +
i n( x%
fx
f
)
L
= 10 + 21(20×5% 4 =)10.67
6
该组血清铁资料的5%位数为10.67 (μmol/L)。
从表2-2可判断出95%位于“24~”这 个组段:
px = L +
n为奇数时: M = X n + 1
2
n为偶数时:M =
1 2
X
+
n 2
X n+ 1 2
式中X*表示将n例数据按升序排列 后的第i个数据。
上式中n为一组观察值的总个数,
n +1
n
n +1
2
2
2
均为下标,表示有序数列中观察值 的位次。
例:某药厂观察9只小鼠口服高山红 景天醇提物(RSAE)后在乏氧条件 下的生存时间(分钟)如下:
一般设10~15个组段,每个组段的 起点称“下限”,终点称“上限”;第 一组段含最小值,最末组段含最 大值。
(4) 列表
频数分布的类型:
对称分布—集中位置在正中、左右 两侧频数分布大体对称
偏态分布
正偏峰分布-集中位 置偏向数值小的一侧
负偏峰分布-集中位 置偏向数值大的一侧
定量变量的特征数
= 119.75
52例慢性肝炎患者的HBsAg滴度 的平均水平为1:119.75。
3. 中位数(median, M)
将一组观察值从小到大按顺序排 列,位次居中的观察值就称中位数。 用M表示。
中位数适用于任何一种分布的定量 资料,一般多用于描述偏态分布或 数据一端无界资料的集中趋势。

【医学统计学】第4章 定量资料的描述(12-17)

【医学统计学】第4章 定量资料的描述(12-17)
定量资料的统计描述
4. 归组计数,整理成表 用计算机或手工划记法汇总,得到各组段观察单位个数,绘制成频
数分布表
定量资料的统计描述
表4-1 某市2010年120名正常成年男子红细胞计数值(×1012/L)的频数表
组段(×1012/L) (1)
组中值 (2)
3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~ 5.90~6.20 合计
频数分布表(frequency table):由变 量值及其频数编制而成的表
定量资料的统计描述
(一)频数表的编制
1. 求极差(range): 极差又称全距,是指全部观察值中最大值与
最小值之差,用符号R表示 R=xmax-xmin
R 6.183.29 2.89cm
定量资料的统计描述

2. 确定组数和组距
组段(×1012/L) (1) 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~
5.90~6.20 合计
频数fi (2)
2 5 10 19 22 24 21 11 4 2 120( )
组中值xi (3) 3.35 3.65 3.95 4.25 4.55 4.85 5.15 5.45 5.75 6.05 47
1
86.9977 50
lg
11.7399
54
即50名麻疹易感儿接种麻疹疫苗后血凝 抑制抗体的平均滴度为1/54
2. 应用及注意事项
•几何均数应用于: •等比资料,如抗体平均滴度 •对数正态分布资料
• 使用几何均数时应注意:
• 观察值不能有0
• 观察值不能同时有正值和负值。若全为负值, 在计算时先把负号去掉,得出结果再加上负 号

《医学统计学》第四章定性资料的统计描述

《医学统计学》第四章定性资料的统计描述

1、不要把构成比与率相混淆。即分析时不能以构成 比代率;这是常见的错误。
某文章作者根据上述资料认为,沙眼在20~组的患病率最高,以后随年 龄增大而减少。该作者把构成比当作率进行分析,犯了以比代率的错误。
2、使用相对数时分母不宜过小。分母过小时相对数 不稳定。
3、注意资料的可比性;
不同时期、不同地区、不同条件下的资料比较时应注意具有 可比性。
12965.2
46.3

265
660291.4
40.1
说明该地市区非吸烟女性饮酒者的肺癌发病率是
非吸烟女性不饮酒者的1.15倍。
3.比数比
比数比( Odds ratio ,OR) : 常用于流行病学
中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为
一般的,两个地方的出生率、死亡率、发病率、不同级别 医院某病的治愈率等不能直接比较。
无可比性的实例:
由表2-7可见,无论有无腋下淋巴结转移,省医院的5年生存 率均高于市医院,但从总生存率看,省医院的5年生存率低于市 医院。这不符合常理。因此,省医院与市医院的总生存率就不能 直接比较(标准化后再比)。
感谢聆听

某事物或现象发生的实 际数 某事物或现象发生的所 有可能数
比例基数
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则

医学统计学-课后答案

医学统计学-课后答案

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。

故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。

故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。

适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。

例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。

随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

医学统计学定量数据的统计描述.pptx

医学统计学定量数据的统计描述.pptx
120
频率 0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83 100.00
累计频数 累计频率
1
0.83
4
3.33
10
8.33
18
15.00
30
25.00
50
41.67
77
64.17
95
79.17
107
89.17
115
95.83
23.07 23.77 18.61 17.48 18.54 21.36 19.53 15.31 19.26 16.52
表 120名健康男性居民血清铁含量频数分布表
组段 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30 合计
频数 1 3 6 8 12 20 27 18 12 8 4 1
卫生部“十二五”规划教材
医学统计学
定量数据的统计描述
频数分布
频数分布的目的和用途
目的:了解数据的分布范围、集中位置以及分布形态等 特征,以便根据资料分布情况选择合适的统计方法。
用途: ①作为陈述资料的形式; ②便于观察数据的分布类型; ③便于发现数据中特大或特小的可疑值; ④当样本量大时,可用各组段的频率作为概率的估计 值。
血 清 铁 ( μ m ol / L )
图 120名健康男性居民血清铁含量频数分布图
集中趋势的统计指标
概述
平均数(average),是描述一组观察值集中位置或 平均水平的统计指标,常作为一组数据的代表值用于 分析和进行组间的比较。
常用的有算术均数、几何均数、中位数、百分位 数等。
算术均数

医学统计学(第二版)思考与练习答案

医学统计学(第二版)思考与练习答案

第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。

不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。

2. 同一资料的标准差不一定小于均数。

均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。

标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。

若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。

3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。

不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。

4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。

曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。

5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。

医学统计学定量数据的统计描述

医学统计学定量数据的统计描述

方差和标准差
方差
一组数据与其平均值偏差的平方和的平均数。
标准差
一组数据各数值与其平均值的差的平方和的平均数 的平方根。
正态分布和偏态分布
1 正态分布
一组数据的分布符合正态曲线,均值、中位数和众数都在同一位置。
2 偏态分布
一组数据的分布不符合正态曲线,左右两侧的数据出现“偏斜”。
频率分布表和直方图
医学统计学定量数据的统 计描述
这个演示文稿将介绍医学统计学中定量数据的基本统计指标和统计描述方法, 为您提供更深入的理解。
医学统计学的介绍
1 定义
医学统计学是一门研究医 学数据的统计量和结果的 学科。
2 目的
通过数据分析,帮助医学 研究者更好地了解疾病的 特点和分布规律,指导医 学决策和治疗方案。
假设检验和t检验
1 假设检验的基本原理
通过样本数据推断总体参数是否符合某个假 设条件。
2 单样本t检验
一种假设检验方法,用于检验某个样本的均 值是否符合总体的规律。
3 多样本t检验
用于比较两组及以上样本的均值是否存在显 著差异。
4 配对t检验
用于比较同一组样本在两个不同时间或条件 下的差异。
方差分析和回归分析
3 应用
医学统计学应用广泛,包 括临床试验、流行病学调 查、疫情监测和医疗卫生 管理等领域。
基本统计指标
均值
一组数据的平均值,即所有数 值相加后再除以数据的个数。
中位数
一组数据中,位于中间位置的 数值。当数据个数为偶数时, 中位数为中间两个数的平均值。
众数
一组数据中出现次数最多的数 值。可能有多个众数。
频率分布表
一种展示数据分布的表格,包括数值范围、频 数、频率和累计频率等。

卫生统计学 定量资料的统计描述

卫生统计学   定量资料的统计描述


均数的特性

各观察值与均数之差(离均差)的总和等于零,即:
(X X ) 0

各观察值的离均差平方和最小,即:
( X X ) ( X a) , a X
2 2
均数是一组观察值最理想的代表值。
均数的应用

均数反映一组同质观察值的平均水平,并可作为样 本的代表值与其他样本进行比较。
中男生引体向上完成次数的情况,根据该资料编制频数
表。 本资料的引体向上次数是一个定量变量,且属于离散型。 欲编制其频数分布表: 第一步:整理出变量值的各个取值(见表的第1列);
第二步:清点出各个取值出现的频数(见表的第2列);
第三步:计算各个取值出现的频率(见表的第3列);
第四步:在第二步得到的数据基础上计算累计频数和累 计频率(见表的第4-5列)。
表2 2005年某市120名9岁男孩肺活量(L)均数计算表
fX X f 5 1.045 4 2.345 200.800 5 4 120 1.673(L)
均数注意事项
加权法中X1, X2, , Xk与f1, f2, , fk分别为频数表资料 中各组段的组中值和相应组段的频数(或相同观察值 与其对应的频数)。
统计推断。
定量变量资料的统计描述

编制频数分布表和绘制频数分布图


集中位置的统计描述
离散趋势的统计描述 分布形态的统计描述
第一节
频数分布表
频数— 观察数据的相同值个数 频数分布— 观察数据在其取值范围内的分布情况 频率— 一个随机试验有几种可能结果,我们常常希 望知道出现某种结果的可能性有多大。例如,某单 位配制一种蜂刺脱敏药。陆续试用于被蜂刺的患者, 共计200人,其中180人用药后症状减 轻。

卫生统计学-定量资料的统计描述精品PPT课件

卫生统计学-定量资料的统计描述精品PPT课件

集中趋势:均数、几何均数、中位数
• 统计指标
离散趋势:极差、方差、标准差、四 分位间距等
定量资料的统计描述---集中趋势
✓ 算数均数 (mean)
适用条件:对称分布,特别是正态或者近似正态分 布的资料。
✓ 几何均数 (geometric mean)
适用条件:偏态分布,但是经过对数变换之后呈正 态或近似正态分布的资料。
SPSS操作过程
SPSS中实现定量资料统计 描述的四个常用过程
Frequencies过程 Descriptives过程 Explore过程 Ratio过程
Frequencies过程:
• 涉及的统计指标比Descriptives过程全 面,并给出常用统计图。
• 还可以对分类资料以及不服从正态分 布的资料进行描述
1. 均数与中位数的比较 2. 频数表 3. 直方图,P-P图,Q-Q图 4. 正态性检验:单峰对称
正态性检验 -explore命令
操作步骤: Analyze-descriptive-explore -plots histogram
normality plots with test
2、Q-Q图
做法:
1、Frequencies 过程的对话框与选择项
• (1)Frequencies 过程的对话框
①Statistics对话框:
②charts对话框
③format对话框
• 练习: • 1、1985年某省农村120例6-7岁正常男童胸
围测量结果。
• Trunc(cc/1.5)*1.5
• 2、某市1974年为了了解该地居民发汞的基 础水平,为汞污染的环境监测积累资料, 调查了留住该市一年以上,无明显肝肾疾 病,无汞作业接触史的居民238人的发汞含 量(umol/kg),试做频数表分析。

第四章 定量资料的统计描述(终板).

第四章 定量资料的统计描述(终板).

二、频数表的用途
1、揭示资料的分布特征和分布类型; 2、便于进一步计算指标和统计分析; 3、便于发现特大或特小的可疑值; 4、据此绘制频数分布图。
频数分布的特征
1、集中趋势:观察值向某一数值集中的 倾向(用平均数指标说明);
2、离散趋势:观察值大小不等的倾向 (用变异指标说明)。
频数分布的类型
19695258999509901962582580505252595099019619625825805052525二选定适当的百分界值三决定正常参考值范围的单侧或双四选择正常参考值范围的估计方法一选择样本含量足够大的正常人25975059959599频数累计频数累计频率1260317208400766863613116014661341548194815119182128908231622895802723498323123598743523699163923810000合计238上表为某市238名健康人发汞含量求该市健康人发汞含量95正常值范围
第一节 频数表与频数图
• 一、定义: • 相同观察结果出现的次数称为频数(frequ
ency)。 • 将所有观察结果的频数按一定顺序排列在
一起,表达变量取值及其不同取值频数分 布情况的统计表称为频数分布表,简称频 数表(frequency table)。
二、频数分布表的编制
原始资料分组
按数量分组
n
n
• 故5个人抗体的平均滴度是1/70。
加权法:若相同观察值较多或资料已编制成频数
表则可利用加权法计算,其公式为:
G lg 1( f1 lg x1 f2 lg x2 ... fn lg xn ) lg 1( f lg X )
f1 f2 ... fn

研究生医学统计学-定量资料的统计描述课件

研究生医学统计学-定量资料的统计描述课件

集中趋势指标
平均数(average)
• 定义:描述一组性质相同的观察值的集中趋势、 中心位置或平均水平的指标
• 平均数是一组数据典型或有代表性的值。
• 常用平均数的种类有: –算术均数 –几何均数 –中位数 – 众数* – 调和均数*
一、算术均数
(arithmetic mean)
1.适用资料:算术均数简称为均数 (mean),适用于正态分布或近 似正态分布资料。
6
6.0
82.0~
83.0
0
0
84.0~86.0 85.0
合计

1
1.0
100 100.0
累计频率% 3.0 8.0 16.0 27.0 52.0 76.0 86.0 93.0 99.0
99.0 频数表的概念
100.0 —
人数
100名健康女大学生血清总蛋白含量的频 数分布
25 20 15 10 5 0
x甲30kg
• 乙组 24 27 30 33 36
x乙30kg
• 丙组 26 29 30 31 34 • R甲=8,R乙=12,R丙=8
x丙30kg
二、四分位数间距
(quartile interval)
1.适用资料:⑴偏态分布资料,⑵资料分布 的末端无确切数据的开口资料
2.符号:Q 3.计算:Q= Qu- QL =P75-P25, Qu上四分位
83)
36.0(小
时)
P95
48
12(164 12
95%
146)
57.8(小
时)
M P50
二、几何均数
(geometric mean)
1.意义:n个数值的乘积开n次方即为这n
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.35 3.65 3.95 4.25 4.55 4.85 5.15 5.45 5.75 6.05 —
频数(f) (3)
2 5 10 19 22 24 21 11 4 2 120
频率(%) (4)
1.7 4.2 8.3 15.8 18.3 20.0 17.5 9.2 3.3 1.7 10.0
累计频数 (5)
(1) 根据研究目的和分析要求灵活确定组

数:
若为计算用,组数可适当增多,
以减少计算误差;若为显示分布特征,则
组数不宜太多或太少, 一般n<50,5~8,
n>50,9~15
(2)确定组距(class interval):相邻两个组段下限之差为组距,一般 采用等距分组。 i=R/ 组数,为了方便资料整理汇总,组距一般取 整数
定量资料的统计描述
• 频数分布的两个特征 •集中趋势(central tendency):指一组数 据向某个位置聚集或集中的倾向 • 离散趋势(dispersion):指一组数据的分散 性或变异度
定量资料的统计描述
• 频数分布的类型 • 对称分布(symmetric distribution) :集中位置在中间,左右两侧频数基
第四章 定量资料的统计描述 Chapter4:Statistic Description
for Quantitative Data
2021/2/8 Monday
1
主要内容
• 频数表与频数图** • 集中趋势的统计描述* • 离散趋势的统计描述* • 正态分布*
定量资料的统计描述
2
第一节 频数表与频数图
4.41 4.90 4.49 5.26 5.69 4.75 5.12 4.06
4.33 5.09 4.85 3.84 5.25 5.39 5.36 3.42
4.58 4.64 5.28 4.17 4.56 5.27 3.86 4.68
【问题4-1】 该资料为何种类型资料? 如何对该资料进行描述?
定量资料的统计描述
图4-1 某市2010年120名正常成年男子红细胞计数值(×1012/L)的频数图
连续型定量资料
20
对称分布
10
30
20
10
0 0.0
250.0
0 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75
频数分布表(frequency table):由变 量值及其频数编制而成的表
定量资料的统计描述
(一)频数表的编制
1. 求极差(range): 极差又称全距,是指全部观察值中最大值与
最小值之差,用符号R表示 R=xmax-xmin
R 6.183.29 2.89cm
定量资料的统计描述
2. 确定组数和组距
2 7 17 36 58 82 103 114 118 120 —
累计频率(%) (6)
1.7 5.9 14.2 30.0 48.2 68.3 85.8 95.3 98.0 100.0 —
(二)频数分布表的用途
1. 揭示频数分布的特征 2. 揭示频数分布的类型 3. 便于发现特大或特小的可疑值 4. 便于进一步计算统计指标和进行统计分析
• 由于个体变异的存在,医学研究中某指标在各个体上的观察结果 不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈 一定的分布(distribution)
• 将原始数据按照一定的标准划分为若干各组,合计各组的频数, 得到频数分布表;也可再将频数表绘制成频数分布图
一、频数分布表
频数(frequency):一组资料中各观察 值或不同组段内观察值出现的频繁程度 (次数)
i 2.89 10 0.289 0.30
定量资料的统计描述
3. 确定组段 组段起点称为下限(lower limit) 组段终点称为上限(upper limit) 注意:第一组段必须包含最小值,最后一个组段必须包括最大值,
各组段不能重叠。除最末一个组段需同时写出上下限外,其余组段 只写出其下限
5.25 4.66
5.17 4.94
4.68 6.00
4.28 4.86
4.37 4.13
4.43 5.31
3.29
4.31 4.84
4.89 4.20
5.79 5.21
4.91 4.05
4.46 4.97
5.33 5.22
4.02 4.53
4.18
4.09 4.79 5.46 5.13 5.03 4.78 5.86 4.13
定量资料的统计描述
4. 归组计数,整理成表 用计算机或手工划记法汇总,得到各组段观察单位个数,绘制成频
数分布表
定量资料的统计描述
表4-1 某市2010年120名正常成年男子红细胞计数值(×1012/L)的频数表
组段(×1012/L) (1)
组中值 (2)
3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~ 5.90~6.20 合计
定量资料的统计描述
• 连续型定量资料:频数图中各距形是相连的,又称直方图 (histogram)
• 离散型定量资料:频数图中各距形是间隔的,又称直条图(bar graph)
定量资料的统计描述
频率(%)
25
正态分布
20
15
10
5
0
2.6
3.2
3.8
4.4
5.0
5.6
6.2
红细胞计数(×1012/L)
定量资料的统计描述
3
5.12 4.24
4.91 5.14
4.21 4.78
4.68 4.56
4.92 5.53
4.70 4.89
4.44 4.68
4.83
5.13 5.45
5.14 5.46
3.73 4.32
5.09 3.52
4.87 4.58
4.28 6.18
4.13 5.48
4.11
4.58 4.32
本对称
定量资料的统计描述
• 偏态分布(skewed distribution):集中位置(高峰 位置)偏向一侧,两侧频数分布不对称
• 正偏态(positive skew)高峰位置偏向数值小的一 侧
• 负偏态(negative skew)高峰位置偏向数值小的一
正偏态
负偏态

二、频数分布图
•频数分布图(graph of frequency)是以变 量值为横坐标、频数(或频率)为纵坐标 (不等距分组时以频率/组距=频率密度为纵 坐标),以每个等宽的距形面积表示每组的 频数(或频率)
相关文档
最新文档