2.计量资料(定量资料)的统计描述

合集下载

定量资料的统计描述解析

定量资料的统计描述解析
定量资料的统计描述
第一节 频数分布表与频数分布图
统计描述是统计分析的最基本内容,也 是统计分析的重要一部分.在统计学中经常 用统计指标和统计图表来揭示和反映原始 资料的数量特征和信息.
频数分布表
➢ 用于反映各变量(观察单位的某种特征)值及其 相应频数之间关系的一类表格,我们称之为频 数表.这里频数指对一种变量在多个观察单位 中进行多次观察,其中某一变量值重复出现的 次数.
数表法两种。
(1)直接法 当观察例数 n 不大时,此法常用。
先将观察值按大小顺序排列,选用下列公式
求 M。
当 n 为奇数时
为偶数时
M=
X
n 2
X
n 1 2
2
例 某病患者 8 人的潜伏期(天)分别为 2,3,3,4,7,8, 10,18,求它们的中位数。
本例 n=8 为偶数,将 8 人潜伏期从小到大排列,用公式算 得
➢ 不同的资料类型编制频数表难易程度不同,其 中计数资料和等级资料比较简单,而计量资料 相对较繁杂些.
计量资料频数表的编制
一般情况下,样本含量小于30的统计资料 无须编制频数表,但对于大样本含量的资料, 编制频数表有利于进一步的统计分析、且频 数表本身也具有统计描述的作用.
编制频数表的步骤
一般 8- 15 之间
3、方差(variance) 离均差平方和的算术平均数,即为方差。总体方差用
符号σ2(σ读seigama)表示,样本方差用S2表示。计算公 式分别为:
N
xi 2
2 i1
N
n
xi
X
2
S 2 i1
n 1
4、标准差(standard deviation) 方差的平方根即为标准差。总体标准差用σ表示,

SCI论文中统计学内容的理解与翻译

SCI论文中统计学内容的理解与翻译

四、常用的统计推断方法(7)
直线回归(linear regression) 定义:分析某量随另一变量而变化依存关系的方法称为直线回归 适用条件: ①线性趋势:绘制散点图 ②独立性:应变量y取值相互独立 ③正态性:应变量y服从正态分布 ④方差齐:应变量y的方差相同 统计推断: ①总体回归系数的估计与假设检验:t检验和方差分析 ②应变量条件均数的区间估计 ③个体值的容许区间估计
二、计量资料的统计描述(1)
1.频数表(frequency table)及直方图(histogram)的应用: (1)揭示频数分布的特征:从频数表可以频数分布的两个重要 特征:集中趋势(central tendency)和离散程 (dispersion)。 (2)揭示频数分布的类型:对称分布及偏态分布。偏态分布 又包括:正偏态(positive skew)和负偏态(negtive skew)。 (3)便于发现特大或特小的可疑值。 (4)便于进一步计算统计指标和进行统计分析。
x2检验(chi-square test)
用途(计数资料): ①两个及以上总体率或构成比是否有差别(完全及配对四格表) ②两个分类变量间有无相关关系(相关性) ③多个率的趋势检验(等级分层或连续性资料等级化后分层) ④两个率的等率性检验(疗效比较) x2检验校正:当n≥40,且有1≤T<5时 Fisher确切概率法: ①P≈α 时 ②当n<40或T<1时
一、医学统计学基本概念(2)
3.统计分析的工作内容: (1)统计描述(descriptive satistics):指用统计指标、统 计表、统计图等方法对资料的数量特征及其分布规律进行 测定和描述,以揭示大量数据所蕴藏的内在信息。 (2)统计推断(inferential statistic):指如何抽样,以及如 何由样本信息推断总体特征的问题。 前提: a.样本的可靠性:明确划分总体的同质范围,且样本的每 个个体确属预先确定的总体。 b.样本的代表性:①样本必须遵循随机化原则 ②有足够的样本例数

公卫执业医师-卫生统计学知识点整理

公卫执业医师-卫生统计学知识点整理

①②③④⑤第一章绪论1、统计工作的基本步骤:研究设计-搜集资料-整理资料-分析资料设计是整个研究过程中最关键的一环;研究设计是统计工作的基础和关键。

统计推断包括参数估计和假设检验。

2.计量资料(定量资料):是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

其变量值是定量的,表现为数值大小,一般具有度量衡单位。

可分为离散型变量(如现有子女数、儿童龋齿数、胎次)和连续型变量(身高、体重、血红蛋白)。

计数资料(定性资料、分类资料):是把观察单位按某种属性(性质)或类别进行分组、清点各组观察单位数所得资料。

各观察数值是定性的,一般无度量衡单位。

各属性之间互不相容(只有“阴、阳”性或···)例:性别、职业、血型。

等级资料:是把观察单位按属性程度或等级顺序分组,清点各组观察单位所得资料。

医学领域的三类资料可以相互转换。

3、同质:是指所研究的观察对象具有某些相同的性质或特征。

变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。

总体:是根据研究目的确定的同质研究对象的全体(或全部同质观察单位)。

观察单位优先的总体称为有限总体;无法确定数量的总体称为无限总体。

样本:从总体中具有代表性的一部分个体。

抽样误差:由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异称为抽样误差。

抽样误差的根源在于个体变异,在抽样研究中是不可避免的。

概率(P):是随机事件发生的可能性大小的数值度量。

P=1的事件称为必然事件;P=0的事件为不可能的事件;0<P<1的事件称为随机事件;P≤0.05的随机事件称为小概率事件。

第二章计量资料的统计描述1、频数表和频数分布图的用途:①揭示计量资料的分布类型;②揭示计量资料分布的重要特征——集中趋势与离散趋势;③便于发现特大或特小的可疑值;④作为陈述资料的形式。

例数大时可以频率估计概率;⑤便于资料的进一步统计分析。

2、集中趋势:①(算数)均数:总体均数μ和样本均数x ;用于计量资料的正态分布或近似正态分布资料②几何均数G:应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。

定量资料的统计描述

定量资料的统计描述

重点掌握 1.频数分布图和频数分布表的制作 2.定量资料统计指标的计算
离散型定量资料
下面我们打开SPSS软件自带的数据demo.sav,找到reside, 这是一组同居人数的资料,我们将结合这组数据学习离散型 定量资料频数分布表和频数分布图的绘制。
变量视图
输出结果
输出结果
连续型定量资料
打开SPSS软件自带的数据demo.sav,找到car,这是一组 私家车价格的资料,我们将结合这组数据学习连续型定量资料 频数分布表和频数分布图的绘制。
变量视图
一般步骤
1.求极差 2.确定组段数和组距 3.根据组距写出组段 4.制作频数表和频数图
求极差
求极差
确定组段数和组距
1.极差:R=95.7≈100 2.确定组段数和组距:i=100/5=20,组段数取5,组距为20
正态QQ图:图中的点代表数据,直线代表理想的正态数据,如果各个点都 落在了直线的周围并且在平均值的部分点的分布比较均匀,这就说明是符 合正态分布的,显然这组年龄数据不符合正态分布
总结
频数分析(Frequencies ):频数分布表、条图和直方图以及 集中趋势和离散趋势的各种统计量。 描述统计(Descriptives ):描述近似正态分布定量变量的集 中趋势和离散趋势的各种统计量,对变量做标准化转换(Z 转换)。 探索分析(Explore ):未知分布类型数据的统计描述,对 数据的分布形态进行检验,功能强大。
频数分析(Frequencies )
下面我们结合人群的年龄(age)数据学习如何使用SPSS计算统计指 标。
ቤተ መጻሕፍቲ ባይዱ
部分中英文对照:
描述统计(Descriptives )
对于近似正态分布的资料,我们还可以通过Descriptives获取统计指 标。这是一组使用某法多次测定某水样中碳酸钙含量的数据,符从正态分 布,下面我们用Descriptives的方法计算这组数据的统计指标。

医学统计学第1-2章(2015)

医学统计学第1-2章(2015)
36
3. 方差(variance , 2 , S2)和标准差 (standard deviation , S)
2 X 2
N
S2
2
XX
n1
总体方差
样 本 方 差
37
4.标准差:
X 2
N
总 体 标 准 差
标准差或方差越大,说明个体差异越大,则均数的 代表性越差。
•应用: 对称分布,尤其是正态分布
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
19
115名正常成年女子的血清转氨酶 (mmol/L)含量分布
血清转氨酶含量
人数
12-
2
15-
9
18-
14
21-
23
24-
19
27-
14
30-
11
33-
9
36-
7
39-
4
42-45
3
20
第二节 集中趋势的描述——平均数
66.67
7
25
32
21.88
62
40
102
60.78
6
分组 血栓组 正常组 合计
表 3. 9 正常妇女和血栓形成者的血型分布
A型
B型
AB 型 O 型
合计
32
8
10
9
59
51
19
12
70
152
83
27
22

医学统计学学习笔记

医学统计学学习笔记

医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。

统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。

概率为参数,频率为统计量。

4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。

不能用于开口型资料。

u(总体均数),X(样本均数)。

b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。

观察值不能为0 、不能同时有正有负。

同一资料算得的几何均数小于算术均数。

c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。

当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。

用频数表法计算百分位数时,组距不一定要相等。

P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。

计算方法为求倒数的均值后再取其倒数。

SPSS:在Transform中输入公式。

2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。

b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。

《医学统计学》第1-2章

《医学统计学》第1-2章
21
常用平均数的意义及其应用场合
平均数
意义
应用场合
均数 平均数量水平
几何均数 平均增减倍数
中位数 位次居中的观 察值水平
应用甚广,最适用于对称分布, 特别是正态分布
①等比资料;②对数正态分布 资料
①偏态资料;②分布不明资料; ③分布一端或两端出现不确定 值
22
1. 均数 (mean):
, X
应用:正态分布或近似正态分布的定量资料。
女 B 14.67 37.8
疗效
显效 有效 有效 无效
男B
16.80
37.6 无效
标识变量
用于数据管理
分析变量-表示试验效应或观察结果大小的
分组变量
变量或指标
反应变量
5
处理 复方哌唑嗪 复方降压片 安慰剂
合计
表 3.8 三种药物治疗高血压的疗效
有效
无效
合计
有效率(%)
35
5
40
87.50
20
10
30
15
定量资料的频数表和频数图(直方图)
表2.2 某市120名5岁女孩 身高频数表
组段(cm)
频数(f)
95-
1
98-
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
图2.1 某市城区120名5岁女孩身高频数分布
16
1、 频数分布的特征
如何选用正确的统计指标描述一个定量 资料?
14
第一节 频数分布

医学统计学 第二章 计量资料的统计描述

医学统计学 第二章 计量资料的统计描述

肌红蛋白含量
人数
0~
2
5~
3
10~
7
15~
9
20~
10
25~
22
30~
23
35~
14
40~
9
45~50
2
18
人数
25 20 15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
医学统计学 第二章 计量资料的统计 描述
计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值:
X1,X2,X3,……,Xn
n为样本例数(样本大小、样本含量)
2
统计描述——描述其分布规律 1、用频数分布表(图)
要求:大样本 如 n〉30
2、用统计指标 描述 集中趋势 离散趋势
6
➢制表步骤 了解分布
1. 求极差(range) 极差也称全 距,即最大值和最小值之差,记作R。 本例
R 5 .7 1 2 .3 5 3 .3 6 ( m m o l/L )
7
2.确定组距(i) :
组段数通常取组 10-15组 本例组距
i 3 .3 6 /1 0 0 .3 3 6 0 .3 0
累计频率(%) (4)
0
402
402
35.80
1
330
732
65.18
2
232
964
85.84
3
118
1082
96.35
4
27

定量资料的统计描述

定量资料的统计描述
定量资料的统计描述
1.集中趋势 (算术)平均数: 几何均数: 中位数:
2.离散趋势 全距: 四分位数间距: 离均差平方和: 方差: 标准差: 变异系数:
3.正态分布 特征: (P16) 应用 估计频率分布
确定医学参考值范围
4.t 分布
(正态近似法和百分位数法)
质量控制 理论基础 特征: (P22) 应用 区间估计 假设检验
(P42)
Ni N
p NNi pi
标准组选取方法 有代表性的
(P42)
两组合并 择其一
定量资料(计量资料)统计推断
一、定量资料的参数估计 (P23)
1.点估计: X
2.区间估计 σ未知,n较小: Xt.SX
σ已知: Xu.X
σ未知但n足够大:
Xu.SX
二、定量资料的假设检验 (P26)
t
检验
单个样本t检验:
3. yˆ 的含义( P138或见讲义) 。
4.回归与相关的区别和联系(见讲义) 5.等级相关的适用范围(P147)。 6.直线回归的应用(P142~ P143 )。
统计表与统计图
1.统计表的分类(P255) 2.统计表的编制要求(P253) 3.统计表的改错(P255)
4.常用统计图的适用条件及要求
(P256 ~ P259 )
基本概念(见讲义)
1.总体和样本(P3) 2.参数和统计量(见讲义)
3.变异(见讲义)
4.抽样误差(见讲义) 5.概率(P4) 6.样本含量(P3) 7.定量资料(P4) 8.定性资料(P4)
9.正偏态分布(P8) 10.负偏态分布(P8) 11.中位数(P11) 12.百分位数(P13) 13. 医学参考值范围(P18) 14.统计推断(P20) 15. 标准误(P22) 16.参数估计(P23)

统计学2 计量资料的统计描述指标课件

统计学2 计量资料的统计描述指标课件

N
Valid
Missing
Mean
Median
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Percentiles
5
25
50
75
95
97.5
238 0
7.1387 6.6111a 3.3217 1.209
x
72.4
例 某地不同年龄女童的身高资料如下,比较不同 年龄女童身高的变异程度。
表 某地不同年龄女童身高(cm)的变异程度
年龄组 1-2月
例数 100
均数 56.3
标准差 2.1
变异系数 (%)
3.7
5-6月 120
66.5
2.2
3.3
3-3.5岁 300
97.2
3.1
3.2
5-5.5岁 500 107.8
ON AVERAGE 间距 3. 标准差,S 4. 变异系数,CV
变异程度指标越大,表示数据离散程度越大。
1. 极差
Range,亦称全距,即全部观察值中最大值与最 小值之差。
R = X max − X min
极差没有利用全部观察值,是简单但又粗略的变 异指标。
效价 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计
例数 f 2 3 6 9 8 14 12 6 60
G=78.79
只用平均数描述资料的弊病
It has been said that a fellow with one leg frozen in ice and the other leg in boiling water is comfortable。

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
11111,11111,11111 中位数是50%位的数值,其为百分位数的特殊形式。
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不

2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S

论文中常用的统计方法 简介-文档资料

论文中常用的统计方法 简介-文档资料
7

计数资料的统计描述
① 强度相对数(说明某现象发生的频率 或强度,又称为率)
② 结构相对数(说明各构成部分在总体 中所占的比重或分布,又称为构成比)
③ 相对比(是两个有关指标之比)
8
几何均数
可用于反映一组经对数转换后呈对数 分布的变量值在数量上的平均水平。
9
中位数(M)
将n个变量值从小到大排列,位置居于 中间的那个数。 1.n为奇数:M=X[(n+1)/2] 2.n为偶数:M=1/2(X(n/2)+X(n/2+1))
又称半定量资料或有序分类变量资料。 为将观察单位按某种属性的不同程度 分成等级后分组计数,分类汇总各组 观察单位数后而得到的资料。如观察 某人群某血清反应,根据反映强度, 结果可分为-、±、+、++、+++、 ++++六级。
14
⑴集中趋势描述(描述一组变量值的集 中位置或平均水平)
① 算数均数 ② 几何均数 ③ 中位数 ④ 百分位数
6
计量资料的统计描述
⑵离散趋势描述(描述数据变异大小) ① 极差(一组变量值的最大值与最小值之差) ② 四分位间距 ③ 方差与标准差 ④ 变异系数(多用于观察指标单位不同时)
⑤ 正态资料用均数±标准差;非正态资料中位数 ±四分位间距描述
③秩转换的非参数检验(W检验):不满足t
检验和F检验条件的
4
㈢统计分析
1 ①X2检验:用于推断两个总体率或构成 比之间有无差别、多个总体率或构成 比之间有无差别、多个样本率的多重 比较、两个分类变量之间有无关联性、 频数分布拟合优度; ②W检验:不满足上述条件的。
⑶等级资料:W检验

论文中常用的统计方法 简介

论文中常用的统计方法 简介

等级资料
又称半定量资料或有序分类变量资料。 为将观察单位按某种属性的不同程度 分成等级后分组计数,分类汇总各组 观察单位数后而得到的资料。如观察 某人群某血清反应,根据反映强度, 结果可分为-、±、+、++、+++、 ++++六级。
1. 计量资料的统计描述 2. 计数资料的统计描述
㈢统计分析
面对一组资料时,先区分其资料类型。 ⑴计量资料: ①t检验:满足条件是正态性、方差齐性和小 样本含量。当样本含量n较大时,t值近似于 u值,称为u检验或Z检验; ②方差分析(F检验):满足条件是分组大 于二个,正态性、方差齐性;
③秩转换的非参数检验(W检验):不满足t
几何均数
可用于反映一组经对数转换后呈Hale Waihona Puke 数 分布的变量值在数量上的平均水平。
中位数(M)
将n个变量值从小到大排列,位置居于 中间的那个数。 1.n为奇数:M=X[(n+1)/2] 2.n为偶数:M=1/2(X(n/2)+X(n/2+1))
百分位数
是一种位置指标,中位数实际上是第 50百分位数。
计量资料
非正态资料中位数四分位间距描述强度相对数说明某现象发生的频率或强度又称为率结构相对数说明各构成部分在总体中所占的比重或分布又称为构成比几何均数可用于反映一组经对数转换后呈对数分布的变量值在数量上的平均水平
论文中常用的统计方法 简介
XXX
㈠资料类型
1. 计量资料 2. 计数资料 3. 等级资料
㈡统计描述
计量资料的统计描述
① ② ③ ④ ⑵离散趋势描述(描述数据变异大小) 极差(一组变量值的最大值与最小值之差) 四分位间距 方差与标准差 变异系数(多用于观察指标单位不同时)

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。

②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。

③、等级资料,又称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。

③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。

④、样本(sample ):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。

⑥、频率(frequency ):指的是样本的实际发生率。

⑦、概率(probability):指的是随机事件发生的可能性大小。

用大写的P 表示。

3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。

第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。

定量资料的统计描述

定量资料的统计描述
定量资料的统计描述
一、基本概念
总体与样本 变量 误差 概率
二、资料和统计分析
资料的两种类型
定量资料(计量资料) 定性资料(分类资料) 连续 离散 二项分类 多项分类
无序
有序(等级)
根据变量取值特点,计量资料分为:
连续性资料:变量值可以在实数轴上连续变
动。如红细胞数、身高、体重。
定量资料统计描述过程:
定量 资料 统计 描述
一、Descriptives过程
进行一般性的统计描述(统计指标) 适用于服从正态分布的定量资料 特殊功能:可对原变量进行标准正态 变换N(0,1)
Descriptives过程:
标准 正态 变换: Z+?
峰度系数、 偏度系数
二、Frequencies过程
涉及的统计指标比Descriptives过程全 面,可产生详细的频数表,并给出常用统 计图。 更适用于对分类资料以及不服从正态分 布的连续性变量进行描述。
Frequencies过程:
产生 频数 表
Frequencies过程:
正态 曲线
三、Explore 过程(探索性分析)
三个过程中功能最强大,对变量的描 述统计更深入详尽; 适用于对资料的性质、分布特点完全 不清楚时; 特殊功能:茎叶图、箱式图
2.Descriptive Statistic
3.Descriptives
optins
几何均数的计算
教材P45 例4.4 数据录入 分析过程
对数转换:Transform Compute
生成 新变 量lgx
Transform
Compute:
函数 组
练习
课后习题P394 第3题

医学统计学02 定量资料的统计描述

医学统计学02 定量资料的统计描述
9
120名8岁男孩身高频数表 组段 112~
频数 f 25
频数 2
114~
21
18
7
9 14
116~
15 10 5 3
20
15 10 5 0 7
14 15 9
118~
120~
122~
1
15
21 18 15 10 5 3 1
10
2 1 身高( cm )
124~ 126~ 128~ 130~ 132~ 134~136
• 加权法
G log
1
f log X f log X ( ) log ( ) n f
1
31
注意事项
几何均数常用于等比级资料或对数正态分布资料。 观察值中若有0或负值,则不宜直接使用几何均 数。 观察值一般同时不能有正值和负值。若全是负值, 计算时可先将负号去掉,得出结果后再加上负号。
7
9 14 15 21 18 15 10
130~
132~ 134~136
5
3 1
5
• 频数(frequency)
– 观察数据的个数
• 频数分布(frequency distribution)
– 观察数据在其取值范围内的分布情况
• 定量资料的频数分布情况可以用频数表 (frequency distribution table)或直方图表 示。
9
14 15 21 18 15
7.5
11.7 12.5 17.5 15.0 12.5
18
32 47 68 86 101
15.0
26.7 39.2 56.7 71.7 84.2
– 组段的起点叫“下限”,终点叫“上

第02章 计量资料的统计描述课件

第02章 计量资料的统计描述课件

组段数 5;组距 10分
表2.1 某医院产科某月顺产婴儿出生身长(单位:cm) 48 48 47 42 53 49 45 50 48 52 49 57 46 48 46 42 49 51 50 51 56 42 59 49 48 52 42 49 55 53 51 45 47 47 47 50 48 51 51 53 46 47 57 45 46 51 46 51 47 51 55 47 52 47 48 54 47 54 49 44 53 54 45 48 44 48 42 47 48 50 55 50 53 56 49 50 56 41 53 53 49 44 49 48 45 52 52 46 54 50 44 53 49 47 48 45 51 45 50 53
(1)直接法—根据样本含量的奇偶选择公式
n为奇数时 n为偶数时
M X ( n1) 2
1
M
2
X(n) 2
X ( n 1) 2
例2-6:9只大鼠存活天数如下: 4,10,7,3,15,2,9,13,>60 则这9只大鼠的平均存活天数为多少天?
排序:2,3, 4, 7, 9,10 ,13, 15, >60 故这9只大鼠的平均存活天数为9天。
-
二、频数分布图
图2.1 100名顺产婴儿出生身长的频数分布
频数
三、频数表和频数分布图用途
1、描述频数分布的类型
25 20 15 10
5 0
图 2 - 2 101 名 正 常 成 年 女 子 血 清 总 胆 固 醇 的 频 数 分 布
血 清 总 胆 固 醇(mmol/L)
对称分布:各组段的频数以频数最多组段为中心左右两侧大体对称。
PX
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

进入SD统计功能 清除原有数据 输入数据
显示计算的 x 显示计算的S 显示计算的n 显示计算的
X
2015/11/16
35
2.几何均数 (geometric mean) 定义:有些医学资料,如抗体滴度、细菌计数等,其频
数分布明显偏态,各观察值之间呈倍数变化(等比关系),
此时宜用几何均数反映其平均增减倍数。
2.绘制频数分布直方图
绘制频数分布直方图 坐标轴
横坐标:变量值即研究指标,无需从0开始,以单位尺度 划分。 纵坐标:为频数f,必须从0开始(f为每一组段内的人数)
直条
直条的宽度:组距 直条的高度:每一组段的频数
累计
2015/11/16
15
2.绘制频数分布直方图
2015/11/16
第十一章 资料的描述性分析
第十一章 资料的描述性分析
第一节 第二节 统计图表 计量资料的统计描述方法 计数资料的统计描述方法
2015/11/16
2
第一节 计量资料的统计描述方法
常用的描述定量资料分布规律的统计方法 有两类:
统计图表:频数分布表/图 选用适当的统计指标:
集中趋势指标:均数、中位数 离散趋势指标:极差、标准差
从中央部分到两侧(血糖值从中等水平到较低或较高水平)的频 数分布逐渐减少,是为离散趋势。
集中趋势和离散趋势是频数分布的两个重要侧面,从这两 方面就可全面的分析所研究的事物。
2015/11/16
18
4.频数分布的类型
频数分布又可分为对称分布和偏态分布
对称分布:集中位置在正中,左右两侧频数分布
2015/11/16
11
1. 频数表的编制步骤
(3)列表划记
计算出每个组段的 频率
每组的频数 样本含量
2015/11/16
12
1. 频数表的编制步骤
(3)列表划记
计算出每个组段的 累计频率 =本组段的频率+上 一组段的累计频率
2015/11/16
13
1. 频数表的编制步骤
2015/11/16
14
5.06,5.20,4.79,5.93,求算术均数。
x (5.61 3.96 5.93)/9 4.83(mmol/ L)
2015/11/16
27
1.算术均数
计算方法
频数表法(weighting method)
当资料中相同观察值的个数较多时,可将相同观察值的个数, 即频数f,乘以该观察值x,以代替相同观察值逐个相加。
2015/11/16
6
1. 频数表的编制步骤
(2)划分组段 确定组数: n>100,10~15组;n<100,8~10组 确定组距:
组距可以相等也可以不相等,一般采用等距分组, 组距=极差/组数 例8.1 1.99/10≈2,故组距=2mmol/L
2015/11/16
7
1. 频数表的编制步骤
1.算术均数
计算方法
直接法:即将所有观察值x1,x2,x3,…,xn直接相加 再除以观察值的个数,写成公式
x1 x2 x3 ... xn xi x n n
x为样本均数
n为变量值个数, i为各变量值, Σ表示求和
2015/11/16
26
1.算术均数
例1 有9名健康成人的空腹胆固醇测定值 (mmol/L)为5.61,3.96,3.67,4.99,4.24,
2015/11/16
34
CASIO fx-3600P计算器统计功能 步骤 1. 2. 3. 键 盘 3 AC DATA DATA DATA 1(数字键) 3 (数字键) 3 (数字键) 1 (数字键) 说 明
4. 5. 6. 7.
MOOD SHIFT 2.35 4.21 3.32 SHIFT SHIFT Kout Kout

离均差的平方和小于个观察值x与任何数α( α ≠
x )之差的平方和。
(x x ) ( x )
2
2015/11/16
2
32
1.算术均数
各离均差(即各观察值x与均数 x之差)的总和等于零。
(x x ) 0 论证: (x x ) (x x ) (x
计算方法:
直接法 加权法
应用:等比资料或对数正态分布资料
2015/11/16
36
2.几何均数
计算方法: 直接法:直接将n个观察值( x1,x2,x3,…,xn )的乘积
开n次
公式
G=n x1 x2 x3 ..., xn
1
写成对数形式为
lg x1 lg x2 ... lg xn G lg ( ) n 几何均数: lg xi 变量对数值 1 lg ( ) 的算术均数 n 的反对数。
大体对称
偏态分布:集中位置偏向一侧,频数分布不对称
正偏态分布:集中位置偏向年龄小的一侧 负偏态分布:集中位置偏向年龄大的一侧
不同类型的分布,应采用相应的统计分析方 法。
2015/11/16
19
4.频数分布的类型
正态分布 ( normal distribution )
中间高、两边低、左右对称 属于对称分布的一种 许多医学资料都属于这种分布, 例如人体正常的生理生化指标
负偏态分布
(negative skewed)
2015/11/16
22
5.频数表的用途
频数表可揭示资料的分布特征和分布类型 便于进一步计算统计指标和统计分析处理(第二节) 便于发现某些特大或特小可疑值,便于资料的校对。
2015/11/16
23
一、集中趋势指标
算术均数(arithmetic mean) 几何均数(geometric mean) 中位数和百分位数(median percentile) 以上统称为平均数(average)常用于描述一组 变量值的集中位置,代表其平均水平或是集中 位置的特征值。
2015/11/16
24
1.算术均数
(arithmetic mean)
又简称为均数(mean) 定义:是反映一组观察值在数量上的平均水平。 总体均数用希腊字母 表示,样本均数用 x 表示 计算方法:
直接法: 频数表法:
应用: 正态分布或近似正态分布资料
2015/11/16
25
16
2.绘制频数分布直方图
2015/11/16
17
பைடு நூலகம்
3、频数分布的特征 从频数表可以看到频数分布的两个重要的特征
集中趋势(central tendency)
血糖值向中央部分(中等水平)集中,以中等水平的血糖值者居 多,是为集中趋势。
离散趋势(tendency of dispersion)
正态分布
2015/11/16
20
4.频数分布的类型
a.尖峭峰 b.正态峰 c.平阔峰
2015/11/16
21
4.频数分布的类型
正偏态分布:峰偏左,尾部向右侧延伸 如:以儿童为主的传染病发病人数的分布 右偏态
正偏态分布
(positive skewed)
负偏态分布:峰偏右,尾部向左侧延伸 如:以老年人为主的慢性病发病人数的分布 左偏态
7 lg 5 11lg10 ... 8 lg 80 G lg ( ) 7 11 22 12 8 lg 1 (1.3161 ) 20.705
1
60人的血清平均抗体效价为1:20.705
2015/11/16
40
2.几何均数
注意事项
等比资料,如:抗体的平均滴度、药物的平均效价、卫生事 业平均发展速度、人口的几何增长 对数正态分布:是右偏态分布
(2)划分组段 确定各组段的上下限:
每个组段的起点称为该组的下限(low limit), 终点称为上 限(upper limit), 上限=下限+组距; 第一组段必须包括最小值,因此其下限取包含最小值、较 为整齐的数值; 例8.1 第一组段下限为 3.60,上限为3.60+0.20=3.80 各组段不能重叠,每一组段均为半开半闭区间,即包括下 限,不包含上限。 例8.1 第一组段为3.60~ 即[3.60,3.80);以此类推。 最后一组段,须包括最大值,且要列出这一组段的下限和 上限,即5.40~5.60, [5.40,5.60]
2015/11/16
37
2.几何均数
例3 有7份血清的抗体效价分别为1:2,1:4,1:8,
1:16,1:32,1:64,1:128,求平均抗体效价。
本例先求抗体效价的倒数,再求几何均数
lg 2 lg 4 ... lg128 1 G lg lg (1.204) 16 7
f1, f2,…,fk分别为各组段的频数,这里的f起到了 “权数”的作用,它权衡了各组中值由于频数不 同对均数的影响。即频数多,权数大,作用也大; 频数少,权数小,作用也小,故称为加权法。
用组中值,加 权法计算出的 均数是精确值 吗?
2015/11/16
31
1.算术均数
均数的两个重要特性
各离均差(即各观察值x与均数 x之差)的总和等 于零。 (x x) 0
2015/11/16
28
1.算术均数
2015/11/16
29
1.算术均数
组中值=(下限+上限)/ 2
如:3.60~组段的组中值=(3.60+3.80)/2=3.70
以此类推
fx x f
i i
614.2 4.653(mmol /L) 132
2015/11/16
相关文档
最新文档