统计学计量的统计描述方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量资料的统计描述方法

怎样表达一组数据?

描述计量资料的常用指标一

A、描述平均水平(中心位置):

均数X、中位数和百分位数、几何均数G众数(mod® B描述数据的分散程度:

标准差、四分位数间距、变异系数、方差、全距

)均数mea n 和标准差s ta ndard deviati on

1.(算术)均数X

均数是描述一组计量资料平均水平或集中趋势的指标。

直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。

2. 中位数(median M和百分位数(percentil®

A.中位数M

是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的

平均值。

应用条件:

用于任何分布类型,包括偏态资料、两端数据无界限的资料。

计算:

n为奇数时--

n为偶数时--

9 人数据:12,13 14,14,15, 15, 15, 17, 19 天

B.百分位数

是将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是第百分50位数。

四分位数间距(quartile range)

=第25百分位数(P25)〜第75百分位数(P75)。

四分位数间距用于描述偏态资料的分散程度(代替标准差S),包含了全部观察值的一半。

百分位数计算(频数表法):

L x :第X百分位数所在组段下限E f L:小于L x各组段的累计频数

i x :第X百分位数所在组段组距n:总例数f x:所在组段频数

注:有的教材X= r ; f L=C

例:求频数表的第25、第75百分位数(四分位数间距)

组段频数f累积频数刀f

56〜22

59〜57

62〜1219 刀f25

L 25 65 〜1534 P25在此

68〜2559

71〜2685 刀f75

L 75 74 〜19104 P75在此

77〜15119

80〜10129

83 〜851130

合计130

①确定Px所在组段:

P25所在的组段:n X %=13(X 25%=32.5,

65〜组最终的累积频数=34, 32.5落在65〜组段内;

P 75所在的组段:n X %=13(X 75%=97.5,此值落在74〜组段

②确定Px所在组段的L X、i X、f x、E f L

③F25 = 65+3x[(130x25%—19)/15] = 65.90

F75 = 74+3x[(130x75%—85)/19] = 74.66

四分位数间距=65.90〜74.66 (次/分)

3.几何均数G(geometric mea)

应用:

适用于成等比数列的资料,特别是服从对数正态分布资料。

原始数据分布不对称,经对数转换后呈对称分布的资料。

可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上

的平均水平。例如抗体滴度。

计算:N个数值的乘积开N次方,即为这N个数的几何均数。

均抗体效价。使用分母计算!

加权法:众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本但较粗糙。

例:有16 例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62 ,试求众数。

正态分布时:均数=中位数二众数

正(右)偏态分布时:均数> 中位数> 众数

负(左)偏态分布时:均数< 中位数< 众数

3.标准差S

S描述数据的分散程度.描述一组数据在其平均数周围的分布情况,若每

个数据集中在其平均数周围,此平均数对这组数据的代表照就大;反之,代表性较差。

标准差S

甲组7580859095100105n 1=7X 1=90

S1=10.

8

乙组45607590105120135n 2=7X 2=90

S2=32.

4

标准差的5应用:

描述变异程度、计算标准误、计算变异系数、 描述正态分布、估计正常值范围

S 用于正态分布资料

怎样使用均数和标准差?

论文中常用X 士 S 描述对称、正态或近似正态分布数据的特征。

描述偏态资料的分散程度需用四分位数间距P25〜P75(代替标准差S ) 方差:

2

万差=s 全距R :

R=最大值-最小值。简单,但仅利用了两端点值,稳定性差 变异系数(coefficient of variation

, CV ):

计算:

CV=( S/X ) 100% 无单位 应用:

1. 单位不同的多组数据比较;

2. 均数相差悬殊的多组资料 什么是正态分布?

(二)正态分布(Normal distribution

正态分布是描述连续型变量值分布的曲线.当例数比较多时,医学上许多 资料近似服从正态分布。正态分布在统计推断上有重要的作用。

正态分布曲线理论上的特征

(1)以X= □均数为中心,X 值呈钟型分布,中央高、两端对称性减少、与X

数据越分散,分子越大。或者

轴永不相交。

(2 )在X= □处,f (x)取最大值(例数最多)。

(3)正态分布由均数卩、标准差。决定曲线的左右位置和高低形状:

正态分布有两个参数,即位置参数--均数和形态参数--标准差。

若固定标准差,改变均数值,曲线沿着X轴平行移动,其形状不变若固定,越小,曲线形状越陡峭;反之,越大,曲线越平坦。

正态分布均数(位置参数)、标准差(变异度)变化示意图

正态曲线面积分布规律:

①X轴与正态曲线所夹面积恒等于1或100%

②区间的面积为68.27%;

③区间 1.96的面积为95.00%;

④区间 2.58的面积为99.00%。

正态分布u值表(标准正态分布概率单位值)

尾部面积为a的u值,记为U a ,称为u界值:

尾部面积各为2.5%时(黑色处),其对应的u值为u=± 1.96 ;

u= (-2.58 , 2.58 )区间的面积为0.99 (空白处)

正态分布的应用:

1. 估计正态分布X值在特定值范围内的分布比例(概率)。

2. 制定某临床指标的参考值范围

3. 利用估计变量值的范围或对极端值做取舍。

4. 许多统计方法的统计推断建立在正态分布基础上。

怎样确定资料是否属正态分布?

相关文档
最新文档