统计学计量的统计描述方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量资料的统计描述方法

怎样表达一组数据?

描述计量资料的常用指标—

A、描述平均水平(中心位置):

均数X、中位数和百分位数、几何均数G、众数(mode)

B、描述数据的分散程度:

是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。

应用条件:

用于任何分布类型,包括偏态资料、两端数据无界限的资料。

计算:

n 为奇数时--

1

(

)2

n M X

+=

n 为偶数时--

()(1)2212n n M X X +⎛

⎫=+ ⎪

⎝⎭

9人数据:12,13,14, 14, 15, 15, 15, 17, 19天

B.百分位数

是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。

四分位数间距(quartile range )

= 第25百分位数(P25)~第75百分位数(P75)。

四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。

)

(天1552

19===+X X M 88451

22221415214.5()

M X X X X ⎛⎫

==== ⎪⎝⎭+如果只调查了前八位中学生,则:

+(+)(+)天

百分位数计算(频数表法):

(%)

X

X X

L X

i P L nX f f =+-∑

X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数

65~组最终的累积频数=34,32.5落在65~组段内;

P 75所在的组段:n X %=130×75%=97.5, 此值落在74~组段 ② 确定Px 所在组段的X L 、X i 、f x 、L Σf ③ P 25=65+3x[(130x25%-19)/15]=65.90

P 75=74+3x[(130x75%-85)/19]=74.66

四分位数间距=65.90~74.66 (次/分)

3.几何均数G(geometric mean)

应用:

适用于成等比数列的资料,特别是服从对数正态分布资料。原始数据分布不对称,经对数转换后呈对称分布的资料。

可用于反映一组经对数转换后呈对称分布或正态分布的变量值

平均抗体效价为: 1:57

加权法:

众数

是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个

组段的组中值。适用于大样本但较粗糙。

例:有16例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。

正态分布时:均数=中位数=众数

正(右)偏态分布时:均数 > 中位数 >众数

负(左)偏态分布时:均数 < 中位数 <众数

标准差的5应用:

描述变异程度、计算标准误、计算变异系数、

描述正态分布、估计正常值范围

S用于正态分布资料

怎样使用均数和标准差?

论文中常用X±S描述对称、正态或近似正态分布数据的特征。

描述偏态资料的分散程度需用四分位数间距P25~P75(代替标准差S)。

方差:

2

医用。

正态分布曲线理论上的特征

(1)以X= μ均数为中心, X值呈钟型分布,中央高、两端对称性减少、与X轴永不相交。

(2 )在 X= μ处,f(x)取最大值(例数最多)。

(3 )正态分布由均数μ、标准差σ决定曲线的左右位置和高低形状:

正态分布有两个参数,即位置参数--均数μ和形态参数--标准差σ。

若固定标准差σ,改变均数μ值,曲线沿着X轴平行移动,其形状不变。

若固定μ,σ越小,曲线形状越陡峭;反之,σ越大,曲线越平坦。

正态分布均数(位置参数)、标准差(变异度)变化示意图

正态曲线面积分布规律:

①X轴与正态曲线所夹面积恒等于1或100%;

②区间μσ

±的面积为68.27%;

③区间 1.96

μσ

±的面积为95.00%;

④区间 2.58

μσ

±的面积为99.00%。

正态分布u值表(标准正态分布概率单位值)

变量值

分布范围(%) 尾部面积

α

单侧u值双侧u值

80 0.20 0.84 1.28

90 0.10 1.28 1.64

95 0.05 1.64 1.96

99 0.01 2.33 2.58

尾部面积为α的u值,记为uα,称为u界值:

尾部面积各为2.5%时(黑色处),其对应的u值为u=±1.96;u=(-2.58,2.58)区间的面积为0.99(空白处)

正态分布的应用:

1.估计正态分布X值在特定值范围内的分布比例(概率)。

2.制定某临床指标的参考值范围

3.利用估计变量值的范围或对极端值做取舍。

4.许多统计方法的统计推断建立在正态分布基础上。

有足够的样本例数(一般不低于100例)

2. 确定参考值范围的百分界限(常用95%)

3. 考虑制定单侧或双侧诊断界值:

新药肯定比旧药好(旧药肯定比新药差)——单侧

新药可能好,也可能差------------------------------双侧

双侧标准较高,结论较可靠(常用)

相关文档
最新文档