统计学-计量资料的统计描述方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量资料得统计描述方法
描述计量资料得常用指标一
A、描述平均水平仲心位置):
均数X、中位数与百分位数、儿何均数G、众数(mode)
B、描述数据得分散程度:
标准差、四分位数间距、变异系数、方差、全距
(一)均
[mean 与标准差standard deviation
数
1、(算术)均数X
均数就是描述一组计量资料平均水平或集中趋势得指标。
*直接计算公式:
- = +X2+…+ Xj》X
应用条件:适用于对称分布,特别就是正态分布资料。
2 *中位数(median) M与百分位数(percentile)
A.中位数M
就是将一组观察值从小到大排序后,居于屮问位置得那个值或两个中间值得平均值。
成用条件:
用于任何分布类型,包括偏态资料、两端数据无界限得资料。
刀为奇数时一
2
力为偶数时一
2
I X
小、"八
V F ” )
9 人数据:12,13,14, 14, 15 15, 15, 17, 19 天
M=X9+I=X5=15(天)
2
如果只调查了前八位中学生,则:
/2 = (X,+X^)/2 = (144-15)/2 = 14.5(天) 就是将fj'W 察值从小到大依次排列,再分成100等份,对应于
X%位得数值即为第X百分位数。中位数就是第百分50位数。
四分位数间距(quartile range)
=第25百分位数(P25)〜第75百分位数(P75)。
四分位数间距用于描述偏态资料得分散程度(代替标准差S),包含Lx:第X百分位数所在组段下限才坨:小于Lx各组段得累计频数
Px X 5X%-百小
fx
了全部观察值得一半。
百分位数计算(频数表法):
L :第X百分位数所在组段组距»:总例数所在组段频数
例:求频数表得第25、第75百分位数(四分位数间距)
组段频数/ 累积频数Ef
56〜 2 2
59〜 5 7
62〜12 19 £725
Lis 65 〜1534 P2$在此
68〜2559
71〜2685 Lf75
Ljs 7419104 P?,在此
77〜15 119
80〜10 129
83 〜85 1 130
合讣130
①确定Px所在组段:
P25 所在得组段:«X%=130X25%=32. 5,
65〜组最终得累积频数=34,32、5落在65〜组段内;
P75所在得组段:«X%=130X75%=97. 5,此值落在74〜组段
②确定Px所在组段得S、2兔
③P25=65+3X[(130X25%-19)/15]=65, 90
P75=74+3X[(130X75%-85)/19]=74. 66
四分位数间距二65、90〜74、66(次/分)
3、几何均娄 (G{geomelric mean)
应用:
适用于成等比数列得资料,特别就是服从对数正态分布资料。
原始数据分布不对称,经对数转换后呈对称分布得资料。
可用于反映一组经对数转换后呈对称分布或正态分布得变量值在数量上得平均水平。例如抗体滴度。
计算:N个数值得乘积开N次方,即为这N个数得几何均数。
c=ig-ZM
n 有歸丽魏砒廳的誚数 ;1:20, 1:40. 1:80,
1:160.1:320,1:640,求平均 抗隹效輾味*仪
i b 夠底的反对数
溉湄0 ・ 40 • 80.160 • 320 • 640 =56.57
&盛
抑 Ig 10+Ig 20+…+Ig 640)/ 8] = 56.57
加权法:
Aft
就是一组观察值中出现频率最高得那个观察值;若为分组资料,众数则就是出现频率最高得 那个组段得组中值。适用于大样本但较粗糙。
例:有 16 例病人得发病年龄为 42, 45, 4& 51, 52, 54, 55, 55, 5& 58, 5& 5& 61, 61, 62, 62,试求 众数。
正态分布时:均数=中位数=众数
正(右)偏态分布时:均数〉中位数〉众数 负(左)偏态分布时:均数 < 中位数〈众数
3>标准差S
S 描述数据得分散程度.描述一组数据在其平均数周围得分布情
况,若每个数据集中在其平均数周围,此平均数对这组数据得代表照就 大;反之,代表性较差。
标准差得5应用:
描述变异程度、计算标准误、计算变异系数. 描述正态分布、估计正常值范围
S 用于止态分布资料
怎样使用均数与标准差? 论文中常用X ±S 描述对称、止态或近似止态分标准差S
75 80 85 90 95 100 105 11|=7 X 1=90 S]=10、8 45
60
75
90
105
120
135
112=7
X 2=90
S2=32、4
数据越分散,分子越大。 或者
屮 组 乙 组
方差二S' 全距R :
R=最大值-最小值。简单,但仅利用了两端点值,稳定性差。
变异系第 [(coefficient of variation, CV):
计算:CV=(S/x)xlOO%,无单位
应用:1、单位不同得多组数据比较;
2、均数相差悬殊得多组资料
什么就是正态分布?
(二)正态分布(Normal distribution)
正态分布就是描述连续型变量值分布得曲线、当例数比较多时, 医学上许多资料近似服从正态分布。正态分布在统计推断上有重要得作用。