第2讲 计量资料的基本统计分析方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
155
131 119 131 142 126 142
114
142 139 162 150 151 154
147
135 131 138 107 149 151
2.计数资料(或定性变量,无序分 类变量)
enumeration data, qualitative data, unordered category data
常用指标:算术均数、中位数等。
(一)算术均数(mean)
1. 定义:简称均数,符号为 数记为μ)。定义公式为
x (相应的总体均
x x n
2.均数的应用与特点
算术均数适合于对称分布的资料 ,如分布均匀的 小样本数据或近似正态分布的大样本数据; 算术均数容易受极端值的影响。
(二)中位数(median)
性的分组有程度的差别,各组按一定顺序排列;与计量
资料的区别是:每个观察单位未确切定量,所以又称为 半定量资料。
某地居民体内核黄素营养状况调查结果
季节 缺乏 夏季 冬季 5 11
营养状况 不足 7 9 适宜 8 2 合计 20 22
*核黄素营养状况评价标准:缺乏为<400μg,不足为 400~1000μg,适宜为>1000μg。
变异指标
变异指标——又称离散指标,用以描述一组计量 资料各观察值之间参差不齐的程度。
变异指标越大,观察值之间差异愈大,说明平均
数的代表性就越差;反之亦然。
三组同性别、同年龄儿童体重
甲组 乙组 26 24 28 27 30 30 32 33 34 36
丙组
丙组 3
乙组 2 甲组 1
26
29
30
31
定义:将观察单位按某种属性或类别分组计数, 分组汇总得到各组观察单位数称为计数资料。 特点:计数排列是无序分组,同组各观察单位之
间没有量的差别,但各组间有质的不同,各组互不
相容。
二项分类和多项分类
各战期战士破伤风病死率比较
战期 第一战期 第二战期 第三战期 合计 死亡人数 28 7 12 47 存活人数 14 16 10 40 合计 42 23 22 87
计量资料的统计描述 Statistical Description
某市110名健康男性工人的血红蛋白量(g/L)
118
149 138 156
148
165 148 149
158
160 139 135
163
119 168 148
138
174 160 138
156
137 120 133
134
152 151 150
3.等级资料(或半定量资料,有序分类变量)
ranked data,semi-quantitative data, ordinal category data
定义:将观察单位按某个指标量的大小分成等级或
某种属性的不同程度分成等级后分组计数,分类汇总各
组的观察单位数称为等级资料。
特点:等级是有序分组。同计数资料的区别是:属
118
149 138 156
148
165 148 149
158
160 139 135
163
119 168 148
138
174 160 138
156
137 120 133
134
152 151 150
140
154 121 132
152
140 146 153
132
122 135 140
148
133 145 145 146 123 140
中位数将变量值一分为二,一半比它小,一半比它大。符号为
将一组变量值按大小顺序排列,位次居中的变量值即为中位数。
M、 M d 。
1. 中位数的计算
x( n 1 ) / 2 Md xn / 2 x1 n / 2 2 n为奇数 n为偶数
2. 中位数的应用与特点
中位数将频数等分为二,所以中位数适合各种类型 的资料,尤其适合于大样本偏态分布的资料。 由于中位数总处在居中的位置上,因而它不受特大 或特小值的影响。
153
138 137 147 150 130 129
142
139 142 144 128 141 149
155
131 119 131 142 126 142
114
142 139 162 150 151 154
147
135 131 138 107 149 151
平均数指标
平均数(average) 是描述一群同质变量值集中位置的特征值, 用以说明同类现象或事物数量的中等水平(集中趋势)。
统计资料的分类
1.计量资料(或定量变量) measurment data ,quantitative data,
定义:测定每个观察单位的某项指标量的大小, 所得的资料称为计量资料。其变量值是定量的,一 般带有度量衡或其它单位。 特点:每个观察单位的观察值之间有量的区别。
某市110名健康男性工人的血红蛋白量(g/L)
第二讲 计量资料的基本统计分析方法
Quantitative data Statistical Analysis
胆管癌患者部分指标
编号 性别 年龄(岁) 部位 分化程度 分期 肝转移 (1) (2) (3) (4) (5) (6) (7) 1 2 3 4 5 … 男 女 女 女 男 … 61 58 63 71 59 … 上 中 上 下 上 … 低分化 高分化 高分化 中分化 高分化 … Ⅰ Ⅱ Ⅳ Ⅱ Ⅲ … 阳性 阴性 阴性 阳性 阴性 … PCNA 指数 (8) 52 89 93 78 85 … 生存时间(月) (9) 14 20 19 5 35 …
24
三组均数 均为30
140
154 121 132
152
140 146 153
132
122 135 140
148
133 145 145 146 123 140
135
127 134 141 121 143 139
146
132 143 150 143 140 140
158
155 128 152 130 140 125
137
134 147 125 141 147 147
135
127 134 141 121 143 139
146
132 143 150 143 140 140
158
155 128 152 130 140 125
137
134 147 125 141 147 147
153
138 137 147 150 130 129
Fra Baidu bibliotek
142
139 142 144 128 141 149