第二章 定量资料的统计描述
第二章 定量资料的统计描述 1-4节
fx x f
0
1 7 3 9 .... 1 29 2228 18.57( μ m ol/ L) 1 3 .... 1 120
2、几何均数(geometric mean,G)
有研究者测定8人血清的抗体效价分别为 1:200,1:25,1:400,1:800,1:50,1:100, 1:50,1:25,求平均抗体滴度。该研究者用倒 数求均数,得平均抗体低度为1:206.25。 1)资料的类型? 2)该研究者对资料的描述是否正确? 3)如何描述该资料的集中趋势?
第二章
定量资料的统计描述
第一节 频率分布表与频率分布图
频率分布表(frequency distribution table):
整理原始数据的一种工具,用来表示数据 各观察值在不同取值区间出现的频数分布情 况。 频数分布表: 显示数据分布的范围、分布最集中的区间 和分布形态。
一、离散型定量变量的频率分布 例2-1 某年某山区96名孕产妇产前检查次 数资料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5….4,7 试编制产前 检查次数的频率分布表
(1)直接法:直接将所有原始观察值相加, 再除以总例数。
x1 x2 ..... xn x n
x
i 1
i
n
(2 1)
例2-3 某年某医院女性晚期肺癌患者红 细胞计数(1012/L)为4.20,6.43,2.08, 3.45, 2.26,4.04,5.42,3.38。试求其算术均 数。
1.描述变量的分布类型 1)对称分布 2)偏态分布 (1)正偏态分布:峰向左侧偏移 (2)负偏态分布:峰向右侧偏移 2.揭示变量的分布特征 集中趋势:频数向中间组段集中, 离散趋势:由中间组段向两侧,频数逐渐 减少 3.便于发现某些离群值或极端值 4.便于进一步计算统计指标和统计分析
卫生统计学第二章定量资料的统计描述
正确答案: E
答案解析:标准差反映观察值的变异程度,标准误反映抽样误差的大小,根据其计算公式可知总体标准差一定时,增大样本例数会减小标准误。在应用中,标准差用于参考值范围的估计,而标准误用于可信区间的估计。
做答人数:1
做对人数:0
题号: 12 本题分数: 2
下列说法正确的是
A. 计量资料都服从或近似服从正态分布
B. 正态分布曲线下,横轴上,从均数μ到μ+1.96倍标准差的面积为97.5%
C. 对数正态分布是原资料的对数值服从正态分布
D. 医学参考值范围一定要定为95%或99%
E. 标准正态分布曲线下中间90%的面积所对应的横轴尺度μ的范围是-∞到+1.645
求正常人某个指标的参考值范围,在理论上要求
A. 正态分布不能用均数标准差法
B. 正态分布不能用百分位数法
C. 偏态分布不能用均数标准差法
D. 偏态分布不能用百分位数法
E. 对称分布不能用百分位数法
正确答案: C
答案解析:制定医学参考值范围一般有两种方法:正态分布法(均数标准差法)和百分位数法。正态分布法适用于正态分布或近似正态分布资料;百分位数法适用于任何类型的资料,但满足正态分布的资料多采用正态分布法。
答案解析:任意正态分布经过标准化变换:u=(x-μ)/σ,可转换为μ=0,σ=1的标准正态分布。由于其位置参数和形态参数均为常数,因此它的曲线是唯一的。
做答人数:1
做对人数:1
所占比例: 100%
题号: 11 本题分数: 2
对于偏峰分布资料且测量值过高才有临床意义,95%单侧正常值范围可定
统计习题——精选推荐
卫生统计学习题第二章定量资料的统计描述1. 1985年某省农村30例6-7岁正常男童胸围(cm)测量结果如下:51.6 54.1 54.0 56.9 57.7 55.558.3 55.4 53.8 57.7 51.3 53.8 57.3 54.8 52.1 55.3 54.8 54.7 53.4 57.1 53.1 55.9 51.4 54.6 56.1 61.859.3 56.8 59.8 53.9(1)试编制以上数据的频数表,绘制直方图,概括其分布特征。
(2)用合适的统计量描述其集中趋势和离散趋势。
(3)对样本进行正态性检验第三章定性资料的统计描述1.某地通过卫生服务的基线调查得到如下资料,试作如下分析:(1)计算全人口的性别比;(2)计算育龄妇女(15~49岁)占总人口的百分比;(3)计算总负担系数;(4)计算老年人口系数某地人口构成情况年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~ 4.2 4.0 45~ 2.4 2.75~ 3.2 3.1 50~ 2.1 2.410~ 4.4 4.2 55~ 1.2 2.215~ 5.5 5.3 60~ 1.3 2.420~ 5.1 5.2 65~ 1.1 1.425~ 6.0 6.1 70~ 0.8 1.230~ 4.3 4.5 75~ 0.5 0.935~ 3.2 3.3 80~ 0.2 0.540~ 2.3 2.5 85~ 0.1 0.2第四章常用概率分布1.假定虚症患者中,气虚型占30%。
现随机抽查30名虚症患者,求其中没有1名气虚型的概率、有4名气虚型的概率。
2.某溶液平均1毫升中含有大肠杆菌3个。
摇均后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少?3.某人群中12岁男童身高的分布近似正态分布,均数为144.00cm,标准差为5.77cm,试估计(1)该人群中12岁男童身高集中在哪个范围?(2)求人群中12岁男童身高的95%和99%参考值范围;(3)求人群中12岁男童身高低于140cm的概率;(4)求人群中12岁男童身高超过160cm的概率;第五章参数估计基础1.某研究表明新研制的一种安眠药比旧安眠药增加睡眠时间。
定量资料的统计描述
四分位数 间距
方差与标 准差 变异系数
频数分析(Frequencies )
下面我们结合人群的年龄(age)数据学习如何使用SPSS计算统计指 标。
部分中英文对照:
描述统计(Descriptives )
对于近似正态分布的资料,我们还可以通过Descriptives获取统计指 标。这是一组使用某法多次测定某水样中碳酸钙含量的数据,符从正态分 布,下面我们用Descriptives的方法计算这组数据的统计指标。
打开SPSS软件自带的数据demo.sav,找到car,这是一组 私家车价格的资料,我们将结合这组数据学习连续型定量资料 频数分布表和频数分布图的绘制。
变量视图
一般步骤
1.求极差 2.确定组段数和组距 3.根据组距写出组段 4.制作频数表和频数图
求极差
求极差
确定组段数和组距
1.极差:R=95.7≈100
定量资料统计描述
定量变量
定量变量可以分为两种类型: 1.离散型变量:只能取整数值,例如,一个月中的
手术病人数,一年里的新生儿数。
2.连续型变量:可以取实数轴上的任何数值,例如, 血压,身高,体重等。
统计描述
统计描述是通过绘制统计表、统计图 或计算相应的统计指标来说明资料的分布 规律及其数量特征,是进一步统计推断的
输出结果
探索分析(Explore )
探索分析(Explore )主要可以分为两个部分
1.未知分布类型数据的统计描述 2.对数据的分布形态进行检验
探索分析(Explore )
统计指标 正态性检验
正态性检验
探索分析(Explore )
四分位数间距
探索分析(Explore )
探索分析(Explore )
第2章 定量资料的统计描述
20~
18 15.00
95
79.17
22~
12 10.00 107
89.17
24~
8 6.67 115
95.83
26~
4 3.33 119
99.17
28~30 1 0.83
120
100.00
合计 120 100
P25
14
2 12
25 120 100
15
16(,ol
/
L)
P75
20
2 12
75 120 100
f
77 50
百分位数(percentileP)X
20
总体中, 数值小于它的个体恰有X %,大于它的个 体恰有1-X %
样本估计:按照升序排列的数列里, 其左侧(即 小于它)的个体数在整个样本中所占百分比为 X%。
21
频率 f L
n X %
fL f
区间 L ? PX L ? L i
? in X% fL f
组段 频数 频率 累计频数 累计频率
26
(1)
(2) (3)
(4)
(5)
6~
1 0.83
1
0.83
8~
3 2.50
4
3.33
10~
6 5.00
10
8.33
12~
8 6.67
18
15.00
14~
12 10.00
30
25.00
16~18 20 16.67
50
41.67
18~20 27 22.50
77
64.17
R = 最大值-最小值 = 29.64-7.42 = 22.22 (3)确定组段数与组距
统计学简答题
医学统计学简答题第二章定量数据的统计描述1.变异系数与标准差的区别标准差使用的度量衡单位与原始数据相同,在两组数据均数相差不大,单位也相同时,从标准差的大小就可以直接比较两样本的变异程度。
但是有时我们需要对均数相差较大或单位不同的几组观测值的变异程度进行比较,标准差不再适宜,这时就应该使用变异系数了。
2.集中趋势和离散趋势的指标及适用范围(1)集中趋势:算术均数、几何均数、中位数,统称平均数,均反映集中趋势。
算术均数:主要适用于对称分布,尤其适合正态分布资料。
几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。
在医院中主要用于抗原(体)滴度资料。
中位数:适合条件:a.极偏态资料。
b.有不确定的数据(有>或<)。
c.有特大值或特小值。
d.分布不明的资料。
(2)离散趋势:极差、四分位数间距、方差和标准差、变异系数均反映离散趋势极差:除了两端有不确定数据之外,均可计算极差。
四分位间距:用于描述偏态分布资料。
方差和标准差:用于描述正态分布计量资料的离散程度。
变异系数:a.均数相差较大。
b.单位不同。
3.简述变异系数的实用时机变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
4.怎样正确描述一组计量资料(1)根据分布类型选择指标(2)正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。
5.标准差与标准误的联系和区别有哪些?区别:(1)概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,标准误越小,均数的可靠性越高。
(2)用途不同:标准差与均数结合估计参考值范围。
(3)计算含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:标准差、标准误均为变异指标,当样本含量不变是,标准误与标准差成正比。
6.正态分布的主要特征(1)正态曲线在横轴上方均数处最高,即频数最大(2)正态分布以均数为中心,左右对称,无限接近于x轴(3)曲线与横轴所围面积为1。
公卫助理医师-综合笔试-卫生统计学-第二单元定量资料的统计描述
公卫助理医师-综合笔试-卫生统计学-第二单元定量资料的统计描述[单选题]1.一组观察值如果每个值都同时增加或减少一个不为0的常数,则A.均数改变,几何均数不变B.均数改变,中位(江南博哥)数不变C.均数,几何均数和中位数都改变D.均数不变,几何均数和中位数改变E.均数,几何均数和中位数都不变正确答案:C参考解析:一组观察值如果每个值都同时增加或减少一个不为0的常数,则均数、几何均数、中位数都改变。
本题选C。
掌握“集中趋势指标★”知识点。
[单选题]3.表示儿童体重资料的平均水平最常用的指标是A.算术平均数B.中位数C.几何均数D.变异系数E.百分位数正确答案:A参考解析:算术平均数简称均数,均数适用于描述单峰对称分布资料,特别是正态分布或近似正态分布资料的集中位置。
掌握“集中趋势指标★”知识点。
[单选题]4.变异系数越大,说明A.标准差越大B.平均数越小C.平均数越大D.标准差和均数都大E.单位均数的变异越大正确答案:E参考解析:变异系数大,说明单位均数的变异越大。
变异系数的定义是标准差与算术均数之比,描述了数值的相对离散程度,本题正确答案为E。
掌握“离散趋势指标★”知识点。
[单选题]5.某人算得某资料的标准差为-3.4,可认为A.变量值都是负数B.变量值负的比正的多C.计算有错D.变量值多数为0E.变量值一个比一个小正确答案:C参考解析:标准差一定大于或等于0,不可能为负数,故答案为C。
掌握“离散趋势指标★”知识点。
[单选题]6.下列关于方差和标准差的叙述,不正确的是A.方差的单位与标准差的单位相同B.方差的单位是标准差单位的平方C.都用于描述定量资料频数分布的变异程度D.二者值越大,说明资料的变异程度越大E.均适用于对称分布,特别是正态分布或近似正态分布资料正确答案:A参考解析:方差的单位是观察值单位的平方,在实际工作中使用不便,因此将方差开算术平方根得到标准差,故选项A不正确,选项B正确;方差和标准差均是描述对称分布,特别是正态分布或近似正态分布资料变异程度的常用指标,值越大,说明资料的变异程度越大,选项C、D、E正确,故本题应选A。
定量资料的统计描述
表2.2 120名正常成年男子血清铁含量(umol/L)频数分布表
组段
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 27 18 12 8 4 1 120
频率 (%)
0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83 100.00 .
.
(一)编制频数表 1.编制频数表的步骤
(1)求极差R R=Xmax - Xmin
(2)划分组段
➢两端组段分别包含 最大值或最小值;
➢尽量取较整齐的数 值作为组段的端点;
➢组距以相等为宜。
确定组数:一般分10~15组;
确定组距i :可相等,可不等 ;
确定各组段的上、下限。
.
(3) 划计归组:按照x大于或等于下限小于上 限的原则确定每一例数据应归属的组段,依 次清点频数、计算频率、累计频数、累计频 率。
.
2.频数分布表的用途 (1)揭示资料的分布类型; (2)可看出频数分布的两个特征:集中趋势、离 散趋势; (3)便于发现特大或特小的可疑值; (4)便于进一步作统计处理。
.
(二)绘制直方图 直方图也称频率直方图。 横轴为所研究的变量(即组段的上下限),纵轴 为频率密度。 频率密度=频率/组距,直条面积等于相应组段的 频率。
.
(2)加权法:当相同观察值较多时,用加权法。 适用于频数表资料。公式:
XfX0 fX0 f n
X0为各组的组中值,f为各组的频数。
10
5
0
0
1
2
3
4
检查次数
某地96名产妇产前检查次率分布
.
频数
《医学统计学》基本统计学部分公式总结
̅2 ������1 − ������ ������ 2 √ 1 ������1 +
2 ������2
������1 = ������1 − 1, ������2 = ������2 − 1
1 2 的双侧 1 置信区间为:
������2
X
1
X 2 t / 2, S X 1 X 2 , t 值 自 由 度 为
̅������ − ������ ̅0 ������ Dunnett − ������ = ,ν = ������误差 ������������ ̅ ������ −������ ̅������ ������������ ̅ ������ −������ ̅������ 1 1 = √������������误差 ( + ) ������������ ������0
������������组内 =
������������组内 ������组内
������ 2 ∑������ ������=1(������������ − 1) ln 1+
2 ������������ ������������2
������ =
������������组间 ������������组内
第二章 定量资料的统计描述 1.算术均数
X
S
2
fX
2
fX
n 1 n
2
X 或( X fX )
n n
8.变异系数
CV
或
2.几何均数
lg X G n X 1 X 2 X 3 X n 或 G lg 1 n f lg X G lg 1 n
医学统计学02 定量资料的统计描述
120名8岁男孩身高频数表 组段 112~
频数 f 25
频数 2
114~
21
18
7
9 14
116~
15 10 5 3
20
15 10 5 0 7
14 15 9
118~
120~
122~
1
15
21 18 15 10 5 3 1
10
2 1 身高( cm )
124~ 126~ 128~ 130~ 132~ 134~136
• 加权法
G log
1
f log X f log X ( ) log ( ) n f
1
31
注意事项
几何均数常用于等比级资料或对数正态分布资料。 观察值中若有0或负值,则不宜直接使用几何均 数。 观察值一般同时不能有正值和负值。若全是负值, 计算时可先将负号去掉,得出结果后再加上负号。
7
9 14 15 21 18 15 10
130~
132~ 134~136
5
3 1
5
• 频数(frequency)
– 观察数据的个数
• 频数分布(frequency distribution)
– 观察数据在其取值范围内的分布情况
• 定量资料的频数分布情况可以用频数表 (frequency distribution table)或直方图表 示。
9
14 15 21 18 15
7.5
11.7 12.5 17.5 15.0 12.5
18
32 47 68 86 101
15.0
26.7 39.2 56.7 71.7 84.2
– 组段的起点叫“下限”,终点叫“上
【精品】定量资料的统计描述
【精品】定量资料的统计描述定量资料的统计描述是指通过定量数据分布的一系列统计量来描述一个样本或总体的特征。
常用的统计量包括中心位置、离散程度、分布形态和相关性等。
中心位置中心位置是指数据分布的平均水平。
常用的中心位置统计量包括平均数、中位数和众数。
平均数是所有数据值的总和除以数据个数。
它具有良好的代表性,但受极端值的影响较大,因此需要谨慎使用。
中位数是将数据按大小排序后位于中间的数值,当数据存在极端值时,中位数比平均数更能正确反映数据的中心位置。
众数是数据中出现次数最多的数值,适用于分布具有明显峰值的情况。
离散程度离散程度是指数据分布的距离平均值的大小。
常用的离散程度统计量包括标准差、方差、极差和四分位数差等。
标准差是数据离均值的平均距离,是最常用的衡量数据分散程度的统计量。
方差是标准差的平方,由于平方的量级较大,因此比标准差不易解释。
极差是数据最大值与最小值之差,不考虑数据内部的分布情况,因此不具有代表性。
四分位数差是在数据中将数值分为四个部分,即25%、50%、75%三个分位点,然后用75%分位点减去25%分位点,用于描述数据离散程度。
分布形态分布形态是指数据分布的偏态和峰态。
常用的分布形态统计量包括偏度和峰度。
偏度是反映数据分布偏斜程度的统计量,正偏分布表示分布的长尾在分布的右侧,负偏分布表示分布的长尾在分布的左侧。
当偏度为0时,表示分布是对称的。
峰度是反映数据分布峰态的统计量,正峰分布表示分布的峰在分布的中心较高,负峰分布表示分布的峰在分布的中心较低。
当峰度为0时,表示分布的峰态基本接近正态分布。
相关性相关性是指两个变量之间的关联程度。
常用的相关性统计量包括相关系数和协方差。
相关系数是反映两个变量之间线性相关程度的统计量,取值范围为-1~1之间,正值表示正相关,负值表示负相关,0表示不相关。
协方差是反映两个变量之间相关性的统计量,数值大小表示两个变量之间的相关程度,但由于单位的影响,不易比较。
第二讲定量资料的统计描述和正态分布
Analyze
Frequencies
选项有:statistics、chart和format
2、2 Descriptives 过程
Analyze
Descripitive statistics
Frequencies
2、3 Expore过程
Analyze
Descriptive Statistics Explore Dependent List框:要分析变量 Plots Normality plots with test Continue OK
算数均数 (mean)
适用条件:对称分布,特别是正态或者近似正态分 布的资料。
几何均数 (geometric mean)
适用条件:偏态分布,但是经过对数变换之后呈正 态或近似正态分布的资料。
中位数 (median)
适用条件:偏态分布资料及两端无确切值或分布不 明确的资料。
定量资料的统计描述---离散程度
计算医学参考值范围常用的方法:
正态分布法 参考值 范围% 单侧 双侧 只有 下限
X 1.64S
百分位数法 单侧 只有 上限
X 1.64S
双侧
只有 下限 P5
只有 上限 P95
95
X 1.96S
P2.5~P97.5
99
X 2.58S
X 2.32S
X 2.32S
P0.5~P99.5
变异系数 (CV)
适用条件:比较度量单位不同或均数相差悬殊的资料
描述定量变量指标的正确选择
正态或近似正态分布的资料
均数和标准差
偏态分布的资料
中位数和四分位数间距
第二章定量资料的统计描述
1.算数均数 1.算数均数(arithmetic mean) )
表2-3 加权法计算均数 组段 (1 ) 6~ 8~ 10~ 10~ 12~ 12~ 14~ 14~ 16~ 16~ 18~ 18~ 20~ 20~ 22~ 22~ 24~ 24~ 26~ 26~ 28~ 28~30 合计 组中值( 组中值(XO) (2 ) 7 9 11 13 15 17 19 21 23 25 27 29
X + X 2 + ... + X n = 1 X n=∑n来自i =1Xi n
=
∑
i
Xi n
=
∑
n
X
1.算数均数 1.算数均数(arithmetic mean) )
测得8 例2-3 测得8只正常大鼠血清总酸性磷 酸酶(TACP)含量(U/L) 4.20,6.43, 酸酶(TACP)含量(U/L)为4.20,6.43, 2.08,3.45,2.26,4.04,5.42,3.38。 2.08,3.45,2.26,4.04,5.42,3.38。 试求其算术均数。 试求其算术均数。 算术均数= 算术均数= (4.20+6.43+2.08+3.45+2.26+4.04+5.4 2+3.38)/8=3.9075 2+3.38)
1998年某地96名妇女产前检查次数分布 1998年某地96名妇女产前检查次数分布 年某地96
频数 (2) 4 7 11 13 26 23 12 96 频率(%) 频率(%) (3) 4.2 7.3 11.5 13.5 27.1 24.0 12.5 100 累计人数 (4) 4 11 22 35 61 84 96 累计频率(%) 累计频率(%) (5) 4.2 11.5 22.9 36.5 63.5 87.5 100.0 -
3定量资料统计描述
二、四分位数间距 (quartile range,Q)
四分位数间距是两个特定的百分位数之差, 用Q表示
Q=QU-QL=P75-P25 适用于任何分布的计量资料,尤其适用于
偏态分布的资料(不宜用标准差表示离散 度)
四分位数间距比全距稳定,但仍然未考虑 到每个观察值的变异。
三、方差与标准差
1 2
3
8
几何平均滴度为1:8
102名健康人的钩端螺旋体血清抗体平均滴度
抗体滴度 (1)
1︰100 1︰200 1︰400 1︰800 1︰1600 合计
人数f (2)
7 19 34 29 13 102
滴度倒数X (3)
100 200 400 800 1600
lgX ( 4)
2.000 2.301 2.602 2.903 3.204
用S表示,公式为:
S (X X )2 n 1
上式n-1称为自由度(ν)。 样本标准差计算也可用直接法或加权法。n较小时,选择 直接法,n较大,选择加权法
直接法:由于
(X
X
)2
X
2
X
n
2
标准差的计算公式可改写为:
S
X
2
X
n
2
n 1
x x 2 x2 2xx x 2
二、离散型定量变量的频数分布
例2-1:1998年某山区96名孕妇产前检查次数资料 如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1, 3,3,……….,4,7。 表2-1是96名妇女产前检查次数分布的频数表
表2-1 1998年某地96名妇女产前检查次数分布
【统计学】04 第二章 定量资料的统计描述
频率(%)
30
25
直条图
20
15
10
5
0
0
1
2
3
4
5
>5
产前检查次数
图2-1 1998年某地96名孕妇产前检查次数频率分布
8
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
首先,分析资料类型? 定量数据---连续型
表211998年某地96名孕妇产前检查次数频率分布检查次数检查次数11频数频数22频率频率33累计频数累计频数44累计频率累计频率11132623124273115135271240125112235618496421152293656358751000合计961000图211998年某地96名孕妇产前检查次数频率分布1015202530离散型定量变量的频率分布图可用直条图表达以等宽直条的高度表示各组频率的多少直条图二连续型定量变量的频率分布例22抽样调查某地120名1835岁健康男性居民血清铁含量mmol数据如下
频数
25 20 15 10
5 0
0
20
40
60
80
100
120
140
滴度倒数
25
20
15
f 10
5
0
0
0.5
1
1.5
2
2.5
lgX
23
3、计算公式:直接法和频数表法。
(1)直接法 公式:
G n X1 X2 X3 Xn
对数的形式为
G lg 1 lg X1 lg X 2 lg X n lg 1 lg X
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章定量资料的统计描述
一、选择题
1.资料的统计分析包括统计描述和统计推断两部分内容,而统计描述是指A.由样本统计量推断总体参数
B.对总体参数进行估计
C.用统计指标、统计图表描述资料的特征
D.对搜集到的资料进行整理
E.比较指标间的差异有无统计学意义
2.定量资料频数分布的两个重要特征是
A.样本与总体B.统计量与参数
C.样本均数与总体均数D.集中趋势与离散程度
E.标准差与标准误
3.常用的平均数指标是
A.样本均数、总体均数、中位数B.均数、几何均数、中位数
C.均数、几何均数、标准差D.均数、几何均数、变异系数
E.均数、中位数、方差
4.描述一组正态分布或近似正态分布资料的平均水平宜采用
A.平均数B.几何均数C.中位数D.变异系数E.均数
5.反映一组血清抗体滴度资料的平均水平,常选用的指标是
A.平均数B.几何均数C.中位数D.变异系数E.均数
6.描述传染病的平均潜伏期宜采用
A.平均数B.几何均数C.中位数D.变异系数E.均数
7.某病患者8人的潜伏期(天)如下:2、3、3、3、4、5、6、30+,则平均潜伏期为
A.7天B.3天C.4天D.3.5天E.大于7天
8.一组数据中各观察值均加(或减)某一个不等于0的常数后
A.均数不变,标准差改变B.均数改变,标准差不变
C.二者均改变D.二者均不改变
E.变异系数不变
9.以下资料类型中,适宜用均数与标准差进行统计描述的是
A.任意分布B.正偏态分布C.负偏态分布D.正态分布E.对称分布10.某研究者测量了某地237人晨尿中的氟含量(/
mg L),结果如下
尿氟0.2~0.6~ 1.0~ 1.4~ 1.8~ 2.2~ 2.6~ 3.0~ 3.4~ 3.8~
人数75 67 30 20 16 19 6 2 1 1
对该资料的集中趋势和离散趋势进行描述宜采用
A.均数与标准差
B.中位数与四分位数间距
C.众数与标准差
D.均数与变异系数
E.中位数与变异系数
11.比较身高和体重两组数据的变异度大小宜采用
A.标准差B.全距C.方差D.变异系数E.四分位数间距
12.比较某地1~2岁与5~5.5岁儿童身高的变异度大小宜采用
A.全距B.四分位数间距C.标准差D.方差E.变异系数
二、计算分析题
1.为了解某地区健康成年女性的血清总蛋白含量水平,某研究者于2013年在该
地区随机抽取了110名健康成年女子,测得其血清总蛋白含量(/
g L),结果见表
2-1。
表2-1 110名健康成年女子的血清总蛋白含量(/
g L)
72.3 76.9 72.2 77.9 70.2 73.2 77.3 73.2 73.4 72.1 71.6 74.6 75.7 73.7 70.7 79.2 75.5 66.4 80.5 79.2 75.5 74.0 70.1 70.8 82.6 73.9 72.7 71.6 71.3 70.8 72.5 76.7 74.7 70.6 66.4 72.0 73.3 68.2 72.0 75.9
65.5 67.9 77.9 75.2 75.2 74.9 75.6 73.6 75.6 78.1 74.8 78.8 74.2 77.7 78.1 70.4 87.0 81.3 76.7 73.8 74.0 72.4 76.4 71.7 74.2 75.8 62.2 68.0 71.1 69.7 73.9 70.0 75.6 76.5 73.1 70.8 77.9 75.6 73.9 70.7 72.2 72.1 74.3 72.6 74.9 77.2 67.4 77.3 70.7 68.9 76.7 77.0 73.5 73.4 68.3 70.6 75.1 78.5 70.8 70.4 70.7 80.8
77.0
65.5
74.0
64.5
73.4
77.4
73.7
67.2
(1)绘制频数分布表及直方图,并简述其分布特征。
(2)计算适当的集中趋势和离散趋势指标。
2.欲评价某市2012年空气质量情况,该市环监站搜集了376个监测点大气中2SO 的日平均浓度(3/g m μ),结果见表2-2。
表2-2 某市376个监测点2SO 的日平均浓度(3/g m μ)
浓度
频数
25~ 32 50~ 62 75~ 56 100~ 54 125~ 50 150~ 47 175~ 43 200~ 8 225~ 7 250~ 5 275~ 4 300~ 2 325~350
6
(1)简述其分布特征。
(2)计算适当的集中趋势和离散趋势指标。
3.某地46例微丝蚴血症患者治疗后5年用间接荧光抗体试验检测其抗体滴度,结果见表2-3,请计算其平均抗体滴度。
表2-3 46例微丝蚴血症患者治疗后抗体滴度
抗体滴度1:10 1:20 1:0 1:80 1:160 1:320
例数 6 11 12 8 5 4
(刘军祥)。