最新统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案资料
2018精选版卫生统计学第7版 方积乾主编 课件第二章 定量资料的统计描述-精心整理
8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
6~
8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
图2-2 120名健康成年男子血清铁含量(μmol/L)分布
努力
30 25 20
数据如下。试编制血清铁含量的频率分布表。
努力
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
2. 确定组段数与组距(class interval)
靠近的整数作为组距,本例取i=2。
6~ 8~ 10~ 12~ 14~ 16 ~ 18 ~ 20 ~ 22 ~ 24 ~ 26 ~ 28~30
1 3 6 8 12 20 27 18 12 8 4 1
120
0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
100.00
最大值。注意各组段不能重合,每组段只写出下限,如6~,8~,最后
一个组段可包括其上限值,如本例28~30。 4. 列表 清点各组的频数,计算频率、累积频率数和累计频率。
努力
表2-2 120名正常成年男子血清铁含量(μmmo/L)频率分布 组段 (1) 频数 (2) 频率(%) (3) 累计频数 (4) 累计频率(%) (5)
检查次数 (1) 0 1 2 3 4 5 >5 频数 (2) 4 7 11 13 26 23 12 频率(%) (3) 4.2 7.3 11.5 13.5 27.1 24.0 12.5 累计频数 (4) 4 11 22 35 61 84 96 累计频率(%) (5) 4.2 11.5 22.9 36.5 63.5 87.5 100.0
医学统计学第七版课后答案及解析
医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
统计学原理第七版课后答案
统计学原理第七版课后答案1. 样本与总体。
1.1 什么是样本?什么是总体?样本是指从总体中抽取出来的一部分个体或观测值,而总体则是指研究对象的全体个体或观测值的集合。
在统计学中,我们通常通过对样本进行统计分析来推断总体的特征。
1.2 为什么要使用样本?使用样本可以节约时间和成本,同时也可以减小调查的难度。
通过对样本的分析,我们可以得出对总体的推断,从而更加高效地进行统计研究。
2. 描述统计与推断统计。
2.1 描述统计和推断统计有什么区别?描述统计是通过对样本数据的整理、分析和总结,来描述数据的基本特征和规律。
而推断统计则是通过对样本数据的分析,来推断总体的特征和规律。
2.2 描述统计和推断统计各自的应用场景是什么?描述统计主要用于对已有数据进行整理和总结,以便更好地理解数据的特征;而推断统计则主要用于从样本数据中推断总体的特征,以便对总体进行更深入的研究和分析。
3. 概率分布。
3.1 什么是概率分布?概率分布是指描述随机变量可能取值的概率规律的数学函数。
常见的概率分布包括正态分布、泊松分布、均匀分布等。
3.2 为什么要研究概率分布?研究概率分布可以帮助我们更好地理解随机变量的性质和规律,从而为后续的统计推断和分析提供基础。
4. 参数估计与假设检验。
4.1 参数估计和假设检验的基本思想是什么?参数估计的基本思想是通过样本数据对总体参数进行估计,从而对总体的特征进行推断;而假设检验的基本思想是在已知总体参数的情况下,通过样本数据来检验总体参数的假设。
4.2 参数估计和假设检验的应用范围有哪些?参数估计和假设检验在统计学中有着广泛的应用,包括医学、经济学、社会学等各个领域。
5. 方差分析。
5.1 什么是方差分析?方差分析是一种用于比较两个或多个总体均值是否相等的统计方法,常用于实验设计和数据分析中。
5.2 方差分析的原理是什么?方差分析的原理是通过比较组内变异和组间变异的大小,来判断总体均值是否存在显著差异。
统计学课后习题及答案
统计学课后习题及答案统计学课后习题及答案统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
作为学习统计学的学生,课后习题是巩固知识、提高技能的重要途径。
本文将提供一些统计学课后习题及其答案,希望对学习者有所帮助。
1. 描述性统计习题:给定以下一组数据:10, 15, 12, 18, 20, 22, 16, 10, 14, 19。
请计算该组数据的均值、中位数和众数,并解释它们的含义。
答案:均值:计算方法是将所有数据相加,然后除以数据的个数。
对于给定的数据,均值为(10+15+12+18+20+22+16+10+14+19)/10 = 16.6。
中位数:将数据按照从小到大的顺序排列,找出中间的数。
对于给定的数据,中位数为16。
众数:出现频率最高的数。
对于给定的数据,众数为10。
这些统计量可以帮助我们了解数据的集中趋势。
均值是所有数据的平均值,中位数是数据的中间值,众数是出现频率最高的值。
在这个例子中,均值告诉我们这组数据的平均水平是16.6,中位数告诉我们大约一半的数据小于16,一半的数据大于16,众数告诉我们10是这组数据中出现次数最多的数。
2. 概率习题:一个骰子有6个面,每个面上的数字分别是1、2、3、4、5、6。
如果投掷一次骰子,求得到奇数的概率。
答案:奇数的个数为3个,即1、3、5。
骰子的总个数为6个。
所以得到奇数的概率为3/6 = 1/2。
概率是事件发生的可能性。
在这个例子中,奇数的个数是3个,总个数是6个,所以得到奇数的概率是3/6,即1/2。
3. 抽样与估计习题:某市有1000名居民,你希望了解他们对某项政策的态度。
你打算进行一次调查,抽取100名居民进行问卷调查。
这个调查结果能否代表整个市民的态度?为什么?答案:这个调查结果不能代表整个市民的态度。
原因是抽样的方式可能引入抽样误差。
如果抽取的100名居民在某些特征上不具有代表性,比如年龄、性别、职业等,那么调查结果可能会偏离整个市民的态度。
统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案
第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:25507523.5(23825%20) 4.7(mol/kg)6625.5(23850%86) 6.6(mol/kg)6027.5(23875%146)8.9(mol/kg)48(%)x xL xiP L n x f f P u P u P u离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,思考与练习(P31)1.答:(1)某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布(2)Descriptive StatisticsN Range Min Max Mean Std. Deviation 胸围120 12.7 49.1 61.8 55.120 2.3188(3) 利用频数分布表数据计算均数和标准差0149.5161.56623.01112055.19(cm)fX X f∑=∑⋯⨯++⨯==⋯++=(4)………..S 2.33(cm)=255075153.0(12025%19)53.58(cm)19155.0(12050%56)55.29(cm)14156.0(12075%70)56.77((cm)26%)x x L xiP L n f f P x P P2.答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)3.答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
卫生统计学第7版方积乾主编课件第二章定量资料的统计描述
2020/6/24
11
正偏态(右偏态)
负偏态(左偏态)
2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理
2020/6/24
12
第二节 描述集中趋势的统计指标
医学定量资料中,描述集中趋势的统计指标主要有 算术均数、几何均数和中位数。 一、算术均数(arithmetic mean)
本例
X X 31.26 3.9075 (U/L) n8
2020/6/24
14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
X fX 0 fX 0
f
n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 X fX 0 2228 18.57 (μmmo/L) f 120
2020/6/24
2
统计描述是用统计图表、统计指标来描述资料的分布 规律及其数量特征的。
第一节 频率分布表与频率分布图
医学研究资料变量值的个数较多时,对个变量值出现的 频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称频数表或频率表。
2020/6/24
2020/6/24
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/6/24
6
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
医学统计学第七版课后答案及解析
医学统计学第七版课后答案及解析医学统计学第七版课后答案及解析目录第一章医学统计中的基本概念 (1)第二章集中趋势的统计描述 (2)第三章离散程度的统计描述 (5)第四章抽样误差与假设检验 (8)第五章 t检验 (10)第六章方差分析 (14)第七章相对数及其应用 (19)第八章2检验 (22)第九章非参数检验 (26)第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
统计学教程答案第二章
∑ X 7 + 9 + 10 + 14 + 15 = = 11.00 n 5
∑ (X − X ) =0.00
∑X = 666.40mg/ml n
2
X =
S=
∑ (X − X ) =551.99mg/ml n −1 S CV = × 100% =82.83% X
X = ∑X = 127.20 mg/ml n
(2)求中位数,均数和标准差。 ①求中位数
M = Lx +
②求均数
ix n 2. 0 (80・50%-38)=12.24g − ∑ f L =12.0+ fM 2 17
X =
③求标准差
∑ fX =12.78 ∑f
2
S=
3.答案:
2 ∑ (X − X ) ∑ fX − ((∑ fX ) ∑ f ) = =3.77g n −1 ∑ f −1 2
统计学教程
第二章 计量资料的统计描述
五、习题答案要点
(一)名词解释 1.答案:频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的 出现的频繁程度(频数) 。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一 日内死亡 0,1,2…20 个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散 布区间由若干组段组成,每个组段对应一个频数。 2.答案:算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数 用μ表示,样本均数用 X 表示。 3.答案:几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的 水平。记为 G。 4.答案:中位数(median)将一组观察值由小到大排列,n 为奇数时取位次居中的变量 值;为偶数时,取位次居中的两个变量的平均值。 5.答案:极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其 计算简便但稳定性较差。 6.答案:百分位数(percentile)是将 n 个观察值从小到大依次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。
统计学课后习题答案(全章节)(精品).docx
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
统计学课后习题参考答案(可编辑修改word版)
思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3.目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;② 建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
卫生统计学选择题(方积乾)
一、选择题(一) A1题每一道题下面有A、B、C、D、E五个被选答案,请从中选择一个最佳答案。
1.下面的变量中,属于分类变量的是(B)A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.下面的变量中,属于定量变量的是(B)A.性别B.体重C.血型D.职业E.民族3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于(A)A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料4.上述资料可以转换为(C)A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料5.若要通过样本作统计推断,样本应是(C)A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.统计量(E)A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标 7.因果关系(C)A.就是变量间数量上的联系B.可以用统计方法证明C.必定表现为数量间的联系D.可以通过单独考察两个变量间关系得出E.可以通过变量间数量上的联系来证明(二)A2型每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择3一个最佳答案。
1. 教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。
有180万儿童参与,约有1/4参与者得到了随机化。
这180万儿童是(C)A.目标总体B.研究总体C.1份样本D.1份随机样本E.180万份样本2.上述试验最终肯定了索尔克疫苗的效果。
请问此结论是针对(C)而言。
A.180万儿童B.每个儿童C.所有使用索菲克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/4二、是非题1.定量变量、分类变量和有序变量可以相互转换。
生物医学研究的统计学方法课后习题答案主编方积乾
思考与练习参考答案第1章绪论一、选择题1.研究中的基本单位是指(D)。
A.样本B.全部对象C.影响因素D.个体E.总体2.从总体中抽取样本的目的是(B)。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.计算统计指标3.参数是指(B)。
A.参与个体数B.描述总体特征的统计指标C.描述样本特征的统计指标D.样本的总和E.参与变量数4.下列资料属名义变量的是(E)。
A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级E.ABO血型5.关于随机误差下列不正确的是(C)。
A.受测量精密度限制B.无方向性C.也称为偏倚D.不可避免 E.增加样本含量可降低其大小二、名称解释(答案略)1.变量与随机变量2.同质与变异3.总体与样本4.参数与统计量5.误差6.随机事件7.频率与概率三、思考题1.生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。
而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。
2.某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。
因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。
样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。
即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。
统计学第七版课后答案
统计学第七版课后答案【篇一:大学统计学第七章练习题及答案】练习题7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。
(1)样本均值的抽样标准差?等于多少?(2)在95%的置信水平下,边际误差是多少?解:⑴已知??5,n?40,?25样本均值的抽样标准差???n?540??0.79 4⑵已知??5,n?40,?25,??,1???95% 4?z?2?z0.025?1.96边际误差7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差;(2)在95%的置信水平下,求边际误差;(3)如果样本均值为120元,求总体均值?的95%的置信区间。
解.已知.根据查表得z?/2=1.96(1)标准误差:e?z??n?1.96*?1.55 4???n?1549?2.14(2).已知z?/2=1.96所以边际误差=z?/2*sn?1.96*1549=4.2(3)置信区间:?z?2sn?120?1549?1.96??115.8,124.2?7.3 从一个总体中随机抽取n?100的随机样本,得到?104560,假定总体标准差??85414,构建总体均值?的95%的置信区间。
z??1.96z??96*85414n?1.?16741.144?z.?104560?16741.144?87818.856n??z?.?104560?16741.144?121301.144n置信区间:(87818.856,121301.144)7.4 从总体中抽取一个n?100的简单随机样本,得到?81,s?12。
(1)构建?的90%的置信区间。
(2)构建?的95%的置信区间。
(3)构建?的99%的置信区间。
解;由题意知n?100, ?81,s?12.(1)置信水平为1???90%,则z??1.645. 2由公式?zs??81?1.645?122n??81?1.974即81?1.974??79.026,82.974?,则?的90%的置信区间为79.026~82.974(2)置信水平为1???95%, z??1.96 2由公式得?z??s2n=81?1.96?12100?81?2.352即81?2.352=(78.648,83.352),则?的95%的置信区间为78.648~83.352(3)置信水平为1???99%,则z??2.576.2s12由公式?z??=?81?2.576?0962n?81?3.即81?3.1则?的99%的置信区间为7.5 利用下面的信息,构建总体均值的置信区间。
生物医学研究的统计学方法后习题答案2014主编方积乾
思考与练习参考答案第1章绪论一、选择题1. 研究中的基本单位是指( D)。
A.样本 B. 全部对象C.影响因素D. 个体E. 总体2. 从总体中抽取样本的目的是( B )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指( B )。
A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。
A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。
A.受测量精密度限制B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量2. 同质与变异3. 总体与样本4. 参数与统计量5. 误差6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。
而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。
2. 某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。
因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。
样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。
即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。
卫生统计学第7版-方积乾主编-课件第二章-定量资料的统计描述学习资料
5
0
0
1
2
3
4
5
>5
产前检查次数
图2-1 1998年某地96名孕妇产前检查次数频率分布
2020/4/12
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/4/12
6
频率表的编制步骤如下:
2020/4/12
18
2.频率表法:当资料中相同变量值的个数f(即频数) 较多时,可通过频率表法计算几何均数,公式为
Glg1flfgX
表2-4 52例慢性肝炎患者的 HBsAg滴度资料
2020/4/12
19
本例Σf lgX= 108.06977 , Σf=52,代入公式得 Glg 1 10 .086 97 lg 1 7 2.078 13 1 .794705 52
本例
XX31.263.9075(U/L) n8
2020/4/12
பைடு நூலகம்14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
XfX0 fX0 f n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 XfX0 222818.57(μmmo/L) f 120
累计频率找出M所在的组段,然后按下式计算。
in ML fm(2fL)
式中L为中位数所在组段的下限,i为该组段的组距,fm为 该组段的频数,ΣfL为小于L的各组段累计频数。
例2-8 50例链球菌咽颊炎患者的潜伏期(小时)如表2-5, 试计算潜伏期的中位数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2章 定量资料的统计描述
案例2-1(P27)
答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:
25507523.5(23825%20) 4.7(mol/kg)
6625.5(23850%86) 6.6(mol/kg)
602
7.5(23875%146)8.9(mol/kg)
48(%)
x x L x i
P L n x f f P u P u P u =+?==+?==+?==+?S
离散程度指标:
四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,
思考与练习(P31)
1.
答:
(1)
某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布
Group Frequency Percent Cumulative Percent
49.0- 1 .8 .8
50.0- 4 3.3 4.2
51.0- 8 6.7 10.8
52.0- 6 5.0 15.8
53.0- 19 15.8 31.7
54.0- 18 15.0 46.7
55.0- 14 11.7 58.3
56.0- 26 21.7 80.0
57.0- 10 8.3 88.3
58.0- 9 7.5 95.8
59.0- 4 3.3 99.2
61.0-62.0 1 .8 100.0
Total 120 100.0
(2)
(3) 利用频数分布表数据计算均数和标准差
0149.5161.56623.01112055.19(cm)
fX X f
∑=
∑⋯⨯++⨯==
⋯++=
(4)………..
S 2.33(cm)=
2550751
53.0(12025%19)53.58(cm)191
55.0(12050%56)55.29(cm)141
56.0(12075%70)56.77((cm)
26%)x x L x i P L n f f P x P P ==+?==+?==+?=+?S
2.
答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.
M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)
3.
答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
lg 1lg 2lg86lg161lg5121lg 301lg 1.68581.68581048.5
f X G f ⎛⎫∑-= ⎪∑⎝⎭
⨯+⨯++⨯⎛⎫-= ⎪
⎝⎭-==≈
四、综合分析题(P393)
第一题
176名燃煤型砷中毒患者尿砷含量(ug/L)的频数分布Frequency Percent Cumulative Percent
0.01- 84 47.7 47.7
0.06- 41 23.3 71.0
0.11- 25 14.2 85.2
0.16-
4 2.3 87.5
0.21- 7 4.0
91.5
0.26-
5 2.8 94.3 0.31-
2 1.1 95.5 0.36-
3 1.7 97.2 0.41- 2 1.1 98.3
0.51-
1 .6 98.9
0.56-0.61 2 1.1 100.0
Total 176 100.0
由上图可见,该资料集中位置偏向左侧,为正偏态分布,可考虑作对数变换: Y=lg(尿总砷)
Tests of Normality(正态性的检验)
a Lilliefors Significance Correction
Descriptive Statistics
结果中的Mean表示尿总砷对数值的均数为-1.1831,求其反对数,得几何均数G=0.0656(ug/L)。
第二题
解:
(1) 已知健康人的血清胆固醇服从正态分布,故采用正
态分布法制定95%的参考值范围。
下限:
上限:
故该市45-55岁健康男性居民的血清胆固醇的95%的参考值范围为(2.96mmol/L, 6.72mmol/L)
1.96 4.84 1.960.96
2.96(/)X S mmol L -=-⨯=1.96 4.84 1.960.96 6.72(/)
X S mmol L +=+⨯=
(2) 45-55岁健康男性居民的血清胆固醇的分布为正态分
布,且仅知样本均数和样本标准差,则先按下式求得z 值,再查附表二的标准正态分布下的面积求得曲线下某区间的面积。
查标准正态分布曲线下的面积表(附表2)得:
1122
3.25
4.84 1.660.96
5.25 4.840.430.96X X Z S X X Z S --===---===1
2()(1.66)0.0485
()(0.43)1(0.43)z z ΦΦΦΦΦ=-===--
即该市45-55岁健康男性居民中,血清胆固醇在
3.25-5.25mmol/L 范围内的比例为61.79%。
(3)
即该市45-55岁健康男性居民中,血清胆固醇低于3.80mmol/L 所占的比例为14.01%。
3.80
4.84 1.080.96X X Z S --===-()(1.08)0.140114.01%z ΦΦ=-==
第三题
Group Frequency Percent Cumulative Percent 50- 3 2.5 2.5
3 2.5 5.0
60-
3 2.5 7.5
70-
80- 9 7.5 15.0
90- 12 10.0 25.0
100- 9 7.5 32.5
110- 27 22.5 55.0
21 17.5 72.5
120-
23 19.2 91.7 130-
10 8.3 100.0 140-
120 100.0
Total。