卫生学作业本统计部分问答题答案汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《卫生学》作业本统计部分——问答题答案
说明:
这份资料来自“超有诶”团队“素心”同学,由于答案不是老师给的,所以给的都是可能答案,答案来源多样,可能会与书上有些许出入,有歧义的地方,以人卫8版《卫生学为准》。
超有诶
第二章
1.均数、几何均数和中位数的适用范围有何异同?
答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5.
表2-5 均数,几何均数和中位数的相异点
平均数意义应用场合
均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布
几何均数平均增减倍数①等比资料;②对数正态分布资料
中位数位次居中的观察值水平①偏态资料;②分布不明资料;
③分布一端或两端出现不确定值
2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?
答:
1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。
(2)计算:中位数和百分位数均可用同一公式计算,即Px=L+(i/fx)(n·x%-ΣfL)
可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。
3.同一资料的标准差是否一定小于均数?
答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?(1)样本含量的大小,样本含量越大,标准差越稳定。
(2)分组的多少
(3)分布形状的影响,偏态分布的标准差较近似正态分布大
(4)随机测量误差大小的影响
(5)研究总体中观察值之间变异程度大小
5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?
(1)概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的连续型
分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正态分布用N (μ,σ2)表示,标准正态分布用N(0,1)表示,对数正态分布N(μlgX,σlgX)表示。
(2)应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。
6.医学中参考值范围的含义是什么?确定的原则和方法是什么?
(1)含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。
(2)原则:
①抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。
②对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。
③判定是否要分组(如男女、年龄、地区等)确定正常值范围。
④决定取双侧范围值还是单侧范围值。
⑤选择适当的百分范围
⑥确定可疑范围
⑦估计界值
(3)方法:
①百分位数法:
–双侧95%: (P2.5, P97.5)
–单侧95%: >P5或< P95
②正态分布法(对数正态分布):
–双侧95%:X±1.96S
–单侧95%:
百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。
第三章
1.标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别:①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体
均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。联系:标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本
均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两
者均可与均数结合运用,但描述的内容各不相同。
2.置信区间是用来估计未知总体参数的范围,范围内包括总体参数的置信度(1-a)。
参考值范围则是个体的波动范围,用于判断个体某项指标是否正常。比如按给定的(1-a)确定的个体的大小、生化指标的正常波动范围。
3.假设检验时首先认为设定H0,然后用样本数据检验是否支持H0,即假设在前,推断是有
规范程序作出的,结论只有成立与否而没有大小数量方面的反映,而区间估计是由其样本
数据算出估计量所在的区间和其置信度1-a,然后人们由估算结果作出判断,两者的相同
之处在于都利用了样本信息与统计推断,不同之处在于假设检验中与样本信息无关的原假
设H0对结果影响很大而区间估计值依据样本,影响较小。不同之处在于:用统计量推断参
数时,如果参数未知,则这种推断叫参数估计——用统计量估计未知的参数;如果参数已
知(或假设已知),需要利用统计量检验已知的参数是否靠谱,此时的统计推断即为假设
检验。
另一种答案:二者都属于统计推断的内容,假设检验推断总体参数间是否有质的区别,并
可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它
不仅可用以回答假设检验的问题,尚可比假设检验提供更多的信息。但这并不意味着用可
信区间代替假设检验,因为假设检验可得到P值,比较精确地说明结论的概率保证,而可
信区间只能告诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因
此,只有二者有机结合起来,互相补充,才是完整的分析。
4.P值是指从H0所规定的总体进行随机抽样,获得的等于或大于(或小于等于)现有样本
获得的检验统计量值得概率,一般认为概率为0.05为小概率事件,一般认为不发生,所以
P<0.05时拒绝H0
5.t检验:是假设检验的一种常用方法,当方差未知时,可以用来检验一个正态总体或两
个正态总体的均值检验假设问题,也可以用来检验成对数据的均值假设问题。具体内容可
以参考《概率论与数理统计》。可以用来判断两组数倨差异是否有显著意义,也就是结果
有没有统计学意义。
方差分析:它是处理实验研究资料时重要的分析方法之一,代表数据是否具有统计意义, 一般一组数据代表某个条件或因素,方差分析可以判断你选取的这个因素是否有意义,是不
是影响因素。如果你做统计为了找到事物相关性,而方差结果显示数据无统计学差异,很可
能代表实验失败或设计有问题。
6.当所设H0为总体参数等于某一定值,而H1为仅从一个方向上偏离此定值者,为单侧检验。以下是几种常见的单侧检验,注意与相应的双侧检验分辨。
①检验两组的差异显著性时,只考虑A>B之意义,不考虑A<B之可能性者,为单侧检验