医学统计学 (2)
医学统计学试题及参考答案 1、2、3套
![医学统计学试题及参考答案 1、2、3套](https://img.taocdn.com/s3/m/884b868cf524ccbff121847b.png)
精心整理医学统计学试题及答案1、2、3套第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B)A条图B百分条图或圆图C线图D直方图2、均数和标准差可全面描述D资料的特征A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A)A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价D不能作评价4、比较身高与体重两组数据变异大小宜采用(A)A变异系数B方差C标准差D四分位间距5、产生均数有抽样误差的根本原因是(A)A.个体差异B.群体差异C.样本均数不同D.总体均数不同6.男性吸烟率是女性的10倍,该指标为(A)(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为(D)A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C.A和B均不是D.A和B均是8、两样本均数比较用t检验,其目的是检验(C)A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D)(A)n1+n2(B)n1+n2–1(C)n1+n2+1(D)n1+n2-210、标准误反映(A)A抽样误差的大小B总体参数的波动大小C重复实验准确度的高低D数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr ,对回归系数检验的t值为tb,二者之间具有什么关系?(C)Atr >tbBtr<tbCtr=tbD二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D)A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为(A)A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
医学统计学案例分析2
![医学统计学案例分析2](https://img.taocdn.com/s3/m/d0e293b6294ac850ad02de80d4d8d15abe23006d.png)
案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。
经检验,得连续性校正χ22=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。
表1-4两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1)该资料是按中西药的治疗结果(有效、无效)分类的计数资料。
该资料是按中西药的治疗结果(有效、无效)分类的计数资料完全随机设计方案。
(2)27例患者随机分配到中药组和西药组,属于例患者随机分配到中药组和西药组,属于完全随机设计方案(3)患者总例数n=27<40,该医师用χ2检验是不正确的。
当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in2×2table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。
该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。
【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1)该资料是按中西药疗效(有效、无效)分类的该资料是按中西药疗效(有效、无效)分类的二分类资料,即计二分类资料,即计数资料。
(2)随机抽取140例胃炎患者分成西药组和中药组,属于属于完全随机设完全随机设计方案。
《卫生统计学II》(专升本)学习指导
![《卫生统计学II》(专升本)学习指导](https://img.taocdn.com/s3/m/109d212b03d8ce2f00662338.png)
《卫生统计学》(本)学习指导刘仁权(Liurq@、64286391)一、课程总说明(一)课程介绍统计学是一门研究数据的收集、整理、分析的科学。
卫生统计学是一门运用统计学原理和方法研究医药卫生工作中数据的收集、整理、分析的科学。
卫生统计学是医学体系的重要分支,是医学院校学生的必修课程。
随着医学的发展,作为医学科学研究方法学的卫生统计学已逐渐为广大医药卫生工作者所认识、所接受,并广为应用。
通过本课程的学习,可以掌握卫生统计学的基本概念、基本理论和基本方法,掌握收集、整理和分析资料的基本知识和方法,可以培养运用这些知识,对医药卫生工作中的数据进行统计处理的能力。
(二)教材、光盘和计算器在本课程的学习中,指定教材和课件光盘都很重要,同学们一定要准备好指定教材和课件光盘,并准备一个计算器或使用计算机Windows附件中的计算器。
1.课件光盘:北京大学医学网络教育学院多媒体网络课件《卫生统计学》光盘2张,主讲:刘仁权。
光盘中是按教材《医学统计学》(第4版,主编:马斌荣)第一章至第十章内容详细讲解的全程授课视频录像。
2.现在指定教材:《医学统计学》(第6版)主申:马斌荣,主编:李康、贺佳;人民卫生出版社(2013年3月)。
本教材是卫生部“十二五”规划教材、全国高等医药教材建设研究会“十二五”规划教材,是“十二五”普通高等教育本科国家级规划教材。
说明:课件光盘是以前录制的,当时的教材是《医学统计学》(第4版),现在已经没有第4版教材出售了,同学们现在拿到的教材是第6版。
不过两版教材内容基本相同,只是换了例题的数据,但解题过程完全相同。
同学们要注意,本课程比较难,大家要认真观看我教学光盘中的讲课录像,安照光盘的顺序和内容,对照教材学习。
为了方便同学们学习,下面的表格是课件光盘、第6版教材内容的比较。
说明2:光盘中“第七章相对数及其应用”是独立的,可以象教材那样提前学习,不影响其他章节的学习。
3.计算器:准备一个计算器或使用计算机Windows附件中的计算器。
医学统计学试题 (2)
![医学统计学试题 (2)](https://img.taocdn.com/s3/m/c98488d151e79b896902263f.png)
医学统计学试题一.选择题(每题2分,共20分)1、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A、n1+n2B、n1+n2-1C、n1+n2+1D、n1+n2-22、标准误反映()A、抽样误差的大小B、总体参数的波动大小C、重复实验准确度的高低D、数据的离散程度3、最小二乘法是指各实测点到回归直线的()A、垂直距离的平方和最小B、垂直距离最小C、纵向距离的平方和最小D、纵向距离最小4、用样本推论总体,具有代表性的样本指的是()A、总体中最容易获得的部分个体B、在总体中随意抽取任意个体C、依照随机原则抽取总体中的部分个体D、用配对方法抽取的部分个体5、随机误差指的是()A、测量不准引起的误差B、由操作失误引起的误差C、选择样本不当引起的误差D、由偶然因素引起的误差6、某项指标95%医学参考值范围表示的是()A、检测指标在此范围,判断“异常”正确的概率大于或等于95%B、检测指标在此范围,判断“正常”正确的概率大于或等于95%C、在“异常”总体中有95%的人在此范围之外D、在“正常”总体中有95%的人在此范围7、从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文χ2χ20.01,1,乙文χ2χ20.05,1,可认为()A、两文结果完全相同B、甲文结果更为可信C、乙文结果更为可信D、甲文说明总体的差异较大8、两样本均数比较的t检验和u检验的主要差别是()A、t检验只能用于小样本资料B、u检验要求大样本资料C、t检验要求数据方差相同D、u检验能用于两大样本均数比较9、对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是()A、适用范围广B、检验效能高C、检验结果更准确D、不易出现假阴性错误10、两数值变量相关关系越强,表示()A、相关关系越大B、相关系数越大C、回归系数越大D、相关系数检验统计量t值越大[参考答案]1-5:DACCD 6-10:DBBAB二.名词解释(每题4分,共20分)1、偏回归系数2、Ⅱ型错误:3、非参数检验:4、残差平方和/剩余平方和:5、率的标准误:[参考答案]1.表示其他自变量保持不变时,X j增加或减少一个单位引起的Y的变化量。
医学统计学-第二章 统计描述
![医学统计学-第二章 统计描述](https://img.taocdn.com/s3/m/d4786333b52acfc789ebc9f6.png)
1. 首先对资料作分布类型的判定; 2. 针对分布类型先用合适的指标描述:
均值、标准差;常记录为 X S
中位数、四分位间距; 常录为M(Ql, Qu)
一、集中趋势:用于描述一组计量资料的集中位置, 说明这种变量值大小的平均水平(average)表示。
频 数
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
(三)频数表的用途:
1.揭示频数的分布特征
频 数
分布 特征
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
集中趋势
(central tendency)
离散趋势
(tendency of dispersion)
集中趋势与离散趋势结合能全面反映频数的分布特征
2.揭示频数的分布类型
对称 分布
频数 分布
正偏
非对称 分布
负偏
集中部位在中部,两 端渐少,左右两侧的
基本对称,为对称 (正态)分布。
集中部位偏于较小 值一侧(左侧),较大 值方向渐减少,为
正偏态分布。
集中部位偏于较大 值一侧(右侧),较 小值方向渐减少,
为负偏态分布。
(2) 定量资料的描述指标
描述指标: 集中趋势:
累计频数 (4) 1 6 14 31 54 75 89 96 99 100 100
累计频率 (5) 0.01 0.06 0.14 0.31 0.54 0.75 0.89 0.96 0.99 1.00 1.00
频数分布图(frequency distribution figure) :
根据频数分布表,以变量值为横坐标,频数为纵坐 标,绘制的直方图。
医学统计学课后习题答案
![医学统计学课后习题答案](https://img.taocdn.com/s3/m/e1e6673f770bf78a64295483.png)
医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。
医学统计学(第二版)思考与练习答案
![医学统计学(第二版)思考与练习答案](https://img.taocdn.com/s3/m/06e50f57f5335a8102d220fe.png)
离散程度指标四分位数间距= (mmol/L)
三、最佳选择题
1.B2. E3. B4.C5. D6.E7.A8.D9. D
四、综合分析题
1.解:输出结果
图4-4尿总砷的频数分布图
由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。
输出结果
图4-5尿总砷对数的频数分布图
2.样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。
3.标准差与标准误的区别在于:①计算公式:标准差为 ,标准误为 ;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。
COPD患者的经常吸烟率比非COPD患者高26.69%
还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果
2.解:
表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化
年份
符号
死亡率
绝对增长量
发展速度
增长速度
累计
二、案例辨析题
该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。
三、最佳选择题
医学统计学方法试题及答案(二)
![医学统计学方法试题及答案(二)](https://img.taocdn.com/s3/m/616b81130812a21614791711cc7931b765ce7b6c.png)
医学统计学方法试题及答案(二)1.在同一总体中进行抽样研究,随着样本含量增大,则()A.标准差增大B.标准误增大C.标准差趋向0D.标准差减小E.标准误减小2.抽样误差是指()A.总体参数与总体参数间的差异B.个体值与样本统计量间的差异C.总体参数间的差异D.样本统计量与总体参数间的差异E.个体值与总体参数间的差异3.X±2.58S 包括变量值的()A.68.3%B.80.0%C.90.0%D.95.0%E.99.0%4.正常参考值范围应()A.取双侧界限B.取单侧界限C.同时计算单侧和双侧界限D.根据实际情况取单侧或双侧界限E.应该是规定不变5.两个样本率差别的假设检验,其目的是()A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同6.有关参考值范围的说法,正确的是()A.参考值范围应根据正常人范围的95%来制定B.如果随机测量某人的某项指标,其值在正常人范围的95%之内,那么应认为此人的此项指标正常C.如果某项指标超出了参考值范围,那么其应为不正常D.求正态资料的参考值范围,精确度越高越好E.所谓的正常和健康都是相对的,在正常人或健康人身上都存在着某种程度的病理状态7.在标准正态分布的曲线下面积中,区间(1.96,+∞)所对应的面积是()A.95%B.99%C.5%D.2.5%E.1%8.甲率P1=48/168,乙率P2=63/200,则甲乙两率的平均率为()A.(48+63)÷2B.(48/168+63/200)÷2C.(48+63)/(168+200)D.48/468+63/200E.(48+168)/(63+200)9.为了由样本推断总体,样本应该是()A.总体中任意的一部分B.总体中的典型部分C.总体中有意义的一部分D.总体中有价值的一部分E.总体中有代表性的一部分10.统计推断的主要内容为()A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测11.在假设检验中,P值和α值的关系为()A.P值越大,a值就越大B.P值越大,α值就越小C.P值和α值均可由研究者事先设定D.P值和α值都不可以由研究者事先设定E.P值的大小与α值的大小无关12.在两组正态分布资料比较的检验中,结论是P<0.05,差别有统计学意义,则P越小,说明()A.两样本均数差别越大B.两总体均数差别越大C.两样本均数有差别的可能性越大D.越有理由认为两样本均数不同E.越有理由认为两总体均数不同13.两样本均数比较,经检验得出差别有统计学意义的结论时,P越小,说明()A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同14.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,为较好的分析此数据,应用的统计检验方法是()A.配对检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验15.两组数据作均数差别t检验,要求数据分布近似正态而且()A.要求两组数据均相近,方差相近B.要求两组数据方差相近C.要求两组数据相近D.均数及方差相差多少都无所谓E.要求标准误相近16.两组数据作均数差别的t检验,其自由度为()A.n1+n2B.n1-n2C.n1+n2-1D.n1+n2-2E.n1+n2-317.在样本均数与总体均数比较时,若n=25,t=1.96,则()A.P>0.05B.P=0.05C.P<0.05D.P<0.01E.P>0.0118.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为()A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比较D.应进行假设检验后再下结论E 应增加气温数据才能做比较19.分析计数资料时,最常用的显著性检验方法是()A.t检验B.正态检验C.方差分析D.X检验法E.z检验,可认为()20.三个样本率作比较,χ2>χ20.01(3)A.各总体率不等或不全相等B.各样本率不等或不全相等C.各总体率均不相等D.各样本率均不相等E.各总体率全相等21.总体均数置信区间的宽度取决于()A.置信水平B.标准差C.标准误D.置信水平、标准差和样本含量E.样本含量22.四个百分率作比较,有1个理论数小于5、大于1,其他都大于5,则()A.只能作校正χ2检验B.不能作χ2检验C.作χ2检验不必校正D.必须先作合理的合并E.要用精确概率法23.某医生对一批计量、计数资料实验数据进行假设检验,结果判定如下:进行四格表χ2检验时,χ2=3.96则()A.P<0.05B.P=0.05C.P>0.05D. P<0.01E.P=0.0124.标准误的正确解释是()A.样本均数的标准差B.样本率的标准差C.标准差的平均数D.标准差的标准差E.统计量的标准差参考答案1.E2.D3.E4.D5.B6.E7.D8.C9.E 10.B 11.E 12.E 13.C 14.A 15.B 16.D 17.A 18.D 19.D 20.A 21.D 22.C 23.A 24.A。
医学统计学 第二章 计量资料的统计描述
![医学统计学 第二章 计量资料的统计描述](https://img.taocdn.com/s3/m/71839634ad02de80d5d84028.png)
肌红蛋白含量
人数
0~
2
5~
3
10~
7
15~
9
20~
10
25~
22
30~
23
35~
14
40~
9
45~50
2
18
人数
25 20 15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
医学统计学 第二章 计量资料的统计 描述
计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值:
X1,X2,X3,……,Xn
n为样本例数(样本大小、样本含量)
2
统计描述——描述其分布规律 1、用频数分布表(图)
要求:大样本 如 n〉30
2、用统计指标 描述 集中趋势 离散趋势
6
➢制表步骤 了解分布
1. 求极差(range) 极差也称全 距,即最大值和最小值之差,记作R。 本例
R 5 .7 1 2 .3 5 3 .3 6 ( m m o l/L )
7
2.确定组距(i) :
组段数通常取组 10-15组 本例组距
i 3 .3 6 /1 0 0 .3 3 6 0 .3 0
累计频率(%) (4)
0
402
402
35.80
1
330
732
65.18
2
232
964
85.84
3
118
1082
96.35
4
27
医学统计学习题二
![医学统计学习题二](https://img.taocdn.com/s3/m/8259e5eef8c75fbfc77db243.png)
医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
电大《医学统计学》形考2
![电大《医学统计学》形考2](https://img.taocdn.com/s3/m/e6834440a55177232f60ddccda38376baf1fe083.png)
形考任务2(第3-4章)一、名词解释(每题5分,共20分)1.相对数答:相对数是由两个有联系的指标之比所构成的统计指标.常用的相对数包括率、构成比和相对比。
2.构成比答:构成比又称为构成指标,表示事物内部每一组成部分在整体中所占的比例。
3.标准误答:在统计学中,将样本统计量的标准误差称为标准误。
4.置信区间答:区间估计是指按照一定的置信度(1-α),估计包含未知总体参数的区间范围,该范围称为参数的置信区间。
二、单项选择题(每题2分,共40分)1. 说明某现象发生强度的指标是( A )A.率B.相对比C. 构成比D. 增长速度2. 构成比所有组成部分的和( B )A.必小于1 B.必等于1C. 必大于1D. 必等于1003. 某年两所企业不同年龄段高血压患病率,均为A企业高于B企业,但总的患病率却是B企业高于A企业,请问出现这种不同的可能原因是( A )A.两所企业病人的严重程度不同B.两所企业的不同年龄段人数构成不同C.两所企业的总人数不同D. 两所企业领导构成不同4. 随机抽取某地300名男性和150名女性为研究对象,结果发现男性和女性某病患病率分别为40%和30%,则合并患病率为( B )A. 33.3%B. 36.7 %C. 35.0%D. 41.2%5. 下列选项中,不受年龄结构影响的指标是( B )A. 粗死亡率B. 年龄别死亡率C. 标准化死亡率D. 死因构成6. 下列有关标化后的总患病率的叙述,正确的选项是(D)A. 反映了患病的实际水平B. 不随所用标准的变化而变化C. 反映了事物实际发生的强度D. 反映了一种相对水平,仅可作为比较的基础7. 动态数列中定基比指标的类型是( C )A. 频率B. 构成比1/ 5。
医学统计学(第2章)正态分布
![医学统计学(第2章)正态分布](https://img.taocdn.com/s3/m/904533136edb6f1aff001f7d.png)
dx
(2-18) )
F(X)
p(a〈x〈b)
0 12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
正态分布曲线下面积的含义
1.表示变量值(x)在a-b区间变量值所占 1.表示变量值 表示变量值( 全部(总体)变量值的比例或概率 比例或概率(p)。 全部(总体)变量值的比例或概率(p)。 2变量值在整个曲线下的面积为100%,或 变量值在整个曲线下的面积为100%,或 出现的概率为1 出现的概率为1。
第五节 医学参考值范围的制定
一、概念 医学参考值是指包括绝大多数“ 医学参考值是指包括绝大多数“正 常人” 的各种生理及生化指标常数, 常人 ” 的各种生理及生化指标常数 , 也 称正常值。 称正常值。 正常值是指在一定范围内波动的值, 正常值是指在一定范围内波动的值, 医学上常用95% 医学上常用95%的范围作为判定正常或 异常的参考标准。 异常的参考标准。
二、 标准正态分布
1.标准正态分布及标准化变量值(u) 标准正态分布及标准化变量值( ) 标准正态分布及标准化变量值 任何正态分布的X值通过 值转换后,称为标 任何正态分布的 值通过u值转换后 称为标 准化的正态分布, 准化的正态分布,即u ~N( µ=0 , σ2=1) ( ) 概率密度函数为: 。概率密度函数为: 2
Φ(−u) 表示从-∞到- u值对应曲线范围 表示从- 值分布比例。 内X值分布比例。
例1: :
Φ(u = −1) = 0.1587 Φ(µ =1) =1− Φ(u = −1)
=1− 0.1587 = 0.8413
例2:标准正态变量值u=(-1,1)和u= 标准正态变量值u=( 1.96,1.96)区间内面积各为多少? ( -1.96,1.96)区间内面积各为多少?
《医学统计学》第二章定量数据的统计描述
![《医学统计学》第二章定量数据的统计描述](https://img.taocdn.com/s3/m/537820082e60ddccda38376baf1ffc4ffe47e204.png)
累积频数
(3) 27
196 363 457 538 580 608 622 626 629 630
-
累积频率(%)
(4) 4.29 31.11 57.62 72.54 85.40 92.06 96.51 98.73 99.37 99.84 100.00
资料如表,试计算其中位数。
某地630名正常女性血清甘油三酯含量(mmol/L)
甘油三酯(mmol/L)
(1) 0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~ 3.10~
合计
频数
(2) 27 169 167 94 81 42 28 14 4 3 1
练习
例 8名食物中毒患者的潜伏期分别为1,4,3,3,2,5,8,16小时,
求中位数。
n=8,为偶数
M
1
2
(
x (
8 2
)
x (
8
1)
)
2
1 2 ( x4
x5 )
1 3 4
2
3.5(小时)
例 某传染病11名患者的潜伏期(天)分别为1,3,2,2,3,7,5,6,
4,7,9,求中位数。
n=11,为奇数 M xn1 2 x(111) x6 4(天 ) 2
偏态分布
正偏态 负偏态
正偏态:集中位置偏向数值小的一侧 负偏态:集中位置偏向数值大的一侧
医学统计学(第7版)
正 态 分 布
医学统计学(第7版)
正偏态
集中位置偏向 数值小的一侧
负偏态
集中位置偏向 数值大的一侧
(麻疹年龄分布)
(肺癌年龄分布)
医学统计学试题及答案 (2)
![医学统计学试题及答案 (2)](https://img.taocdn.com/s3/m/bcdbca6e551810a6f424865f.png)
医学统计学试题及答案习题《医学统计学》第二版(五年制临床医学等本科生用)(一)单项选择题1.观察单位为研究中的( d )。
A.样本 B. 全部对象 C.影响因素 D. 个体2.总体是由( c )。
A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成3.抽样的目的是(b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差 C.几何均数 D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
医学统计学-课后答案
![医学统计学-课后答案](https://img.taocdn.com/s3/m/fcf7ff793c1ec5da51e27029.png)
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
医学统计学试题 (2)
![医学统计学试题 (2)](https://img.taocdn.com/s3/m/76b5f63db307e87100f69609.png)
一、简答题(每题6分,共60分)1、配对比较的假设检验,符合参数检验条件,能否出现t检验结果P>0.05;而非参数检验P<0.05的结果?如果出现上述情况,此时应该怎样解释检验结果?有可能,因为非参数检验检验效能低(具体自己she)2、某市为了解该地居民发汞(μmol/kg)的基础水平,为汞污染的坏境监测积累资料,对238名留住该市一年以上,无汞作业接触史,无明显肝、肾疾病的居民进行了调查,结果见表1:表1:238名居民发汞含量(μmol/kg)发汞含量1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~21.5人数20 66 60 48 18 16 6 1 0 3(1)说明此频数分布的特征;选用何中指标描述其集中趋势和离散趋势较好?分布特征:正偏态分布。
描述集中趋势的指标:几何均数;or中位数?(不确定)描述离散趋势的指标:四分位数间距(2)计算该地居民发汞值的95%正常值范围(只写公式,不必计算)。
因为资料呈负偏态分布,故应使用百分位数法计算参数范围,因为发汞过高为异常,应制定单侧95%参考范围。
用公式:P x=L X+i*(n x% —∑f x)/f x3、标淮差与标准误之间的联系与区别是什么?具体答案详见教材75页。
4、某医师对某年某医院的住院病人按不同 职业进行分组统计,结果见表2。
该医 师得到结论:全体病人中工人占75%, 农民占10%。
因此,工人比农民更容易 患病,提示工人的健康状况应受到重视。
你认为这种说法是否合理?若不合理, 为什么?不合理,因为该医师所计算的指标是构成比,只能说明全体病人中,工人、农民及其他所占的比重,不能说明3种职业患病的频率或强度,该医师犯了以构成比代替率的错误。
4、某年级一班、二班各有学生50人。
从两个半各抽取10人测量身高,并求其平均身高。
如果一班平均身高160cm ,二班平均身高154cm ,能否认为一班学生的平均身高高于二班?为什么? 不能进行此推论,理由如下。
医学统计学题二
![医学统计学题二](https://img.taocdn.com/s3/m/e00022d076a20029bd642d86.png)
医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学(第2版)练习思考题
![医学统计学(第2版)练习思考题](https://img.taocdn.com/s3/m/0d7fa085dbef5ef7ba0d4a7302768e9951e76ef2.png)
《医学统计学》(第2版)练习思考题第一章 绪论一、最佳选择题1.医学统计学研究的对象是( c )A .医学领域的某种小概率事件B .疾病的预防与治疗C .有变异的医学事件D .各种类型的数据E .医学中的必然事件2.从总体中抽取样本的目的是( c )A .研究样本统计量B .研究典型案例C .由样本统计量推断总体参数D .计算统计指标E .研究总体统计量3.用样本推断总体,具有代表性的样本是指( d )A .在总体中随意抽取任意个体B .剔除总体中偏大或偏小后的部分个体C .总体中最容易获得的部分个体D .依照随机原则抽取总体中的部分个体E .挑选总体中的有代表性的部分个体4.下列资料属于等级资料的是(C )A .红细胞计数B .门诊就诊人数C .患者的病情分级D .ABO 血型分型E .成年男性的体重资料5.关于随机抽样误差,下列不正确的是(A )A .不可避免B .可尽量减小C .无方向性D .可间接地计算出它的大小E .与样本含量大小无关6.关于概率的说法,下列不正确的是(A )A .某种事件发生的频率即概率B .大小在10≤≤PC.在实际中,概率是难以获得的D.随机事件的概率为1<P0< E.某事件发生的概率为05P时,称为小概率事件≤.0二、简答题1.医学统计学与数理统计学有什么区别与联系?P12.资料类型有哪几类?根据分析需要,如何将其相互转化?P63.医学统计工作包括那几个基本步骤?P74.医学统计学的主要内容是什么?P35.统计学的特点和基本思想是什么?P36.如何正确认识医学统计学的作用?P8第二章实验设计与调查设计一、最佳选择题1.实验设计和调查设计的根本区别是( D )A.实验设计是以动物为研究对象B.调查设计是以人为研究对象C.实验设计可以随机分组D.调查设计不可以随机分组E.实验设计可以人为设置处理因素2.实验设计的三个基本要素是( D )A.随机、对照、均衡B.随机、对照、重复C.随机、对照、盲法D.处理因素、研究对象、实验效应E.受试对象、处理因素、综合指标3.在实验设计中,选择实验效应指标时应注意( E )A.特异性B.灵敏性C.客观性D.精确性E.以上都是4.实验设计应遵循的基本原则是( A )A.随机、对照、均衡、重复B.随机、对照、盲法、重复C.随机、配对、盲法、均衡D.随机、配伍、对照、重复E.随机、盲法、对照、实用5.实验设计中影响样本含量大小的因素为( E )σA.αB.βC.参数的容许误差δD.总体标准差E.以上都是6.在常用的调查研究抽样中,抽样误差由大到小的顺序为(C )A.整群抽样≥单纯随机抽样≥分层抽样≥系统抽样B.分层抽样≥系统抽样≥单纯随机抽样≥整群抽样C.单纯随机抽样≥整群抽样≥系统抽样≥分层抽样D.整群抽样≥单纯随机抽样≥系统抽样≥分层抽样E.整群抽样≥分层抽样≥系统抽样≥单纯随机抽样1.实验设计的基本原则是什么?基本要素包括哪些?P13P122.何谓随机?随机的目的是什么?P133.决定样本含量的依据有哪些?. 决定样本含量的依据有哪些?答:决定样本含量的依据有:①犯Ⅰ类错误的概率α,即检验水准。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一单元概述1.研究设计应包括那几方面内容?答:包括:专业设计和统计设计。
专业设计是针对专业问题进行的研究设计,如选题、形成假说等。
统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。
统计设计是统计分析的基础。
任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。
第二单元资料描述性统计1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?答:集中趋势的指标有:算术均数、几何均数、中位数。
算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。
描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。
极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。
2.变异系数和标准差有何区别和联系?答:区别:1.计算公式不同:CV=S/X*100%,标准差是方差的平方根。
2.单位不同:变异系数无量纲,标准差量纲和原指标一致。
3.用途不同。
联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV与s呈正比。
3.频数表的用途有哪些?答:1.描述资料的频数分布的特征;2.便于发现一些特大或特小的可疑值;3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理;4.当样本量足够大时,可以以频数表作为概率的估计值。
4.用相对数时应注意哪些问题?答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。
2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。
3.正确计算频数指标的合并值。
4.相对数的比较具有可比性。
5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。
第三单元医学统计推断基础1.正态分布和标准正态分布的联系和区别?答:联系:均为连续型随机变量分布。
区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。
一般正态分布变量经标准化转换后的新变量服从标准正态分布。
4.简述二项的应用条件?答:条件为:1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变;3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。
5.简述Q-Q图法的基本原理?答:u-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,u-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。
Q-Q图法实际上就是首先求的小于某个x的积累频率,再通过该积累频率求得相应的u值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u-变换直线),否则(u,x)不会近似在一条直线上。
Q-Q图法正是根据(u,x)是否近似在一条直线上来判断是否为正态分布。
第四单元参数估计与参考值范围的估计1.均数的标准差和标准误的区别和联系?答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制;而标准误则是指样本统计量的标准差,均数的标准误实质上是样本均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,间接反映了均数的抽样误差大小。
2.简述t分布和标准正态分布间的区别与联系?答:t分布是进行小样本总体参数区间估计和假设检验的理论基础,t分布比标准正态分布的峰值低,且尾部翘的要高。
此外随着自由度的增大,t分布逐渐趋近于标准正态分布,即为自由度趋于无穷时,t分布就是标准正态分布。
3.简述医学中参考值范围的含义和制定参考值范围的一般步骤?答:含义:医学中把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。
步骤:1.定义“正常人”,不同的指标“正常人”的定义也不同;2.选定足够数量的正常人作为研究对象;3.用统一和准确的方法测定相应的指标;4.根据不同的用途选定适当的百分界限,常用95%和99%;5.根据此指标的实际意义,决定用单侧范围还是双侧范围;6.根据此指标的分布决定计算方法,常用的计算方法有正态分布法、百分位数法。
第五单元t检验与单因素方差分析1.I型错误和II型错误有何区别与联系,这两种错位有何实际意义?答:I型错误是指实际上成立的H0所犯的“弃真”错误,其概率大小用α表示。
II型错误则是指“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用β表示。
当样本含量n确定时,α愈小,β愈大,反之亦然。
意义:若在应用中要重点减少α,则取α=0.01;若在应用中要重点减少β,则取α=0.05,0.10,0.20甚至更高。
2.假设检验和区间估计有何联系?答:联系在于可信区间亦可以回答假设检验的问题,在判断两个或多个总体参数是否相等时,假设检验和可信区间是完全等价的。
3.为什么假设检验的结论不能绝对化?答:因为通过假设检验的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。
拒绝H0是可能犯I型错误;接受H0时可能犯II型错误。
因此不能在结论中使用绝对化字词如“肯定”等。
5.如何正确选取单侧或双侧检验?答:单双侧检验首先应根据专业知识来确定,同时也应该考虑所要解决问题的目的。
1.若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;2.在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验;3.若研究者对低于或高于两种结果都关系,用双侧检验;若只关系其中一种可能,用单侧检验。
一般认为双侧检验较保守和稳妥;单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。
6.两样本t检验的应用条件?答:条件为:两样本相互独立的;所来自的总体为正态总体;两总体方差相等。
7.方差分析的应用条件?答:条件是:1.各样本是相互独立的随机样本,均服从正态分布;2.相互比较的各样本的总体方差相等,即具有方差齐性。
第六单元列联表分析1.R*C表的卡方检验中,对于理论频数太小的情况应如何处理?答:处理方法:1.增加样本含量,以达到增大理论频数的目的,该方法为首先;2.根据专业知识,删除理论频数太小的格子所对应的行或列,可能损失样本信息或随机性,慎用;3.根据专业知识,将理论频数太小的格子所对应的行或列与性质相近的或邻列合并,使重新计算的理论频数变大,但要合并的合理;4.改用双向无序的R*C表的Fisher确切概率法,该方法计算复杂,需要SAS软件实现。
第七单元非参数统计分析方法1.简述非参数检验的应用条件?答:条件:1.资料不符合参数统计法的应用条件或总体分布类型未知;2.等级资料;3.个别数值偏大或某一端为不确定数如<0.01;4.在资料满足参数统计的要求时,应首选参数法,以免降低检验效能。
4.对同一资料,又出自同一研究目的,用参数统计和非参数统计所得结果不一致时,应以何种结果为准?答:两种方法各有适用的条件。
如果资料符合参数统计的要求,如满足正态、方差齐性等条件,以参数统计的结果为准;如果资料不符合参数统计的应用条件,如总体为非正态或分布类型不明确等,以非参数统计的结果为准。
第八单元回归与相关1.试总结从样本数据判断总体回归关系是否成立的统计方法有哪些?答:用tb、tr作t检验,用F对b作方差分析,直接查r界值表。
2.直线相关与秩相关的区别与联系:答:二者的联系(1):两者嗦解决的应用问题相同,都可用来表示两个数值变量间关系的方向和密切程度;(2):两个相关系数都没有单位,取值在【-1,1】之间;(3):计算上用秩次作直线相关得到的就是秩相关系数数。
二者的区别:(1):资料要求不同,直线相关系数要求x、y从正态分布,秩相关可以是任意分布;(2):对于资料要求不同,二者分属于参数和非参数统计方法,所以符合分布条件时,直线相关的效率高于秩相关;(3):二者假设检验方法不同。
3.简述直线回归和直线相关的区别与联系答:区别:(1)资料要求不同,直线回归要求Y服从正态分布,进行回归分析时成为2型回归,直线相关要求XY都服从正态分布,进行回归分析时成为2型回归;(2):应用目的不同,说明两变量的数量关系用回归分析,说明其关联用相关分析;(3):意义不同;(4):计算方法不同;(5):取值范围不同;(6):单位不同;二者联系:(1):方向一致;(2):假设检验等价;(3):用回归解释相关,回归平方和越接近总平方和,r2越接近1,说明相关性越好。
4.经检验认为回归方程有意义,是否表明两变量间存在因果关系?答:两变量间不一定存在因果关系,直线回归定量考察应变量与自变量间的线性关系,统计学检验表明回归方程有意义,只是说明二者数量上的线性关系存在,至于内在联系的性质尚需借助医学专业知识确定。
5.秩相关特别适用于哪些资料?答:(1):不服从双变量正态分布而不宜作直线相关分析的资料;(2):总体分布类型未知的资料;(3):用等级表示的资料;(4):分布端点无确定数值的资料;(5):用相对数表示的资料。
第九章实验设计与调查设计1.简述试验中对照设立的形式答:(1):空白对照是在不施加任何处理的“空白”条件下进行观察的对照;(2):实验对照是在某种与处理因素有关的实验条件下进行观察的对照;(3):标准对照是以标准值或正常值作为对照,或对照组采用的处理方法为现有标准方法或常规方法;(4):潜在对照是不专门设立对照组,而是已过去的间就结果作为对照;(5):相互对照是不专门设立对照组,各实验组之间互为对照;(6):安慰剂对照是指对照组采用一种无药理作用的物质,但其剂量或处置上不能为受试者识别,这种物质成为安慰剂。
2.什么是随机化?随机化作用是什么?在整个实验设计和实验过程中如何实验随机化?答:随机化是使各种对比组间在大量不可控制的非研究因素的分布方面尽量保持均衡一致的重要措施,随机化保证了各对比组间的均衡可比性,也是资料统计分析时进行统计推断的前提。
随机化既机会均等,应贯穿实验设计和实施的全过程,具体体现在三方面(1)抽样随机,(2)分组随机;(3)实验顺序随机。
3.常用的抽样方法有那些?答:(1)单纯随机抽样又称简单随机抽样,其抽样原则是使调查总体中每个观察单位被选入的概率完全相同;(2)系统抽样又称机械抽样或等距抽样,即先将调查总体中得所有观察单位排序后按样本例数分段,并从第一段随机抽取一个单位作为起始点,然后以相同间隔机械的从其他段中各抽取一个观察单位构成样本;(3)分层抽样又称类型抽样或分类抽样,即先将总体中所有观察单位按某项特征或标志划分为若干类型或组别,然后再按随机原则从每一层中抽取若干观察单位组成样本;(4)整群抽样是将总体中所有观察单位按某种属性分成若干群体,然后以“群”为初级抽样单位,从所有群体中随机抽取若干群体,由这些群体中的观察单位构成样本。