医学统计考试资料2
医学统计学 单选题2
医学统计学单选题21.均数95%可信区间主要是用于A.估计“正常人群”某指标95%观察值所在范围B.估计总体均数有95%的可能在某区间√C.反映某指标的可能取值范围D.反映某指标的观察值波动范围E.95%的样本均数在此范围2.当总体标准差σ已知,可用于估计总体均数置信区间的方法是A.t分布法B.正态分布近似法√C.百分位数法D.查表法E.t分布法或正态分布近似法3.关于t分布的叙述错误的是A.t分布是一簇曲线B.t分布是单峰分布C.当自由度ν→∞时,t分布趋近于标准正态分布D.以0为中心,左右对称分布E.ν相同时,t绝对值越大P值越大√4.越小,用该样本均数估计总体均数的可靠性越大A.CVB.SC.RD.SE√E.Q5.进行假设检验时,备择假设为:μ1≠μ2,应表述为A.两总体均数不相等√B.两总体均数相等C.两样本均数不相等D.两样本均数相等E.两样本均数有统计学差异6.假设检验结果为t>tα/2,ν,则P值及相应的结论为A.P>α,差别无统计学意义B.P<α,差别有统计学意义√C.P>α,差别有统计学意义D.P<α,差别无统计学意义E.P<α,差别显著7.抽取一个样本量为100的随机样本,其均数为81,标准差s=12总体均数μ的99%的置信区间为A.81±1.97B.81±2.35C.81±3.10√D.81±3.52E.81±1.208.在假设检验中,原假设和备择假设A.都有可能成立B.都有可能不成立C.只有一个成立而且必有一个成立√D.原假设一定成立,备择假设不一定成立E.不确定9.研究者考察了城市和农村两种条件下各30名幼儿园学生身高的情况,得到两种条件下两组被试的身高分别为:78±10cm和84±8cm,从中你可以得到A.两种条件下学生身高的差异非常显著B.因为84≠78,所以两种条件下学生身高差异非常显著C.因为84>78,所以农村学生身高非常显著地高于城市学生的身高D.以上都对E.以上都不对√10.在一所规模较大的综合大学中,全体注册学生的年龄分布未知,但在一个400名学生的简单随机样本中,发现200人年龄超过20岁,下面答案中正确的是A.恰好全体注册学生的50%超过20岁B.全体注册学生中约50%超过20岁,但可能偏离少许百分点√C.全体注册学生中约50%超过20岁,但可能偏离10或20个百分点D.无法判断E.以上均不正确11.假设检验中的显著性水平是A.推断时犯第Ⅱ类错误的概率B.推断时犯第Ⅰ类和第Ⅱ类错误的概率C.推断时犯第Ⅰ类错误的概率√D.推断时犯第Ⅲ类错误的概率E.以上均不正确12.相同自由度时,∣t∣值越大,则A.概率P不变B.概率P越大C.概率P越小√D.概率P大小不能确定E.以上均不正确13.在相同∣t∣值时,同一自由度的双侧概率是单侧概率的倍A.1B.2√C.3D.4E.514.关于样本均数的抽样分布特点,下列哪一个说法是错误的A.各样本均数未必等于总体均数B.各样本均数之间未必相等C.各样本均数围绕着总体均数,中间多、两边少,左右基本对称D.样本均数之间的变异比较原变量明显变大√E.各样本均数也服从正态分布15.关于总体均数的估计,说法不正确的是A.当总体标准差已知时,用正态分布近似法B.当总体标准差未知但n足够大时,用正态分布近似法C.当总体标准差未知时,可采用t分布法D.当总体标准差未知时,可采用t分布法和正态分布近似法√E.总体均数的估计分为区间估计和点估计16.关于总体率的估计正态分布近似法的条件正确的是A.n足够大B.p和n(1-p)均不太小C.np大于5D.n(1-p)大于5E.以上均正确√17.下列哪一变量服从t分布18.若H0成立但被拒绝,则A.计算有误B.检验方法选择不正确C.犯第一类错误√D.犯第二类错误E.检验方法效率不够高19.标准误反映A.抽样误差的大小√B.总体参数的波动大小C.重复实验准确度的高低D.数据的离散程度E.以上都不对20.在进行假设检验时,P值和α值的关系A.P值是研究者事先确定的B.P值和α值意义相同,且数值一定相等C.P值和α值意义相同,且数值不等D.P值和α值意义不同,且数值不等E.α值是研究者事先研究的√1.两独立样本均t检验,检验零假设为A.两样本均数无差别B.两总体均数无差别√C.两总体有差别D.两总体无差别E.两样本和总体均数均无差别2.由两样本均数t检验结果,P<0.05可认为A.两样本均数有差别B.两总体均数有差别√C.两样本和两总体均数的差别都具有实际意义D.两样本均数的差别具有实际意义E.两总体均数的差别具有实际意义3.两样本均数比较,差别具有统计学意义时,P值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两样本均数不同D.越有理由认为两总体均数不同E.越有理由认为两样本和总体均数差别都大√4.减少假设检验的Ⅱ类误差,应该使用的方法是A.减少Ⅰ类错误B.减少测量的系统误差C.减少测量的随机误差D.提高检验界值√E.增加样本含量5.两样本均数比较的t检验和z检验的主要差别是A.t检验只能用于小样本资料B.z检验要求大样本资料√C.t检验要求数据方差相同D.t检验的检验效能更高E.z检验能用于两大样本均数比较6.单样本t检验假设检验,查t界值表自由度为A.1B.∞C.n-1√D.n1+n2-1E.n1+n2-27.作单样本t检验假设检验,检验水准选下面哪个值,犯第Ⅱ类错误几率最小A.α=0.01B.α=0.05C.α=0.10D.α=0.15E.α=0.20√8.两样本均数比较的t检验不但要求资料服从正态分布,而且要求A.两样本均数相差不大B.两总体均数相差不大C.两样本方差相同D.两总体方差相同√E.两样本含量相等9.配对设计的目的是A.提高测量精度B.操作方便C.为了应用t检验D.提高组间可比性√E.减少实验误差10.对10名大学生分别用皮褶厚度仪测量左右前臂皮褶厚度,比较左右前臂皮褶厚度有无差别,可进行作A、成组设计检验B、成组设计t检验C、配对设计Z检验D、配对设计检验√E、χ2检验11.配对t检验中,治疗前数据减治疗后数据和治疗后数据减去治疗前数据,两次计算结果A、t值符号相反,结论相反B、t值符号相同,结论相同C、t值符号相反,但结论相同√D、t值符号相同,但大小不同,结论相反E、t值符号与结论无关12.当α=0.05,t>t0.05/2y,统计学上可认为A、两总体均数差别无统计学意义B、两样本均数有差别统计学意义C、两总体均数差别有统计学意义√D、两样本均数差别有统计学意义E、以上均不对13.抽样调查男生和女生各100名,并分别统计出身高与体重均数,其中同性别的身高与体重均数不可作假设检验,是因为A、资料不具备可比性√B、身高资料不呈正态分布C、体重资料不呈正态分布D、身高与体重方差不相等E、样本含量较小14.由10对数据组成的资料作配对检验,其自由度等于A、10B、20C、9√D、18E、1915、成组两样本均数作检验,其自由度等于A、12B、20C、30√D、31E、3216.测定尿铅含量有甲乙两种方法现用甲乙两法检测相同样品,结果如下要比较两法测得的结果有无差别,宜用10名患者的尿样分别用两法测定尿铅结果A.配对设计t检验√B.两样本均数的t检验C.两样本均数的z检验D.方差分析E.配对设计z检验17.测得10名正常人和10名病毒性肝炎患者血清转铁蛋白的含量g/L,结果如下,比较患者和正常人的转铁蛋白是否有显著性差别,用A.两样本均数的z检验B.样本均数与总体均数的t检验C.两样本均数的t检验D.配对设计t检验E.先作方差齐性检验,再决定检验方法√18.从9窝大鼠的每窝中选出同性别、体重相近的2只,分别喂以水解蛋白和酪蛋白饲料,4周后测定其体重增加量,结果如下,比较两种饲料对大鼠体重的增加有无显著性影响,宜用A.单因素方差分析B.方差分析C.配对设计t检验√D.两样本均数的t检验E.配对设计z检验19.已知正常人乙酰胆碱酯酶活力的平均数为1.44U,现测得10例慢性气管炎患者乙酰胆碱酯酶活力分别为:1.50,2.19,2.32,2.41,2.11,2.54,2.20,2.22 1.42,2.17欲比较慢性气管炎患者乙酰胆碱酯酶活力的总体均数与正常人有无显著性的差别,用A.两样本均数的t检验B.配对设计t检验C.两样本均数的z检验D.样本均数与总体均数的t检验√E.样本均数与总体均数的z检验1.完全随机设计方差分析的H0检验假设是A.各处理组样本均数相等B.各处理组总体均数相等√C.各处理组样本均数不相等D.各处理组总体均数不相等E.以上均不对2.方差分析的条件是A.各样本是相互独立的随机样本B.各样本来自正态分布总体C.各总体方差相等D.以上都是√E.以上都不是3.完全随机设计资料的方差分析中,错误的是A.SS总=SS组间+SS组内B.ν总=ν组间+ν组内C.MS总=MS组间+MS组内√D.MS组间>MS组内E.MS组间<MS组内4.完全随机设计方差分析中,组间均方是A.表示全部观测值的变异大小B.仅表示随机误差大小C.仅表示处理因素作用的大小D.表示处理因素和随机误差作用的大小√E.以上都不是5.当组数等于2时,对于完全随机设计和区组设计资料的方差分析与t检验结果A.完全等价,且F=tB.完全等价,且F=√tC.完全等价,且t=√F√D.t检验结果优于方差分析E.方差分析结果优于t检验6.若检验统计量F近似等于1,说明A.组间方差中不包含测量误差B.组内方差中不包含测量误差C.组间方差中不包含处理因素√D.方差分析应拒绝原假设E.方差分析中应接受原假设7.方差分析中,获得P<0.05时,结论是A.证明各总体均数都不相等B.证明各总体均数不全相等C.可认为各总体均数都不相等D.可认为各总体均数不全相等√E.以上都不是8.多样本均数比较经方差分析后,P<0.05,为进一步弄清四个均数彼此之间是否相等,可采用以下哪种分析?A.卡方检验B.t检验C.SNK-q检验√D.秩和检验E.Z检验9.适用于多个实验组与一个对照均数间的比较方法为A.LSD-t检验B.SNK-q检验C.Dunnett-t检验√D.三者皆是E.三者皆不是10.设某实验设计因素A有K个水平,观测指标为连续性数据变量资料,且满足各种参数检验的前提条件用多次检验取代方差分析和q检验,将会A.增大犯第I类错误的概率√B.增大犯第II类错误的概率C.增大犯第I、II类错误的概率D.使计算过程更加简便E.使结论更加具体11.方差分析中,组内变异反映的是A.测量误差B.个体差异C.随机误差,包括个体差异及测量误差D.抽样误差√E.系统误差12.方差分析中,组间变异主要反映A.随机误差B.处理因素的作用√C.抽样误差D.测量误差E.个体差异1.某研究室用甲乙两种血清学方法检查422例确诊的鼻咽癌患者,得结果如下表.分析两种检验结果之间有无差别,检验公式是:甲乙两种血清学方法检查结果2.有20例急性心肌梗塞并发休克病人,分别采用西药和中西药结合的方法抢救,疗效如下,比较两组病死率有无差别,宜用A.两样本率的u检验B.四格表的χ2检验C.四格表的校正χ2检验D.2×2表的χ2检验E.四格表的确切概率法√3.某山区小学男生80人,其中肺吸虫感染23人,感染率为28.75%;女生85人,感染13人,感染率为15.29%,如比较男女生的肺吸虫感染率有无差别,可用:A.两样本率的u检验B.四格表的χ2检验C.2×2表的χ2检验D.四格表的确切概率法E.以上方法均可√4.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数为:A.T11B.T12C.T21√D.T22E.T135.χ2检验的自由度为:A.n-1B.1C.n-kD.R-1C-1√E.n1+n2-26.四格表χ2检验校正公式适用于A.n<40,T﹥5B.n<40,1<T<5C.n﹥40,T<5D.n﹥40,1<T<5 √E.以上都不对7.某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人该资料宜选用的统计方法为A.四格表χ2检验√B.四格表校正χ2检验C.t检验D.u检验E.方差分析8.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别√C.推断两个样本率和两个总体率有无差别D.推断两个总体分布是否相同E.推断两个样本率和两个总体率的差别有无统计意义9.由两样本率的差别推断两总体率的差别,若P<0.05,则A.两样本率差别很大B.两总体率差别很大C.两样本率和两总体率差别有统计意义D.两总体率差别有统计意义√E.其中一个样本率和总体率的差别有统计意义10.四格表资料中的实际数与理论数分别用A与T表示,其基本公式与专用公式求χ2的条件为A.A≥5B.T≥5C.A≥5且T≥5D.A≥5且n≥40E.T≥5且n≥40√11.三个样本率比较得到χ2>χ20.01,2,可以为A.三个总体率不同或不全相同√B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同12.四格表χ2检验的基本公式应用条件为A.n≥40且T>5 √B.n<40且T>5C.n≥40且1<T<5D.n<40且1<T<5E.n>40且T<113.下表是甲、乙两医院治疗同一种疾病的情况,如比较甲、乙两医院的总治愈率有无差别,应用:甲、乙两医院的治愈率比较A.按病情轻重分别比较B.四格表的X2检验C.两样本率的u检验D.四格表的确切概率法E.先作率的标准化,再对标化率作假设检验√。
医学统计学复习资料(完整版)
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学试题 (2)
医学统计学试题一.选择题(每题2分,共20分)1、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A、n1+n2B、n1+n2-1C、n1+n2+1D、n1+n2-22、标准误反映()A、抽样误差的大小B、总体参数的波动大小C、重复实验准确度的高低D、数据的离散程度3、最小二乘法是指各实测点到回归直线的()A、垂直距离的平方和最小B、垂直距离最小C、纵向距离的平方和最小D、纵向距离最小4、用样本推论总体,具有代表性的样本指的是()A、总体中最容易获得的部分个体B、在总体中随意抽取任意个体C、依照随机原则抽取总体中的部分个体D、用配对方法抽取的部分个体5、随机误差指的是()A、测量不准引起的误差B、由操作失误引起的误差C、选择样本不当引起的误差D、由偶然因素引起的误差6、某项指标95%医学参考值范围表示的是()A、检测指标在此范围,判断“异常”正确的概率大于或等于95%B、检测指标在此范围,判断“正常”正确的概率大于或等于95%C、在“异常”总体中有95%的人在此范围之外D、在“正常”总体中有95%的人在此范围7、从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文χ2χ20.01,1,乙文χ2χ20.05,1,可认为()A、两文结果完全相同B、甲文结果更为可信C、乙文结果更为可信D、甲文说明总体的差异较大8、两样本均数比较的t检验和u检验的主要差别是()A、t检验只能用于小样本资料B、u检验要求大样本资料C、t检验要求数据方差相同D、u检验能用于两大样本均数比较9、对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是()A、适用范围广B、检验效能高C、检验结果更准确D、不易出现假阴性错误10、两数值变量相关关系越强,表示()A、相关关系越大B、相关系数越大C、回归系数越大D、相关系数检验统计量t值越大[参考答案]1-5:DACCD 6-10:DBBAB二.名词解释(每题4分,共20分)1、偏回归系数2、Ⅱ型错误:3、非参数检验:4、残差平方和/剩余平方和:5、率的标准误:[参考答案]1.表示其他自变量保持不变时,X j增加或减少一个单位引起的Y的变化量。
医学统计学复习资料(2)
医学统计学复习资料(2)i ed医学统计学复习资料一、名词解释题1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
复习资料(医学统计)
复习资料第一大题:单项选择题1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()∙ A. 样本∙ B. 有限总体∙ C. 无限总体∙ D. 个体2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为98.67cm,标准差为4.63cm,头围均数为46.23cm,标准差为3.16cm,欲比较两者的变异程度,下列结论正确的是:()∙ A. 身高变异程度大∙ B. 头围变异程度大∙ C. 身高和头围的变异程度相同∙ D. 由于两者的均数相差很大,无法比较两者的变异程度3、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )∙ A. 会变小∙ B. 会变大∙ C. 不变∙ D. 会出现负值4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )∙ A. 概率∙ B. 构成比∙C. 发病率∙D. 相对比5、两个分类变量的频数表资料作关联性分析,可用( )∙A. 积距相关或等级相关∙B. 积距相关或列联系数∙C. 列联系数或等级相关∙D. 只有等级相关6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:∙A. 越大∙B. 越小∙C. 比r小∙D. 可能较大也可能较小7、多组均数的两两比较中,若不用q检验而用t 检验,则:()∙A. 结果更合理∙B. 结果一样∙C. 会把一些无差别的总体判断为有差别∙D. 会把一些有差别的总体判断为无差别8、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()∙A. -3.5,3.5∙ B. -3.5,-3.5∙ C. 3.5,3.5∙ D. -3,49、Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)回归方程,若体重换成国际单位kg,则此方程:()∙ A. 截距改变∙ B. 回归系数改变∙ C. 两者都改变∙ D. 两者都不变10、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。
医学统计学习题二
医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学试题及参考答案 1、2、3套
医学统计学试题及答案1、2、3套第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B)A条图B百分条图或圆图C线图D直方图2、均数和标准差可全面描述D资料的特征A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A)A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价D不能作评价4、比较身高与体重两组数据变异大小宜采用(A)A变异系数B方差C标准差D四分位间距5、产生均数有抽样误差的根本原因是(A)A.个体差异B.群体差异C.样本均数不同D.总体均数不同6.男性吸烟率是女性的10倍,该指标为(A)(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为(D)A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C.A和B均不是D.A和B均是8、两样本均数比较用t检验,其目的是检验(C)A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D)(A)n1+n2(B)n1+n2–1(C)n1+n2+1(D)n1+n2-210、标准误反映(A)A抽样误差的大小B总体参数的波动大小C重复实验准确度的高低D数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr ,对回归系数检验的t值为tb,二者之间具有什么关系?(C)Atr >tbBtr<tbCtr=tbD二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D)A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为(A)A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
医学统计考试资料2
医学统计考试资料2医学统计学名词解释:1.标准差:方差开方,是描述数据分布离散程度(或变量变化的变异程度)的指标。
2.相对数:为了使计数资料具有可比性,取原始的两个资料(绝对数)之比所得指标统称为相对数。
3.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
4.标准化率法:为了在比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(如年龄、性别、工龄、病程长短等)的影响。
5.x方检验:是英国统计学家Pearson提出的一种用途广泛的假设检验方法。
该检验以X2分布为理论依据,可以推断两个(或多个)总体率以及构成比之间有无差别。
6.参数统计:指在总体分布类型已知(如正态分布)的条件下对其未知参数进行检验称为参数统计。
7.非参数统计:一种不依赖总体分布的具体形式的统计方法即在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计方法。
8.回归系数:X每变化1个单位Y所平均变化的单位数9.相关系数:说明具有直线关系的两个变量间相关密切成都和相关方向的统计量。
10.小概率事件:在一次实践中几乎不会发生的事件(P≤0.05或P≤0.01的事件)11.百分位数:把一组测定值按大小的顺序排好,位臵百分之一位的观察值或是一种位臵指标,用Px表示,一个百分位数按大小顺序排列的变量值分为100份,理论上有x%的变量值比它小,有(100—x)%的变量值比它大,对应x%位次的数值。
12.可比性:N个样本比较,除处理目标不同外,其他对结果有影响的主要非外理因素要求基本相同。
13.发病率:某一时期内特定人群中患某病新病例的频率14.患病率:某一时点人群中患某病的频率(检查时发现的新老病例)15.臵信区间:一个范围指包涵总体指标可信度来计算的范围16.变量:对某项变异特征进行测量和观察,得到的指标称为变量。
17.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
医学统计学第3版,02计量资料的统计描述试题
第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
医学统计考试资料
1.统计工作的基本步骤是什么?一、设计要求; 科学、周密、简明二、搜集资料要求;完整、准确、及时三、整理资料步骤;审核、分组、汇总四、分析资料内容;1、统计描述、2、统计推断第一步设计:制定计划,对整个过程进行安排。
是整个工作的关键。
如何进行设计?举例。
背景-目的-方法-内容-经费预算第二步收集资料(现场调查):根据计划取得可靠、完整的资料。
收集资料的方法有三种:统计报表、日常性工作、专题调查。
注重资料的真实性。
第三步整理资料:原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。
可借助于计算机(常用软件:EPI、SPSS、SAS)。
第四步分析资料(统计分析):统计学的关键所在。
运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。
统计中的几个基本概念2.统计资料分为几类?特点?1.计量资料通过测量所获得的资料,一般用度量衡单位2.计数资料根据性质或类别进行分类的资料,一般不是有度量衡单位3.等级分组资料计量与计数资料之间的一类资料,即半定量资料判断:大学教授的年收入,欧洲的国家数,血红蛋白含量,患病人数等。
资料的相互转换(1)测得一群人Hb值(g/L),此资料为计量资料;(2)按正常和异常分为两组,此时资料为根据性质或类别进行分类的资料,一般不是有度量衡单位;(3)按量的多少分为: < 60 (重度贫血), 60 ~ (中度贫血), 90 ~ (轻度贫血), 12 0~ 160 (正常)及> 160 (Hb增高)。
此时资料为等级分组资料。
3.什么是总体?什么是样本?总体:是根据研究目的确定的同质观察单位的全体,可分为有限总体与无限总体。
样本:是总体中随机抽取的一部分.4.什么是小概率事件?事件A发生的概率是如此之小,以至于在一次试验(抽样)时,我们往往认为它(事件A)不会发生。
5.什么是抽样误差?如何减小?能否避免?抽样误差---由抽样而引起的样本指标与总体指标之差一般来说,样本含量越大,则抽样误差越小。
医学统计学试题及答案 (2)
医学统计学试题及答案习题《医学统计学》第二版(五年制临床医学等本科生用)(一)单项选择题1.观察单位为研究中的( d )。
A.样本 B. 全部对象 C.影响因素 D. 个体2.总体是由( c )。
A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成3.抽样的目的是(b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差 C.几何均数 D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
医学统计学考题(按章节)第2题【20分】__X方检验
二、两样本率比较(X2检验或确切概率法)(20分)题干由试题和相关SPSS分析结果组成1、根据资料选择正确的统计检验方法;2、列出计算表;3、请写出假设检验步骤:检验假设,检验水准,列出计算公式,根据SPSS结果选择正确的统计量值和P值、并作出结果判断。
1、成组设计四格表资料χ2检验四格表χ2检验的条件:n :为总例数;A:为(所有各各中的)实际数;T:为(所有各各中的)理论数。
n,T。
可先求四格表中最小的理论数。
(1)T≥ 5,而且n ≥ 40 ---------直接用χ2检验(2)1 ≤ T< 5,而且n ≥ 40------校正χ2检验(3)T < 1 或n < 40-----------确切概率法注意:上述条件是以理论数为依据,而非实际数检验的适用条件及四格表专用公式:表3.5 两种药物治疗十二指肠球部溃疡效果处理愈合未愈合合计愈合率(%)呋喃硝胺组甲氰咪胍组合计54(48.22) 8(13.78) 62 87.10 44(49.78) 20(14.22) 64 68.75 98 28 126 77.78四格表χ2检验——Pearson χ2某医学院随机抽查四年级和五年级学生的近视眼患病情况如下表,问两个年级的近视眼患病率有无差别?四年级28 2 7.14五年级14 5 35.71四年级和五年级学生的近视眼患病患病率比较计算表年级 近视人数 无近视人数合计四年级 2 26 28 五年级 5 9 14 合计7 354233.242147T min =⨯=四格表校正χ2检验例:某防疫站观察当地的一个污水排放口,在高温季节和低温季节水样的伤寒菌检出情况,资料如下表,问两个季节污水的伤寒菌检出率有无差别?高低温季节污水中伤寒菌的检出率 季节气温阳性水样数 阴性水样数 合计 阳性率(%)高 1(4) 11(8) 12 8.33 低 7(4) 5(8) 12 58.33 合计8162433.33四格表确切概率法:表3.5 两种药物治疗十二指肠球部溃疡效果处理 愈合 未愈合 合计 愈合率(%) 呋喃硝胺组 甲氰咪胍组 合计 54(48.22) 8(13.78) 62 87.10 44(49.78) 20(14.22) 64 68.75 98 28 126 77.782、配对设计四格表资料χ2检验已确诊肝癌患者100人,每个患者分别用甲、乙两法检测AFP,结果如下表。
《医学统计学》考试试题及答案大全02
(A)95%
(B)49.5% (C)99%
(D)97%
11.两样本均数间的差别的假设检验时,查 t 界值表的自由度为 C
(A)n-1
(B)(r-1)(c-1)
(C)n1+n2-2
(D)1
12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A
(A)总体中个体值存在差别
(B)样本中个体值存在差别
(C)样本只含总体的一部分
(D)总体均数不等于0
13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错
误最小 B
(A)α=0.05 (B)α=0.20
(C)α=0.01
(D)α=0.10
14.比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 C 。
(A)线图 (B)条图 (C)半对数线图 (D)圆图
20.同一双变量资料,进行直线相关与回归分析,有 B
(A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b
二、填空题 12分
1、 统计资料按其性质不同,通常将资料分为 (计量、计数、等级 ) 三 种类型。 2、 统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四
答:不能,因为 P 值的大小与总体指标间差异大小不完全等同。P 值的大 小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽 样误差大小不同,所得的 P 也会不一样,抽样误差大小实际工作中主要 反映在样本量大小上。
五、计算分析题
1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。
4
33.3
4
33.3
合计 72
医学统计学考试复习资料
医学统计学考试复习资料一、统计学(statistics) ---是搜集资料、整理资料、分析资料,并且据此作出决策的一门学科。
医学统计学(medical statistics) --- 是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理、分析,并且作出决策。
从而掌握事物内在客观规律的一门学科。
二、医学统计工作可分为四个步骤:1、统计设计(第一步也是关键一步);2、搜集资料(资料来源:统计报表,医疗卫生工作记录,专题调查或实验研究);3、整理资料(审核,分组,汇总);4、分析资料(统计描述,统计推断)。
三、频数分布图的步骤,用途:步骤:1、计算全距;2、确定组距;3、划分组段;4、统计频数;5、频率与累计频率。
用途:①反映频数分布的类型。
②描述频数分布的特征。
③便于发现极端值:如极大值、或极小值。
④便于进一步进行统计分析。
四、集中趋势与离散趋势的概念、特点及应用条件:集中趋势:反映一组数据的平均水平的指标。
(1)算术均数:应用条件:①正态分布的数据;②对称分布的数据。
(2)几何均数:适用条件:对于变量值呈倍数关系或呈对数正态分布。
(3)中位数:应用条件:①偏态分布②分布不明③有极端值④有开口的资料。
特点:不受极端值影响。
(4)百分位数:应用条件:①描述一组资料在某百分位置上的水平;②用于确定正常值范围;③计算四分位数间距。
(5)众数:一组观察值中出现次数最多的那个数值,可以没有也可以不止一个。
离散趋势:反映一组数据离散或分散的水平的指标。
(1)极差:全距=最大值-最小值。
优点:计算简单方便,应用广范,容易理解。
缺点:只反映两端数据最大最小值的差别,易受极端值的影响,不能反映组内其他变量离散情况。
(2)四分位数间距:Q=P75-P25。
优点:不受极端值影响,比极差R 稳定。
缺点:计算繁琐、不易理解、只反映中间50%的数据的两端的差值(3)方差的特点:①充分反映了每一个数据与平均数的差别;② S2指标很稳定;③S2应用广泛;④S2计算比较麻烦;⑤S2单位是原单位的平方,在实际应用时不太方便。
医学统计学试题 (2)
一、简答题(每题6分,共60分)1、配对比较的假设检验,符合参数检验条件,能否出现t检验结果P>0.05;而非参数检验P<0.05的结果?如果出现上述情况,此时应该怎样解释检验结果?有可能,因为非参数检验检验效能低(具体自己she)2、某市为了解该地居民发汞(μmol/kg)的基础水平,为汞污染的坏境监测积累资料,对238名留住该市一年以上,无汞作业接触史,无明显肝、肾疾病的居民进行了调查,结果见表1:表1:238名居民发汞含量(μmol/kg)发汞含量1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~21.5人数20 66 60 48 18 16 6 1 0 3(1)说明此频数分布的特征;选用何中指标描述其集中趋势和离散趋势较好?分布特征:正偏态分布。
描述集中趋势的指标:几何均数;or中位数?(不确定)描述离散趋势的指标:四分位数间距(2)计算该地居民发汞值的95%正常值范围(只写公式,不必计算)。
因为资料呈负偏态分布,故应使用百分位数法计算参数范围,因为发汞过高为异常,应制定单侧95%参考范围。
用公式:P x=L X+i*(n x% —∑f x)/f x3、标淮差与标准误之间的联系与区别是什么?具体答案详见教材75页。
4、某医师对某年某医院的住院病人按不同 职业进行分组统计,结果见表2。
该医 师得到结论:全体病人中工人占75%, 农民占10%。
因此,工人比农民更容易 患病,提示工人的健康状况应受到重视。
你认为这种说法是否合理?若不合理, 为什么?不合理,因为该医师所计算的指标是构成比,只能说明全体病人中,工人、农民及其他所占的比重,不能说明3种职业患病的频率或强度,该医师犯了以构成比代替率的错误。
4、某年级一班、二班各有学生50人。
从两个半各抽取10人测量身高,并求其平均身高。
如果一班平均身高160cm ,二班平均身高154cm ,能否认为一班学生的平均身高高于二班?为什么? 不能进行此推论,理由如下。
医学统计学题二
医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学试题及答案2
《医学统计学》课程考试试题(B卷)(评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷)注意:第1-80小题的答案全部涂到答题卡上。
一、选择题(每题1分,共55分,只选一个正确答案)1、下列指标中不属于离散趋势的指标()A.样本均数 B.方差 C.全距 D.离均差平方和2、计量资料编制频数表时,组段数的选择()A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关3、比较一组人群身高与体重的变异度应选()A.极差 B.方差 C.标准差 D.变异系数4、若要用标准差描述资料的离散趋势,对资料的要求是()A.未知分布类型的资料 B.等级资料C.呈倍数关系的资料 D.正态分布资料5、频数分布两端有超限值时,描述其集中趋势的指标是()A.标准差 B.几何均数 C.相关系数 D.中位数6、医学统计工作的步骤是()A、研究设计、收集资料、整理资料和分析资料B、计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析,统计描述和统计推断D、选择对象、计算均数、参数估计和假设检验7、下列关于变异系数的说法,其正确的是()A.比较均数相差较大的两组或多组资料的变异程度B.描述一组资料的离散趋势C.其度量横单位与均数的度量衡单位一致 D.其度量横单位与标准差的度量衡单位一致8、10名食物中毒的病人潜伏时间(小时)分别为3,4,5,3,2,5.5,2.5,6,6.5,7,其中位数是()A.4 B.4.5 C.3 D.2 9、调查一组正常成人的白细胞数,如果资料属于正态分布,描述这组资料集中趋势的指标为()A.中位数 B.算术均数 C.二者均不可 D.二者均可10、正态分布曲线下,当μ不变,σ变大时,()A.曲线形态不变,中心位置向左移 B.曲线形态不变,中心位置向右移C.曲线形态变的矮胖,中心位置不变 D.曲线形态变的瘦高,中心位置不变11、用于描述一组对称分布资料全部观察值变异程度大小的指标是()A.S B.R C. D.CV12、下列指标中,不属于集中趋势指标的是()A.算术均数 B.中位数 C.变异系数 D.几何均数13、总体是由()组成A.部分个体 B.全部个体 C.相同的观察指标 D.同质个体的所有变量值14、随着样本例数的增大,样本标准差()A.增大 B.减小 C.不变 D.与总体标准差更加接近15、抽样误差产生的原因是()A.资料不是正态分布 B.个体变异 C.仪器测量不准确D.观察对象不纯16、观察单位为研究中的()A.样本 B.全部对象 C.个体 D.观察指标17、变异系数CV是()A.构成比 B.率 C.标准差 D.相对比18、各观察值同加上一个不等于0的常数后,()不变A、算术均数B、标准差C、几何均数D、变异系数19、下列资料()为等级资料A、体重B、血型C、某病发病率D、病人的病情分级20、标准正态分布曲线下,0到2.58的面积为()A.90% B.95% C.49.5% D.50%21、测定一组人群的听力,已知听力过低为异常,若制定其医学参考值范围,应选择()A.单侧上限 B.单侧下限 C.双侧 D.单侧22、关于医学参考值范围的制定,下列说法正确的是()A.样本例数不能太少 B.只能选95%的百分界限C.不受资料分布类型的限制 D.选择单侧和双侧的结果是一样的23、正常成年男子收缩压的医学参考值范围一般指()A、所有正常成年男子收缩压的最小值到最大值范围B、绝大多数正常成年男子收缩压的波动范围C、所有正常成年男子收缩压的波动范围D、少部分正常成年男子收缩压的波动范围24、有关样本均数的标准误,下列说法正确的是()A.与样本例数的大小无关 B.表示样本均数离散趋势的大小C.表示样本变量值差异的大小 D.与样本所代表的总体变量值的离散趋势无关25、下列哪项不是样本均数标准误的用途()A.可用来计算总体均数的可信区间 B.可表示样本均数抽样误差的大小C.可用来计算医学参考值范围 D. 可用于均数假设检验的计算.26.t分布曲线随自由度的增大()A.曲线下的总面积变小 B.曲线的中心位置向左移C.曲线的高峰变低,尾部翘得较高 D.曲线的高峰变高,尾部翘得较低27.自由度一定的t分布曲,当t值增大时,其尾部面积()A.变小 B.变大 C.不变 D.不清楚28、总体均数95%的可信区间主要是用于()A.估计总体均数有95%的可能性在此区间内 B.反映某指标的可能取值范围C.95%的样本均数在此范围内 D.确定医学参考值范围29、要提高总体均数可信区间的把握度与精确度,最好的方法是()A.改变计算公式 B.减小样本例数 C.增加样本例数 D.样本例数保持不变30、假设检验中,确定单双侧的依据是()A.资料的类型B.计算出统计量后再作决定C.专业知识或研究目的D.检验水准的大小31.样本均数与已知总体均数比较的目的是()A.推断未知总体均数是否小于零 B.推断已知总体均数与未知总体均数是否相等C.推断样本均数与未知总体均数是否相等 D.推断未知总体均数是否为负数32、配对设计的目的是()A.提高组间可比性 B.计算简便 C.易于理解 D.为了使用t检验33、配对设计t检验的目的是()A.推断差数的总体均数是否等于零.B.推断差数的样本均数是否等于零.C.推断差数的总体均数是否大于1. D.推断差数的样本均数是否大于1.34、两样本均数t检验的目的是()A.推断两总体均数是否相等.B.推断两样本均数是否相等.C.推断两总体例数是否相等. D.推断两样本例数是否相等.35、甲乙两人分别从同一总体中抽得30个变量值作为两个样本,求得、S12,、S22,则有()A、做两样本t检验,必然得差别无统计学意义的结论B、做两样本t检验,必然得差别有统计学意义的结论C、分别有甲、乙两样本求出的总体均数的95%的可信区间,必然有重叠D、分别有甲、乙两样本求出的总体均数的95%的可信区间,很可能有重叠36、两样本均数的t检验,若两样本例数分别为n1和n2,自由度为()A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-237、反映某现象发生的频率或者强度的指标宜采用()A.构成比 B.率 C.相对比 D.标准化率38、某地某年冠心病的发病人数占同年心血管疾病病人数的15%,该指标为()A.构成比 B.率 C.相对比 D.发病率39、甲乙两地进行高血压发病率的比较,需要进行率的标准化的情况有()A.年龄内部构成不同 B.年龄内部构成相同C.两地的发病率相差太大 D.两地各年龄组的发病率相差不大40、甲、乙两组资料进行率的标准化时,选择标准人口数或选择该标准人口数换算成相应的标准人口构成比,两方法得出的结论()A.相同 B.甲组标化率大于乙组标化率C.不同 D.甲组标化率小于乙组标化率41、某医师给某地全部的麻疹易感儿童进行免疫接种,共有3000人,一个月后,从中随机抽取400人进行抗体水平的测定,其中阳性人数是200人,若计算该疫苗接种的阳性率,其数值为()A.10% B.25% C.50% D.60%42、某医师从工人与干部两个总体中进行高血压发病情况的抽样研究,样本例数为n1、n2 ,高血压的患病人数为x1、x2 ,则两样本合计的高血压发病率为()A.x1/ n1 B.x2 / n2 C.x1 / n1+ x2 / n2 D.(x1+x2)/ (n1+n2)43、有关样本率的标准误,下例错误的是()A.表示样本率围绕总体率的离散趋势B.表示样本率相互之间的离散趋势C.表示样本率抽样误差的大小D.表示样本阳性率与样本阴性率之间的差异44、总体率估计的最佳方法是()A.点值估计 B.区间估计 C.概率估计 D.频率估计45、值是反映实际频数与理论频数()A.相差多少的指标 B.吻合程度的指标 C.是否相等的指标D.以上均不对46、四格表检验时,不需要进行连续性校正的条件是()A.n≥40, T≥5 B.n<40,1≤T<5 C.n≥40,T<1 D.n ≥40,1≤T<547、四格表资料的检验,理论频数T的计算是根据()A.π1 =π2 B.π1≠π2 C.π1<π2 D.π1 >π248、用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用()A.行X列表资料的检验 B.配对设计四格表检验C.t检验 D.两样本率比较的四格表检验49、4个样本率作比较,< 0.05,3,则在α=0.05检验水准下,可认为()A.各总体率不等或不全相等 B.各总体率均相等C.各样本率均相等 D.各样本率不全等50、相关系数是表示两变量x与y之间()A .有无数量关系的指标 B.那个变量较大的指标 C.有无依存关系的指标 D.相关关系的密切程度与相关方向的指标51、相关系数假设检验的备择假设是()A .ρ≠0 B.ρ=0 C.β≠0 D.β=052、相关系数假设检验的自由度为()A.n - 1 B.n - 2 C.n D.n + 1 53.最小二乘法原理是()A.各实测点距所求直线的纵向距离最小B.各实测点距所求直线的纵向距离相等C.各实测点距所求直线的纵向距离平方和最小D.各实测点距所求直线的垂直距离平方和最小54、对于同一资料的直线相关系数和直线回归系数,下列论断正确的是()A.相关系数越小,回归系数也越小 B.相关系数与回归系数无关系C.回归系数有单位,相关系数没有单位 D.样本相关系数为0时,样本回归系数也为055、关于回归系数b,下列说法错误的是()A.是直线回归方程的斜率 B.同一资料x作自变量与y作自变量计算的b相等C.取值范围为 (-∞,+∞) D.b>0时,随x的增大y也增大二、判断题(若正确,请在答题卡上涂A,若错误,请在答题卡上涂B,每题1分,共17分)56、绘制计量资料的频数表时,各组段的组距可以相等,也可以不等。
医学统计学部分试题及复习资料
第一章绪论1.下列关于概率的说法,错误的是A. 通常用P表示B. 大小在0%及100%之间C. 某事件发生的频率即概率D. 在实际工作中,概率是难以获得的E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件[参考答案] C. 某事件发生的频率即概率2.下列有关个人基本信息的指标中,属于有序分类变量的是A. 学历B. 民族C. 血型D. 职业E. 身高[参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是A. 性别B. 民族C. 职业D. 血型E. 身高[参考答案] E. 身高4.下列关于总体与样本的说法,不正确的是A. 个体间的同质性是构成总体的必备条件B. 总体是根据研究目的所确定的观察单位的集合C. 总体通常有无限总体与有限总体之分D. 一般而言,参数难以测定,仅能根据样本估计E. 从总体中抽取的样本一定能代表该总体[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是A. 所有糖尿病患者B. 所有成都市居民C. 2007年所有成都市居民D. 2007年成都市居民中的糖尿病患者E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民6.简述小概率事件原理。
答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。
答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的答:研究人员通常需要了解与研究某一类个体,这个类就是总体。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学名词解释:1.标准差:方差开方,是描述数据分布离散程度(或变量变化的变异程度)的指标。
2.相对数:为了使计数资料具有可比性,取原始的两个资料(绝对数)之比所得指标统称为相对数。
3.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
4.标准化率法:为了在比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(如年龄、性别、工龄、病程长短等)的影响。
5.x方检验:是英国统计学家Pearson提出的一种用途广泛的假设检验方法。
该检验以X2分布为理论依据,可以推断两个(或多个)总体率以及构成比之间有无差别。
6.参数统计:指在总体分布类型已知(如正态分布)的条件下对其未知参数进行检验称为参数统计。
7.非参数统计:一种不依赖总体分布的具体形式的统计方法即在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计方法。
8.回归系数:X每变化1个单位Y所平均变化的单位数9.相关系数:说明具有直线关系的两个变量间相关密切成都和相关方向的统计量。
10.小概率事件:在一次实践中几乎不会发生的事件(P≤0.05或P≤0.01的事件)11.百分位数:把一组测定值按大小的顺序排好,位臵百分之一位的观察值或是一种位臵指标,用Px表示,一个百分位数按大小顺序排列的变量值分为100份,理论上有x%的变量值比它小,有(100—x)%的变量值比它大,对应x%位次的数值。
12.可比性:N个样本比较,除处理目标不同外,其他对结果有影响的主要非外理因素要求基本相同。
13.发病率:某一时期内特定人群中患某病新病例的频率14.患病率:某一时点人群中患某病的频率(检查时发现的新老病例)15.臵信区间:一个范围指包涵总体指标可信度来计算的范围16.变量:对某项变异特征进行测量和观察,得到的指标称为变量。
17.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
18.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得观察单位数称为等级资料。
19.频数表:当变量值个数较多时,可将各变量值及其相应的频数列表称为频数表。
20.极差:又称全距,指所有观察值中最大值与最小值的差值。
21.四分位数间距:变量值中上四分位P75与下四分位数P25的差值。
22.方差:各个变量值的离均差平方和与样本例数之比,描述资料的离散趋势。
23.变异系数:样本标准差与均数之比的百分数,描述资料的离散趋势24.集中趋势:所有观察值向均数集中靠拢的趋势。
25.离散趋势:是指观察值的参差不齐或者分散性。
26.自由度:随机变量能自由取值的个数。
27.检验水准:亦称显著性水准,用α表示,是预先规定的概率值。
28.P值:从Ho规定的总体随机抽得等于或大于(或≤)现有样本统计量值的概率。
29.第I类错误:拒绝了实际上成立的Ho,即”弃真”的错误。
30.第II类错误:接受了实际上不成立的Ho,即“存伪”的错误31.偏回归系数:是指多重回归方程中的bj(j=1,2,…,p)。
它表示在其它自变量固定条件下,Xj每增减一个单位对Y的效应(Y增减b个单位),即自变量对应变量的影响程度。
32.复相关系数:R,表示P个自变量共同对应变量线性相关的密切程度。
0≤R≤1.33.确定系数:R2=SS回归/SS总,在y的总变异中,由x变量组建立的线性回归方程所能解释的比例。
34.直条图:用等宽直条的长短来表示相互独立的各项指标的数值大小,如发病率等。
35.直方图:用直方面积的大小表示数值变量资料频数分布的情况。
36.对照原则:通过对照组效应鉴别出实验组效应大小;控制乃至消除非实验因素的影响,显露真正的实验效应;通过对照还可减少或消除实验误差。
37.均衡原则:要求实验中的各组之间除处理因素不同外,要尽可能控制非处理因素,是使实验组与对照组在非处理因素方面基本一致,具有齐同可比性。
38.随机原则:尽量使各实验组之间各种非处理因素分布一致,即提高组间均衡性,尽量减少偏倚,将一些不可控制的因素的总效应归并到总的实验误差中。
39.重复原则:要在相同实验条件下进行多次观察。
填空题:1.正态分布用N(u,σ)表示,为了应用方便,常对变量X作变量变换,使u=0,σ=1,则正态分布转变为标准正态分布,用 0,1 表示。
2.正态曲线下面积的分布有一定规律,理论上u+σ、u±1.96σ和u±2.58σ,区间的面积(观察单位数)各占总面积(总观察单位数)的 68.27% 、 95% 和99% ,可用于估计医学参考值范围和质量控制方面。
3.标准正态曲线下,区间(-1.96,0)的面积占总面积的47.5%。
4.用均数和标准差可全面描述正态分布资料的特征。
5.为了说明离散程度应选用变异指标,常用的变异指标有全距、方差、标准差和变异系数。
6.正常值范围的意义是指绝大多数正常人的变量均在此范围中,这个绝大多数习惯上包括正常人的 80% 、 90% 、 95% 、 99% 而最常用的是 95% 。
7.对于正态分布的资料,在u±1.96,u±2.58区间内的变量值,其出现的概率分别为 95% 和 99% 。
8.频数分布的两个重要特征是指集中趋势和离散趋势,可全面地分析研究的食物。
9.偏态分布资料宜计算中位数以表示其平均水平。
10.平均数的计算和应用必须具备同质基础、合理分组,否则平均数是没有意义。
11.正态分布有以下的特征①正态曲线在横轴上方,且均数所在处最高。
②正态分布以均数为中心左右对称。
③正态分布有两个参数即 u 和σ。
④正态分布的面积有一定的规律性。
12.描述一组正态分布资料的变异度,以标准差指标为好。
13.变异系数CV常用于比较单位不同或均数相差较大的两组或多组资料的变异程度。
14.统计学上用标准差表示均数抽样误差的大小。
15.决定t分布的参数为自由度,其为无穷大时,t分布等于u分布。
15.对总体所作的假设进行统计推断,作出拒绝或接受假设的结论的方法,称假设检验(显著性检验)。
16.两样本均数比较,经t检验差别有显著性时,P越小,说明两总体均数不同的可能性越大。
17.可同时减少第一类错误和第二类错误的方法为增加样本含量 .18.应用t检验时,资料应符合①样本随机取自正态总体,②各样本总体方差齐性。
19.标准误越小,表示样本均数对总体均数估计越可靠。
20..统计推断包括总体参数估计和假设检验两方面。
21.假设检验中,不拒绝Ho时,可发生第二类错误(Ⅱ型错误)错误,其概率用β表示。
拒绝Ho时,可发生第一类错误(Ⅰ型错误)错误,其概率用α表示。
22.多个样本均数比较用方差分析,其资料应符合下列条件:. 各样本是相互独立的随机样本、各样本来自正态总体和处理组总体方差相等(方差齐性)。
23.完全随机设计方差分析把总变异分成组内变异和组间变异。
24.常见的方差分析类型(设计)有:完全随机设计(单因素)方差分析、随机区组设计(双因素)方差分析、交叉设计方差分析、重复测量资料方差分析、析因设计方差分析、正交设计方差分析、拉丁方设计方差分析、重复测量资料方差分析、方差齐性检验、回归效应分析(任选其三)等。
25.在单因素方差分析中,其各自由度之间的关系是 V总=V组间+V组内。
26.常用的相对数有率、构成比和相对比。
27.反映某现象实际发生频数与可能发生频数的比值可选用率。
28.分析时不能以构成比代替率,构成比只能说明事物各组成部分的比重和分布,不能说明某现象发生的频率与强度。
29.率的标准化母的是消除混杂因素对结果影响。
30.从同一总体中随机抽出观察单位相等的多个样本,样本率与总体率,各样本率之间往往有差异,这种差异被称作率的抽样误差,用σρ和S P 表示。
33.四格表若有理论数小于1或n<40宜用确切概率法(精确X2)法。
31.行×列表X2检验若有T<1或1<T<5的格子数占格子数1/5以上,其最好的处理办法是增加样本含量。
32.四格表X2值校正检验条件为 n≥40 1≤T<5 。
33.配对资料的X2检验,当 b+c≤40 时,需计算校正X2值。
34.非参数检验主要优点是不受总体分布的限定,非参数不足之处是符合作参数检验的资料,如用非参数检验,因没有充分利用资料提供信息适应范围广,检验效率低于参数检验。
35.做配对比较和检验时,如果对子数 n>25 超出T界值表范围,可用正态近似法检验。
36.直线回归方程的一般表达式为 Y=a+bX 。
37.直线回归描述两变量间的数量上的依存关系相关系数r表示两变量间的直线相关的密切程度和相关方向。
38.根据回归方程绘制的直线称回归直线,此线与纵坐标的交点称为截距回归直线的斜率称为回归系数。
39.直线相关系数波动范围为—1——1 。
40.对同一资料进行直线相关和回归分析,其tb与tr的关系为 t b=t r 。
41.直线相关系数的意义为相关关系的密切程度和相关方向指标。
42.在直线回归分析中,因变量的总离均差平方和可以分解为两部分,即回归平方和∑(Y—Y)2 和剩余平方和∑(Y—Y)2。
43.直线回归方程中,a为回归直线在Y的截距,即X=0时的Y值,b为样本回归系数即回归直线的斜率。
44.r是反映两个变量线性关系相互关系的密切程度和相关方向指标,r没有单位。
45..编制统计表的原则有突出重点、简单扼要、主谓分明、层次清楚。
50.处理因素、受试对象及实验效应被称为实验设计的三要素。
46.统计表的五个组成部分是标题、标目、线条、数字和备注。
47.描述某地某年210名健康人发汞含量的分布,宜绘制频数分布图(直方图)图。
48.对照、重复、均衡原则和随机化原则是实验设计中的四个基本原则。
49.样本含量大小的估计可通过公式计算,也可用查表估计,两者都必需预先确定第一类错误概率α即检验水准、检验效能1—β、容许误差δ、总体标准差或用“S”来代替。
50.在实验设计中严格遵循四个基本原则的目的是为了尽量减少和抵消非处理因素对实验结果的干扰的干扰与影响。
51.按调查的范围,调查方法可分为普查和非全面,后者又以抽样调查和典型调查调查最为常用。
52.调查设计的四种基本抽样方法是单纯随机抽样、系统抽样、整群抽样、分层抽样。
53.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效实验组用胃灵丹治疗对照组用公认为有效的“胃苏冲剂”这种对照在实验中称为标准对照。