统计学-问答题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学
1.描述集中位置的指标:
①算术均数:单峰对称或近似单峰对称分布资料的平均水平的描述。

②几何均数:各变量值之间成倍数关系,分布呈偏态,但经过对数变换后变成单峰对称分布的资料。

③中位数和百分位数:资料呈偏态分布或不规则分布时集中位置的描述,也用于开口资料的描述,当资料适合计算均数或几何均数时不宜用。

2.描述离散趋势的指标:
①极差:最大小值之差,不灵敏不稳定。

②四分位数间距:不能考虑全部观察值的变异程度,若集中位置用中位数描述,相应离散趋势用四分位数描述。

③方便和标准差:方差表示一组数据评论离散程度,离均差平方和相加除以样本个数,标准差直接地总结地平均地描述了变量值的离散程度,近似正态分布的数据。

④变异系数:比较单位不同或均数相差悬殊的两组或多组资料的离散程度。

3.应用相对数注意问题:
①计算相对数的分母不宜过小
②分析时不可以构成比代替率
③对观察单位数不等的几个率不能直接相加求平均率
④对比时应注意资料的可比性
⑤对两个或多个相对数进行比较时应考虑抽样误差进行假设检验不能轻易做出结论
4.正态分布特征:
①单峰分布,高峰位置在均数X=μ处
②以均数为中心,左右完全对称
③取决于两个参数均数μ标准差σ,μ为位置参数,σ为形态参数
④有些指标不符合正态分布但通过适当的变换后服从正态分布
⑤正态分布曲线下的面积分布是有规律的(曲线下对称于0的区间面积相等曲线下总面积为100%或1)
5.统计推断:
医学研究往往是从总体中随机抽取一定含量的样本进行研究,目的通过样本的信息判断总体的特征,这一过程,内容:参数估计+假设检验
6.t分布特征:
①一簇单峰分布曲线
②以0为中心左右对称
③与自由度有关,v小峰低,两侧尾部高,v增大接近标准正态分布,v无穷大,为标准正态分布
7.标准误与标准差的关系:
【区别】
①意义上:标准差描述个体值之间的离散程度,即观察值间的离散程度;而标准误是描述样本统计量的标准差,即样本统计量和总体参数的接近程度。

②用途上:标准差常用于表现观察值的波动范围;标准误常表示抽样误差的大小,估计总体参数可信区间。

③与样本含量:标准差是随着样本含量的增多,逐渐趋于稳定;标准误是随着样本含量的增多,逐渐减少。

【联系】
①标准差和标准误都是变异指标,说明个体之间的差异用标准差,说明统计量之间的变异用标准误。

②当样本含量不变时,标准差大,标准误也越大,均数的标准差与标准误成正比。

③标准误=标准差/√n。

8.α与P的含义:
(1)检验水平α:指在假设检验之前人为规定的,说明按不超越多大的风险为条件作结论,是犯Ⅰ型错误的最大风险。

(2)P值:是指由H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值的概率,P值的大小表明以多大的风险拒绝H0,P值越小,风险越小,所得结论的误差也越小。

9.Ⅰ、Ⅱ型错误区别联系实际意义:
【区别】
Ⅰ型错误:统计学上规定,拒绝了实际上成立的H0,这类弃真的错误称为Ⅰ型错误,也叫作第一类错误。

Ⅱ型错误:不拒绝实际上不成立的H0,这类存伪的错误称为Ⅱ型错误,也叫作第二类错误。

【联系】当样本例数确定后,α和β是相互制约的,α越小,β越大,反之,α越大,β越小。

拒绝H0,只可能犯Ⅰ型错误,不可能犯Ⅱ型错误,不拒绝H0,只可能犯Ⅱ型错误,不可能犯Ⅰ型错误。

【意义】当样本例数确定后,可以根据研究要求适当控制,若重点减少α,一般取较小的α,若重点在β,一般取α=0.05或0.1或更高。

由于假设检验中可能犯第一类错误或第二类错误,所以结论不可以绝对化。

10.t检验、u检验联系:
当样本较大v>100时,假设检验对资料饿正态性和方差齐性要求不高且t分布和标准正态u分布很接近,故可以用u检验代替t检验。

11.假设检验的意义与注意问题:
【意义】
①分辨两个样本是否分别属于两个不同的总体,并对总体做出适当的总结;
②分辨一个样本是否属于某个特定总体、三个及三个以上的样本是否属于相同总体等。

【注意】
①要有严密的研究设计,个体应具有同质性,资料应具有代表性,组间应具有可比性;
②选用的假设检验方法应符合其应用条件,以计量资料为载体t检验要求数据满足独立性、正态性和方便齐性三个条件。

③正确理解α水准和P值的意义。

④单侧检验和双侧检验,若从专业知识可判断一种方法的结果不可能低于或高于另一种方法的结果,可选用单侧检验,在选择单双侧检验时一定要依赖专业知识。

⑤结论不能绝对化。

12.假设检验、区间估计的联系:
【区别】可信区间用于推断总体均数的范围,假设检验用于推断两总体均数是否不同
【联系】
①可信区间也可回答假设检验的问题,可信区间比假设检验可提供更多信息
②可信区间只能在已设定的概率检验水平α的前提下进行计算,假设检验能获得较为确切
的P值,故将两者结合才是完整的分析
③根据样本统计量来推断总体参数
④都要借助t分布、标准误来计算统计量
⑤以95%可信区间得出上下界在一定范围内假设检验是否在假设范围内
⑥实际上可信区间与假设检验就是同一个问题,从不同角度去阐述统计学问题
⑦都要考虑样本均数抽样误差
13.卡方检验基本思想:
如果Ho成立,则实际频数与相应理论频数比较接近。

在Ho成立的条件下,计算χ²检验统计量不应太大,如果实际频数与理论频数相差较大,χ²检验统计量超出界值则拒绝Ho。

14.秩和检验的基本思想:
若两组处理的效应相同,则每对产量差值的总体分布是以0为中位数的,即差值的总体中位数为0。

因此,若Ho成立,则样本的正负秩和应相近,即T不会太大或太小,如果T太大或太小超出表中按α水准所列的界值范围,则拒绝Ho
15.成组秩和检验的基本思想:
如果Ho成立,则当n1n2确定后,样本含量为n1的样本的秩和T与其相应的理论秩和n1(N+1)/2一般相差不大,若相差悬殊,超出附表中按α水准所列的界值范围,说明随机抽的现有样本统计量T的概率P小于α,因而在α水准上拒绝HO
16.非参数检验
【适用的情况】
①有序分类资料
②偏态分布资料
③变异较大或方差不齐的资料
④分布型不明的数据
⑤特大、特小值或数据的一端或两端有不确定数值的资料
【优点】不受总体分布的限制,适用范围广。

【缺点】符合参数检验的资料如用非参数检验,因没有充分利用资料提供的信息,检验效率降低。

不依赖总体分布形式的统计方法
17.试验研究的基本要素:
①处理因素:外加于受试对象,在实验中需要观察并阐明其效应的因素,包括物理化学生物因素,注意抓住实验中的主要因素、明确处理因素与非处理因素、处理因素的标准化
②受试对象:处理因素作用的客体,包括动物选择和人的选择
③实验效应:受试对象接受实验处理后所出现的实验结果,由人或动物相应指标来反应,观察指标要求关联性、客观性、准确性与精确性、敏感性与特异性
18.实验设计的基本原则:
①对照选择:设立对照组控制各种外来因素衬托出处理因素的效应
②随机化原则:统计分析的前提,避免主管因素干扰,控制非实验因素(抽样、分组、实验顺序随机)
③重复原则:提高结论可靠性,避免将个别现象当做普遍现象
19.研究设计类型:
①完全随机设计:将实验对象用随机的方法分配到各个平行的处理组,以进行实验观察,或分别从不同总体中随机抽样进行对比观察的一种设计方法,用于实验对象同质性较好的实验对象,简单灵活易理解,实验误差高精度低
②配对设计:当个体变异度较大时,将那些个体变异度较小的研究对象配成若干对子,每对中两个对象差异较小,并用随机的办法分配给相应的试验组和对照组,降低实验误差提高实验精确度,配对条件过严难以配对
③随机区组设计:事先将全部受试对象按自然属性分为若干区组,各区组内受试对象特征将近或相同,且对象数与处理因素水平相等,然后在将每个区组内的观察对象随机的分配到各处理组 ,配伍组设计,不能分析交互作用,误差减低,均衡性提高,一个区组内对象发生意外整个放弃采取缺项估计
20.研究设计的意义与作用:
①合理安排试验因素,提高研究质量
②控制误差,使研究结果保持较好稳定性
③通过减少观察例数获取尽可能丰富的信息。

相关文档
最新文档