重庆医科大学统计学

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总体与样本:总体:根据研究目的所确定的同性质的全部观察单位某一指标(或某些因素及结果)测量值的集合。根据总体集合所包括元素是否有限,可分为有限总体与无限总体;总体具有特定的分布特征及参数。样本:以某方式按预先规定的概率从总体中随机抽取、具有足够数量、能反映总体分布特征的一部分观察单位某指标数据的集合。根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数。

小概率事件与小概率事件原理:小概率事件是指发生概率P0.05的随机事件,小概率事件原理指小概率事件在一次观察或实验中为不可能发生的事件。

配对设计与完全随机设计:完全随机设计:是指将同质的受试对象随机分到各处理组中进行实验观察或从不同总体中随机抽样进行对比的方法。配对设计是指将受试对象按某些特征或条件配对成对子,然后分别把每对中的两个受试对象随机分配到试验组和对照组,在给予每对中的个体以不同处理,连续试验若干对,观察对子间的差别有无意义的方法。

Ⅰ类错误与Ⅱ类错误:假设检验中,无论是接受还是拒接原假设均有可能犯错。如拒绝了一个实际成立的原假设,所犯错误称为Ⅰ类错误,其概率记为α;如接受了一个实际不成立的原假设,所犯错误称为Ⅱ类错误,其概率记为β;当样本含量确定时,α越大,则β越小,反之,α越小,则β越大,如拟同时降低α与β,则需增大样本含量。

⎺x±1.96S与⎺x±t0.05(v)·S⎺x:⎺x±1.96S:从正态总体中抽样,样本含量较大时,观测值95%的被动范围。⎺x±t0.05(v)·S⎺x:利用小样本的样本均数与样本标准差估计某指标未知总体均数的95%的可信区间(置信区间)

标准差与标准误:

比较

内容

标准差标准误

意义表示单个观

测值对其均

数的离散程

度表示样本统计量对总体参数的离散程度

计算方法变量值的标

准差为S=

样本均数的标准

误为

S⎺x =

阳性结果的

标准差为S=

样本阳性率的标

准误为S p=

数值

大小

大小

用途描述:观测

值的变异范

围推断:估计总体参数的可信区间假设检验

直线相关分析与直线回归分析:(1)区别:资料要求:回归要求因变量Y在给定x=x0的条件下,服从正态分布;X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。相关要求两个变量X、Y服从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归。可以计算两个回归方程。应用:相关分析主要是描述两个变量之间线性关系的密切程度和方向;回归分析说明两变量间依存变化的数量关系,不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。统计量:回归分析中主要统计量为截距a和回归系数b,相关分析统计量为相关系数r。回归系数有单位,相关系数无单位。(2)联系:r与b符号一致:对一组数据若同时计算r与b,它们的正负号是一致的。假设检验等价:对同一样本,r和b的假设检验得到的t值相等。(3)用回归解释相关:r的平方称为决定系数,r2=。

r与b:

比较

内容

b r

概念样本直线回归

系数样本直线相关系数

计算

公式

b= r=

统计意思当X变化一个

单位时Y的平

均改变的估计

值。B>0,Y随

X的增大而增

大;b<0,Y随

X增大而减小

具有直线关系

的两变量间相

关的密切程度

与相关方向。

r>0为正相关,

r<0为负相关

资料条件双变量正态分

布,或Y为正

态分

双变量正态分

精密度与准确度:精确度:指对同一标本进行多次重复测定时,测定值与平均测定值的接近程度,属于随机误差,常用标准差或变异系数表示。此值愈小,说明测定方法重现性愈好。准确度:测定值与真值的接近程度,用于说明测定方法有无系统误差。一般采用回收试验,计算回收率度量其大小。回收率愈接近100%,则准确度愈高;当回收率偏离100%较大时,则测定方法存在系统误差。回收率=×100%。准确度与精密度均为评价检测方法(包括仪器、试剂、操作等)可信赖程度的指标,其中以准确度为首要指标,当测定方法存在系统误差时,即使其精密度高,也不能采用此方法;当测定方法的精密度差,其准确度也不会高。

1.反应原始测定数据对其均值离散程度的统计量用标准差(S)。表达样本统计量对其参数随机偏离程度的统计量是标准误n=400,⎺x=30,s=5。

2.已知某医学统计资料服从正态分布,且其n=400,⎺x=30,s=5,据此可估计其中95%的数据波动范围是30±1.96×5,其总体均数95%的可信区间为30±1.96×5/(4001/2)。

3.总体设计为单因素完全随机多组测定数值变量资料的统计比较,应采用完全随机设计方差分析(F检验)或完全随机设计秩和检验,当具有统计学意义时,再根据需要进行两两比较。这种情况不能直接进行两两t检验,其原因是t检验将增大Ⅰ类误差。

4.在直线回归分析中,S yx的含义是扣除自变量X对应变量Y的线性影响后,实测值Y对估计值Y(hat)的离散程度,S b的含义是回归系数的标准误。

5.对一组同质的计量资料,通常可以从集中趋势和离散趋势两个方面来全面描述其数字特征。

6.对于一分统计资料,通常从统计描述与统计推断两个方面进行分析,其中统计推断包括参数估计、假设检验两方面的内容。

7.对计数资料进行统计描述通常采用相对数指标,常用的相对数指标有率、构成比、相对比。

8.医学统计工作的基本步骤是设计、收集资料、整理资料、分析资料。

9.常用的制定医学正常值范围(参考值范围)的方法有正态分布法和百分位数法两种,一般前者适用于正态分布分布资料,后者适用于偏态分布分布资料。

10.计量资料做假设检验要求资料满足正态性及方差齐性,如果数据不能满足方差齐性要求,一般可以通过近似t检验、数据变换使达到正态性及方差齐性要求和非参数假设检验三种途径来处理资料。

11.估计总体参数的方法有点估计和区间估计两种,其中以区间估计最常用。

12.两样本均数比较的t检验,得∣t∣

13.了解两个变量之间相互关系的密切程度和方向性,一般常计算的统计量是r(相关系数)。

14.实验研究设计的基本原则是随机原则、对照原则和重复原则。

15.实验设计中,设置对照的基本要求是所设立的对照组必须与实验组达到均衡一致,均衡是指各对比组之间除处理因素不同外,其他重要的、可控制的非处理因素的分布尽量保持一致。

16.常用的调查方法有全面普查、抽样调查、典型调查。

17.常用的基本抽样方法有单纯随机抽样、系统随机抽样、整群抽样、分层抽样。

18.常用的实现抽样或分组随机化的主要手段有单纯随机抽样。

19.医学人口统计资料可分为静态人口统计和动态人口统计两大类。

20.随机误差的含义是由于实验因素微小波动造成测定结果有大有小的变动,系统误差的含义是由于某种偏因导致测量结果倾向性增大或减小。前者常用精密度统计指标来表达,后者常用准确度统计指标来表达。

21.实验室质量控制的步骤为找出质量问题、分析主要原因、寻找主要原因、研究改进措施、执行措施计划、检查效果、巩固措施、提出尚未解决的新问题。

22.医学工作中所获得的观察结果按其性质分为计量资料、计数资料和等级资料三大类。

23.统计假设检验的基本原理是小概率事件原理,其中拟定的假设检验概率水平P值的含义是从原假设成立的总体随机抽样,获得等于大于或等于小于现有样本信息统计量的概率。

24.均数的抽样误差大小可以用S⎺x来反映,率的抽样误差大小可以用S P来表示。

25.描述一定观察值集中或平均水平常用的统计指标有均数、几何均数和中位数。

26.比较身高和体重两组数据变异程度大小宜采用变异系数。

27.现有两样本均数⎺=79.5和⎺=85.2,从统计学的观点看造成这两个样本均数不相等的原因有抽样误差和来自不同总体两方面。

28.直线回归分析中求回归方程所用原则是最小二乘原则。

29.欲分析人体血硒与发硒含量的关系宜选用散点图;某肿瘤医院与描述病人的病种构成情况宜绘制圆图。

30.实验研究设计内容“三要素”是指受试对象、处理因素以及效应指标。

31.从总体中做200次随机抽样,求总体均数的95%的可信区间,可获得200个可信区间,大约有10个可信区间没有包含总体均数。

32.均数的抽样误差大小可以用标准误来反映,率的抽样误差大小可以用率的标准误来反映。

相关文档
最新文档