医学统计学名词解释

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

医学统计学：是运用运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学。

1、观察单位（observed unit）亦称个体，是统计研究中的基本单位。

2、总体（population）是根据研究目的确定的同质观察单位（研究对象）的全体。

3、有限总体（finite population）明确规定了空间、时间、人群范围内有限个观察单位。

4、无限总体（infinite population）没有时间和空间范围的限制，其观察单位的全体数只是理论上存在的，因而可视为“无限”。

5、抽样（sampling）从总体中抽取部分观察单位的过程。

6、样本从总体中随机抽的的部分观察单位，其实测值的集合。

7、样本含量（sample size）该样本所包含的观察单位数。

8、变量（variable）能表现观察单位的变异性的特性称为变量。

8、同质（Homogeneity）:指被研究指标的有关影响因素相同。

8、变异（Variation）：指同质基础上的各种观察单位间的异同。

9、变量值（value of variable）或观察值（observed value）变量的观测值称为

10、计量资料（measurement data）又称定量资料（quantitative data）或数值变量（numerical variable）资料。为观测每个观测单位某项指标的大小，而获得的资料。其变量值是定量的，表现为数值大小，一般由度量单位。根据其观测值取值是否连续，又可分为连续型和离散型两类。

11、计数资料（enumeration data）又称定性资料（qualitative data）或无序分类变量资料、名义变量资料。为将观察单位按某种属性或类别分组计数，分组汇总各组观察单位数后而得到的资料。其变量值是定性的，表现为互不相容的属性或类别。

12、等级资料（ranked data）又称半定量资料或有序分类变量资料。为将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质，表现为等级大小或属性程度。

13、误差（error）泛指实测值与真值之差。分为随机误差和非随机误差（后者又分为系统误差和分系统误差）。

14、随机误差（random error）是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起。常见随机测量误差、抽样误差.

15、系统误差（systematic error）是实验过程中产生的误差，它的值或恒定不变，或遵循一定的变化规律，产生原因往往是可知的或可以掌握的，通常可以减少或消除。

16、非系统误差（nonrandom error）在实验过程中由研究者偶然失误而造成的误差，亦称过失误差。

17、抽样误差（sampling error）由抽样造成的样本统计量与总体参数之间差异或多样本统计量之间的差异。

随机事件（Random event）：指对随机试验的各种可能结果的集合。

18、频率（relative frequency）在重复多次后，出现某个结果的比例称为。

19、概率（probability）是描述随机事件发生可能性大小的一个度量，统计学上用符号“P”来表示。

20、统计描述（statistical description）指选用适当的统计指标，通常称为统计量，选用合适的统计表和统计图，对资料的数量特征及其分布规律进行测定和描述。

21、统计推断（statistical inference）指如何在一定的可信程度下由样本信息推断总体特征。

22、参数（parameter）描述总体变量值特征的指标，一般未知，需通过样本指标估计。

23、参数估计（estimation of parameter）由样本统计指标来推断总体相应指标。有两种方法：点估计和区间估计。

算数均数（mean）：用于反映一组呈对称分布的变量值在数量上的平均水平

几何均数（geometric mean）：用于反映一组经过对数转换后呈对称分布的变量值在数量上的平均水平

中位数（median）：将n个变量值从小到大排列，位置居于中间的那个数。

24、假设检验（hypothesis test）由样本差异来推断总体之间是否可能存在差异。

25、极差（range）也成全距，即最大值和最小值之差，记作R。不能反映所有数据的变异大小，一般不单独应用，可用于所有分布类型的资料。

26、四分位数（quartile）是把全部变量值分为四部分的分位数，即第1四分位数（Ql=P25）、第2四分位数（M=P50）、第3四分位数（Qu=P75）。

27、四分位数间距（quartile range）是由第3四分位数和第1四分位数相减而得，记作QR。多用于偏态分布资料。

28、变异系数（coefficient of variance）是相对数没有单位，用来比较度量单位不同或均数相差悬殊的两组或多组资料间的变异度。29、正态分布（normal distribution）随着观察例数逐渐增多，组段不断分细，直方图顶端的连线就会逐渐形成一条高峰位于中央（均数所在处），两侧逐渐降低且左右对称，不与横轴相交的光滑曲线，称频数曲线，近似于数学上的正态分布

30、医学参考值（reference value）是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数，也称正常值。31、标准误（standard error，SE）即样本均数的标准差，也称均数的标准误（standard error of mean，SEM）反映样本均数间的离散程度，也反映样本均数与相应总体均数间的差异，因而说明了均数抽样误差的大小。

32、可信区间（confidence interval，CI）是按一定的概率100（1-α）%估计总体均数所在的范围，亦称估计区间。常取的可信度为95%和99%。

33、假设检验（hypothesis test）亦称显著性检验，其基本思想是先对总体的参数或分布做出某种假设，然后根据样本信息选用适当的方法，推断此假设应当拒绝或不拒绝的方法。34、I型错误（type I error）拒绝了实际上成立的h0，即样本原本来自u=u0的总体，由于抽样的偶然性得到了较大的t值，所以拒绝了h0，接受了h1，这类弃真错误称为第一类错误，犯第一类错误的概率是α。

35、II型错误（type II error）是不拒绝实际上不成立的h0，即“存伪”即样本原本来自u=/u0的总体，但是由于抽样的偶然性，得到了较小的t值，得到了较大的P值，没有拒绝h 0，这类存伪错误称为第二类错误，犯第二类错误的概率是1-β。

36、方差（variance）用来度量随机变量和其数学期望（即均值）之间的偏离程度。

37、比（ratio）又称相对比，为两个有关指标之比，说明两个指标间的比例关系。

38、比例（proportion）又称结构相对数，表示事物内部一部分与该事物内部个部分之和之比。用来说明各构成部分在总体中所占的比重或分布。

39、率（rate）又称强度相对数，表示某现象发生的频率或强度。

40、动态数列（dynamic series）是一系列按时间顺序排列起来的统计指标（可以为绝对数、相对数或平均数），用以观察和比较该事物在时间上的变化和发展趋势。

41、自然增长率（Natural increase rate）一定时间内种群自然增长数(出生数＞成长死亡数)与种群总数之比。

42、二项分布（binomial distribution）是指在只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验中，当每次试验的“阳性”概率π保持不变时，出现“阳性”次数X=0,1,2…n的一种概率分布。

43、Poisson分布（Poisson distribution）泊松分布是在π很小，样本含量n趋向于无穷大时，二项分布的极限形式。更多地用于研究单位时间、单位人群、单位空间内，某罕见事件发生的次数的分布。

45、卡方检验（chi-square test）是一种用途很广的假设检验方法,它在分类资料统计推断

中应用,包括两个率或两个构成比比较的卡方

检验;多个率或多个构成比比较μ卡方检验及

分析资料μ相关分析等。

46、等级相关（rank correlation）又称秩相关是一种非参数统计方法，适用于资料不是正态双变量或总体分布未知；数据一端或两端有不确定值的资料或等级资料。

47、非参数检验（nonparametric test）又称任意分布检验，是相对于参数检验而言的，它直接对总体分布作假设检验，不受总体分布的限制。

111非参数统计（non-parametric statistics）样本所来自的总体分布难以用某种函数式来表达，还有一些资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制，故称非参数统计法，或称为不拘分布（distribution-free statistics）的统计分析方法。

48、直线回归（linear regression）是用直线回归方程表示两个数量变量间依存关系的统计分析方法，属双变量分析的范畴。

49、直线相关（linear correlation）又称简单相关，描述两变量间有无直线相关关系及其方向和密切程度。

89. 相关系数（correlation coefficient）亦称积差相关系数，用符号r表示样本相关系数，用“肉“表示总体相关系数，

50、统计表（statistical table）是将研究指标或统计指标及其取值以特定表格的形式列出，以简洁明了、条理清晰的方式表达数据，便于阅读、比较和计算。

51、统计图（statistical chart）是用“点、线、面、体”等各种几何图形来形象化地表达和对比数据。

52、条图（bar graph）用等宽长条的高度表示按性质分类资料各类别的数值大小，用于表示它们之间的对比关系。

53、圆图（pie graph）圆形图适用于百分构成比资料，表示事物各组成部分所占的比重或构成。

54、百分条图（percent bar）意义及适用资料同圆图，也称构成条图。

55、线图（line graph）线图适用于连续性资料，以不同的线段升降来表示资料的变化，并可表明一事物随另一食物（时间）而变动的情况。

56、直方图（histogram）直方图用于表达连续性资料的频数分布。

57、散点图（scatter diagram）散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系。常用在对资料进行相关分析之前适用。

58、统计模型（statistical model）指以概率论为基础,采用数学统计方法建立的模型.常用的这类模型有:标准差模型,回归模型.

59:logistic regression:回归：属于概率型非线性回归，是研究二分类观察结果和一些影响因素之间关系的一种多变量分析方法。