统计学名称解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
一、名词解释
1、参数parameter:也叫参变量,是一个变量;如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数;描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值;
2、统计量statistic:描述样本特征的数,是统计理论中用来对数据进行分析、检验的变量;
3、总体population:根据研究目的确定的研究对象的全体;当研究有具体而明确的指标时,总体是指该项变量值的全体;
4、样本 sample:从总体中随机抽取的部分观察单位,总体中有代表性的一部分;
5、同质 homogeneity:是指观察单位研究个体间被研究指标的影响因素相同;
6、变异 variation:同质事物个体间的差异;来源于一些未加控制或无法控制的甚至不明原因的因素;
7、概率 probability:度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数;
8、抽样误差 sampling error:由于抽样所造成的样本统计量与总体参数的差别;
三、简答题
1、统计学的基本步骤有哪些
设计、搜集、整理、分析资料
2、总体与样本的区别与关系
区别:
总体:根据研究目的确定的研究对象的全体;当研究有具体而明确的指标时,总体是指该项变量值的全体;
样本:总体中有代表性的一部分;
联系:总体包含样本,样本是总体中的一部分
3、抽样误差产生的原因有哪些可以避免抽样误差吗
产生原因:
1总体单位的标志值的差异程度; 差异程度愈大则抽样误差愈大,反之则愈小; 2样本单位数的多少; 在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小;
3抽样方法; 抽样方法不同,抽样误差也不相同;一般说,重复抽样比不重复抽样,误差要大些;
4抽样调查的组织形式; 抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差;
不可以,它具有不可避免性,只能减少抽样误差
4、何为概率及小概率事件
概率:度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数; 小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将 pA≤或≤称为小概率事件,认为小概率事件在一次试验中不可能发生;
第二章第三章
1. 正态分布 normal distribution:也叫高斯分布Gaussian distribution,一种最常见、最重要的连续型对称分布正态分布是对称分布,但对称分布不一定是正态分布
2. 中位数 median:是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平;
3. 四分位数间距 quartile interval:是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.即:Q3 --Q1
4. 方差 variance:样本观察值的离均差平方和的均值;表示一组数据的平均离散情况;反映一组数据的平均离散水平;
5. 正偏态分布 positively skewed distribution:也称右偏态分布,右侧的组段数多于左侧的组段数,频数向右侧拖尾
6. 负偏态分布 negatively skewed distribution:左偏态分布,左侧的组段数多于右侧的组段数,频数向左侧拖尾
7. 对数正态分布 logarithmic normal distribution :对数为正态分布的任意随机变量的概率分布;如果X是正态分布的随机变量,则 exp X为对数分布;同样,如果Y是对数正态分布,则 log Y为正态分布;
8. 医学参考值范围 medical reference range:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围;最常用的是95%参考值范围;
三、简答题
1. 描述数值变量资料集中趋势的指标有哪些其适用范围有何异同
平均数:描述一组变量值的集中位置或平均水平的指标体系;
不同的分布使用不同的指标
算术均数:正态或近似正态或观察值相差不大的小样本资料
几何均数:对数正态分布或等比级数资料
中位数:一般偏态分布传染病发病的潜伏期
2. 描述数值变量资料离散趋势的指标有哪些其适用范围有何异同
反映数据的离散度 Dispersion ;即个体观察值的变异variation程度;常用的指标有:
1. 极差Range 全距适用范围:任何计量资料;是参考变异指标
2. 百分位数与四分位数间距 Percentile and Quartile range
百分位数:适用范围广泛,可用于偏态资料,分布不明的资料和分布两端无确定值的资料
四分位数间距:常用于描述偏态分布资料的离散程度,值越大——变异程度越大,中位数与四分位间距一起使用,描述偏态分布资料的特征;
3. 方差 Variance正态分布资料
4. 标准差Standard Deviation适用范围:均数与标准差经常被同时用来描述正态分布资料的集中和离散趋势;
5. 变异系数 Coefficient of Variation适用范围:主要用于单位不同或均数相差悬殊资料
3. 医学中参考值范围的涵义是什么确定的步骤和方法是什么
医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围;最常用的是95%参考值范围;
步骤与方法:1. 确定“正常人”对象的范围:即根据研究目的确定的未患被研究疾病的个体;
2. 统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同;
3. 确定分组:一般需用年龄、性别等对“正常人”对象进行分组,分组特征也可