统计学名词解释
统计学名词解释
名词解释1.备择假设(alternative hypothesis):与原假设逻辑上反面的假设。
2.标准分数(standard score):也称标准化值或分数,它是变量值与其平均数的离差除以标准差后的值。
3.残值(residual):因变量的观测值y i与根据估计的回归方程求出的预测值y i之差,用e表示。
对于第i个观测值,残差为e i=y i-y i。
4.α错误(αerror):原假设为真却在检验中将原假设被拒绝,又称弃真错误或者第一类错误(type I error),用α表示其概率。
5.β错误(βerror)原假设为伪却在检验中未拒绝的原假设,又称取伪错误或者第二类错误(type II error),用β表示其概率。
6.对照组(control group):随记选取的实验对象的子集。
在这个子集中,每个单元不接受实验组成员所接受的某种特别的处理。
7.多重共线性(multicollinearity)回归模型中两个或两个以上的自变量彼此相关。
8.多重判定系数(multiple coefficient of determination)回归平方和占总平方和的比例,反映因变量y取值的变差中,能被估计的多元回归方程所解释的比例。
9.峰态(kurtosis)对数据分布平峰或尖峰的程度的测度。
10.假设检验(hypothesis testing)根据样本信息,对提出的命题进行检验的一套程序和方法。
11.离散系数(coefficient variation)也称变异系数,一组数据的标准差与其相对应的平均数之比,是测度数据离散程度的相对值。
12.拟合优度实验(goodness of fit test)对多个总体比例是否等于其期望概率的检验。
当期望概率相同时,表现为对多个总体的比例是否相等的检验。
13.偏态(skewness)对数据分布对称性的测度。
14.异众比率(variation ratio)非众数组的频数占总频数的比例。
(完整)统计学名词解释
名词解释:医学统计学:用统计学的原理和方法研究生物医学问题的一门学科.变量(variable ):观察单位的某项特征变量值(value of variable ):变量的观察结果(测量值)总体(population ):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。
样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。
随机抽样(random sample ):按随机化原则从总体中抽取部分观察单位的过程。
同质(homogeneity ):是针对被研究指标来讲,其影响因素相同.简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。
变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。
等级资料(ordinal data ):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡.有序变量(定性变量的一种)。
概率(probability):是度量某一随机事件A 发生可能性大小的一个数值,记为P (A ),P (A )越大,说明A 事件发生的可能性越大,0〈P(A)<1,小概率事件.频率(frequency ):在相同的条件下,独立重复做n 次实验,事件A 出现了m 次,比值m/n 称为随机事件A 在n 次实验中出现的频率。
随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计.系统误差(system error ):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免.随机变量(random variable ):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。
统计学名词解释
17.相对指标:也称相对数,就是将两个有联系指标的数值进行对比的结果;
18.时期数列:是由时期指标形成的,数列中的每个指标数值都是反映某种社会经济现象在一段时期内发展过程的总量;
29.简单随机抽样:这是按随机原则从总体N个单位中直接抽取n个单位做样本,使总体中每一个单位都有同等的可能性被抽中;
30.简单相关表:是资料未经分组的相关表,它是相关因素的标志值按照大小顺序并配合结果标志值一一对应而平行排列起来的统计表;
31.常住单位:是指在我国的经济领土上具有经济利益中心的经济单位;
88.组中值:指本组的上限与下限之间的中点值。它代表组内所有单位的标准值的平均水平。
89.次数分布:是指在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布。
90.总体:按数量标志分组就形成变量分配数列,简称变量数列。
91.统计表就是用来表现统计资料汇总整理结果的汇总表。
92.累计次数:是指数列中高于或低于某一变量值的次数总和。
93.强度相对指标:是两个性质不同但是存在一定联系的指标的对比,用来反映事物的强度、密度和普遍程度的指标。
94.众数:是指总体中出现次数最多的标志值。
95.平均发展水平:将不同时期的发展水平加以平均而得的平均数叫平均发展水平,在统计上又称为序时平均数或动态平均数。
44.资本形成
:是指各机构单位通过经济交易获得或处理生产资产的行为;
45.因素分析法:它是利用指数体系,对现象的综合变动从数量上分析其受各因素影响的一种分析方法。
统计学名词解释
统筹学统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反映现象总体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
平均发展水平:将不同时间的发展水平加以平均而得到的平均数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中报告期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
年距发展速度:反映报告期发展水平对于上年同期发展水平的变化方向与程度。
统计学名词解释
一、名词解释标志:统计标志简称标志,是说明总体单位属性或特征的名称。
指标:统计指标简称指标,是反映统计总体数量特征的范畴和具体数值。
变量:可以是在不同总体单位之间具体表现不尽相同的标志,也可以是在不同时间或空间上数值不尽相等的指标。
普查:为某种特定目的而专门组织的一次性全面调查.统计报表:按统一规定的表格形式,统一的报送程序和报表时间,自下而上提供基础统计资料。
统计表:用来表现统计资料的表格,是展示统计资料的常见方式.总量指标:反映社会经济现象发展的总规模、总水平的综合指标。
相对指标:又称相对数,它是两个有相互联系的现象数量的比率,以反映现象的发展程度、结构、强度、普遍程度或比例关系。
平均指标:是将一组数据的总和除以该组数据的项数所得到的结果,是表明同一总体各单位标志值一般水平的指标.变异指标:测定离散程度的指标。
综合反映总体各单位标志值的差异程度和离散程度。
抽样估计:在抽样调查的基础上,用样本的实际资料计算样本指标,并据此估计或推算总体相应数量特征的一种统计推断方法。
总体:即所要认识的研究现象全体,它是由所研究范围内具有某种相同性质的全体单位所组成的整体。
总体单位:总体的单位数,用N表示。
样本:又称子样,它是从总体中随机抽取出来,代表总体的那部分单位的集合.时间序列:把反映某种现象在不同时间上的发展变化情况的一系列统计指标志,按照时间先后顺序排列起来所形成的序列。
发展速度:将报告期发展水平与基期发展水平相对比而计算的动态相对指标,用以反映现象报告期水平比基期水平发展的相对程度.增长速度:将报告期增长量与基期发展水平对比而计算的相对指标,用以反映现象报告期水平比基期水平纯增减的相对程度。
狭义的统计指数:是一种特殊的相对数,它是反映多种不能直接相加的现象数量总体变动的相对数.数量指数:反映生产、经营或经济工作中数量变动的指数。
质量指标指数:说明产品或工作等质量变动的指数。
指数体系:由若干个有联系的指数结合形成的一个整体。
统计学名词解释
1第一章1.统计数据:即统计信息,是指通过统计工作过程中取得的各项数据资料以及与之相关的其他资料的总称。
2.统计学:即统计理论,是指系统地阐述统计实践活动根本原理和研究方法的理论。
它是一门研究如何搜集、整理和分析统计资料的理论和方法论科学。
4.统计学的研究对象:客观事物中的数量特征、数量关系和数量变化。
5.统计学包括商务管理统计的研究对象特点:数量性〔根本特点〕、总体性、变异性。
7.商务管理统计研究方法大量观察法统计分组法比照分析法综合指标法统计推断法动态测定法8.统计总体。
又称“调查总体〞简称“总体〞,在数理统计中又称母体,与样本相对应。
但凡客观存在的、具有共同性质的个体所构成的整体就是统计总体。
其形成必须具备以下条件:客观性:即统计总体必须是客观存在的,并且能实际观察到的。
同质性:即构成统计总体的所有单位至少具有某一个共同性质是统计总体的前提条件。
变异性:即构成统计总体的各总单位至少在某一性质上具有共同特征外,在其他性质上应具有差异性,变异性是统计研究的重点。
9.总体单位:构成统计总体的每个根本单位称为总体单位,简称单位或个体,它是各项统计特征的原始承当者。
10.统计总体分类:按其包含的单位数是否可计分为有限总体与无限总体按总体单位的形态分为实体总体和行为总体。
11.总体与总体单位的关系:a.总体是由总体单位组成,总体单位是组成总体的个别事物。
b.根据研究目的不同,总体和总体单位是可以相互转化的。
12.标志:表示总体单位特征的名称。
如性别、年龄、籍贯、企业所有制、规模等。
13.标志表现:即标志特征在各单位的具体表现。
如性别标志的表现有“女〞、“男〞,年龄标志用“30〞岁“50〞岁等数量来表现。
14.标志的分类a.根据标志表现的形式不同。
数量标志,说明总体单位数量特征的标志,是可以用数值表示的。
品质标志,说明总体单位属性特征的标志,不能用数值表现。
b.按照各总体单位标志的具体表现是否一样。
不变标志:某一标志的具体表现在总体中各总体单位都一样。
统计学的名词解释
统计学的名词解释统计学是一门研究数据收集、分析和解释的学科,旨在通过收集和解析数据来支持决策过程和了解现象。
统计学涉及一系列概念和方法,包括数据收集、数据描述性统计、概率理论、假设检验、统计推断和回归分析等。
1. 数据收集:统计学中的第一步是收集数据。
数据可以通过各种方法获得,包括实地观察、实验、调查问卷和从现有的数据集中获取等。
2. 数据描述性统计:在收集到数据后,统计学家使用描述性统计来总结和描述数据的特征。
描述性统计包括计算数据的平均数、中位数、众数、标准差和百分位数等。
3. 概率理论:概率理论是统计学的基石之一。
它研究随机现象发生的可能性,并给出事件发生的数学表达。
概率理论为统计推断和建立模型提供了理论基础。
4. 假设检验:假设检验用于确定一个观察结果是否与一个给定的假设相符。
它提供了一种确定性地评估研究或实验结果的方法,并决定是否拒绝或接受一个假设。
5. 统计推断:统计推断是通过对样本数据进行分析和推断来对总体进行推断的过程。
它使用样本数据估计总体参数,并根据这些估计进行一些统计判断。
6. 回归分析:回归分析是一种统计方法,用于建立和探索变量之间的关系。
它可以用来预测一个变量(因变量)如何随着其他变量(自变量)的变化而变化。
7. 统计模型:统计模型是由统计学方法和理论构建的数学表达式,用于描述和解释观察数据之间的关系。
统计模型可以是简单的线性模型,也可以是更复杂的非线性模型。
8. 抽样方法:在统计学中,由于往往难以调查每一个个体或观察每一个事件,人们通常采用抽样方法来从总体中选择一部分样本进行研究。
常见的抽样方法包括随机抽样和分层抽样等。
9. 统计图表:统计图表是一种可视化数据的方式,用来展示和比较数据。
常见的统计图表包括柱状图、饼图、散点图和箱线图等。
10. 多元统计分析:多元统计分析是一项通过同时考虑多个变量来分析数据的方法。
它包括主成分分析、因子分析和聚类分析等。
总之,统计学是一门研究数据收集、分析和解释的学科,它运用一系列概念和方法来帮助人们理解数据,并从中获取有关现象和决策的信息。
统计学名词解释
10、统计整理:根据统计研究目的和统计分析的要求,使统计调查所获得的原始资料进行科学的分类和汇总,或对简单加工过的资料进行再加工,使之系统化、条理化,从而得出能够反映事物总体特征资料的工作过程。
11、统计分组:根据研究任务的需要和事物内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。
A60----70分这一组B70----80分这一组C60---70或70---80两组都可以D作为上限的那一组
4、2003年-----2004年间,甲单位的商品销售额平均增长速度是乙单位的103%,这是(B)
A比例相对指标 B比较相对指标 C强度相对指标 D动态相对指标
5、变量数列中的各组(单位数)表示我们所要考察(标志值)在各组中出现的次数,所以称为次数。
6、变量数列中各组标志值出现的次数称(频数),各组单位数占单位总数的比重称(频率)。
7、所谓同度量因素,就是在计算综合指数时,吧不能直接相加的(指标)过渡到可以总的指标的那个(媒介因素)。
8、编制时间序列应遵循的基本原则就是保证构成时间数列的(各个指标值)具有(可比)性
统计整理:根据统计研究的目的,把统计调查所搜集到的资料(原始资料、次级资料)进行科学的加工,使之系统化、条理化、科学化,从而得出能够反映事物总体特 征的资料的工作过程
统计分组:根据研究的目的和现象的内在特点,按某个标志(或几个标志)把被研究的总体分为若干不同性质的组。
抽样调查:是一种非全面,按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断的一种统计调查方法。。
A相对数时间序列 B时期数列 C平均数时间数列 D时点数列
10、“首末折半法”适用于(B)
统计学名词解释
1.总体:根据研究的目的确定的同质观察单位的全体,更确切的说,它是同质的所有观察单位某种观察值的集合2.参数:描述总体数量特征的统计指标3.样本:从总体中随帆抽取部分观察单位,其测量结果的集合称为样本。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本,该样本中所包含的观察单位数称该样样本的样本含量。
4.误差:泛指实测值与真值之差。
按其产生的原因的性质可粗分为随机误处和非随机误差,后者又可分为系统误差和非系统误差。
5.标准误:将样本统计量的标准差称为标准误,样本均数的标准差也称为均数的标准误(反应样本均数间的离散程度,也反应样本均数与相应总体均数间的差异,从而说明均数抽样误差的大小)6.医学参考值:指包括绝大多数的正常人的人体形态、功能和代谢产物等各种生理级生化指标常数,也叫正常值。
由于存在个体差异,生物医学数据并非常数,而是在一定的范围内波动,故又采用医学参考值范围作为判定正常或者异常的标准。
7.医学参考值范围:7:I类错误:指拒绝了实际上成立的HO,这类“弃真”的错误称为I型错误,其架率大小用a表示。
8.II类错误:指接受了实际上不成立的HO,这类“存伪”的误称为II 型错误,其频率大小用β。
9.系统误差:在实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生的原因往往是克制的或可以掌握地。
10.医学参考值:指包括绝大多数正常人的人体形态、功能和代谢产物等各种的生理及生化指标常数,也成正常值。
11.随机误差:是一类不恒定、陆机变化的误差,由多种尚无法控制的因素引起。
在抽样过程中由于抽样的偶然性而出现的抽样误差。
脸机误差是不可避免的,在大量的重复测量中,或在抽样过程中,它可出现或大或小或正或负,呈一定规律的变化。
12.抽样误差:这种由个体变异产生,随机抽样造成的样本统计量与总体参数的差异。
13.P 值:概率又叫几率,是度量某一随机事件A发生可能性的大小的一个数值,(Λ),P(A)越大,说明此时入事件发生的概率越大。
统计学名词解释
1.实验设计experiment design:根据研究目的,制定总的设计方案。
2.统计量:即样本统计量,根据样本(即一组观察值)计算出来这组数据数字特征的量,既可反映样本概貌也可用来进行统计推断,根据样本分布特征而计算得到数值(指标),如S、P。
参数Parameter:即总体参数,包括反映总体数字特征的量和总体规律公式中参数,据总体分布特征而计算总体数值,以描述总体分布特征,如σ、π。
3.指标:预期中打算达到的指数、规格、标准。
4.收集资料collecting data:根据研究目的,实验设计要求,收集准确完整含有丰富信息原始资料。
5.整理资料sorting data:把收集原始资料,有目的进行科学加工,使资料系统化、条理化,以便进行统计分析。
6.计量资料measurement data:对每个观察对象指标用定量方法测得其数值大小所得资料,一般用度量衡单位表示,如身高、体重、浓度、脉搏、血磷、血红蛋白。
7.计数资料enumeration data:先将观察对象观察指标按性质或类别进行分组,然后计数各组数目所得资料。
8.变异variance:即个体差异,不同个人体在相同条件下,对外界环境因素发生不同反应现象。
9.总体population:根据研究目的确定同质研究对象全体,即性质相似研究对象中所有观察单位某种变量值集合。
样本Sample:总体中随机抽取有代表性一部分。
10.抽样sampling:从总体中抽取部分个体过程。
11.样本含量sample size:一个样本里含个体数目可不同,样本包含个体数称样本含量。
12.机械抽样:即等间隔抽样,先将总观察对象按某种顺序编号,再从这些编号中采用等间隔抽样。
13.分层抽样stratified sampling:按某种性质将总体分为若干组别、类别或区域。
按不同比例再分别随即抽样称分层随机抽样stratified random sampling14.完全随机设计completely random design:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。
统计学名词解释
统计学名词解释1.标志:说明总体单位特征或属性的名称;指标:是反映社会经济现象总体数量特征的概念和具体数值。
2.统计调查:是根据统计研究预定的目的和任务,运用各种科学的调查方法,有计划、有组织地向调查对象搜集各种真实、可靠的原始资料的工作过程。
3.统计分组:就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。
4.相对指标:就是将两个有直接联系的指标数值对比形成的一种比率,是用来反映现象之间数量对比关系和联系程度的综合指标。
5.标志变异指标:又称标志变动指标,它是综合地反映社会经济现象总各单位标志值之间差异程度的综合指标。
6.动态数列:它是指各个不同时间的社会经济统计指标,按照时间先后顺序排列而形成的数列。
7.平均发展水平:对各个不同时间上的指标数值求平均数,将指标在各个时间上表现的差异加以抽象,以一个数值来代表现象在这一段时间上的一般发展水平。
8.综合指数:是两个总量指标对比形成的指数。
9.平均发展速度:是各个时期环比发展速度的序时平均数,说明社会经济现象的较长时期内速度变化的平均程度。
10.次数分布数列:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位中各个单位在各组间的分布。
11.统计分组的作用:(1)区分社会经济现象的类型;(2)反映社会经济总体的内部结构;(3)反映社会经济现象的依存关系。
12.总量指标的作用:(1)总量指标是认识社会经济现象总体的起点;(2)总量指标是进行科学管理的依据;(3)总量指标是计算相对指标和平均指标的基础,也是反映社会经济活动绝对效果的工具。
13.相对指标的作用:(1)进行数量指标分析,就可以充分反映社会经济现象之间的联系程度、发展速度、有助于鉴别好坏,分析其效益;(2)它是一个抽象化的数值,所以他能深入、概括的说明总量指标所不能反映的问题,便于比较和分析事物。
14.动态数列的编制原则:最基本的原则是保证数列中各个指标数值之间的可比性。
统计学名词解释
备择假设:与原假设逻辑相反的假设。
比例:一个样本中各个部分的数据占全部数据之比。
比率:样本中各不同类别数值之间的比值。
必然事件:在同一组条件下,每次试验一定出现的事件。
变量:说明现象某种特征的概念。
标准差:方差的平方根。
标准分数:也称标准化值或分数,它是变量值与其平均数的离差除以标准差后的值。
标准化残差:残差除以它的标准差后得到的数值。
不规则波动:称为随机波动,指序列中的偶然性波动。
不可能事件:在同一组条件下,每次试验一定不出现的事件。
参数:用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
残差:因变量的观测值y i与根据估计的回归方程求出的预测值y i之差,用e表示。
对于第i 个观测值,残差为e i=y i-y i。
充分统计量:在样本加工统计量的过程中不损失任何信息的统计量。
抽样分布:样本统计量的分量。
抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺少的。
抽样误差:由抽样的随机性引起的样本结果与总体真值之间的差异。
处理:不同的因子水平。
次序统计量:设有样本,若有满足如下条件的函数:每当样本得到一组观察值x1,x2,…x n时,其由小到大的排序x(1)<=x(2)<=…<=x(n)中,第i个值x(i)就作为统计量X(i)的观测值,而X(1),X(2),…,X(n)称为次序统计量。
β错误:原假设为伪却在检验中未拒绝原假设,又称取伪错误错误或第Ⅱ类错误,用β表示其概率。
а错误:原假设为真却在检验中原假设放弃,又称弃真错误或第Ⅰ类错误,用а表示其概率。
单因素方差分析:研究一个分类型自变量同数值型因变量之间关系的一种统计方法。
点估计:用样本估计量θ的取值直接作为总体参数θ的估计值。
独立性:两个事件中不论哪一个事件发生与否并不影响另一个事件发生的概率,则称这两个事件具有相互独立性。
独立性检验:对两个分类型变量是否存在相依关系的检验。
如果存在相依关系,有必要对这种相关性进行进一步测定。
统计学名词解释完整版
统计学名词解释HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】名词解释●统计工作:是从数量方面对社会经济现象做调查研究的一种工作,是人们为认识客观事物而进行的搜集、整理、分析和提供统计资料的工作过程。
●统计资料:是统计工作的成果,是指在统计实践活动中所取得的,反映统计研究对象有关特征的各种综合性的数字资料和分析报告。
●统计学:是阐述统计理论与方法的系统性科学,是统计工作实践的理论概括和科学总结,是研究、整理、分析统计资料的理论和方法的科学。
●总体:是指客观存在的,在某一相同性质基础上结合起来的许多个别事物的整体●总体单位:构成总体的个别事物●样本:从总体当中抽取出来,用从代表这一总体的部分个体组成的集合●标志:是说明总体单位属性或特征的名称●统计指标:说明总体数量特征的,简称指标。
有俩种理解,一是指反映现象总体数量特征的概念。
二是指反映现象总体数量特征的概念及其数量表现。
●普查:是专门组织的一次性的全面调查。
这种调查,主要用来搜集一些比较全面而又不能或不宜从经常调查中得出的统计资料。
●重点调查:是一种非全面调查,它是从所要调查的单位中选择一部分重点单位进行调查●抽样调查:也是一种非全面调查,它是按照随机原则从被研究总体中抽取出一定数量的单位(样本)进行调查,根据样本指标数值来推算总体指标数值的一种调查●典型调查:是一种十分重要的、行之有效的非全面调查方法。
它是从研究总体中有意识地选取若干具有代表性单位(典型单位)进行调查,用来了解总体的详细情况●统计调查:根据统计工作任务和统计设计的要求,用科学的方法,有计划有组织地向调查单位搜集调查资料的过程●统计分组:根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法●分配数列:又称分布数列、次数数列,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列●总量指标:是反映社会经济现象的总体规模和水平的统计指标。
统计学名词解释
第1章统计与统计数据1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示24. 频数:落在某一特定类别(或组)中的数据个数。
25. 频数分布:数据在各类别(或组)中的分配。
26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。
27. 比率:样本(或总体)中各不同类别数值之间的比值。
28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。
30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
统计学名词解释
7、抽样估计和假设检验
抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异
标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。
1
9、"时间序列的最初水平、处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。
20、"调查对象、调查单位和填报单位
调查对象是所要研究对象的总体。调查单位是所要研究对象的个体。填报单位是提交调查资料的单位。调查单位和填报单位有时相同,有时不同。
4、统计调查
统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。
5、统计绝对数和统计相对数
反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标
总体单位总量和总体标志总量。
(2)按其反映不同的时间状况不同分:
时期指标和时点指标。
(3)按其采用的计量单位的不同分:
实物指标、价值指标和劳动指标。
5、时期指标和时点指标的区别
时期指标:
(1)连续记数,其值可以相加
(2)具有时间xx,与时间长短有关
(3)是流量时点指标:
(1)间断记数,其值不可以相加,相加无实际意义
算总体相应指标
了解被研究对象的特征及发展变化
趋势,可近似推算总体数量,无法估计误差用样本指标数值推断总体指标数值,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
名词解释:医学统计学:用统计学的原理和方法研究生物医学问题的一门学科。
变量(variable):观察单位的某项特征变量值(value of variable):变量的观察结果(测量值)总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。
样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。
随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。
同质(homogeneity):是针对被研究指标来讲,其影响因素相同。
简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。
变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。
等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。
有序变量(定性变量的一种)。
概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P (A)越大,说明A事件发生的可能性越大,0<P(A)<1,小概率事件。
频率(frequency):在相同的条件下,独立重复做n次实验,事件A出现了m次,比值m/n 称为随机事件A在n次实验中出现的频率。
随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计。
系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。
随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。
参数(parameter):根据总体分布特征而计算的总体统计指标。
统计量(statistic):由总体中随机抽取样本而计算的相应样本指标。
频数表(frequency table):将各变量值及其相应的频数列出表格形式,用来表示一批数据各观察值出现的频繁程度。
算术均数(arithmetic mean):描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
几何均数(geometric mean):描述对数正态分布或数据呈倍数变化资料的水平,记为G.中位数(median),将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两个变量的平均值。
极差(range):又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差。
符号R.百分位数(percentile):将n个观察值从小到大依次排列,再把它们的位次转化为百分位。
四分位数间距(inter quarnle range):表示百分位数P75和百分位数P25之差,定义为Q=P75-P25.。
方差(variance):表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
标准差(standard deviation):是描述反映正态分布计量资料离散程度的指标。
是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大小样本均可,最为常用。
变异系数(coefficient of variation ):用于量纲不同和变量间或均数相差较大的变量间变异程度的比较,其计算公式为: CV=100%⨯XS 正态曲线(normal curve )是函数f(X)=222)(21σμπσ--x e 对应的曲线,此曲线是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线。
正态分布(normal distribution ):若指标X 的频率曲线对应于正态曲线,则称该指标服从正态分布,通常用记号N (μ,σ2)表示均数为标准差为的正态分布。
标准正态分布(standard normal distribution ):均数为0标准差为1的正态分布为标准正态分布,记为N(0,1).标准化转换(standardized transformation ):若随机变量X 服从正态分布N (μ,σ2),经过标准化转换Z=σμ-X ,就服从标准正态分布。
统计推断(statistical inference ):通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程为统计推断。
抽样误差(sampling error ):由个体差异产生,由于抽样而造成的样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差,无倾向性,不可避免。
均数的标准误(standard error of mean SEM ):用于表示均数抽样误差的指标,反映样本均数之间的离散程度和样本均数抽样误差的大小。
可信区间(confidence interval CI ):为按预先给定的概率确定的包含未知总体参数的可能范围,含义是包含总体参数的可能性是1-a 。
自由度:n 个变量中,可自由取值的变量的个数。
参数估计:用样本指标(统计量)估计总体指标(参数),有点估计和区间估计两种。
假设检验中P 的含义:指从H 0规定的总体随机抽得的等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
I 类错误:拒绝了实际上成立的H 0这类弃真的错误称为I 类错误,概率大小用alfa 表示。
II 类错误:接受了实际上不成立的H 0这类存伪的错误称为II 类错误,概率大小用β表示。
检验效能:是指当两总体确有差别,按规定的检验水准所能发现该差异的能力。
数值表示:1-β检验水准:是预先规定的,当假设检验结果拒绝H 0接受H 1下有差别的结论时犯错误的概率称为检验水准,记为α均方:有离均差平方和被自由度相除而得。
方差分析:根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个或某几个因素的作用加以解释,通过各变异来源地均方与误差均方比值的大小,借助F 分布做出统计推断,判断各因素对观测指标有无影响。
总变异:样本中全部实验单位差异称为总变异,其大小可用全部观察值的均方表示。
组间变异:各处理组间观察值大小不等,这种变异称为组间变异,可用组间均方表示。
组内变异:各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。
完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应。
随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平相等,然后将每个区组内的观察对象随机地分配到各处理组。
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有“率,构成比,比”等。
率:频率指标,说明一定时期内某现象发生的频率或强度,计算公式为发生某现象的观察单位数除以可能发生某现象的观察总体值*100% 表示方式有百分率%,千分率。
构成比:构成指标。
说明某一事物内部的各组成部分所占的比重或分布,计算公式为:某一组分的观察单位数除以同一事物各组分的观察单位总数*100%,表示方法有百分数等。
比相对比。
是AB 两个有关指标之比,说明A 是B 的若干倍或百分之几,计算公式为比等于B A 。
标准化法:常用于内部构成不同的两个或多个率比较的一种方法,基本思想是指定一个统计标准,按指定标准计算调制率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
定基比:统一用某个时间的指标作为基数,其它各时间的指标与之相比。
环比:以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比。
平均增长速度:用于概括某一时期的平均速度变化,即该时期环比的几何均数减1。
计算公式为平均增长速度=平均发展速度-1=10n n a a 粗死亡率(crude death rate CDR ):或死亡率(mortality rate ),指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平。
发病率(incidence rate IR ):表示一定时期内,可能发生某病的一定人群中新发生某病的强度。
患病率(prevalence rate PR ):又称现患率,指某时刻点上受检人群中现患某种疾病的频率,通常用于描述病程较长或发病时间不明确的疾病的患病情况。
动态数列(dynamic series )按一定的时间顺序,将一系列描述事物的统计指标依次排列起来,就可以观察和比较该事物在时间上的变化和发展趋势。
标化死亡率(standardized mortality rate SMR ):寻找一个统一的分布作为标准组,然后每个比较组均按照该分布标准计算相应的死亡率,所得到的死亡率是相对于标准组的,故称为标化死亡率,由于采取了统一的标准,消除了内部分布不同对总死亡率的影响,使算得的标化死亡率具有可比性。
二项分布(Binomial distribution ):如果每一次实验只有阳性或阴性两种可能的结果,每次实验阳性结果的发生概率均为π,阴性结果均为1-π,每次实验结果是相互独立的,那么重复n 次实验,发生阳性结果次数X 的概率分布称为二项分布。
拟合优度:指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。
非参数统计:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验。
参数统计:通常要求样本来自总体分布型是已知的,在这种假设的基础上,对总体参数进行估计和检验。
秩次:变量值按从小到大顺序所编的秩序号。
秩和:各组秩次的合计称为秩和,是非参数检验的基本统计量。
直线回归:建立一个描述应变量依自变量而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
回归系数:即直线的斜率,直线回归方程中用b表示,其统计意义为X每增减一个单位,Y 平均改变b个单位。
直线相关:用于双变量正态分布资料,有正相关,负相关和零相关等关系。
零相关表示两变量之间美欧直线相关系数。
相关系数或积差相关系数:以符号γ表示样本相关系数,p表示总体相关系数,它是说明具有直线关系的两个变量间相关关系的密切程度与相关方向的指标。
秩相关或等级相关:用双变量等级数据作直线相关分析,适用于1,不服从双变量正态分布而不宜作积差相关分析,2,总体分布型未知,3,用等级表示原始数据。
统计图:将统计指标用几何图形表达,即以点的位置,线段的升降,直条的长短和面积的大小等形式直观的表示事物间的数量关系。
安慰剂对照:在实验研究中,对照组使用一种外形与实验药物完全相同而毫无药理作用的物质,这种对照称为安慰剂对照。