spss统计相关重要名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频数:将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数。
(各组段内的数据个数,频数分布类型有正态,左偏态和右偏态)
百分比:又称百分率、百分数(符号为%)是一种表达比例,比率或分数数值的方法,使用100作为分母。
当前频数/总数(包括缺失值)。
有效百分比:总数是剔除可缺失值等过滤因素的百分比.
比如第一项是40%,第二项是30%,第三项是20%,第四项是10%,
那么前三项的累计百分比就是90%。
当前频数/有效总数(不包括缺失值)。
累计百分比:前几项按照指示从上而下的累加,加到最后一项就是100%。
累计频数/有效总数(不包括缺失值)。
分位数:当随机变量X的分布函数为F(x),实数α满足0 <α<1 时,α分位数是使P{X< x α}=F(xα)=α的数xα,上侧α分位数是使P{X >λ}=1-F(λ)=α的数λ,双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使P{X>λ2}=1-F(λ2)=0.5α的数λ2。
正态分布:若随机变量服从一个位置参数为、尺度参数为的概率分布,且其概率密度函数为
则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作,读作服从,或服从正态分布。
(见课本)
均值(平均数):平均数是指在一组数据中所有数据之和再除以数据的个数。
它是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。
解答平均数应用题的关键在于确定“总数量”以及和总数量对应的总份数。
在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。
方差:统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。
标准差:标准差是方差的算术平方根。
标准差能反映一个数据集的离散程度。
卡方统计量:当观察频数与期望频数完全一致时,χ2值为0;观察频数与期望频数越接近,两者之间的差异越小,χ2值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ2
值越大。
换言之,大的χ2值表明观察频数远离期望频数,即表明远离假设。
卡方检验:卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设为H0是:观察频数与期望频数没有差异。
卡方检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。
根据χ2分布及自由度可以确H0假设成立的情况下获得当前统计量及更极端情况的概率P。
如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著差异;否则不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。
似然比:似然比(likelihood ratio, LR) 是反映真实性的一种指标,属于同时反映灵敏度和特异度的复合指标。
即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。
自由度:自由度指的是计算某一统计量时,取值不受限制的变量个数。
通常df=n-k。
其中n 为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。
自由度通常用于抽样分布中。
参数检验:先由测得的样本数据计算检验统计量,若计算的统计量值落入约定显著性水平a 时的拒绝域内,说明被检参数之间在所约定的显著性水平 a 下在统计上有显著性差异;反之, 若计算的统计量值落入约定显著性水平a 时的接受域内,说明被检参数之间在统计上没有显著性差异,是同一总体的参数估计值。
统计推断的一个重要问题,就是从观测到的样本值去估计总体分布参数(或其函数)。
例如总体均数的点估计或区间估计、相关系数和回归系数的假设检验等,常假定样本所来自的总体分
布(如正态分布、泊松分布等)具有已知的函数形式,而其中有的参数为未知。
统计推断的目的就是对这些未知参数进行估计或检验。
估计参数或对有关参数的假设进行检验称为参数统计,所用的检验叫做参数检验。