心理统计学知识点

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

心理统计学知识点

第三章：集中量数
1．未分组数据求算术平均数

2．已分组数据求算术平均数

3．未分组数据求中数（一组数据中没有重复数据）
4．未分组数据求中数（一组数据中有重复数据）
5．分组数据求中数
6．众数（直接观察求众数）
7．利用公式求众数
8．加权平均数
9．几何平均数（略）
10．调和平均数（略）
第四章：差异量数
1．全距
2．百分位数
3．百分位差或
4．百分等级
5．四分差
6．平均差
7．方差、标准差（利用平均数求方差、标准差）

8．方差、标准差（利用原始数据求方差、标准差）

9．方差、标准差（分组数据求方差、标准差）

10．总标准差的合成(略)
11．差异系数
12．标准分数
第五章：相关关系
1．积差相关系数的适用资料
（1）要求成对数据，成对数据的数目不宜少于30对
（2）两列变量各自总体分布都是正态，至少是接近正态的单峰分布
（3）两列变量都是连续的变量，即都是测量数据
（4）两列变量之间的关系应该是直线性的
2．积差相关系数的计算公式（利用标准差和离均差计算）
3．积差相关系数的计算公式（利用标准分数计算）
4．积差相关系数的计算公式（利用原始数据计算）
5．积差相关系数的计算公式（利用减差法计算）
6．积差相关系数的计算公式（利用加差法计算）
7．斯皮尔曼等级相关公式（等级差数法）（N＜30）
8．斯皮尔曼等级相关计算公式（等级序数法）
9．斯皮尔曼等级相关计算公式（有相同等级时）

10．肯德尔等级相关适用资料（肯德尔W系数）
肯德尔W系数，又叫肯德尔和谐系数。计算肯德尔和谐系数，一般采用等级评定法，即让K个被试（或评价者）对N件事物或作品进行等级评定，每个评价者都能对N件事物的好坏、大小等排列出一个等级顺序。最小的等级序数为1，最大的为N，这样，K个评价者便可得到K列从1到N的等级变量资料；或者一个评价者先后K次评价N件事物或N件作品，也是采用等级评定法，这样，也可得到K列1至N的等级变量资料。这类K列等级变量资料综合起来求相关，就用肯德尔W系数。
11．肯德尔等级相关计算公式（肯德尔W系数）

12．肯德尔等级相关适用资料（肯德尔U系数）
如果有N件事物，由K个评价者对其优劣、大小等单一维度的属性进行评价，若评价者直接使用等级评定的方法，家采用坑德尔W系数分析K个评价者是否具有一致性。若评价者采用对偶比较的方法，即将N件事物两两配对，可配成N(N—1)∕2对，然后对每一对中两事物进行比较，择优选择，优者记1，非优者记0，最后整理

所有评价者的评价结果，这时便应计算肯德尔U系数。
13．肯德尔等级相关计算公式（肯德尔U系数）
（N被评事件的数目，K为评价者的数目。）
14．点二列相关适用资料
按事物的某一性质划分的只有两类结果的变量，称为二分变量。二分变量又分为真正的二分变量和名义的二分变量。真正的二分变量也称为离散型二分变量。所谓人为的二分变量，是指该变量本来是一个连续一体，但被某种人为的规定划分为两个类别。如果两列变量中有一列为等距或等比测量数据，而且其总体分布为正态，另一列变量是二分称名变量，此时，给“二分”变量的一系列观测值赋予对应的数字，就得到一个“二分”数列，另一个连续变量的一系列观测值就是一个点数列。如果一个点数列与一个“二分”数列中的点存在一一对应的关系，则称这两个数列为点二列。点二列相关考察两列观测值，一列是连续变量，另一个为二分称名变量之间相关程度的统计方法。
15．点二列相关计算公式

16．二列相关适用资料
二列相关适用的资料是两列数据均属于正态分布，其中一列变量为等距或等比的测量数据，另一列变量为人为划分的二分变量。
17．二列相关计算公式

18．多列相关适用资料
多列相关适合处理两列正态变量资料，其中一列为等距或等比的测量数据，另一列被人为的划分为多种类别，称为名义变量。多列相关多用于一列正态连续变量与另一列正太的称名变量之间的一致性分析，在测验时，常常用于效度分析。
19．多列相关计算公式（略）
20．四分相关的适用资料
四分相关适用于计算两个变量都是连续变量，且每一个变量的变化都被人为的分为两种类型这样的测量数据之间的相关。
21．四分相关的计算公式

22．Φ系数的适用资料
当两个相互关联着的变量分布都是真正的二分变量，在两个分布中间都各有一个真正的缺口时，用phi系数解决此类点分布问题。
23．Φ系数的计算公式

第六章：概率分布
1．正态分布理论在测验中的应用
（1）化等级评定为测量数据
（2）确定题目的难易程度
（3）在能力分组或等级评定时确定人数
（4）测验分数的正态化
2．二项分布的平均数和标准差
当二项分布满足p＜q，np≥5（或p＞q，nq≥5）时，二项分布接近正态分布。这时二项分布的X变量（即成功的次数）具有如下的性质：，
3．样本分布
（1）总体正态分布，方差已知，样本平均数的分布为正态分布。

（2）总体分布非正态，但方差已知，这时，当样本足够大时（n≥30），其样本平均数的分布为渐进正态分布。接近正态分布的程度即总体偏斜

程度有关。样本n越大，接近的越好或总体偏态越小，接近的程度越好。
（3）总体分布为正态，方差未知时，样本平均数的分布为t分布。

（4）总体分布为非正态而且总体方差也未知时，若满足n＞30这一条件，样本平均数的分布近似t分布。

（5）依随机取样的原则，于正态分布的总体中抽取容量为n的样本，当n足够大时（n＞30），样本方差以及样本标准差的分布渐趋于正态分布。样本分标准差分布的平均数与标准差与母总体的标准差之间的关系如下。
（6）自正态分布的总体中，随机抽取容量为n的样本，样本方差与总体方差的比值为分布。
特别提示：和第五条联系起来，样本方差以及样本标准差的分布为渐趋于正态分布。但是第五条的公式要求n非常大，一般难以保证，所以方差和标准差的推论，较少用渐进正态分布，二选择用精确分布。方差的推论就用第六条规则，标准差的推论，可以先求方差的范围，然对方差开平方，取正的范围就可以了。
（7）自一个正态总体重随机抽取容量为n1、n2的两个样本，其方差比率的分布为F分布，分子自由度为n1—1，分母自由度为n2—1。

4．分布的基本公式
从一个正态分布的总体中，每次随机抽取随机变量，分别将其平方，即可得到，这样可抽取无限多个数量为n的随机变量及，那么，这无限多个n个随机变量平方和或标准分数的平方和的分布，即为分布。

5．t分布的基本公式

从一个总体正态分布，总体方差未知时，样本平均数的分布为t分布，平均数分布的标准差与样本本身的标准差之间的关系如下。

6．F分布的基本公式
设有两个正态分布的总体，其平均数与方差分别为，从这两个总体中分别随机抽取容量为，每一个样本都可以计算出，这样可以得到无限多个及，每个随机变量个除以自由度df1、df2，（df1= n1或n1—1，df2= n2或n2—1）之比，称为F比率，这无限多个F的分布称做F分布。

（在这个公式里df1= n1—1，df2= n2—1）
第七章：参数估计
1．点估计
点估计就是用样本统计量来估计总体参数，因为样本统计量为数轴上的某一点值，估计的结果也以一个点的数值表示，所以称为点估计。对总体平均数的估计，用样本的平均数；对总体方差估计，常用样本的方差；用样本相关系数r来估计总体相关系数。
2．良好点估计的标准
（1）无偏性
即用多个样本的统计量作为总体参数的估计值时，其偏差的平均数为0。用样本平均数作为总体平均数μ的估计，就具有无偏性。样本方差就不是总体方差一个无偏估计量。的无偏估计量为，用表示。
（2）有效性
当总体

参数的无偏估计不止一个统计量时，无偏估计变异小者有效性高，变异大者有效性低，即方差越小越好。
（3）一致性
当样本容量无限增大时，估计值应该能够越来越接近它所估计的总体参数，估计值越来越精确，逐渐趋近于真值。
（4）充分性
指一个容量为n的样本统计量，是否充分反映了全部n个数据所反映总体的信息。
3．区间估计
区间估计时根据估计量以一定的可靠程度推断总体参数所在的区间范围，它是用数轴上的一段距离表示未知参数可能落入的范围。区间估计的原理是样本分布理论。在计算区间估计值，解释估计的正确概率时，依据的是该样本统计量的分布规律以及样本分布的标准误（SE）。样本分布提供概率解释，而标准误的大小决定区间估计的长度。一般情况下，加大样本容量可使标准误变小。
4．用平均数估计总体平均数的步骤
（1）用实得样本的数据计算样本的平均数与标准差。
（2）计算样本平均数分布的标准误。分为两种情况。
当总体方差已知时：
当总体方差未知时：
（3）确定置信水平或显著性水平。
一般定显著性水平为0.05或0.01，即置信水平为0.95或0.99。
（4）根据样本平均数的抽样分布，确定查何种统计表。一般来说，当总体方差已知时，查正态表；当总体方差未知时，查t值表。
（5）计算置信区间，分为两种情况
如果查正态表，置信区间可写作：
(0.95)
（0.99）
如果查t值表，置信区间可写作：
（0.95）
（6）解释总体平均数的置信区间。
估计总体平均数落入该区间的正确可能性为0.95或0.99，犯错误的可能性为0.05或0.01。
5．标准差的置信区间
根据样本分布理论，当样本容量n＞30时，样本标准差的分布为渐进正态分布。
标准差分布的平均数为：标准差分布的标准差为：
总体方差未知，可用样本的作为估计量计算标准误。置信区间一般为0.95或0.99。置信区间可写作：

6．方差的区间估计
根据分布：

自正态分布的总体中，随机抽取容量为n的样本，其样本方差与总体方差的比值为分布。这样可以直接查表确定其比值的0.95或0.99置信区间。再进一步用下面的公式确定总体方差的0.95或0.99置信区间：
或
查的表，确定与。
7．两总体方差之比的区间估计
根据F分布，可估计二总体方差之比的置信区间：
若二总体方差相等，上面的公式可以写作：
这就是说，根据样本方差估计二总体方差之比在1上下一定区间之内，即可推论二总体方差相等。
8．积差相关系数的区间估计
当总体相关系数时，样本相关系数的分布，服从自由度df=n－2的t分

布，标准误为：
根据时，样本相关系数的分布为t分布便可计算其置信区间：

特别提示：一般情况下，我们无法知道总体相关系数是否为0，用刚才的公式计算的置信区间包含0在内，说明样本可能是取自相关为0的总体，也说明所计算的置信区间是正确的（所依据的分布即标准误正确）。如果，不包括0在内，则应该换成另外一种情况。
9．斯皮尔曼等级相关系数的区间估计
在9≤n≤20时，斯皮尔曼相关系数的样本等级相关系数rR的分布近似为df=n－2，的t分布。若符合这个条件，可依此分布及标准误计算置信区间：

若n＞20时，的分布近似正态分布，标准误仍然为，这时要查正态表（用代替）。
10．比率的样本分布
在心理与教育实验调查中，设具有某种属性的时间出现的比率（即概率）为p，则除此之外的事件出现的概率为q，p＝1－q。从这样的二项分布总体中每次抽取容量为n的样本（即进行n次重复实验），每次可计算实得的比率，（x为成功的次数），，当np≥5（或nq≥5）时，样本比率的分布为渐进正态分布。平均数和标准差为：
特别提示：比率的标准误与二项分布的标准差的意义相同，只是使用的单位不同。二项分布用成功的次数表示
若用比率表示，则都除以n：

11．比率的区间估计
当时，比率的置信区间可写作：

当总体p、q未知时，用样本的、
当np≤5时，此时二项分布不接近正态分布，也就是说比率的样本分布不接近正态。可以直接查表求得。
12．比率差异的抽样分布
从总体比率分别为p1与p2的两总体中随机抽取样本容量为n1及n2的样本，得到。当n1p1≥5，n2p2≥5时，统计量的分布为正态分布。平均数和标准误分别为如果p1与p2未知与p2未知，可分别用两样本的比率作为p1与p2的点估计值，的公式可以写作：

如果p1＝p2＝p，则该两样本是取自同一总体，两样本的比率都可以作为p的点估计值。这是标准误的计算不单独用，而是用平均的比率（pe）

这样标准误可以写作：
13．比率差异的区间估计
根据比率的样本分布，当n1p1≥5，n2p2≥5时，比率差异的置信区间可用正态分布概率计算。
（1）若p1≠p2，置信区间为：
（2）若p1＝p2＝p，置信区间为：

第八章：假设检验
1．假设检验中的小概率原理
假设检验的基本思想是概率性质的反证法。为了检验虚无假设，首先假定虚无假设为真。在虚无假设为真的前提下，如果导致违反逻辑或违背人们尝试和经验的不合理现象出现，则表明“虚无假设为真”的假定是不正确的，也就不能接受虚无假设。如果没有导致不合理现象出现，那就认为

“虚无假设为真”的假定是正确的，也就是说要接受虚无假设。
2．假设检验中的两类错误（αβ）
1－β被称为统计检验力
3．单侧检验和双侧检验
4．假设检验的步骤
（1）根据问题要求，提出虚无假设和备择假设。
（2）选择适当的检验统计量。
（3）规定显著性水平α。
（4）计算检验统计量的值。
（5）做出决策。
5．平均数的显著性检验
平均数的显著性检验是指对样本平均数与总体平均数之间差异进行的显著性检验。
（1）总体正态分布，总体方差（或标准差）已知
（2）总体正态分布，总体方差（或标准差）未知
（3）总体非正态分布，总体标准差已知
一般认为当n≥30（也有人认为n≥50）时，尽管总体分布非正态，对于样本平均数的检验仍然可以用Z检验（近似Z检验）。

（4）总体非正态分布，总体标准差未知时，由于样本容量较大，可以直接用样本方差代s代替。
6.平均数差异的显著性检验
平均数差异的显著性检验，就是对两个样本平均数之间的差异进行的检验。
（1）两个总体都是正态分布、两个总体方差都已知，独立样本的平均数差异检验
当两个变量相互独立时，两个变量和或者差的方差等于各自方差的和。

则
则
（2）两个总体都是正态分布、两个总体方差都已知，相关样本的平均数差异检验
相关样本，意思是两个样本的数据存在一一对应的关系。当两个样本的相关系数为r时，两变量之差的方差为：

（3）两总体都是正态分布、两个总体方差都未知，两个总体方差一致或相等，即独立样本的平均数差异检验（等容量）
注意：首先要进行方差齐性检验

（4）两总体都是正态分布、两个总体方差都未知，两总体方差不齐性，独立样本的平均数差异检验（略）
（5）两总体都是正态分布、两个总体方差都未知，相关样本的平均数差异检验（相关系数未知）
（6）两总体都是正态分布、两个总体方差都未知，相关样本的平均数差异检验（相关系数已知）此时，因为，所以标准误和t值分别为：

（7）两总体非正态分布，独立样本的平均数差异检验，当两个样本的容量都大于30时（或都大于50时）也可以用检验。
总体方差都已知：
总体方差都未知：
（8）两总体非正态分布，相关样本的平均数差异检验，当两个样本的容量都大于30时（或都大于50时）也可以用检验。
总体方差都已知
总体方差都未知
7．样本方差与总体方差的差异检验
当从正态分布的总体重随机抽取容量为n的样本时，其样本方差与总体方差的比值的分布为分布。即：
因此，若进行样本方差与总

体方差的差异显著性检验，只需计算出卡方值，然后根据自由度df＝n－1，从卡方值表中分别找出与，定显著性水平为α（通常为0.05）。则当或时，与的差异显著；当时，差异不显著。
8．两个独立样本之间的方差差异显著性检验。（方差齐性检验）根据F分布，

设总体一的方差为，总体二的方差为
如果，则，则，当和未知时，可以用和代替。则应该在1的附近波动。
，当，两个样本的方差之间差异不显著。这样比较麻烦，而且要求倒数，增加了计算误差。在求方差时，通常将较大的样本方差放在分子，较小的方差放在分母。。公式中的在理论上还应该是，但是当n1和n2相差不大时，可以用代替。（查附表3）当时，两个样本方差的总体方差差异不显著。
9．两个相关样本之间的方差差异显著性检验

当（双侧）（单侧）认为两个方差之间差异不显著，当（双侧）或（单侧），差异显著。
第九章：方差分析
1．方差分析的基本原理：综合的F检验
方差分析主要处理两个或两个以上平均数之间的差异检验的问题。这样就需要设定综合的虚无假说：当综合的虚无假设被推翻之后，还应该紧接着确定究竟哪两个组之间的平均数之间存在这显著差异。
2．方差具有可分解性
如果令

则
3．方差分析的基本过程
（1）求平方和
一般直接用原始数据求平方和。

（2）计算自由度

（3）计算均方

（4）计算F值

（5）查F值表进行F检验并做出决断
只有当F值大于1，并且落入F分布的临界区，才能表明数据的总变异基本上由不同的实验处理所造成的，或者说不同的实验处理之间存在着显著差异。
4．方差分析的基本假设
（1）总体正态分布
（2）变异的相互独立性
（3）各实验处理内的方差要一致
（方差分析中要进行方差齐性检验）
第十章：卡方检验
1．检验的假设
（1）分类相互排斥，互不包容
（2）观测值相互独立
（3）期望次数的大小
为了努力使χ2分布称为χ2值合理准确的近似估计，每一个单元格中的期望次数应该至少在5个以上。当自由度等于1时，在进行χ2检验时，每个单元格的期望次数至少不应该低于10，这样才能保证检验的准确性。
2．检验的类别
χ2检验因研究问题的不同，可以细分为多种类型：配合度检验、独立性检验、同质性检验。
（1）配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近，这种χ2检验有时也称为无差假说。
（2）独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。
（3）同质性检验主要目的在于鉴

定不同人群母总体在某一个变量的反应是否具有显著性差异。
3．检验的基本公式
4．期望次数的计算
期望次数是虚无假设成立时的数值。在配合度检验中，期望值为总体的实际数值或使某一理论存在的数值。在独立性检验和同质性检验中，如果两个变量或两个样本无相互关联使。期望值为列联表中个单元格的理论次数，即各个单元格（cell）对应的两个边缘次数(marginal)次数的乘积除以总次数。
5．配合度检验
（1）统计假设
应用公式求出值。
（2）确定自由度
自由度通常为分类项数－1。
（3）理论次数的计算
这个要根据具体情况而定。无差假说的。
6．独立性检验
（1）统计假设
独立性检验的虚无假设是二因素或多因素之间是独立的或无关联的；备择假设为二因素或多因素之间是有关联的，或者说差异显著。一般多用文字叙述。
（2）理论次数的确定

（3）自由度的确定
（4）统计公式
或。（这两个公式是等价的，应用在独立样本的多格表中，比如2×3格表中）
7．独立样本的四格表的独立性检验
自由度为1。A、B、C、D为每一格的实计数，AD、BC分别为两个对角线的实计数的乘积。（此公式只适用于独立样本的四格表的独立性检验）
8．相关样本的四格表的独立性检验
自由度为1。(A、D是两次实验或调查中分类项目不同的那两个格的实计数，此公式只适用于相关样本的四格表的独立性检验)
7．同质性检验（略）