《心理统计学》重要知识点

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《心理统计学》重要知识点
第二章统计图表
简单次数分布表得编制:Excel 数据透视表
列联表(交叉表):两个类别变董或等级变量得交叉次数分布,Excel 数据透视表
直方图(histogram ):直观描述连续变量分组次数分布悄况,可用Excel 图表向导得柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量得关系状况与变化趙向。

条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据得次数分布情况。

简单条形图:用于描述一个样组得类别(或等级)数据变董次数分布。

复式条形图:用于描述与比较两个或多个样组得类别(或等级)数据得次数分布。

圆形图(circle graph ).饼图(pie graph ):用于直观描述类别数据或等级数据得分布情况。

线形图(I ine graph ):用于直观描述不同时期得发展成就得变化趁势;
第三章集中量数
•集中趁势与离中趁势就是数据分布得两个基本特征。

•集中趟势:就就是数据分布中大董数据向某个数据点集中得趋妍。

•集中董数:描述数据分布集中趙势得统计董数。

•离中趁势:就是指数据分布中数据分散得程度。

•差异量数:描述数据分布离中趙势(离散程度)得统计董数
•常用得集中量数有:算术平均数、众数(Mo ).中位数(MJ
1.算术平均数(简称平均数,M 、X. Y ): X=^-
Excel 统计函数AVERAGE
算术平均数得重要特性: (1) 一组数据得离均差(离差)总与为0,即另(旳-x ) = 0
(2) 如果变量X 得平均数为乂,将变董X 按照公式y = a + bx 转换为Y 变量后,
那么,变量Y 得平均数Y=a + bX
2. 中位数(median,此):在一组有序排列得数据中,处于中间位置得数值。

中位数上下得数据出现次数
各占50%o
3. 众数(mode, M 。

):一组数据中出现次数最多得数据。

4•算术平均数、中数、众数之间得关系。

正偏态分布
M < Ma<M o 负偏
态分布 正态分布 M Qi v 3 v
6.调与平均数(harmon i c mean, MJ :一组数值倒数得平均数得倒数。

M H =——— ------ -- - Excel 统计函数 HARMEAN
(— + — + - +—) //?乞丄
州兀2 £ / X 、
(1) 用于描述同一个体(或一组个体)不同时间段得平均学习速度、平均工作效率。

(2) 用于描述不同能力水平个体得平均学习速度、平均工作效率。

7.几何平均数(geometr ic mean, Mg )就是指n 个观察值连乘积得n 次方根、
(D-组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映数据
得集中趋许。

Excel 统计函数GEOMEAN
(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比得几何平均数。

=爲主(x xw 心为各个时间段得成果数据) 兀“ 兀-\x { ・
平均增长率:M’-l
第四章差异量数
差异量数:描述一组数据离散程度(离中趁势)得统计量数。

差异量数较大,说明数扌松分布得比较分 散,数据之间得差异较大;差异董数较小,说明数損分布得比较集中,数据间得差异较小。

差异量数还能反映平均数对一组数据得代表性。

差异董数越小,平均数得代表性越好;差异量数越 大,平均数得代表性越差。

•常用得差异量数就是标准差、方差、差异系数
Excel 统计函数STDEVP (给定样本总体得标准偏差)
Excel 统计函数STDEV (给定样本得标准偏差) Excel 统计函数VARP (给定样本总体得方差)
Excel 统计函数VAR (给定样本得方差)
差异系数(又称变异系数、离散系数、相对标准差):cv = i
X
(1) 用于比较不同观测工具测量结果(数据单位不同)得离散程度,例如,身高离散程度大,还就是体
电离散程度大?
(2) 用于比较用同一观测工具测得得、均数差异较大得不同样本数据得离散程度。

例如:7岁组儿
童与13组岁儿童得体重离散程度,哪个较大?
•标准差得重要特性:如果变量X 得标准差为Sx ,将变量X 按照公式y = a + bx 转换为Y 变董后, 那么,变董
Y 得标准差Sy =bS X
标准差s + fX ;「对 标准差s “九=厘竺竺
V ,?-1
方差宀宀空』
•相对位置量数:反映个体(数据)在团体中相对位置得统计量数。

主要有标准分数及其线性转换分数(Z分数、T分数)、百分等级(PR)、正态化标准分数等。

1.标准分数得计算与应用:z =
xT或:z =
S a
T = 10Z + 50, CEEB=100Z + 500
z分数得特点:Z分数得平均数为0,即“z =0,标准差为1,即a z =1
T分数得平均数“丁=50,标准差为a T =10
CEEB分数得平均数二____________ ?,标准差二____________ ?
(1)可用于比较个体各方面水平鬲低(横向比较,个体内差异评价)。

(2)对被试多方面得测量结果进行综合,如对高考冬科成绩得综合,各分测验分数得综合。

(3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判斷其水平就是提高了,退步了,还就是没有变化。

2.原始分数X得百分等级得含狡与计算
根据简单次数分布表计算:PR* •"一厲xlOO
A N
X—S
—:—■ / + 你
根据分组次数分布表计算:PR、=一------------------ xlOO
A N
第五章相关关系
•相关关系得描述方法
(1)相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间得关系。

可用Excel图表向导中得“XY散点图”绘制。

(2)双向次数分布表(交义表、列联表):适用于描述两个等级变量1或称名变量、类别变量)之间得关系。

可用Excel数据透视表编制列联表)。

(3)相关系数(相关关系得特征值)。

相关系数:描述两个变量相关关系得统计量数,在T、00~1、00之间取值,绝对值越大,越接近1, 说明两个变量之间得关系程度越密切;绝对值越小,越接近0,说明两个变量得关系程度越低。

•常用得相关系数:
适用条件:(1)X、Y两个变量都就是连续性变量(等距数据或比率数据);
(2)X、Y两个变量总体上为正态分布或接近正态分布。

2•斯皮尔曼等级相关:就是一对(两列)名次变莹得积差相关。

对数据变量得分布形态没有要求。

(1)等级积差相关法(名次积差相关法)。

Excel统计函数C0RREL
1.积差相关:/•=Excel统计函数C0RREL
公式中得处与0就是分别代表两变量中每个数据在变量中得名次。

(2)等级差数法(名次差数法)。

如果每个等级(即名次)变量中没有相同得等级名次,可用下面公式计算:
等级差数法简化公式:a = 1 - N (N
如果等级(即名次)变董中有相同得等级名次,需用下面校正公式计算:
, , 0
等级差数法校正公式:怙= bQ 计算方法参见教材125页
2・J (W )(勿 2)
3. 肯德尔W 系数(肯德尔与谐系数):描述多个名次变董一致性程度得统计量数。

适用于描述与分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)得 一致性程度,在心理测董与教育评价中称为评分信度。

例如,5位阅卷老师对10篇论文评分排名得一 致性。

如果评价者给出得不就是个体得水平名次,而就是分数(或等第、符号),可先将其转换成名次, 然后再计算W 系数。

公式中:n 为每个名次变量中相同名次得数目。

4. 点二列相关(point-biser i a I correlat ion ):
用于描述一列续性变量与一列真正二分变量(或非正态二分变量)之间得相关。

真正二变量:指按某种性质或标准将个体划分为两种结果得变量,如对、错,男、女等。

Excel 统计函数C0RREL
5.二列相关(bi serial correlat ion ):用于描述由一个正态连续变量人为划分成得二分变量与另外 一个
正态连续变量之间得相关。

或者说,用于描述一正态二分变董与一正态连续变量之间得相关。

人为二分变量?就是指由连续变董转换而来得二分变量,例如,将测验或考试分数区分为及格与
不及格,80分以上与80分以下;按中考(或高考)成绩,将考生区分为录取.未录取。

正态二分变量?如果二分变量就是根据正态连续变量转换而来,那么,可称之为正态二分变量。

y
y 为将正态分布面积画分为q 、g 两部分得纵线得高度。

y 得计算方法:利用Excel 统计函数计算
标准正态分布区间点函数NORMS I NV Ip 值) T 区间点Z 值
正态分布函数N0RMDIST (区间点Z 值,0, 1,0) TZ 值得槪率密度y
用于描述两个真正二分变量得相关程度,也用于描述一个人为二分变量与真正二分变量得相关。

注意相关计算公式就是由皮尔逊积差相关计算公式转换来得。

因此,如果两列二分变量转换
为0、1(或1、2)得数值变量时,可以用Excel 统计函数C0RREL
计算①系数。

乞尺 2 乏冬)_
VV = —」 —K 2(N‘-N) 12
校正公式:W= ------------
—QZ _N)_ZT 6. e 相关(e 系数):=
\ad-bc\ J(a + b)(c + d)(a + c)(b + d)
第六章概率分布
1 •正态分布得特征(见教材)
2.Excel软件中正态分布函数与正态分布区间点函数得应用
♦标准正态分布函数NORMSDIST得应用:
(1)P(Z<1. 96)=? 二NORMSDIST(J 96)=0. 9750
(2)P (Z> 1、96) = ? =1-N0RMSD I ST (仁96)=0. 0250
(3)P(T、5VXV2、5)=? =N0RMSDIST(2> 5)-NORMSDIST (T、5)=0、9270
♦正态分布函数NORMDIST得应用
例如:已知菜次测验得分数呈正态分布,平均分为75分,标准差为10分,试计算:
(1)低于80分得考生占多大比例,P(X<80分)=?
(2)80分以上得考生占多大比例,P(XM80分)二?
(3)80分以上,低于90分得考生占多大比例,P(80WXV90) = ?
P(X<80 分):性NORMDIST(79、5,75,10,1)” =0、6736
PCX>80 分):“h-NORMDIST(79、5, 75,10,1) w =0、3264
P(80WXV90) : —NORMDIST(89、5, 75,10,1)-NORMDIST(79、5,75, 10,1)^ =0. 2528 ♦标准正态分布区间点函数NORMS I NV得应用
根据给定得向上累积概率P (Z<a),标准正态分布得临界值a=? a二NORMS I NV (p值)
例如:P(Z<a)=0> 90 =NORMSINV(O. 90)= 1、28, a= 1 > 28, P(Z>1> 28)=0、10 ♦正态分布区间点函数NORM I NV得应用
根据正态变童X得平均数、标准差与向上累积概率P(X<a),计算临界值a=?
例:已知英次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。

现准备录取10% 得考生进行面试,录取分数线大致就是多少?
P(X>?) =0> 10,即P(XV?)=1-0、10=0、9, =NORMINV(O> 9,55,12) =70. 38,
最低分数线应为70分。

3•测验分数、测评等级得正态化:
根据被试样本原始分或等级得简单次数分布表,计算各个不同分数或等级得正态标准分数
(1)计算每个不同分数X(或等级)以下累计次数Fb;
(2)计算每个不同分数X(或等级)中点以下累积比率CP: CPx = °、' *厲
x N
(3)利用Excel统计函数NORMS I NV,计算CP对应得正态Z分数。

(4)根据需要■正态Z分数转为其她标准分数形式:
T分数、CEEB分数、托福考试分数.离差智商IQ等,
T = 10Z + 50, CE£B=100Z + 500, TOEFL= 70Z + 500, /Q = 15Z + 100
4•偏态系数(SK)与峰态系数(Kurt)得计算与应用
偏态系数:Excel统计函数SKEW;峰态系数:Excel统计函数KURT。

偏态系数SK = O,对称分布;SK>0,正偏态分布;SKV0,负偏态分布。

峰态系数Kurt = 0,正态分布得峰态;Kurt>0,次数分布得峰度比正态分布峰度低阔;
Kurt<0,次数分布峰度比正态分布峰度高狭。

偏态系数与峰态系数都等于0或接近0时,变童得分布为正态分布。

5.二项分布得定乂
二项分布就是二项试验验结果得槪率分布。

进行门次二项试脸,乞次试脸彼此独立,每次试验时某事件出现得槪率都就是Q,该事件不出现得概率为Q(=1~p),则该事件出现X次得概率分布为:
P(x =x) = b(x,“,“,)= C,' p x q n~x o
二项分布得Excel统计函数:BINOMDIST
6.二项分布函数BINOMDIST得应用
对20道四选一得单项选择题,如果完全凭猜测答題,那么
(1)猜对5道题得概率就是多少?
(2)猜对5题以下概率就是多少?
(3)猜对6题以上得概率就是多少?
n =20,每题猜对得槪率为p =0. 25
(1)猜对5 道题得概率P(扫5) 二BINOMDIST(5, 20,0、25, 0)=0> 20233
(2)猜对5 题以下得槪率PUW5) =BIN0MDIST(5,20,0、25, 1)=0. 61717
(3)猜对6 题以上得槪率P(Q6)*Pg5) =1-BINOMDIST(5,20,0. 25,1)=0. 38283
7•二项分布得形态:随ZK°得变化具有不同得分布形态
(1)当尸g时,二项分布就是对称分布。

(2)当UpM5时,接近正态分布。

(3)当p丰q, np<5或nq<5时,二项分布为偏态分布。

(4)当p主q、npA5且g25时,二项分布接近正态分布。

8.二项分布得平均数与标准差
进行门次二项试验,每次试验时菜事件出现得概率都就是。

則该爭件出现次数得理论平均数(“)、
方差(夕)与标准差cr分别为:“ =w,er2= npq、o = Jnpq。

如果np^5且门qM5,成功事件出现结果得槪率分布接近“ =np、o = Jnpq得正态分布。

进行投掷100枚硬币试验,如果进行无数次试验,正面向上得硬币数目会在0〜100个之间变化。

那么,正面向上次数得理论平均数:“二斫100X0、5=50,标准差为cr = 7w =>/100 x0.5x05 = 5 o
20道四选一得单项选择题,如果完全凭猜测答题,那么,
猜对题数得平均数为〃二砰20X1/4二5
猜对题数得理论标准差为o = Vw = 720x1/4x3/4 = 1.94。

第七章总体参数估计
1•常用得点估计:
总体均数“得点估计:用样本平均数X, Excel统计函数为AVERAGE
总体方差 /得点估计:用样本标准差S;),或S? •— o
71-1
总体标准差CT得点估计:用样本标准差S-],
2.总体平均数得区间估计
1.若样本均数得抽样分布为正态分布,
总体均数得0. 95置信区间为:X ± Z OO5;2SE?= X ± 1.96 x
y/n -1
总体均数得0. 99置信区间为:X ± Z00I(.2S£V= X ± 2.58 x
yjn - 1
2.若样本均数得抽样分布为d仁得t分布,那么,
总体均数得0、95置信区间为:只±仏5/2$£壬=斤±心05/2><月=
J〃一1
总体均数得0、99置信区间为:X±5W2SE K =X±G W2X^=
Jn -1 自由度d仁甲=2 ,心身二?,可用Excel统计函数TINV计算。

也可查教材453页t值表
3.总体方差与标准差得区间估计
总体方差/得0、95置信区间为:
力0.975
总体方差/得0、99置信区间为:
龙0.995
自由度d仁得力2分布右侧概率区间点得计算,也可用Excel统计函数CHIINV。

也可查教材475页X1分布数值表
总体标准差<7得置信区间:取总体方差er,置信区间上、下限得正平方根。

4.总体积差相关系数得区间估计:
(1)舟样本相关系数r转换为费舍Zr值,转换方法:Excel统计函数FISHER
⑵计算Zr得标准误SEz「:SE” =^=
y/n - 3 ⑶计算总体乙值得1-a置信区间:乙土Za》SE〃
1 96
0. 95置信区间为:乙土Z^.SE^ =Z r±^^
• 一J H-3
n CQ
0、99置信区间为:乙土ZggSEN =Z r± —
Jn-3
(4)计算总体相关系数Q值得置信区间:将总体乙值区间上、下限进行费舍逆转换, 转换方法:Excel统
计函数FISHERINV
5.总体比率(比例)得区间估计
np > 5t nq > 5时,样本比率p得抽样分布渐近正态分布。

| A A 总体比率得0、95置信区间为:p±1.96SE/?=p±1.96x
总体比率得0、99置信区间为:p ± 2.58SE p = p ± 2.58
x
第八章假设检验
在Z 检验中:双侧检验临界值:Zoaxh 、96
Z OO 1/2=2. 58 单侧检验临界值:Z 005 =1. 645
Z 001=2> 326
单侧显著性概率P:=1-NORMSDIST (ABS (Z 值))
双侧显著性概率 P : = (1-NORMSDIST (ABS (Z 值)))*2 在t 检验中:单侧显著性
槪率P:=TDIST (ABS (t 值)9df 91)
双侧显著性概率P:=TDIST (ABS (t 值),d 行2)
1 •单个样本Z 检验
主要用途:分析单个样本均数元与已知得总体均值 X 得有无显著差异, 适用条件:(1)总体呈正态分布,总体方差CT?已知;
(2) 总体就是正态分布,总体方差虽然未知,但样本容#/i>30; (3) 即使总体非正态分布,总体方差/也未知,样本容#/?>30.
z=—肖 或:
CF/ y/n S : y/n - 1
2.单个样本t 检验
主要用途:用于分析单个样本均数丘与已知得总体均数U 。

得差异,
适用条件:(1)总体呈正态分布,总体方差CT 2
未知,样本容董/?<30得情况下、
⑵总体非正态分布,总体方差/未知,样本容±n >30得情况下、
3•单个样本比率Z 检脸
主要用途:根据一个样本得比率分析样本所代表得总体比率〃与已知比率內有无显苦差异。

适用条件:
/?/?()> 5, Mu - 5
4•两独立样本比率差异Z 检验
主要用途:根据两个独立样本得比率p.-p 2,推斷两总体比率6、P2有无显著差异 适用条件:两个样本相互独立,n x p v n 2p 29 «i<7r 心么都$5
A
A
7-—一
卩'“
Dl +〃2》2)(®N +〃2“2)
Y
n }n 2(n } + n 2)
5 •两独立样本方差齐性检验
主要用途:根据相互独立得两个样本得方差,推斷两个总体得方差就是否相等或就是否有显著差 异。

大的s 爲 _ n 、S 訂_1) 小的
S 爲一 “2$孑/(”2-1)
双侧显箸性概率P 值:二FDIST (F 值,分子自由厦,分母自由皮)*2
X _〃0
5/7^1
分子方差得自由度df=o-1,分母方差得自由度d 仁处T
6•相关样本t 检验
主要用途:
(1)根据一纽被试前.后两次测评结果,推断两次测验结果得总体均数有无显苦差异。

⑵根扌居实验组与配对对照组测评结果,推断实验组与对照组得总体均数有无显著差异。

适用条件:两个样本得数据有一一对应关系,且有可比性;两总体数据呈正态分布。

7 •独立样本Z 检验
主要用途:根損两个独立样本得均数差异X,-X 2,推斷两总体均数//P //2有无显著差异。

适用条件:
(1)两总体为正态分布,总体方差cr ;已知,不管样本大小
(2) 两总体非正态分布,总体方差另已知,>30, /?2 >30时
(3) 两总体非正态分布,总体方差<7卷 型未知,>30, /?2 >30时 总体右、邑已知时:
z=
X 】 儿 :总体O":、CT ;未知时:Z =
B 亠^2
vV 石
8 •独立样本等方差假设t 检验
主要用途:根据两个独立样本得均数差异X^X 2,推斷两总体均数“、从有无显著差异? 适用条件:⑴两总体为正态分布,总体打、<7子未知,且O ■汁另,不管样本大小
(2)两总体非正态分布,总体of 、CT ;未知,且af = crf, n { >3U «2>30时
两总体方差Of 、<7孑就是否相等,需要先做方差齐性检验。

注意:大多数请况下,两总体方差基本相等。

9 •独立样本异方差假设t 检验
主要用途:根据两个独立样本得均数差异X^X 2,推斷两总体均数“、仏有无显著差异? 适用条件:
(1)两总体为正态分布,总体erf 、er ;未知,且er :工er 訂不管样本大小
(2)两总体非正态分布,总体亓、er ;未知,且crf^cr ;, ^>30, n 2 > 30时
10•积差相关显著性t 检验
主要用途:根据一对变童得样本数据及其积差相关系数厂,推斷两变量有无显著关系。

适用条件:两变量为连续性数值变量,且总上正态分布。

第十四章抽样原理及方法(参见教材)
+n 2S2
/Z| + Hy
当 n \ =n 2=nH t, df =n-l ;当叫 hn 2 时,df =。

相关文档
最新文档