《心理统计学》学习笔记
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
65~69 67 7
60~64 62 4
55~59 57 1
总和50
二.相对(比值)次数分布表。累积次数分布表
相对(比值)累积次数:累积次数值/总数N
注:一般避免不等距组(“以上”“以下”称为开口组)
相对次数累积次数(此处意为“每组上限以下的人次)”小于制“
.04 50
.06 48
.04 45
.12 43
&3.样本均值(#)的抽样分布
一.总体方差σ2已知时,#的抽样分布
1.正态总体,σ2已知时,#的抽样分布
设(X1,X2,…Xn)为抽自正态总体X~N(μ, σ2 )
的一个简单随机样本,则其样本均值#也是一个正态分布的随机变量,且有:
E(#)=μ, σx2 =σ2 /n
即#~N(μ, σ2 /n)
Z=(#-μ)σ/n1/2
&2.二项分布
一.二项分布
P(x)=Cnxpxgn-x做对的概率px:做错的概率gn-x:X:对的数量pxgn-x ——每一种分情况的概率。一种情况:pxgn-x再乘上系数。
Eg:产品合格率为90%取n=3(个)
TTT的情况90 * 90*90=P3 0.729
TFT 90*0.10*90=P2g1 0.081
Eg:一次测验,μ=100 σ=5
从该总体中抽样一个容量为25的简单随机样本,求这一样本均值间于99到101的概率?
解:已知X~N(100,52)
n=25.
则#~N(100,12)
Z=(#-100)/1~N(0,1)
当#=99时,Z=-1
当#=101时,Z=1
所以P(99≤#≤101)
=P(-1≤Z≤1)=.68268
解:已知:μ=5000,σ=400,n=100>30是大样本
所以#近似正态分布
#~N(5000,402)
当#=4900时,Z=(4900-5000)/400/1001/2=-2.5
P(#≥4900)=P(Z≥-2.5)=0.99379
3.有限总体的修正系数
(引出)(2)同上题,从2000(有限总体)盏中不放回地抽取100盏,问。。。。。
3个用途
五.偏态量与锋态量(SK)
1.偏态量:sk=(#-Mo)/σx
动差(一级~四级)a3= Σ(x-#)3、/ N/σx3三级动差计算偏态系数)
2.峰态量:高狭峰a4>0 (a4=0 ——正态峰)
低调峰。A4<0
用四级动差a4=Σ(X - #)4/N/σx4-3
&3.地位量数
一.百分位数
eg:P30=60(分)“60分以下的还有30%的人”
Z=(x-#)/σx=(x-15)/8~N(0,12)
P=150/2800=0.053
0.5-0.053=0.447
Z=1.615
X=1.615*8+75≈88(分)
2.某高考,平均500分,标准差100分,一考生650分,设当年录取10%,问该生是否到录取分?
解:Zo=(650-500)/100=1.5 (X~N(500,1002)(Z~N(0,12)
Po=0.5-0.43319=0.06681=6.681%<10%
所以可录取。
《心理统计学》学习笔记—第五章 抽样分布(概率P)
第五章抽样分布(概率P)
&1.抽样方法
一.简单随机抽样
二.等距抽样
三.分层抽样
四.整群抽样
五.有意抽样
&2.抽样分布
(1)(2)(3)(4)(5)
20 25 30 35 40
二.百分等级
30→60(在30%的人的位置上,相应分数为60)
So→Md
《心理统计学》学习笔记—第四章 概率与分布
第四章概率与分布
&1.概率
一.概率的定义
W(A)=m/n (频率/相对频数)
后验概率:
P(A)=lim m/n
先验概率:不用做试验的
二.概率的性质和运算
1.性质:o≤P≤1
p=1必然可能事件
四.正态分布的应用
T=KZ+C T~N(C,K2)
IQ=15Z+100 IQ=100一般
IQ≥130 ——超常
(30=2x*15)
IQ<70 ——弱智
70几——bndenline
eg:1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。问录取分数定为多少分?
解:X~N(75.82)
(3)成绩在60分以下多少人?
解: X~N(57.08,18.042) ——参数(μ,σ2)
Normal表示符合正态分布
令Z= (x-57.08)/18.04),则Z~N(0,12)标准分数平均数一定为0,标准差一定为1。
(1)Z1=(90-57。08)/18.04=1.82
P(Z>1.82)=.0344
.28 37
.22 23
.14 12
.08 5
.02 1
1.00
&3.次数分布图
一.直方图
1.标出横轴,纵轴(5:3)标刻度
2.直方图的宽度(一个或半个组距)
3.编号,题目
4.必要时,顶端标数)
图
二.次数多边图
1.画点,组距正中
2.连接各点
3.向下延伸到左右各自一个组距的中央
最大值即y轴最大值
相对次数分布图,只需将纵坐标改为比率。(累积次数,累积百分比也同样改纵坐标即可)”S形”曲线是正态分布图的累积次数分布图
&2.次数分布表
一.简单次数分布表
eg:组别次数(人次)
1002
90~99 5
80~89 14
70~79 15
60~69 7
60分以下3
1.求全距R=Max – Min(连续变量)
(间断变量)——R=Max-Min+1
2.定组数K(组数)=1.87(N-1)。。。→取整N-总数
3.定组距I=R/K。一般,取奇数或5的倍数(此种更多)。
(2)完全凭猜测做判断题,(共2道),做对1题的概率为:
A={T.Ti B={F.Ti C={T.Fi D={F.Fi
P=P(B)+P(C)=1/4+1/4=0.5
3.乘法:
P(A1,A2…An)=P(A1),P(A2)…P(An)
Eg:(1)四选1。(十道)完全凭猜测得满分得概率:(1/4)*(1/4)…*(1/4)=1/410
P(x=6)=C610P6g4=C610(1/2)6(1/2)4=.20508
P(x=7)=C710P7g3=C710(1/2)7(1/2)3=.11719
=.04395
=.00977
+P(x=10)=C1010P10g0=(1/2)10 =.000098
至少答对5题:P(X≥5) = 0.62306
两个合格的情况→TTF
FTT
其概率C32P2g1=3p2g1.
Cn0P0gn+CnP1gn-1+…+CnPng0=1
注:二项分布可能的结果只有两种。F 0r T
合格Or不合格
选对Or选错
例:(1)10道是非题,凭猜测答对5,6,7,8,9,10题的概率?至少答对5题的概率?
P(x=5)=C510P5g5=C510(1/2)51/2)5=.24609
年龄有绝对0
时间(年代,日历。。。)位移无绝对0,可能有相对0,即有正负
4.等比量表。可做乘除法。
要有绝对零。
成绩中的,0分不是绝对0(因为并不说明此人一窍不通)
分数代表的意义。Eg:0~10分
与90~100分。每一分的“距离”不一样
因为严格来说,成绩是顺序量表。但为了实际运用中的各种统计,把它作为等距量表
(2)四选一,猜中8,9,10题的概率?
P(x=8)=C819P8g2=C819(1/4)8(3/4)2=.0039
二.二项分布图(P84~85)
三.二项分布的平均数与标准差(前提np≥5且ng≥5)
平均数——M=np标准差——r=npg1/2
&3.正态分布
一.正态分布曲线
二.标准正态分布。(P387附表可查面积P)
《心理统计学》学习笔记——第二章 数据整理
第二章数据整理
&1.数据种类
一.间断变量与连续变量eg:人数~间断
二.四种量表。
1.称名量表。Eg:307室,学号,电话号码不能进行数学运算(也包括不能大小比较)
2.顺序量表。Eg:名次。能力大小,不能运算
3.等距量表。可以运算(做加减法),不能乘除
要求:没有绝对0
2.非正态总体,σ2已知时,#的抽样分布
设(X1,X2,…Xn)是抽自非正态总体的一个简单1随机样本。当n≥30时,其样本均值#接近正态分布,且有:
EBiblioteka Baidu#)=μ, σx2 =σ2 /n
即#~N(μ, σ2 /n)
若是小样本,题目无解。
Eg(1)一种灯具,平均寿命5000小时,标准差为400小时(无限总体)从产品中抽取100盏灯,问它们的平均寿命不低于4900小时的概率。
7575 74 74 73 (III)I=R/K =43/9≈5
7272 72 71 71
7170 70 69 69
6867 67 67 65 (iu)组别组值次数
64 62 62 61 57 95~99 97 2
90~94 92 3
85~89 87 2
80~84 82 6
75~79 77 14
70~74 72 11
eg: 91年92 93 94 95 96
12%10%11%9%9%8%
求平均增长率
xg=
加权平均数
甲:600人#=70分
乙:100人#=80分
加权平均数:#=(70*600+80*100)/(600+100) (总平均数)eg:600人,100人
简单平均数:(70+80)/2
三.中(位)数。(Md)
P(70≤x≤80)=p(o≤z≤1)
P(60≤x≤70)=P(-1≤z≤0)
2.μ
P(0≤z≤1)=P(μ≤x≤μ+σ)
P(-1≤z≤0)=P(μ-σ≤x≤μ)
图(略)
例:某地区高考,物理成绩μ=57。08(分)σ=18。04(分)
总共47000人。(1)成绩在90分以上多少人?
(2)成绩在(80,90)多少人?
Z=(x-ц)/r (x:原始分数)
标准分数(有正有负)ΣZ=0
三.正态分布表的使用
查表P(0≤Z≤1)=0.34134——Z的范围中的人数比例(百分数)
P(0≤Z≤1.645)=0.4500
1.64-.44950=0.45
1.65-.45053=0.45
之上,标准分数高于2个标准差,则非常聪明。
Eg:1. μ=70(分) σ=10
图
《心理统计学》学习笔记——第三章 常用统计量数
第三章常用统计量数
&1.集中量
一.算术平均数
公式
算术平均数的优缺点。P36~37
算术平均数的特征。Σ(X-#)=0离(均数)差
Σ(X-#)(X-#)取#时,得最小值
即:离差平方和是一最小值
二.几何平均数
#g=略
long#g=1/NσlogXi
根据按一定比例变化时,多用几何平均数
N1=np=47000*0.0344=1616(人)
(2)Zz=(80-57.08)/18.04=1.27
P(1.27<Z<1,82)=.46562-.39796=0.677
N2=NP=3177(人)
(3)Z3=(60-57.08)/18.04=0.16
P(Z<0.16)=.56356
N3=26487(人)
4.定各组限
5.求组值X=(上限+下限)/2上限——指最高值加或取10的倍数等)
6.归类划记
7.登记次数
例题:99 96 92 90 90(I)R=99-57+1=43
87 86 84 83 83
8282 80 79 78 (II)K=1.87(50-1)。。。≈9
7878 78 77 77
7776 76 76 76
(1)#=20 22.5 25 27.5 30
(2)22.5 25 27.5 30 32.5
(3)25 27.5 30 32.5 35
(4)27.5 30 32.5 35 37.5
(5)30 32.5 35 37.5 40
总体分布
图
抽样分布
图
一.平均数
E(#)=µ
二。标准差,方差。
σx=σ/n1/2σ#2=σ2/n
p=0不可能事件
2.加法。
P(a+b)=P(a)+P(b)
“或”:两互不相克事件和。
推广:“有限个” P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
eg:(1)A=出现点数不超过4(x≤4)
P(A)=P(x=1)+P(x=2)+P(x=3)+P(x=4)=1/6+…1/6=4/6=2/3
MD={Σ|x-#(或Md)|}/N
三.方差
总体方差的估计值
S2 =Σ(X-#)2反编
样本的方差:σ2 x有编
N很小时,用S2估计总体
N>30时,用S2或σ2 x都可以
计算方法:σ2 x=Σx2 /N-(ΣX/N) 2
标准差σx=σ2 x2/1
四.差异系数(CV)
CV=σx/# *100% CV∈[5%,35%]
1.原始数据计算法
分:奇、偶。
2.频数分布表计算法(不要求)
3.优点,缺点,适用情况(p42)
四.众数(Mo)
1.理论众数
粗略众数
2.计算方法:Mo=3Md-2#
Mo=Lmo+fa/(fa+fb)*I
计算不要求
3.优缺点
平均数,中位数,众数三者关系。
&2.差异量数
一.全距
R=Max-Min
二.平均差(MD或AD)
60~64 62 4
55~59 57 1
总和50
二.相对(比值)次数分布表。累积次数分布表
相对(比值)累积次数:累积次数值/总数N
注:一般避免不等距组(“以上”“以下”称为开口组)
相对次数累积次数(此处意为“每组上限以下的人次)”小于制“
.04 50
.06 48
.04 45
.12 43
&3.样本均值(#)的抽样分布
一.总体方差σ2已知时,#的抽样分布
1.正态总体,σ2已知时,#的抽样分布
设(X1,X2,…Xn)为抽自正态总体X~N(μ, σ2 )
的一个简单随机样本,则其样本均值#也是一个正态分布的随机变量,且有:
E(#)=μ, σx2 =σ2 /n
即#~N(μ, σ2 /n)
Z=(#-μ)σ/n1/2
&2.二项分布
一.二项分布
P(x)=Cnxpxgn-x做对的概率px:做错的概率gn-x:X:对的数量pxgn-x ——每一种分情况的概率。一种情况:pxgn-x再乘上系数。
Eg:产品合格率为90%取n=3(个)
TTT的情况90 * 90*90=P3 0.729
TFT 90*0.10*90=P2g1 0.081
Eg:一次测验,μ=100 σ=5
从该总体中抽样一个容量为25的简单随机样本,求这一样本均值间于99到101的概率?
解:已知X~N(100,52)
n=25.
则#~N(100,12)
Z=(#-100)/1~N(0,1)
当#=99时,Z=-1
当#=101时,Z=1
所以P(99≤#≤101)
=P(-1≤Z≤1)=.68268
解:已知:μ=5000,σ=400,n=100>30是大样本
所以#近似正态分布
#~N(5000,402)
当#=4900时,Z=(4900-5000)/400/1001/2=-2.5
P(#≥4900)=P(Z≥-2.5)=0.99379
3.有限总体的修正系数
(引出)(2)同上题,从2000(有限总体)盏中不放回地抽取100盏,问。。。。。
3个用途
五.偏态量与锋态量(SK)
1.偏态量:sk=(#-Mo)/σx
动差(一级~四级)a3= Σ(x-#)3、/ N/σx3三级动差计算偏态系数)
2.峰态量:高狭峰a4>0 (a4=0 ——正态峰)
低调峰。A4<0
用四级动差a4=Σ(X - #)4/N/σx4-3
&3.地位量数
一.百分位数
eg:P30=60(分)“60分以下的还有30%的人”
Z=(x-#)/σx=(x-15)/8~N(0,12)
P=150/2800=0.053
0.5-0.053=0.447
Z=1.615
X=1.615*8+75≈88(分)
2.某高考,平均500分,标准差100分,一考生650分,设当年录取10%,问该生是否到录取分?
解:Zo=(650-500)/100=1.5 (X~N(500,1002)(Z~N(0,12)
Po=0.5-0.43319=0.06681=6.681%<10%
所以可录取。
《心理统计学》学习笔记—第五章 抽样分布(概率P)
第五章抽样分布(概率P)
&1.抽样方法
一.简单随机抽样
二.等距抽样
三.分层抽样
四.整群抽样
五.有意抽样
&2.抽样分布
(1)(2)(3)(4)(5)
20 25 30 35 40
二.百分等级
30→60(在30%的人的位置上,相应分数为60)
So→Md
《心理统计学》学习笔记—第四章 概率与分布
第四章概率与分布
&1.概率
一.概率的定义
W(A)=m/n (频率/相对频数)
后验概率:
P(A)=lim m/n
先验概率:不用做试验的
二.概率的性质和运算
1.性质:o≤P≤1
p=1必然可能事件
四.正态分布的应用
T=KZ+C T~N(C,K2)
IQ=15Z+100 IQ=100一般
IQ≥130 ——超常
(30=2x*15)
IQ<70 ——弱智
70几——bndenline
eg:1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。问录取分数定为多少分?
解:X~N(75.82)
(3)成绩在60分以下多少人?
解: X~N(57.08,18.042) ——参数(μ,σ2)
Normal表示符合正态分布
令Z= (x-57.08)/18.04),则Z~N(0,12)标准分数平均数一定为0,标准差一定为1。
(1)Z1=(90-57。08)/18.04=1.82
P(Z>1.82)=.0344
.28 37
.22 23
.14 12
.08 5
.02 1
1.00
&3.次数分布图
一.直方图
1.标出横轴,纵轴(5:3)标刻度
2.直方图的宽度(一个或半个组距)
3.编号,题目
4.必要时,顶端标数)
图
二.次数多边图
1.画点,组距正中
2.连接各点
3.向下延伸到左右各自一个组距的中央
最大值即y轴最大值
相对次数分布图,只需将纵坐标改为比率。(累积次数,累积百分比也同样改纵坐标即可)”S形”曲线是正态分布图的累积次数分布图
&2.次数分布表
一.简单次数分布表
eg:组别次数(人次)
1002
90~99 5
80~89 14
70~79 15
60~69 7
60分以下3
1.求全距R=Max – Min(连续变量)
(间断变量)——R=Max-Min+1
2.定组数K(组数)=1.87(N-1)。。。→取整N-总数
3.定组距I=R/K。一般,取奇数或5的倍数(此种更多)。
(2)完全凭猜测做判断题,(共2道),做对1题的概率为:
A={T.Ti B={F.Ti C={T.Fi D={F.Fi
P=P(B)+P(C)=1/4+1/4=0.5
3.乘法:
P(A1,A2…An)=P(A1),P(A2)…P(An)
Eg:(1)四选1。(十道)完全凭猜测得满分得概率:(1/4)*(1/4)…*(1/4)=1/410
P(x=6)=C610P6g4=C610(1/2)6(1/2)4=.20508
P(x=7)=C710P7g3=C710(1/2)7(1/2)3=.11719
=.04395
=.00977
+P(x=10)=C1010P10g0=(1/2)10 =.000098
至少答对5题:P(X≥5) = 0.62306
两个合格的情况→TTF
FTT
其概率C32P2g1=3p2g1.
Cn0P0gn+CnP1gn-1+…+CnPng0=1
注:二项分布可能的结果只有两种。F 0r T
合格Or不合格
选对Or选错
例:(1)10道是非题,凭猜测答对5,6,7,8,9,10题的概率?至少答对5题的概率?
P(x=5)=C510P5g5=C510(1/2)51/2)5=.24609
年龄有绝对0
时间(年代,日历。。。)位移无绝对0,可能有相对0,即有正负
4.等比量表。可做乘除法。
要有绝对零。
成绩中的,0分不是绝对0(因为并不说明此人一窍不通)
分数代表的意义。Eg:0~10分
与90~100分。每一分的“距离”不一样
因为严格来说,成绩是顺序量表。但为了实际运用中的各种统计,把它作为等距量表
(2)四选一,猜中8,9,10题的概率?
P(x=8)=C819P8g2=C819(1/4)8(3/4)2=.0039
二.二项分布图(P84~85)
三.二项分布的平均数与标准差(前提np≥5且ng≥5)
平均数——M=np标准差——r=npg1/2
&3.正态分布
一.正态分布曲线
二.标准正态分布。(P387附表可查面积P)
《心理统计学》学习笔记——第二章 数据整理
第二章数据整理
&1.数据种类
一.间断变量与连续变量eg:人数~间断
二.四种量表。
1.称名量表。Eg:307室,学号,电话号码不能进行数学运算(也包括不能大小比较)
2.顺序量表。Eg:名次。能力大小,不能运算
3.等距量表。可以运算(做加减法),不能乘除
要求:没有绝对0
2.非正态总体,σ2已知时,#的抽样分布
设(X1,X2,…Xn)是抽自非正态总体的一个简单1随机样本。当n≥30时,其样本均值#接近正态分布,且有:
EBiblioteka Baidu#)=μ, σx2 =σ2 /n
即#~N(μ, σ2 /n)
若是小样本,题目无解。
Eg(1)一种灯具,平均寿命5000小时,标准差为400小时(无限总体)从产品中抽取100盏灯,问它们的平均寿命不低于4900小时的概率。
7575 74 74 73 (III)I=R/K =43/9≈5
7272 72 71 71
7170 70 69 69
6867 67 67 65 (iu)组别组值次数
64 62 62 61 57 95~99 97 2
90~94 92 3
85~89 87 2
80~84 82 6
75~79 77 14
70~74 72 11
eg: 91年92 93 94 95 96
12%10%11%9%9%8%
求平均增长率
xg=
加权平均数
甲:600人#=70分
乙:100人#=80分
加权平均数:#=(70*600+80*100)/(600+100) (总平均数)eg:600人,100人
简单平均数:(70+80)/2
三.中(位)数。(Md)
P(70≤x≤80)=p(o≤z≤1)
P(60≤x≤70)=P(-1≤z≤0)
2.μ
P(0≤z≤1)=P(μ≤x≤μ+σ)
P(-1≤z≤0)=P(μ-σ≤x≤μ)
图(略)
例:某地区高考,物理成绩μ=57。08(分)σ=18。04(分)
总共47000人。(1)成绩在90分以上多少人?
(2)成绩在(80,90)多少人?
Z=(x-ц)/r (x:原始分数)
标准分数(有正有负)ΣZ=0
三.正态分布表的使用
查表P(0≤Z≤1)=0.34134——Z的范围中的人数比例(百分数)
P(0≤Z≤1.645)=0.4500
1.64-.44950=0.45
1.65-.45053=0.45
之上,标准分数高于2个标准差,则非常聪明。
Eg:1. μ=70(分) σ=10
图
《心理统计学》学习笔记——第三章 常用统计量数
第三章常用统计量数
&1.集中量
一.算术平均数
公式
算术平均数的优缺点。P36~37
算术平均数的特征。Σ(X-#)=0离(均数)差
Σ(X-#)(X-#)取#时,得最小值
即:离差平方和是一最小值
二.几何平均数
#g=略
long#g=1/NσlogXi
根据按一定比例变化时,多用几何平均数
N1=np=47000*0.0344=1616(人)
(2)Zz=(80-57.08)/18.04=1.27
P(1.27<Z<1,82)=.46562-.39796=0.677
N2=NP=3177(人)
(3)Z3=(60-57.08)/18.04=0.16
P(Z<0.16)=.56356
N3=26487(人)
4.定各组限
5.求组值X=(上限+下限)/2上限——指最高值加或取10的倍数等)
6.归类划记
7.登记次数
例题:99 96 92 90 90(I)R=99-57+1=43
87 86 84 83 83
8282 80 79 78 (II)K=1.87(50-1)。。。≈9
7878 78 77 77
7776 76 76 76
(1)#=20 22.5 25 27.5 30
(2)22.5 25 27.5 30 32.5
(3)25 27.5 30 32.5 35
(4)27.5 30 32.5 35 37.5
(5)30 32.5 35 37.5 40
总体分布
图
抽样分布
图
一.平均数
E(#)=µ
二。标准差,方差。
σx=σ/n1/2σ#2=σ2/n
p=0不可能事件
2.加法。
P(a+b)=P(a)+P(b)
“或”:两互不相克事件和。
推广:“有限个” P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
eg:(1)A=出现点数不超过4(x≤4)
P(A)=P(x=1)+P(x=2)+P(x=3)+P(x=4)=1/6+…1/6=4/6=2/3
MD={Σ|x-#(或Md)|}/N
三.方差
总体方差的估计值
S2 =Σ(X-#)2反编
样本的方差:σ2 x有编
N很小时,用S2估计总体
N>30时,用S2或σ2 x都可以
计算方法:σ2 x=Σx2 /N-(ΣX/N) 2
标准差σx=σ2 x2/1
四.差异系数(CV)
CV=σx/# *100% CV∈[5%,35%]
1.原始数据计算法
分:奇、偶。
2.频数分布表计算法(不要求)
3.优点,缺点,适用情况(p42)
四.众数(Mo)
1.理论众数
粗略众数
2.计算方法:Mo=3Md-2#
Mo=Lmo+fa/(fa+fb)*I
计算不要求
3.优缺点
平均数,中位数,众数三者关系。
&2.差异量数
一.全距
R=Max-Min
二.平均差(MD或AD)