心理学(研究方法)内容精讲(心理统计学-概率分布与总体参数的估计)【圣才出品】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
心理学(研究方法)内容精讲
第三部分心理统计学
第三章概率分布与总体参数的估计
第一节概率与概率分布
一、概率的一些基本概念
(一)什么是概率
概率因寻求的方法不同有两种定义,即后验概率和先验概率。
1.后验概率的定义
以随机事件A在大量重复试验中出现的稳定频率制作为随机事件A概率的估计值,这样寻得的概率称为后验概率。
2.先验概率的定义
先验概率是通过古典概率模型加以定义的,故又称为古典概率。古典概率模型要求满足两个条件:①试验的所有可能结果是有限的;②每一种可能结果出现的可能性(概率)相等。
(二)概率的性质
1.任何随机事件A的概率都是介于0与1之间的正数;
2.不可能事件的概率等于0;
3.必然事件的概率等于1。
(三)概率的加法和乘法
1.概率的加法
在一次试验中不可能同时出现的事件称为互不相容的事件。两个互不相容事件和的概
率,等于这两个事件概率之和。
2.概率的乘法
A 事件出现的概率不影响
B 事件出现的概率,这两个事件为独立事件。两个独立事件的概率,等于这两个事件概率的乘积。
二、正态分布
(一)正态分布特点
1.呈倒挂的钟形,两头小,中间大,能力的特点呈正态分布;
2.有其分布函数;
3.横坐标以标准差为单位,用z 分数表示;
4.正态分布下数据与标准差有一定数量关系
1%
X 1.96SD 95%X 2.58SD %X SD -
⎧±⎪⎪±⎨⎪±⎪⎩
-
- 包含所有数据的68.2 包含所有数据的 包含所有数据的99(二)正态分布的应用
1.正态表的应用
(1)已知概率可查Z 分数;
(2)已知Z 分数可查概率;
(3)已知概率或标准分数可查密度值、函数值。
2.正态分布在研究的应用
(1)按能力分组,确定人数;
(2)化等级评定为测量数据;
(3)测验分数的正态化。3.标准分数与应用公式:
Z x x S
-=式中:x 代表原始数据;x 为一组数据的平均数;
S 为标准差
如果研究数据呈正态分布,可按正态分布的规律来解释。例如:一个班成绩90x -
=,SD=3。已知一个学生的成绩为97.5分,则其Z=(97.5—90)/3=2.5,接近2.58,那么即可知该学生位于99.5%的位置,如果是100人,可知该人的成绩排第一位。三、二项分布
(一)什么是二项分布
对选择答案的客观题,学生只在所提供的答案上进行选择。学生在每一题的得分,可能是真会,也可能是猜对的得分。如果需要,应该予以鉴别。如何鉴别呢?要用到二项分布。选择答案的分数分布属于二项分布。对这种选择题,学生可能选对,也可能选错,只有两种可能。这种只有两种可能结果的分布,称为二项分布。(二)二项分布的平均数、标准差
np
npq
μσ==μ为平均数,是指理论上推导出来的,称为总体平均数,用μ表示。如果是根据样本实际计算出来的平均数,用x -
(称为样本统计量)表示。
σ为标准差,也是理论上推导的结果,故与SD有不同表示。n为题数,p为猜对的概率,q为猜错的概率。如果为是非题,猜对猜错的概率为l/2;如果为三选一题,猜对概率为l/3,猜错概率为2/3;如果是四选一题,猜对概率为1/4,猜错的概率为3/4。
μ是什么意思呢?即如果一个学生对某一门功课一点没学过,但让他去回答某一客观题试卷,他完全凭猜测,可得一定的分数。若很多这样的学生,每人都可得一个分数,这很多人得分的平均数即为μ。这些分数的分散程度即为σ。同样可推理,若同一份试卷(客观题)让同一个考生回答多次,其每一次得分的平均数也为μ,其分散程度为σ。由此可知,完全凭运气,得分在μ±σ之间的人数为68.26%,得分在μ±1.96σ之间的人数为95%。
例如,有100道四择一客观题,其平均数为μ=100×1/4=25,即完全凭机遇猜对的平均数为25题。
σ=⨯⨯,意即有人运气好可猜对多些,有些人运气不好可猜对少些,1001/43/4 4.33
其散布程度为4.33,可推算得分在:
25±4.33=20~29之间的人数占总人数的68.26%;
25±1.645×4.33=17.88~32.12之间的人数占总人数的90%;
25±1.96×4.33=16.5~33.5之间的人数占总人数的95%;
25+4.33=29.33,即得分在29分以下的人数占总人数的84.13%(0.50+0.34l3);
25+1.645×4.33=32.12,即得分在32.12分以下的人数占总人数的95%(0.50+0.45)。
这就是说,若完全凭机遇去猜,得分为32.12分以上的人数只能少于5%(1.00-0.95),那么若把32.12分作为一个界限,凡得此分数以上的人,就作出“他真会而不是猜对”的结论,犯错误的概率为5%(因为有5%的人凭运气是可以猜对这个分数以上的),因此,若判断一个人是否真会而不是猜测,其公式为:
1.645
z
=≥
npq
若Z>1.645,则推论说真会,若Z<1.645,则可推测说他是凭猜测得的分。
选择题的数目(n)越大,二项分布越接近正态分布,可用正态分布概率去解释结果。而当选择项越多,np(μ)就越小,凭猜测所得的分数就越低。
四、抽样分布
(一)抽样分布的概念
要区分以下三种不同性质的分布:①总体分布:总体内个体数值的频数分布。②样本分布:样本内个体数值的频数分布。③抽样分布:某一种统计量的概率分布。
(二)平均数抽样分布的几个定理
几个相关的定理:①从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。②容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的方根。③从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。
④虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。
(三)样本平均数与总体平均数离差统计量的形态
从正态总体中随机抽取的容量为n的一切可能样本平均数为中心呈正态分布。当总体标准差已知时,一切可能样本平均数与总体平均数的离差统计量呈标准正态。总体标准差σ的无偏估计量S等于样本统计量σx乘以贝赛耳氏校正数。
从正态总体中随机抽取容量为n的一切可能样本平均数的抽样分布呈正态分布。当总体标准差σ未知,需用估计值S来代替,于是平均数标准误也被平均数标准误的估计值所代