中科院心理所心理统计学2统计量数
中科院心理所心理统计学复习
每个数要么是1要么是5 每个数要么是1要么是9 每个数要么是1要么是5或者9,其中至少有2个数 是5
重复上题,要求SD尽可能小
0
1
2
3
4
5
6
0-4岁 5-9岁 10-14岁 15-19岁 20-24岁 25-29岁 30-34岁 35-39岁 40-44岁 45-49岁 50-54岁 55-59岁 60-64岁 65-69岁 70-74岁 75-79岁 80-84岁 85-89岁 90-94岁 95-99岁
母子,双生子 配对组
数据类型和统计方法
测量变量 描述统计量 适合的统计检验 非参数检验 、 非参数检验 类别变量 众数、频率、列联系数 顺序变量 中 数 、 百 分 位 数 、 Kendallτ Spearman rs 等距变量 平均数、方差、Pearson r
参数检验和非参 数检验
比例变量 几何平均数、差异系数、多重相关系数 参数检验和非参 数检验
标准正态分布
X ~ N ( , ), X Z ~ N (0,1)
2
标准正态分布表
需要记住的一些Z值
Z 0.05
2
Z 0.01
2
总体 参数
样本 统计量 X 参数估计 差异检验
样本均数 2 X ,即Z X X ~ N , 且已知, ~ N , X ~ N 0, 1 n n
50, 40, 60, 30, 70, 25, 75 50, 40, 60, 30, 70, 25, 75, 50, 50, 50 50, 40, 60, 30, 70, 25, 75 50, 40, 60, 30, 70, 25, 75, 99, 1
教育与心理统计学 第二章 常用统计参数考研笔记-精品
第二章常用统计参数第二章常用统计参数用参数来描述一组变量的分布特征,便于我们对数据分布状况进行更好的代表性的描述,也有利于我们更好地了解数据的特点。
常见的统计参数包括三类:集中量数、差异量数、地位量数(相对量数X相关量数。
描述统计的指标通常有五类。
第一类集中量数:用于表示数据的集中趋势,是评定一组数据是否有代表性的综合指标,比如平均数、中数、众数等。
概述[不背]第二类差异量数:用于表示数据的离散趋势,是说明一组数据分散程度的指标,比如方差、标准差、差异系数等。
第三类地位量数:是反映个体观测数据在团体中所处位置的量数,比如百分位数、百分等级和标准分数等。
第四类相关量数:用于表示数据间的相互关系,是说明数据间关联程度的指标,比如积差相关、肯德尔和谐系数、①相关等。
第五类:是反映数据的分布形状,比如偏态量和峰度等(不作介绍I第一节集中量数(一)集中量数的定义(种类、作用)[湖南12名]描述数据集中趋势的统计量数称为集中量数。
集中量数能反映大量数据向某一点集中的情况。
常用的集中量数包括算术平均数、加权平均数、几何平均数、中数、众数等等,它们的作用都是用于度量次数分布的集中趋势。
(二)算术平均数(平均数、均数)(一级)简述算术平均数的定义和优缺点。
(1)平均数的含义算术平均数可简称为平均数或均数,符号可记为M。
算术平均数即数据总和除以数据个数,即所有观察值的总和与总频数之比。
只有在为了与其他几种集中.数洞区别时,如几何平均数、调和平均数、加权平均数,才全称为算术平均数。
如果平均数是由变量计算的,就用相应的变量表示,如又匕算术平均数是用以度量连续变量次数分布集中趋势及位置的最常用的集中量数,在一组数据中如果没有极端值, 平均数就是集中趋势中最有代表性的数字指标,是真值的最佳估计值。
(2)平均数的优缺点简述算术平均数的使用特点[含优缺点]算术平均数优点①反应灵敏。
观测数据中任1可一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反映出来。
中科院心理所心理统计学考试试题
心理统计中国科学院心理研究所 班级 ____________________________ 姓名 __________________________ 一、单项选择题(在每小题的四个备选答案中选出一个正确答案, 内。
每小题2分,共20分) 1. 下列数据中,哪个数据是顺序数据? ( ) A.月工资1300元 B.语文成绩为80分 C.百米赛跑得第2名 D.某项技能测试得5分 2. 下列描述数据集中情况的统计量是 并将其号码填在题后的括号 ( ) S C.S [1 数据的分布呈偏态时,A.M M d iB.M o M d3•—组数据中有少数数据偏大或偏小,A.几何平均数B.调和平均数C.算术平均数D.众数 4. 测得某班学生的身高平均 170厘米,体重平均65公斤,欲比较两者的离散程度,应选( A.方差 B.标准差 C.四分差 D.差异系数 5. 假设两变量为线性关系,这两变量为等距或等比的数据且均为正态分布,计算它们的相关 系数时应选用( A.积差相关 6. 以下各分布中, A.t 分布 7. 以下有关) B.斯皮尔曼等级相关不因样本容量的变化而变化的分布是B.F 分布C.X 分布D.M M d Mg (T 其集中趋势代表值应是( C.二列相关 D.点二列相关 ) D.正态分布 ) A. B. C.当样本容量n 不变时,有可能同时减小 同一组学生的数学成绩与物理成绩的关系为 D.实际上不可能同时犯8.A. 因果关系B.共变关系C. )函数关系D.相关关系9. A. 一个好的估计量应具备的特点是 (充分性、必要性、无偏性、一致性 B.充分性、无偏性、致性、有效性C. 必要性、无偏性、一致性、有效性D.必要性、充分性、 无偏性、有效性 10.某项调查选取三个独立样本,其容量分别为 均数之间的差异显著性时,其组内自由度为 n 1=10, n 2=12,n 3=15, ( ) 用方差分析法检验平A. 2B. 5C. 36D. 34二、填空题(每空1分,共10分) 1. 实验数据按其是否具有连续性可划分为 ________________ 和离散变量。
中科院心理所心理统计学相关分析_OK
2
Xi X
2
Yi Y
n
xy
1S X
SY
其中 xy 为协方差 n 1
=
n X iYi X i Yi
n
X
2 i
X i 2 n Yi2 Yi 2
13
P59 例 2-13
xi yi x y x*x y*y x*y xi*xi yi*yi xi*yi
74 82 -1.6 -1.7 2.56 2.89 2.72 5476 6724 6068
74 87 -1.6 3.3 2.56 10.89 -5.28 5476 7569 6438
Summation 756 837 0 -0 198.40 188.10 91.80 57352 70245 63369
Mean
75.6 83.7
SD
4.70 4.57
rXY
0.48
14
rXY
P65 例2-16
评分者1 评分者2 评分者3 评分者4 评分者5 评分者6 Ri Ri*Ri
一3
3
3
3
3
3
18 324
二5
5
4
5
5
5
29 841
三2
2
1
1
2
2
10 100
四4
4
5
4
4
4
25 625
五1
1
2
2
1
1
8 64
90 1954
W
S SRi
1954 902
5 0.93
1 K 2 n3 n的校正t表示相同等技数
当出现相同等级时(P65 例 2-17)
W
2020中国科学院大学心理学738(347)考研真题解析
本文由文都比邻心理学教研组整理文都比邻:教育学、心理学考研院校定向辅导2020心理学考研真题分析-中国科学院大学738/347一、院校简介中国科学院大学心理研究所,是我国唯一的国家级心理学研究机构,是中国心理学会的挂靠单位,是心理学一级学科博士和硕士的学位授予单位,设有心理学博士后流动站。
心理所现有博士点5个,学术型硕士学位授权点5个,应用心理硕士授权点。
博士生导师70人,硕士生导师62人,在学研究生346人。
心理所2020年计划招收33名学术型硕士研究生、25名全日制专业学位硕士研究生及15名非全日制专业学位硕士研究生,其中40%左右拟用于接收推荐免试生。
下面,文都比邻教研老师给大家送上2020中国科学院大学心理学738/347(同一套试卷)考研真题分析,快来查收吧!二、真题题型及科目分值分析1.2020年题型科目分值分布科目单选题(5’*21=105’)简答题(20’*6=120’)论述题(25’*2=50’)计算题(25’*1=25’)科目总分普通心理学35’40’25’100’实验心理学35’40’25’100’心理统计学35’40’25’100’2.2020年与2019年的分布对比科目单选题(21小题)简答题(6小题)论述题(2小题)计算题(1小题)总分年份2019202020192020201920202019202020192020普通心理学772211/0100分100分实验心理学772211/0100分100分心理统计学772210/1100分100分105分105分120分120分75分50分0分25分300分三、2020年真题特点分析及解读1.题型难度分析2020年中国科学院大学心理学738/347的考试题型与2019年相比略有调整,题量不变。
21道单选题、6道简答题不变,3道论述题拆分成2道论述和1道计算题,整体难度系数依旧比较高,保持了中科院的风格。
①选择题难度系数处于中等水平,主要有三个特点:a.直接考察对基础知识的提取:如“加德纳的多元智力理论构成成分”、“艾宾浩斯的贡献”、“变异系数的应用”等,这些是每个学科比较基础的知识,认真看过书就没有问题。
中科院心理所心理统计学2统计量数
2.1.1 众数(Mode,Mo)
众数:一组数据中出现次数最多的数
– 如2、3、5、3、4、3、6的众数为3 – 卡尔.皮尔逊 1894
如果次数分布最多的有两个数,而且两个数 是相邻的,那么一般取两者的平均值作为众 数;如果这两个数不相邻,那么一般需要报 告两个众数,而且认为该组数据是bimodal双 峰分布的
N
N
3.3方差和标准差 3.3.1 定义
总体方差和总体标准差
2 Xi 2 X i 2
N
N
样本方差和样本标准差
2
S2 Xi X
S
2
Xi X
N 1
N 1
2 X
2
X 2 2 2X
当n很大时, S2与2相差很小,前者是后者的 无偏估计
3.3.4 标准差的性质
一组数据的每一个数据都加常数C后标准差 不变
一组数据的每一个数据都乘常数C后标准差 变为原来的C倍
3.3.5方差与标准差的优点
方差与标准差是表示一组数据离散程度的最好的指标。其值 越大,说明离散程度大,其值小说明数据比较集中。具有以 下优点:
思考题
某病患者的潜伏期如下,求中数 2,3,3,3,4,5,6,9,16
– 若增加1例患者,其潜伏期为30天,求中数
求15,35,25,5的中数
中数的应用
不易受极端值的影响 当数据呈明显偏态时,中数较均数或几何均
数合理
2.1.3 平均数(Mean) 2.1.3.1 平均数的定义
按原数据求方差和标准差 总体方差和总体标准差
2
X N
2 i
-
心理统计学PPT课件2:平均数和标准差
无偏性
当数据量足够大时,平均 数的期望值等于其真实值, 因此平均数具有无偏性。
02
CHAPTER
标准差
定义
01
描述数据分布的离散程度
标准差是用来描述数据分布离散程度的统计量,它表示各数值与其平均
数之间的偏差程度。
02
计算每个数值与平均数的差的平方
标准差的计算方法是将每个数值与平均数之间的差的平方,然后求和,
04
CHAPTER
平均数和标准差的局限性和 注意事项
平均数的局限性
平均数易受极端值影响
01
当数据集中存在极端值时,平均数会受到较大影响,导致结果
偏离实际。
平均数难以反映数据分布
02
平均数只能描述数据集的中心趋势,无法反映数据的离散程度
和分布形态。
不同数据集的平均数难以比较
03
由于不同数据集的单位、量级可能不同,直接比较两个数据集
03
CHAPTER
平均数和标准差在心理统计 中的应用
描述数据分布
平均数
描述数据集中趋势,计算所有数值的 和除以数值的数量,反映数据“中心 ”或“典型值”。
标准差
描述数据离散程度,计算各数值与平 均数之差的平方和的平均数,再取平 方根,反映数据分布的“宽度”或“ 波动范围”。
比较两组数据
平均数差异检验
的平均数可能导致误解。
标准差的注意事项
标准差并非绝对标准
标准差的大小受数据量级和单位的影响,因此需要结合实际情境 进行解释。
标准差并非越小越好
标准差小表示数据离散程度较小,但这并不意味着数据质量就高。
标准差并非适用于所有情况
对于非正态分布的数据,标准差可能无法准确反映数据的离散程度。
心理统计学二第十章χ2检验
05
CHAPTER
χ2检验的限制和注意事项
样本大小的影响
样本量过小
当样本量过小时,χ2检验的准确性会受到影响,可能导致误判。
样本量过大
虽然样本量越大,检验的准确性越高,但过大的样本量也会增加计算复杂度和时间成本。
数据分布的影响
非独立性
χ2检验要求数据是独立的,如果数据之间 存在相关性,会影响检验结果。
02
CHAPTER
χ2检验的原理
理论频数与实际频数的比较
当理论频数与实际频数存在显著差异 时,表明数据分布与预期的理论分布 存在显著差异。
通过比较理论频数与实际频数,可以 判断数据是否符合预期分布,从而推 断总体分布是否与理论分布一致。
观察频数与期望频数的比较
观察频数是实际观测到的频数,而期望频数是按照理论分布 计算得出的频数。
在社会科学研究中的应用
社会调查
在社会调查中,χ2检验常用于分析不同社会群体在某一特征上的 分布情况,例如性别、年龄与职业分布之间的关系。
政策评估
在评估某项政策实施效果时,χ2检验可以用来比较政策实施前后 某一特征的变化情况。
经济分析
在经济分析中,χ2检验可以用来分析不同经济变量之间的关系, 例如收入水平与消费习惯之间的关系。
VS
离散程度
数据离散程度过高或过低都会影响χ2检验 的结果,需要合理控制数据的离散程度。
效应大小的影响
效应大小较小
当效应大小较小时,即使样本量足够大,也 可能无法检测到显著性差异。
效应方向
效应方向也会影响χ2检验的结果,需要综 合考虑效应方向和效应大小的影响。
06
CHAPTER
案例分析
心理学研究中的χ2检验案例
心理统计学重点知识
心理统计学一.描述统计(一)统计图表 1、统计图次数分布图——①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。
②次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。
③累加次数分布图:分为累加直方图和累加曲线图;其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态),另一种是下枝长于上枝(负偏态),第三种是上枝,下枝长度相当(正态分布)。
其他统计图:条形图:用于离散型数据资料; 圆形图:用于间断性资料;线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。
散点图: 2、统计表①简单次数分布表 ②分组次数分布表③相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。
④累加次数分布表⑤双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。
(二)集中量数 1、算术平均数M1nii XX N==∑优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数; 计算和运用平均数的原则: 同质性原则;平均数与个体数值相结合的原则; 平均数与标准差、方差相结合原则; 性质:①在一组数据中每个变量与平均数之差的总和等于零②在一组数据中,每一个数都加上一个常数C ,所得的平均数为原来的平均数加常数C ③在一组数据中,每一个数都乘以一个常数C ,所得的平均数为原来的平均数乘以常数C 2、中数:Md 按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。
注意计算方法;3、众数:Mo 是指在次数分布中出现次数最多的那个数值;三者的关系:正偏态分布中,M>Md>Mo 负偏态分布中,M<Md<MoMo=3Md-2M (自己推导一下)(三)差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
中科院心理所心理统计学相关分析_OK
4 0.25 43.5
23
2.2.2 肯德尔和谐系数(肯德尔W系数)
ssRi表示Ri的平方和,Ri的离均差的平方和
多列等级变量
W
S SRi
1 K 2 n3 n
12
其中
SSRi
2
Ri R
2
Ri
Ri n
Ri2
Ri 2 n
K — 评价者的数目
n — 被评价对象的数目 24
广告费支出与商品销售额的关系
4
相关系数
相关系数:两列变量间相关程度的数量化指标
r – 总体
样本 (读rou 希腊字幕)
|r| ≤ 1 –
相关数量的值总是小于等于1的。
几个概念
– 完全相关:-1.00 或 1.00
– 不完全相关:0 < |r| < 1
– 不(零)相关:r ≈ 0
– 正相关:两个变量的变化方向一致, 0 < r ≤ 1
P65 例2-16
评分者1 评分者2 评分者3 评分者4 评分者5 评分者6 Ri Ri*Ri
一3
3
3
3
3
3
18 324
二5
5
4
5
5
5
29 841
三2
2
1
1
2
2
10 100
四4
4
5
4
4
4
25 625
五1
1
2
2
1
1
8 64
90 1954
W
S SRi
1954 902
5 0.93
1 K 2 n3 n 1 62 53 5
心理学考研笔记心理统计篇
第一章绪论统计学内容(凑字数):(1)描述统计(整理数据):第二章图表第三章集中量数第四章差异量数第五章相关(2)推论统计(推断总体):第七章参数估计;第八第十第十一章假设检验。
(3)实验设计(取样,实验条件控制,结果分析):第九章方差第十二章回归第十三章因子分析第十四章样本选择数据类型:(1)观测方法:计数数据:能数出来的计量数据:用工具量的(2)测量水平:称名数据:类别顺序数据:类别、次序--------心理测验的原始数据是这个等距数据:类别、次序、相差程度-------心理测验数据都会转换成这个等比数据:类别、次序、相差程度、相差比例(3)是否连续:离散数据:非连续,有个数能数出来连续数据:中间可以无限细分出无数个值第二章图表统计表:(1)次数表:简单次数分布表:无论什么类型数据只要用来记录次数就可,数据少时使用分组次数分布表:同样只要记录次数就能用,数据多时使用相对次数分布表:用比率和百分数表示次数。
累加次数分布表:需知道某个数据以下和以上人数时使用。
双列次数分布表:两列变量的次数用同一个表来表示。
不等距次数分布:无法等距分组时使用。
(2)其他表:简单表:无分类分组表:一个分类复合表:多个分类统计图:(1)次数图:直方图(表分布):横坐标连续数据,纵坐标频次次数多边图:直方图条条去掉连成线就是这个。
比直方图轮廓好易看出规律。
累加次数分布图:横坐标(等距数据以上)分组区间;纵坐标(任何记录次数的数据)累加次数累加曲线:累加次数分布图曲线化。
可更好的看出数据的形态(正态,偏态)(2)其他图:条形图(表内容):对计数或离散数据进行描述圆形图(表内容):不连续的数据-----------可以按比例分的数据线形图(表变化):连续型数据进行描述散点图(表相关):横坐标可计数可离散,纵坐标必须连续数据茎叶图(表分布和保留具体数值):两位数的数据次数箱型图(表数据离散状况)第三章集中量数:一组数据的最佳代表值算数平均数:最好的集中量数,能用就用这个(1)何时不能使用:有极端数值时,有模糊数据时。
心理统计学常用公式总结
心理统计常用公式总结1 、组数K(总体分布为正态)(N 为数据个数,K 取近似整数)2 、算术平均数3 、中数4 、众数5 、加权平均数,其中W i 为权数,其中为各小组的平均数,n i 为各小组人数6 、几何平均数,其中n 为数据个数,X i 为数据的值7 、调和平均数8 、方差与标准差,其中9 、变异系数,其中S 为标准差,M 为平均数10 、标准分数,其中X 为原始数据,为平均数,S 为标准差11 、全距R=最大数-最小数12 、平均差13 、四分差,其中L b 为该四分点所在组的精确下限, F b 为该四分点所在组以下的累加次数,和为该四分点所在组的次数,i 为组距,N 为数据个数14 、积差相关基本公式:,其中N 为成对数据的数目,S x 、S y 分别为X 和Y 的标准差变形:差法公式:用估计平均数计算:用相关表计算:15 、斯皮尔曼等级相关,其中D 为各对偶等级之差直接用等级序数计算:,其中R X 、R Y 分别为二变量各等级数有相同等级时:16 、肯德尔等级相关有相同等级:17 、点二列相关,其中是两个二分变量对偶的连续变量的平均数,p 、q 是二分变量各自所占的比率,p+q=1 ,S t 是连续变量的标准差18 、二列相关,其中S T 与是连续变量的标准差与平均数,y 为P 的正态曲线的高度19 、多系列相关,其中P i 为每系列的次数比率,y 1 为每一名义变量下限的正态曲线高度,y h 为每一名义变量上线的正态曲线高度,为每一名义变量对偶的连续变量的平均数,S t 为连续变量的标准差20 、总体为正态,σ 2 已知:21 、总体为正态,σ 2 未知:22 、23 、24 、。
中科院心理研究所考研参考书目
中科院心理研究所考研参考书目1.前言中国科学院心理研究所是中国心理学界的一颗明珠,主要开展心理学研究、咨询、教育等工作。
考研是很多学生考虑的问题,那么,考生在备考考研心理专业的时候应该参考什么书目呢?本文将为大家介绍中科院心理研究所考研参考书目。
2.《心理统计学》《心理统计学》是一本经典的心理学教材,由美国心理学家曼德尔和沃尔夫编写。
这本书包含了心理学中的常用统计方法,如假设检验、方差分析、多重回归等。
这本书对于理解实验方法和统计分析方法有很大帮助,并且对于心理学研究的科研人员来说,也是一本不可或缺的书。
3.《心理学概论》《心理学概论》是心理学入门的基本教材,该书由美国心理学家约翰·惠伦·艾伯特编写。
该书主要介绍了心理学的各个领域以及其发展和方法论,是心理学学习的基础教材。
而且,该书通俗易懂,对于初学者来说,很容易掌握。
4.《心理测量学》《心理测量学》是一本关于心理测量的经典教材,对于了解量表的设计、信度和效度等方面的知识有很大的帮助。
该书由美国心理学家克罗伊特编写,包含了心理学测量中的常用方法和工具,对于研究者来说,非常有用。
5.《认知心理学》《认知心理学》是一本介绍认知心理学的经典教材,作者是美国心理学家罗伯特·斯特恩伯格。
该书主要讲解了人类的思维、知觉和记忆等方面的内容,对于计算心理学、神经心理学等方向的研究人员来说,非常有用。
6.《社会心理学》《社会心理学》是一本介绍社会心理学的经典教材,在探讨个体与社会之间相互作用的同时,也介绍了社会心理学中的常用研究方法和技巧。
该书由美国心理学家戴维·迈尔斯和约翰·道伯逊编写,对于社会心理学专业的学生来说,是一本必备的教材。
7.《发展心理学》《发展心理学》是一本介绍人类发展过程的经典教材,该书由美国心理学家希尔芙·加特曼编写。
该书包含了人的发展过程中的各个方面,如婴幼儿期、学龄前期、青少年期等,并介绍了相关的理论和实验研究,对于研究儿童心理学的专业人士是非常有用的。
心理学基本概念系列文库:T2统计量
心理学基本概念系列——T2统计量形而上是人类区别于动物的重要文明之一,情志,即现在所说的心理学,在人类医学有重要地位。
本文提供对心理学基本概念“T2统计量”的解读,以供大家了解。
T2统计量服从T2分布的统计量。
霍德林1931年给出。
设Y和W是独立的,且Y~Np(μ,∑),nW~Wp(n,∑),则T2=Y′W-1Y所服从的分布,称“非中心T2-分布”,T2称“T2统计量”。
常简记为T2~T2(p,n,δ),(0≤T2<+∞),式中非中心参数δ=μ′∑-1μ。
在μ=0时,δ=0,此时T2为中心T2分布。
有人将T2统计量称为“HotellingT2统计量”。
威忌斯曼和博克研究了T2统计量与F统计量之间的关系,取得如下成果:设T2=Y′W-1Y,此处Y~Np(μ,∑),nW~Wp(n,∑),且Y与W彼此独立,则有·~F(p,n-p+1,δ),即T2可转化为F分布。
此处F的自由度是p与n-p+1,非中心参数δ=μ′∑-1μ。
在多元分析中,杰森和荷伟1968年编制了T2统计量的上侧百分位点的数值表以供查阅,也可转为F分布,查阅F统计量的数值表。
T2分布在多维正态分布的均值检验中有着直接应用。
如为检验H0:μ=μ0;H1:μ≠μ0。
从p维正态总体Y中随机抽取样本Y1,Y2,…,Yn,即有Yi~INp(μ,∑)(“IN”表示彼此独立的正态变量),于是Y~Np(μ,∑/N),(N-1)S~Wp(N一1,∑),与S 也相互独立。
构造检验统计量T2=N(-μ0)′S-1(-μ0),在H0成立时,T2服从T2(p,N-1)分布,或·服从F(p,N-p)分布(是样本均值向量,S是样本方差-协方差矩阵)。
《心理与教育统计学》考研笔记
P(Z>1.82)=.0344
N1=np=47000*0.0344=1616(人)
(2)Zz=(80-57.08)/18.04=1.27
P(1.27<Z<1,82)=.46562-.39796=0.677
N2=NP=3177(人)
(3)Z3=(60-57.08)/18.04=0.16
P(Z<0.16)=.56356
N3=26487(人)
四.正态分布的应用
T=KZ+C T~N(C,K2)
IQ=15Z+100 IQ=100一般
IQ≥130 ——超常
(30=2x*15)
IQ<70 ——弱智
70几——bndenline
eg:1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。问录取分数定为多少分?
3.乘法:
P(A1,A2…An)=P(A1),P(A2)…P(An)
Eg:(1)四选1。(十道)完全凭猜测得满分得概率:(1/4)*(1/4)…*(1/4)=1/410
&2.二项分布
一.二项分布
P(x)=Cnxpxgn-x做对的概率px:做错的概率gn-x:X:对的数量pxgn-x ——每一种分情况的概率。一种情况:pxgn-x再乘上系数。
平均数——M=np标准差——r=npg1/2
&3.正态分布
一.正态分布曲线
二.标准正态分布。(P387附表可查面积P)
Z=(x-ц)/r (x:原始分数)
标准分数(有正有负)ΣZ=0
三.正态分布表的使用
查表P(0≤Z≤1)=0.34134——Z的范围中的人数比例(百分数)
心理统计学二第十章χ2检验
48
一、单因素分类数据的同质性检验
检验步骤: 1. 计算各个样本组的χ 2值和自由度; 2. 累加各样本组χ 2值,计算其总和以及自由度的总和; 3. 将各样本组原始数据按相应类别合并,产生一个总的数 据表,并计算这个总数据表的χ2值和自由度; 4. 计算各样本组的累计χ 2值与总测试次数合并获得的χ 2值 之差——异质性χ 2值; 5. 查χ 2临界值表,判断χ 2值差是否显著。
14
4、使用校正公式
❖在二乘二的列联表检验中, 若单元格的期望次数低于10但 高于5,可使用耶茨校正公式 来校正。若低于5,或样本总 人数低于20,则应使用费舍精 确概率检验法。
15
六、应用χ 2检验应注意取样设计
应用χ 2检验时,要十分注意取样的代表性。
16
第二节 配合度检验
一、配合度检验的一般问题 二、配合度检验的应用 三、连续变量分布的吻合性检验
4549505455596064656970747579808485899094959910182240467244281812例例101055一独立性检验的一般问题与步骤一独立性检验的一般问题与步骤二四格表四格表独立性检验独立性检验rcc表独立性检验表独立性检验四多重列联表分析四多重列联表分析一统计假设一统计假设二理论次数的计算二理论次数的计算三自由度的确定三自由度的确定四统计方法的选择四统计方法的选择五结果及解释五结果及解释一独立样本四格表的独立样本四格表的22检验检验二相关样本四格表的相关样本四格表的22检验检验三四格表四格表22值的近似校正值的近似校正四格表的fisherfisher精确概率检验方法精确概率检验方法22独立样本四格表的独立样本四格表的22检验就是双向表检验就是双向表22检验
心理统计简要概述(doc 24页)
心理统计简要概述(doc 24页)心理统计===============陈毅文中国科学院心理研究所社会与经济行为研究中心心理统计⏹描述统计⏹描述统计学主要研究如何整理科学实验或调查得来的大量数据,通过图表的形式描述一组数据的全貌,并计算出一些统计特征⏹推断统计⏹推断统计学是研究如何根据样本数据去推断总体数量特征的方法。
它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表达的推断。
描述统计⏹统计图表⏹集中量数⏹差异量数⏹相对量数⏹相关量数算术平均数主要适用于等距以上数据,但不适用于类别数据和顺序数据。
优点是反应灵敏、计算简单、符合代数方法进一步演算、较少受抽样变动的影响;缺点是易受极端值的影响;加权平均数:用于分组数据1、组距分组数据设原始数据被分成K 组,各组的组中值分别为X 1,X 2,•••,X K ,各组变量值出现的频数分别为F 1,F 2,•••,F K ,则均值为:2、单变量值分组K K K F F F F X F X F X X +•••+++•••++=212211KK k n n n X n X n X n X +•••+++•••++=212211几何平均数调和平均数众数 众数是一组数据中出现次数最多的变量值。
用Mo 表示,它是一个位置代表值,主要用于测度定类数据的集中趋势,也适用于定序、定距和定比数据的集中趋势的测度值。
优点是不受极端值的影响,缺点是可能不唯一中数⏹中数也叫中位数,是一组数据中按从小到大排序后,处于中间位置上的变量值。
它将全部数据分成两部分,每个部分各包含50%的数据。
⏹中位数是一个位置代表值,它主要用于测度顺序数据的集中趋势。
也适用于等距以上数据。
但不适用于类别数据。
⏹ 将全部数据排序后,如果项数是奇数,则正中央的那一项即为中位数;如果项数是偶数,则正中央的那两项的平均值即为中位数。
1-3、差异量数⏹离差与平均差⏹ 方差与标准差⏹ 变异系数 离差与平均差 离差:也叫离均差,X -X i 或μ-i X平均差:也称平均离差,是各变量值与其均值离差绝对值的平均数,用M D 表示。
《心理统计学》重要知识点
《心理统计学》重要知识点第二章统计图表简单次数分布表的编制:Excel数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel数据透视表直方图(histogram):直观描述连续变量分组次数分布情况,可用Excel图表向导的柱形图来绘制散点图(Scatter plot):主要用于直观描述两个连续性变量的关系状况和变化趋向。
条形图(Bar chart):用于直观描述称名数据、类别数据、等级数据的次数分布情况。
简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。
复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。
圆形图(circle graph)、饼图(pie graph):用于直观描述类别数据或等级数据的分布情况.线形图(line graph):用于直观描述不同时期的发展成就的变化趋势;第三章集中量数●集中趋势和离中趋势是数据分布的两个基本特征.●集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。
●集中量数:描述数据分布集中趋势的统计量数。
●离中趋势:是指数据分布中数据分散的程度。
●差异量数:描述数据分布离中趋势(离散程度)的统计量数●常用的集中量数有:算术平均数、众数(M O)、中位数(M d)1.算术平均数(简称平均数,M、、):Excel统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即(2)如果变量X的平均数为,将变量X按照公式转换为Y变量后,那么,变量Y的平均数2.中位数(median,M d):在一组有序排列的数据中,处于中间位置的数值.中位数上下的数据出现次数各占50%。
3.众数(mode,M O):一组数据中出现次数最多的数据.4.算术平均数、中数、众数之间的关系.5.加权平均数:6.调和平均数(harmonic mean,M H):一组数值倒数的平均数的倒数.Excel统计函数HARMEAN(1)用于描述同一个体(或一组个体)不同时间段的平均学习速度、平均工作效率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
缺点
– 易受极端值的影响 – 若出现模糊不清的数据时无法计算
ppt课件
2.1.3.4 算术平均数的适用条件
数据必须是同质的
– 如:如果身高均数在性别上有差异,那么不分性 别地求某一年龄组的身高均数时没有实际意义的
又叫均数、算术平均数,缩写M, X
设一组数据为x1,x2,•••,xn
n
xi Xx1x2 xi xn
i1
X X
n
ppt课件
10名健康人的 白细胞总数(109个/L) 5.50, 7.00, 8.20, 4.80, 6.70, 5.75, 6.10, 9.30, 7.60, 7.15
X5.5 07.0 0 7.1 56.81 10
ppt课件
练习
已知 X: 1 5 3 Y: 2 4 3 求
X; Y; X 2; XY; X 1Y 1; X XY Y
参考答案
3; 3; 3; 53; 11; 64
ppt课件
2.1.3.2 平均数的特点
一组数据的每一个数与平均数的差(离均差) 的总和等于零
一组数据的每一个数加上常数C,其平均数 为原来的平均数加常数C
ppt课件
2.1.4 加权平均数(Weighted mean)
用于分组数据
X n j X j n j X j
nj
nT
n
是第
j
j组的人数
X j是第 j组的平均数
nT 是总人数
学校 均数 人数
A 72.6 32 B 80.2 40 C 75 36
ppt课件
2.1.5 几何平均数(Geometric mean)
– 血清中抗体滴度、血清凝集效价
ppt课件
Mg N X 1 X 2 • • • X N 4 1 .1 1 .1045 1 .07 1 .1077 1 .095
Mg 4 2200 • 2430 • 2600 • 2880 2000 2200 2430 2600
4 2880 1 .095 2000
中数:一组数据中按从小到大排序后,处于 中间位置上的变量值
– 1883 高尔顿 – 将全部数据排序后,如果项数是奇数,则正中央
的那一项即为中位数 例:4、7、8、9、10、11、12、13、14 Mdn=10 – 如果项数是偶数,则正中央的那两项的平均值即 为中位数 例: 2、3、5、7、8、10、15、19 Mdn=(7+8)/2=7.5ppt课件
描述统计
– 对数据特征的描述
数据的两个主要特征
– 中心位置 – 离散性
ppt课件
2. 集中量数
集中量数
– 对数据的集中趋势的度量 – 确定一组数据的代表值
20
10
Std. Dev = 7.03
Mean = 79.7
0
N = 100.00
61.0
67.0
73.0
79.0
85.0
91.0
97.0
年度 人数 变化率
1987 1988 1989 1990 1991
2000 2200 2430 2600 2880
思考题
某病患者的潜伏期如下,求中数 2,3,3,3,4,5,6,9,16
– 若增加1例患者,其潜伏期为30天,求中数
求15,35,25,5的中数
ppt课件
中数的应用
不易受极端值的影响 当数据呈明显偏态时,中数较均数或几何均
数合理
ppt课件
2.1.3 平均数(Mean) 2.1.3.1 平均数的定义
计算众数的皮尔逊经验法 Mo=3Mdn-2M
ppt课件
众数的用途
快速粗略寻求一组数据的代表值 做不同质数据的代表值,如工资 次数分布中有两极端的数目(一般用中数,
有时用众数) 用平均数和众数之差作为次数分布是否偏态
的指标
ppt课件
众数与从众
买东西
ppt课件
2.1.2 中数(Median,Md或Mdn)
常用统计量数
授课教师:禤宇明
ppt课件
本章内容
描述统计 统计量数:定义、性质、用法
– 集中量数
• 众数、中数、算术平均数、加权平均数、几何平均数
– 差异量数
• 全距、平均差、方差、标准差、差异系数
– 地位量数
• 百分位数、十分位数、四分位数、中(位)数
ppt课件
1. 描述统计 descriptive statistics
M g NX 1X 2•••X N
数据分布近似正态分布,但呈偏态
– 传染病的潜伏期
心理物理学的等距与等比量表实验
ppt课件
呈(近似)等比数列变化的数据,即变量值呈倍 数关系或近似倍数关系的数据
– 用于计算平均发展速度、平均增长率、学习记忆 的平均进步率、学校经费平均增加率、平均人口 出生率等等
ppt课件
2.1.1 众数(Mode,Mo)
众数:一组数据中出现次数最多的数
– 如2、3、5、3、4、3、6的众数为3 – 卡尔.皮尔逊 1894
如果次数分布最多的有两个数,而且两个数 是相邻的,那么一般取两者的平均值作为众 数;如果这两个数不相邻,那么一般需要报 告两个众数,而且认为该组数据是bimodal双 峰分布的
64.0
70.0
76.0
82.0
88.0
94.0
pptS课CORE件
2.1 常用集中量数
众数mode 中数median 算术平均数 mean 加权平均数 weighted mean 几何平均数 geometric mean 调和平均数 harmonic mean
ppt课件
问题
某部门有5名一般职员和1名经理。一般职员 的薪水是3000元,而经理的薪水是10000元, 请问该部门收入的平均水平是多少?
一组数据的每一个数乘每一个数与常数C的差的平方和 不小于该组数据的每一个数与平均数的差的 平方和
ppt课件
X X 0
X C X C
C•X C•X
X X 2 X C 2
ppt课件
2.1.3.3 算术平均数的优点和缺点
优点
数据取值必须明确 适用于呈正态分布的数据 数据离散不能太大
ppt课件
2.1.3.5 思考题
「你们念统计的常以算术平均数来代表总体 (population),那么你们一手泡在沸水中,另 一手浸在冰水中,一定会感到很舒服,因为 你们的平均感受是正常体温。」
请举例说明什么情况下我们会对估计总体的 平均数感兴趣。