心理学统计题集课件
第三章集中量数 心理统计学PPT课件
29
(二)应用 有极端值数据; 心理物理学中等距、等比量表编制
30
例3-6:某一研究者想研究介于S与S二感觉之 间的感觉的物理刺激是多少。他随机选10名被 试,让其调节一个可变的物理刺激,使产生的 感觉恰介于S与S之间。10名被试的结果如下: 5.7、6.2、6.7、6.9、7.5 、8.0、7.6、10.0、 15.6、18.0。问这10名被试二感觉之间的那个 感觉的物理刺激平均值是多少?
X11 35 02,X2
303 10
代入公式得:
MH 1
1 1
1
1 2.4 5
( )
2 2 3 12
答:该生学习生词的平均速度为 2.4字分 。
38
例3-9:在一个学习实验中,统计了6名被试在2小时的解题 量,依次为24题,20题,16题,12题,8题,4题。问这6 名被试平均每小时解多少题?
解:设六名被试单位时间解题数依次为 X 1,X2,X3,X4,X5,X6,
总体平均数——
3
(二)计算公式 1、未分组数据计算平均数方法
公式一:X Xi
N
例3-1:现有一组实验观测数据,25,27,28,27,25,29, 30,34,32,33。计算它们的平均数。
: 解:根据题意,已知N=10,根据公式
X2 52 7...3 3292 09 10 10
4
公式二:
—
7984 28
7
① 将 fm,N 代入上面第一个公式计算:
X=
fm
N
7984
= 100
=79.84
② 设 AM=79,将 AM, fd,N,i 代入上面第二个公式计算:
X = AM + fd N
心理统计学回归分析课件PPT
二元线性回归方程的偏回归系数
b1
L1Y L22 L2Y L12 L11L22 L122
b2
L2Y L11 L1Y L21 L11L22 L122
• 式中各个L都是相应的离差平方和或离差 乘积和
序号 1 2 3 4 5 6 7 8 9 10
例题
数学成绩Y 83 67 74 48 72 66 90 54 71 65
n
n
n
n
(Xi X )(Yi Y )
X iYi ( X i )( Yi ) / n
bYX i1 n
i1 n
i 1
i 1
n
(Xi X )2
X
2 i
(
Xi)2 / n
i 1
i 1
i 1
与相关系数 r 比较
n
(X i X )(Yi Y )
r i1 nSX SY
回归方程的建立
– 常用的拟合这条回归线的原则,就是使各点 与该线纵向距离的平方和为最小。
回归线
回归线
回归线
回归线
回归方程
• 确定回归线的方程称回归方程。
Yˆ a bX
Yˆ aYX bYX X
Xˆ a XY bXYY
回归方程的建立
• 用最小二乘方法求回归系数(regression coefficient)
n
Байду номын сангаас
r 2
(Yˆi Y )2
i 1
n
(Yi Y )2
1666 .3577 2554 .1000
0.6524
i 1
对回归方程的方差分析
方差来源 平方和 自由度 均方差 F 值
心理统计学PPT课件(3):数据整理与特征量
常用统计指标
• 集中量 • 算术平均数 • 中位数 • 众数 • 加权平均数 • 几何平均数 • 调和平均数
• 差异量 • 全距 • 平均差 • 方差与标准差 • 相对差异量 • 差异系数 • 偏态量 • 峰态量
精品文档
集中量
• 集中量(measures of central tendency)是 代表一组数据典型水平或集中趋势的量。 它能反映频数分布中大量数据向某一点 集中的情况。
• 也可以将频数分布表中频数最多的组的 组中值作为粗略众数。
精品文档
众数的优缺点
众数虽然简明易懂,但是它并不具 备一个良好的集中量的基本条件。它主 要在以下情况下使用: 当需要快速而粗略地找出一组数据的代表 值时; 当需要利用算术平均数、中位数和众数三 者关系来粗略判断频数分布的形态时; 利用众数帮助分析解释一组频数分布是否 确实具有两个频数最多的集中点时。
计值
精品文档
算术平均数的缺点
• 易受两极端数值(极大或极小)的影响;
•
某村农户收入状况
•
120, 127, 130, 131, 132, 132, 135,
136, 137, 139, 140, 145, 146, 149, 153, 158,
160, 320, 400
• 平均数=162.63
• 一组数据中某个数值的大小不够确切时 就无法计算其算术平均数。
• 中位数的应用及其优缺点
精品文档
中位数的应用及其优缺点
中位数虽然也具备一个良好的集中 量所应具备的某些条件,例如比较严格 确定、简明易懂,计算简便,受抽样变 动影响较小,但是它不适合进一步的代 数运算。它适用于以下几种情况: 一组数据中有特大或特小两极端数值时; 一组数据中有个别数据不确切时; 资料属于等级性质时。
心理统计ppt03图表呈现
实到学生有36人。 某学生身高为1.61米。 某学生做对14道是非题。 某学生跑400米用了1分30秒。 某学生在用五级记分的体操比赛中获3分。 某学生数学成绩为85分。
第三讲 统计图表
一 、次数分布表
次数分布表是对杂乱无序 的数据进行整理的重要手段, 它能使我们对样本情况有个初 步的了解,为今后进一步分析 和研究问题提供很大方便。
Y
230~
1
1
2
210~
1
1
1
1
4
190~
1
3
2
1
7
170~
1
3
3
1
8
150~
1
2
1
4
130~
110~
2
2
1
5
1
1
X 1 5 9 8 4 3 1 31
二、次数分布图
在编制次数分布表的基础上,可以绘制次 数分布图,使一组数据特征更加直观和概括, 而且还可以对数据的分布情况和变动趋势作粗 略的分析。 绘制次数分布图可以用已有的计算机程序, 如EXCEL,也可以用专门的统计程序。
累积曲线。
图3-8 累积次数分布曲线
累积曲线可用于判断一组数据的大致分布形态。
图3-9 正态分布数据的累积曲线
图3-10 正偏态数据累积曲线 图3-11 负偏态数据累积曲线
二、计算机制作统计图表
在心理与教育研究中常用的基本统计程序主 要有两个:SPSS和SAS。其中以SPSS应用最多。
SPSS是专门用于社会科学研究的统计分析工 具:Statistics Package for Social Science
组中值
现代心理与教育统计学PPT课件
• 对数据进行统计分类以后,得到的各种数 量结果称为统计指标。
• 把统计指标和被说明的事物之间的关系用 表格的形式表示就称为统计表。
• 统计表具有简明、清晰、准确的特点,表 中的数据易于比较分析。
• 统计图是依据数字资料,应用点、线、画、 面、体、色等描绘制成,简明而又有规律, 并且能显示数量的图形,它是统计数据资 料的可视化显示方式。
• 顺序数据,是按照事物的某种属性,对一 系列事物进行排序后所获得的数据。
• 等距数据,是有相同单位,但是没有绝对 零点的数据。
• 例如,温度、智力分数等。
• 此类数据只可进行加减,不能进行乘除运 算。
• 例如,数学测验中,A得了80分,B得了60 分,可以说A 得分高于B,A比B高了20分, 但是不能说A的数学能力是B的4/3倍。
• 心理与教育统计学是专门研究如何运用统 计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料, 并根据这些数据资料传递的信息,进行科 学推论找出心理与教育活动规律的一门学 科。
心理与教育统计学的内容
心理与教育统计中的基本概念
1 根据数据的观测方法,可分为计数数据和 测量数据
• 一般说来,分组的数目多,则组距小,计算精确。 但它要求总的数据量大,否则会出现有的组距内 无次数分布的现象,那将使整个数据的分布规律 显示不明显,也就不能发挥次数分布表的作用了。
• 如果分组少,组距就大,计算简单,但引进计算 误差较大。
• 因此,要做到既不增加搜集数据的工作量,又能 使分组后的计算精确到最大限度,那么,按上述 公式分组,是一个较好的方法。
• 在制作图表之前,首先要对收集到的数据 资料进行初步的整理,整理的基本方法有 排序和统计分组两种。
心理统计学一第二章统计图表ppt课件
第二章 统计图表
各种科学研究的结果大多以 数据的形式出现。这些直接获得 的数据称为原始数据或观测数据, 它们纷乱无章,初看起来难以发 现问题,只有经过整理分析才能 从中提取出有用的信息构成规律 性的知识。
第二章 统计图表
因此,科学工作者在实验或调 查结束后的第一项工作就是依据研 究的目的要求,对原始数据加以初 步整理与分析,制成简单的统计图 或统计表,从中发现这些数据分布 的形式和特点,再选择必要的统计 方法进一步作深入研究。
统计表的结构
表号
标题
表2-1 统计表的格式
顶线
横标目的总标目 纵标目 表线
横标目
数字
注:
表注
标目
底线
统计表的结构和组成要素图示
顶线 表线
标目
表注
表号
标题
表2-1 80名员工对部门主管尽职程度调查结果
80名员工对主管尽职情况评定
人数
①非常不尽职
9
②不尽职
30
③不置可否
10
④尽职
25
⑤非常尽职
6
总计
条形图:用直条的长短来表示统计项目数 值大小的图形,主要是用来比较性质相似 的间断型资料。
圆形图:是用于表示间断型资料比例的图 形。圆形的面积表示一组数据的整体,圆 中扇形的面积表示各组成部分所占的比例。 各部分的比例一般用百分比表示。
单式条形图
60
50
40
人 数
30
20
图形
10
尺度线 0
即总次数。
(6) 抄录新表:新表包括的栏目有:第一列为分组区间,第二列为各分
组区间的组中值,第三列为次数。
分组次数分布表的意义与缺点
《心理统计学》课件-第10~11章
多选题
下列关于卡方配合度检验方法中的自由度,说法正确的( )
A. 配合度检验的自由度与实验的自由度分类的项数有关 B. 通常情况下,配合度检验的自由度为分类的项数减1 C. 配合度检验的自由度一般为理论次数减1 D. 在正态拟合检验时,自由度为分组项目数减3
多选题
下列关于卡方配合度检验方法中的自由度,说法正确的(ABD )
10.1 χ²检验
10.1.1 χ²检验的原理 选择
χ²检验方法能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否 相一致问题,或说有无显著差异问题。
10.1 χ²检验
χ²检验的原理 χ²检验的基本假设 χ²检验的分类 χ²检验的基本公式 期望次数的计算
1、观察频数:又称实际频数,是指在实验或调查中得到的计数资料。 2、理论频数:是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的 次数,又称为期望次数。
10.1.5 期望次数的计算 选择
小期望次数的连续性矫正(即每组里面的理论次数小于5时)
10.1 χ²检验
χ²检验的原理 χ²检验的基本假设 χ²检验的分类 χ²检验的基本公式 期望次数的计算
当单元格人数过少时,处理方法有以下四种: 1、单元格合并法 2、增加样本法 3、去除样本法 4、使用矫正公式:在2×2的列联表检验中,若单元格的期望次数低于10但高于5可 使用耶茨校正公式来加以校正。若期望次数低于5时,或 样本总人数低于20时,则应 使用费舍精确概率检验法。当单元格内容牵涉到重复测量设计时(例如前后测设计), 则可使用麦内玛检验。
A. 配合度检验的自由度与实验的自由度分类的项数有关 B. 通常情况下,配合度检验的自由度为分类的项数减1 C. 配合度检验的自由度一般为理论次数减1 D. 在正态拟合检验时,自由度为分组项目数减3
心理统计学PPT课件2:平均数和标准差
无偏性
当数据量足够大时,平均 数的期望值等于其真实值, 因此平均数具有无偏性。
02
CHAPTER
标准差
定义
01
描述数据分布的离散程度
标准差是用来描述数据分布离散程度的统计量,它表示各数值与其平均
数之间的偏差程度。
02
计算每个数值与平均数的差的平方
标准差的计算方法是将每个数值与平均数之间的差的平方,然后求和,
04
CHAPTER
平均数和标准差的局限性和 注意事项
平均数的局限性
平均数易受极端值影响
01
当数据集中存在极端值时,平均数会受到较大影响,导致结果
偏离实际。
平均数难以反映数据分布
02
平均数只能描述数据集的中心趋势,无法反映数据的离散程度
和分布形态。
不同数据集的平均数难以比较
03
由于不同数据集的单位、量级可能不同,直接比较两个数据集
03
CHAPTER
平均数和标准差在心理统计 中的应用
描述数据分布
平均数
描述数据集中趋势,计算所有数值的 和除以数值的数量,反映数据“中心 ”或“典型值”。
标准差
描述数据离散程度,计算各数值与平 均数之差的平方和的平均数,再取平 方根,反映数据分布的“宽度”或“ 波动范围”。
比较两组数据
平均数差异检验
的平均数可能导致误解。
标准差的注意事项
标准差并非绝对标准
标准差的大小受数据量级和单位的影响,因此需要结合实际情境 进行解释。
标准差并非越小越好
标准差小表示数据离散程度较小,但这并不意味着数据质量就高。
标准差并非适用于所有情况
对于非正态分布的数据,标准差可能无法准确反映数据的离散程度。
心理统计学PPT课件2:平均数和标准差
温度计读数、百分制得分(为什么不列入等比量表或顺序量表?) 等比(比率)量表(ratio scale)
长度、时间
四种数据水平
平均数和方差的故事
考试成绩 67, 87, 90, 58, 88, 76, 44, 63, 95, 81, 68, 83, 77, 72, 86, 89, 81, 93, 50, 62, 82, 92, 49, 51, 56, 64, 75, 79, 80, 71
请问该班此次考试成绩如何? 报出每人考分? 报告平均数?
人数
名次
个数
五分制得分 ……
取值个数有限的数据
连续型随机变量
(continuous scale)
取值个数无限的数据 身高 体重 智商 时间长短 百分制得分 ……
称名量表(nominal scale)
学号、房间号、邮政编码、电话号码 顺序量表(等级量表) (ordinal scale)
名次、等级、五分制得分 等距量表(interval scale)
定义公式:
标准差
样本的方差
01
样本的标准差
02
样本的方差与标准差
标准分数(z-score)
T-score
T = KZ + C
总体均值的假设检验
两总体均值之差的假设检验
两总体均值之差的假设检验
相关样本平均数差异的 显著性检验 D=X1-X2
方差分析
问题 为了研究三种不同教材的质量,抽取三个实验班分别使用其中一种教材,而对其他因素加以控制。经过一段时间的教学后进行测试,得到三种实验处理的数据如下: 教材A:70 74 72 68 71;平均数:71 教材B:75 80 77 68 75;平均数:75 教材C:70 72 66 72 70;平均数:70 总平均数:72 三种教材的效果有无显著差异?
心理统计学统计图表 ppt课件
1.1 数据排序 1.2 统计分组 分组前的准备
数据核对 切忌随心所欲删除不符合自己主观假设的数
据; 以充分的理由剔除过失数据 (平均数加减3
个标准差) 。
心理统计学统计图表
分组的标志
对数据分组时所依据的特性称为标志。 性质类别:反映事物在组别、种类上的不同,
如性别、年龄(老中青) 数量类别:以数值大小进行分组 ,经济收入,
心理统计学统计图表
标目 分类的项目,说明统计数字意义
标目位置
横
标
目
横标目
纵标目
纵标目
心理统计学统计图表
纵标目 横 标 目
心理统计学统计图表
内容
主语:资料性质,指标或指标体系 定语:限制主语,分组或分组体系 谓语:统计资料——数字
横标目纵标目 横︵ 标定 目语
︶
纵标目 (主语)
数字
(谓语)
心理统计学统计图表
研究设计
搜集 数据
统计整理 分析
观测数据或原始数据
图表呈现,生动直观、一目了然、容易理解
心理统计学统计图表
Contents
1 数据的初步整理
2
次数分布表
3
次数分布图
4 其他类型的统计图表
心理统计学统计图表
1 数据的初步整理
统计表
简单、清晰、准确
心理统计学统计图表
❖ 统计图
更具体形象
心理统计学统计图表
P29
心理统计学统计图表
统计图应用实例:正误判断
心理统计学统计图表
心理统计学统计图表
心理统计学统计图表
2 次数分布表
表示数据在各个分组区间内的散布 情况。
简单次数分布表:依据每
心理统计学全套课件
答案
组别 组中值 次数(f) 相对 累积 累积相 累积百 次数 次数 对次数 分比
95-99 97
2
.04 50 1.00 100
90-94 92
3
.06 48
.96
96
85-89 87
2
.04 45
.90
90
80-84 82
6
.12 43
.86
86
75-79 77
14 .28 37
.74
74
70-74 72
二项分布的平均数和标准差
• 当二项分布接近于正态分布时,在n次二 项实验中成功事件出现次数的平均数和 标准差分别为: μ=np
•和
npq
做对题数
0 1 2 3 4 5 6 7 8 9 10 总和
二可能项结果分数 布的概应率用
1
0.001
10
0.010
45
0.044
120
0.117
210
0.205
例题
• 某学生从5个试题中任意抽选一题,如 果抽到每一题的概率为1/5,那么抽到 试题1或试题2的概率为多少?
概率的乘法
• A事件出现的概率不影响B事件出现的概 率,这两个事件为独立事件。
• 两个独立事件积的概率,等于这两个事 件概率的乘积。用公式表示为: P(A ·B) = P(A) ·P(B) 其推广形式是 P(A1 ·A2 … An) = P(A1) ·P(A2) … P(An)
四种数据水平
• 称名量表 • 学号、房间号、邮政编码、 号码 • 顺序量表〔等级量表〕 • 名次、等级、五分制得分 • 等距量表 • 温度计读数、百分制得分 • 等比〔比率〕量表 • 长度、时间
《心理统计学》课件-第5章
1、成对(N<30) 2、非正态 3、线性 4、非连续,主要是顺序数据或称名数据。
思考
皮尔逊积差相关 VS 等级相关
1、成对(N≥30) 2、正态(接近正态) 3、线性 4、连续,主要是等距或等比数据。
1、成对(N<30) 2、非正态 3、线性 4、非连续,主要是顺序数据或称名数据。
总之,等级相关的适用范围比积差相关的大,又对总体分布不做要求。但其精确度要差 于积差相关,因此凡是符合积差相关的资料,都不用等级相关计算。
5.1 相关、相关系数与散点图
5.2 积差相关
第五章 相关关系
5.3 等级相关
5.4 质与量相关
5.5 品质相关
5.2 积差相关(Pearson相关)
5.2.1 积差相关的概念与适用条件 选择、简答
积差相关是揭示两个变量线性相关方向和程度最常用和最基本的方法。
5.2 积差相关
概念与适用条件 基本公式 差法公式
)。
A. x数值增大时,y也随之增大 B. x数值减少时,y也随之减少 C. x数值增大(或减少)时,y也随之减少(或增大) D. y的取值,几乎不受x取值的影响
5.1 相关、相关系数与散点图
5.1.2 相关系数 选择
5.1 相关、相关系数与散点图
相关及相关类别 相关系数 散点图
两列变量相关程度的数字表现形式,常用r来表示,描述总体时一般用ρ来表示。
完全负相关 r=-1
完全正相关 r=1
正相关
负相关
零相关
多选题
【统考】散点图的形状为一条直线,它们之间的相关系数可能为(
A. 1 B. 0.5 C. 0 D. -1
)。
多选题
AD 【统考】散点图的形状为一条直线,它们之间的相关系数可能为(
4_心理统计辅导讲义(14页)
官方总站:圣才学习网
1.离差与平均差 0 (1)离差又称离均差,反映一个数据与该组数据中心的距离。
.1 (离差), www (2)平均差,离差绝对值的平均数。可以反映同组数据的分散情况。
2.方差与标准差 (1)总体
网 习
(2)样本
学
理 样本为什么要用 n-1,自由度的理解:最少要固定的数目个数-确定整组数目的不变。以后还会遇到:t,
如何选择呢?主要是考虑两列测量数据类别的匹配。 相关系数的使用
Y\X 名义变量
网 名义变量
φ 相关
顺序变量
等距或等比变量
顺序变量
习
Spearman 等级相关
学 等距或等比变量
(其中一列转化为等 点二系列相关 级)Spearman 等级相 Pearson 积差相关(r)
一元回归方程建立检验与应用假设检验总汇数据类型单样本问独立样本的比较相关样本的比较多组样本的比较相关问题总体正态分布单样本检验独立样本检验相关样本检验单因素方差分析重复测验方差分析积差相关等比等距型分布形态未知大样本下相应的检验大样本下相应的检验大样本下相应的检验转化为顺序型转化为顺顺序型符号检验单向方差分析弗里德曼双向方差分等级相关第四部分练习题一填空中华心理学习网www100xinlicom官方总站
(SX-连续变量所有数据的标准差)
(2)二列相关(两列均为正态连续变量,其中一列人为划分为二分变量—比如成绩优秀否,及格否,高个 子与矮个子等)(很不常用,用于对项目区分度的确定。如果变量的正态性无法确定时,都用点二列相关)
(St 两列连续变量总的标准差,y 为正态曲线中 P 值对应的高度)
5.φ 相关 当两列变量都是真正的二分变量时,可以用 φ 相关。
心理统计学1[1]
1.解释下列名词的意思
统计学描述统计推断统计随机变量数据总体个体样本参数统计量名称变量顺序变量等距变量比率变量连续变量离散变量计数数据
2.简述心理统计学内容及其各内容之间的关系。
3.简述参数与统计量的区别和联系。
4.简述统计总体的基本特征。
5.论述心理统计学的重要意义。
6.如果不考虑测量结果,下列变量中哪些是连续变量,哪些是离散变量?
①时间()②性别()
③家庭的大小()④绝对感觉阈限()
⑤职员工作评定等级()⑥测验成绩()
7.试从变量的性质上,连续性上及数据类型上指出下列观测值所属的变量类型。
①李芳在班上名列第5名。
()
②初二(3)班有女生24人。
()
③王鹏跑100米用了16秒4。
()
④丹丹的身高是150厘米。
()
⑤朱华英做对了10道题。
()
⑥郭明明的数学测验是90分。
()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
描述统计与推断统计-心理学统计与测量经典习题1第一章描述统计名词解释1.描述统计(吉林大学2002研)答:描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
具体内容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据的全貌。
2.相关系数(吉林大学2002研)答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。
作为样本的统计量用r表示,作为总体参数一般用ρ表示。
相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。
3.差异系数(浙大2003研)答:差异系数,又称变异系数、相对标准差等,它是一种相对差异量,为标准差对平均数的百分比。
其公式如下:常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。
4.二列相关(中科院2004研)答:如果两列变量均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量虽然也是正态分布,但被人为地划分为两类。
求这样两列变量的相关用二列相关。
5.集中量数与差异量数(浙大2000研,苏州大学2002研)答:集中趋势和离中趋势是次数分布的两个基本特征。
数据的集中趋势就是指数据分布中大量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。
用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。
6.中位数(南开大学2004研)答:中位数,又称中点数,中数,是指位于一组数据中较大一半和较小一半中间位置的那个数,用M d或Mdn来表示。
7.品质相关(华东师大2002研)答:品质相关是指R×C表的两个因素之间的关联程度。
两个因素只被划为了不同的品质类别,其数据一般都是计数的数据,而非测量的数据。
品质相关可依二因素的性质及分类项目的不同,而有不同的名称和计算方法,较常见的有四分相关和Ф相关。
8.标准分数(华南师大2004研)答:标准分数,又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
其计算公式为:简答题1.简述使用积差相关系数的条件。
(首师大2004研)答:一般来说,用于计算积差相关系数的数据资料,需要满足下面几个条件:①要求成对的数据,即若干个体中每个个体都有两种不同的观测值。
②两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布。
③两个相关的变量是连续变量,也即两列数据都是测量数据。
④两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关。
2.简述算术平均数的使用特点。
(浙大2003研,苏州大学2002研)答:算术平均数的优点有反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响。
缺点有易受极端数据的影响;如果出现模糊不清的数据时,无法计算平均数,因为平均数的计算需要每个数据的加入。
从算术平均数的这些特点可以看出,如果一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,用算术平均数表示其集中趋势最佳。
3.如果你不知道两个变量概念之间的关系,只知道两个变量的相关系数很高,请问你可能做出什么样的解释?(武汉大学2004研)答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。
两个变量的相关系数很高,只能说明两变量间具有较高的共变关系,即一个变量的变化会引起另一个变量朝相同或相反方向发生变化。
至于二者有无因果关系,或谁是因谁是果则无法确定。
所以在解释时只能说两变量间存在较高的相关关系。
4.一组大学生的智力水平和性别之间求相关,设男为1,女为2。
如果两变量的相关为负,请问说明了什么情况?请举例说明。
(武汉大学2004研)答:根据题意,如果两变量的相关为负,则说明大学生的智力水平与性别存在负相关,即男生智力水平低,女生智力水平高。
举例提示:本题所求的相关是点二列相关,一列变量为等距变量(智力水平),另一列变量为名义变量(性别)。
根据点列相关的数据特点,列出两组数据,运用相应公式计算即可。
要注意的是,男生的智力水平平均分数应小于女生的。
5.某省进行了一次小学五年级的数学统考。
已知不同小学教学水平相差较大,但同一个小学的五年级的不同班级教学水平很相近。
以学生的考试成绩为原始数据,问:①如何处理这些原始数据,使得数据处理的结果能够比较不同小学学生的数学学习潜能?答:提示:使用标准分数。
由于要考察的是不同学生的数学学习潜能,而非已有的数学水平,所以应该以每个学校的五年级学生为总体,求每个学生的标准分数,然后比较不同学校学生间的标准分数。
②如何处理这些原始数据,使得数据处理的结果能够反映一个学校的教学水平?(南开大学2004研)答:提示:一个学校的教学水平主要体现在学生的学习成绩上,而学生成绩的好坏有两个标准:一是平均水平的高低,二是整体水平的差异。
一般来说,平均水平越高,同时整体水平差异越小,表明该学校的教学水平高,反之则低。
而同时反映了这两个指标的只有差异系数(CV)。
其公式为:6.举例说明相关程度很高的两个变量之间并不存在因果关系。
(北师大2001研)答:变量之间的因果关系必须符合以下几个条件:①二者之间必须有可解释的相关关系;②二者必须有一定的时间先后顺序,也就是说“因”的变化在前,“果”的变化在后,二者顺序不能变;③二者不能是虚假关系(即一种关系被另一种关系被另一种关系取代后,原来的关系被证明不成立);④因果决定的方向不能改变。
而变量之间的相关关系是一种共变关系,即一种变量发生变化,另一种变量也相应地朝相同或相反方向发生变化。
但有高相关的两个变量之间并不一定存在因果关系,如一般情况下,数学成绩好的学生,物理成绩也会比较好,即两者存在很高的正相关。
但是,数学成绩和物理成绩之间没有一定的时间先后顺序,而且无法确定二者谁决定了谁,即不能满足因果关系的②④两个条件,所以不是因果关系。
7.度量离中趋势的差异量数有哪些?为什么要度量差异量数?(西北师大2002研)答:对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数。
这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等。
一组数据集中量数的代表性如何,可由表示差异情况的量数来说明。
差异量数越小,则集中量数的代表性越大;若差异量数越大,则集中量数的代表性越小。
如差异量数为零,则说明该组数据彼此相等,其值都与集中量数相同。
集中量数是指量尺上的一点,是点值,而差异量数是量尺上的一段距离,只有将二者很好地结合,才能对一组数据的全貌进行清晰的描述。
所以需要度量差异量数。
8.用算术平均数度量集中趋势存在哪些缺点?试举例说明。
(重大2004研)答:其缺点有:易受极端数据的影响;如果出现模糊不清的数据时,无法计算平均数,因为平均数的计算需要每个数据的加入。
如:有两组物理成绩:第一组:25,37,32,60,100,99,96第二组:63,72,60,68,63,62,61尽管两组成绩的平均分相等都约为64,但由于极端数据的存在,64不能很好地代表第一组数据的平均水平,却较好地代表了第二组数据。
计算题1.五位教师对甲乙丙三篇作文分别排定名次如下表;名次教师序号甲乙丙1 3 1 22 3 2 13 3 1 24 1 3 25 1 3 2请对上述数据进行相应的统计分析。
(华东师大2003研)答题提示:题目目的是让考生对5位教师的一致性做出评价。
该题是让5个被试(教师)对3篇作文进行等级评定,每个被试都根据自己的标准对三篇作文排出了一个等级顺序。
所以应该计算肯德尔W系数。
将题中原始数据代入公式即可。
2.计算未分组数据:18,18,20,21,19,25,24,27,22,25,26的平均数、中数和标准差。
(首师大2003研)答题提示:平均数与标准差的计算直接将原始数据代入相应公式即可。
中位数的计算稍复杂一些。
将数据从小到大进行排序,可知数组中虽有重复数据,但位于中间的数非重复数据,加之数据数为偶数,所以取第N/2和第N/2+1两个数的平均数作为中数即可。
3.4名教师各自评阅相同的5篇作文,表2为每位教师给每篇作文的等级,试计算肯德尔W系数。
(首师大2003研)表2 教师对学生作文的评分答题提示:将数据代入肯德尔W系数即可。
4.把下列分数转换成标准分数。
11.0,11.3,10.0,9.0,11.5,12.2,13.1,9.7,10.5(华南师大2003研)答题提示:先根据相应公式计算平均数和标准差,然后根据标准分数公式依次计算每个分数的标准分数。
5.假定学生的成绩呈正态分布,某班五名学生的数学和物理成绩如下,求相关系数。
(重大2004研)答题提示:两列数据均为测量数据,而且呈正态分布,因此应该求积差相关。
将数据代入积差相关公式即可。
第二章推断统计单选题1.什么情况下样本均值分布是正态分布?A 总体分布是正态分布B 样本容量在30以上C A和B同时满足D A或B之中任意一个条件满足(北京大学2000)参考答案D2.以下关于假设检验的命题,哪一个是正确的?A如果H0在=.05的单侧检验中被接受,那么H0在=.05的双侧检验中一定会被接受B如果t的观测值大于t的临界值,一定可以拒绝H0C如果H0在=.05的水平上被拒绝,那么H0在=.01的水平上一定会被拒绝D在某一次实验中,如果实验者甲用=.05的标准,实验者乙用=.01的标准。
实验者甲犯II类错误的概率一定会大于实验者乙。
(北京大学2000)参考答案D3.让64位大学生品尝A B两种品牌的可乐并选择一种自己比较喜欢的。
如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表):A 2.28%B 4.01%C 5.21%D 39.06% (北京大学2000)参考答案C4.在多元回归的方法中,除哪种方法外,各预测源进入回归方程的次序是单纯由统计数据决定的:A逐步回归B层次回归C向前法D后退法(北京大学2000)参考答案B5.以下关于假设检验的命题哪一个是正确的A、实验者甲用=0.05的标准,实验者乙用=0.01的标准,甲犯II类错误的概率一定会大于乙:B、统计效力总不会比水平小C、扩大样本容量犯II类错误的概率增加D、两个总体间差异小,正确拒绝虚无假设的机会增加。
(北京大学2002)参考答案D6.已知X和Y的相关系数r1是0.38,在0.05的水平上显著,A与B的相关系数r2是0.18,在0.05的水平上不显著A、r1与r2在0.05水平上差异显著B、r1与r2在统计上肯定有显著差异C、无法推知r1与r2在统计上差异是否显著D、r1与r2在统计上不存在显著差异(北京大学2002)参考答案C7.在回归方程中,假设其他因素保持不变,当X与Y相关趋近于0时,估计的标准误是怎样变化?A、不变B、提高C、降低D、也趋近于0(北京大学2002)参考答案C简答题1.非参数检验方法的特点有哪些?(浙江大学2005)参考答案:①一般不需要有严格的前提假设②非参数检验特别适用于顺序资料(等级变量)③很适用于小样本,且方法简单④最大的不足是未能充分利用资料的全部信息;⑤非参数方法目前还不能处理“交互作用”。