第二章 统计图表
张厚璨《现代心理与教育统计学》书后习题详...
5 91 85
6 48 68
7 55 47
8 82 76
9 32 25
10 75 56
解: (1)用积差相关方法解答如下: A X 86 58 B Y 83 52
7
2 2
被试 1 2
X
Y
XY
7138 3016
7396 3364
6889 2704
心理学统考专业资料店:/ 3 4 5 6 7 8 9 10 79 64 91 48 55 82 32 670 670 89 78 85 68 47 76 25 56 659 6241 4096 8281 2304 3025 6724 1024 5625 48080
QQ:382895420
fXc 67 248 342 416 752 1000 1258 672 432 242 153 84 ∑fXc=5666
X=
fXc = 5666 =36.09
N
157
1 * 157 64 Md=34.5+ 2 *5=36.46 37
答:平均数为 36.09,中数为 36.46。
QQ:382895420 51 48 43
解: i 40 51 48 43 182 T
i i
i i 2 i 2 i
i
40 90.5 51 91.0 48 92.0 43 89.5 90.8 182
S d
ST
解 : 因为5厘米组与10厘米组的标准差单位相同(都是厘米), 但平均数差异很大,5厘米组 标准差直接比较5厘米组和10厘米组的离散程度大小是无意义的,应采用差异系数比较 其离散程度的大小。具体计算如下: s 0.7 CV1 100% 100% 11.1% 6.3 s 1.2 CV2 100% 100% 8.39% 14.3 答:通过比较差异系数可知, 5厘米组的离散程度比10厘米组的离散程度大。
现代心理与教育统计学复习资料
现代心理与教育统计学复习资料第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量就是可以挑相同值的量。
统计数据观测的指标都就是具备变异的指标。
当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的x或y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本须要研究的同质对象的全体,称作总体。
每一个具体内容研究对象,称作一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。
4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ5、统计误差误差就是测量得值与真值之间的差值。
测出数值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。
对于个别极端数据与否该剔出,应当遵从三个标准差法则。
二、次数原产表中(一)简单次(频)数分布表(二)相对次数分布表将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n(三)累加次数分布表(四)双列次数分布表双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中则表示其次数原产。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
统计图表
表号 表号指表的序号,位于表的
左上方,一般以出现的先后顺序 排列。
名称
名称又称标题,是一个表格的名称,应写在表的上 方。标题用语要简练扼要,准确得体,一望即知该 表的内容。
表的序号和标题之间留一个汉字的空格。二者居中
排在顶线的上方,长度不宜超过表的宽度,若标题
字数过多,应转行排列。
标目
标目即分类的项目。标目的好坏决定统计表 的质量,要认真酌定。标目一般在表的上面 一行或左侧一列。如果分类的标志只有一个, 写在表的上行或左列都可以。如果分类的标 志有两个,且二者没有隶属关系,则左列与 上行各一个。如果两个分类标志有隶属关系, 则要放在一个方向(或上面或左侧)分两行 分述。标目确立了数据组织的逻辑,并确定 了栏目下数据栏的性质。
2、数量类别。这是以数据的取值大小为分类标志, 把数据按数值大小以分组或不分组的形式排出一个 顺序来。(等距、比率)
对原始数据排序和分类以后,数量小的就可以直接计算,数量大时再做进一 步分组,编制统计表、统计图为以后的分析打下基础。
三、统计表
1、定义:统计表是用来表达统计指标与被说明 事物之间数量关系的表格。 统计指标:在对数据进行统计分类以后,得到的 各种数量结果称为统计指标。 2、作用:简洁、清晰、准确、一目了然,明显 地反映出事物的全貌及其蕴含的特征,省去冗长 的文字叙述,便于分析、比较、计算和记忆。 3、结构
图题的文字要言简意赅,具有说明性和专指性,使
人一看就能知道该图所要显示的是何事、何物,发 生于何时、何地。如果图示资料比较复杂,这时图
题可用大标题与小标题呈现。图题的字体要与整个
图形的大小相称,一般是图中使用的最大号的文字。
现代心理与教育统计学(张厚粲)课后习题答案
现代心理与教育统计学(张厚粲)课后习题答案第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.1858、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
现代心理教育与统计学 第三版复习资料(张厚粲)
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
第二章 统计图表
• 2.分类标志要明确,要能包括所有的数据 • 对数据进行分组时,所依据的特性称为分组或 分类的标志。 • (三)分组的标志 • 分类标志有各种各样。这些分类标志按形式大 致可分为性质类别与数量类别两种。 • 1.性质类别。主要是根据事物的属性不同将 被观测的事物加以划分,反映事物在组别、种类 上的不同,不说明事物之间的数量差异。 • 性质类别可根据事物的性质及研究的需要分成 不同的层次,每个层次又可分为不同数量的细目。
• 图目 写在图形基线上的各种不同类别、名称,或 时间、空间的统计数量值,即横坐标上所用的各 种单位名称。也叫刻度线标签。 • 图尺 在统计图的横坐标及纵坐标上都要用一定 的距离表示各种单位,这些单位称为图尺(ruler或 scale)。图尺分点(tick)要清楚,整个图尺大小要 包括所有的数据值,如果数据值大小相差悬殊, 图尺可用断尺法或回尺法,减少图幅。 • 图形 是图的主要部分,图形线条要清晰,一般 除图形线外,避免书写文字。要表示不同的结果, 用不同的图形线以示区别。 • 图例 用来表示并标明各种图形的含义。图例 (legend)的位置可选图中或图外适当的地方,注 意保证整个统计图的和谐美观和均衡。 • 图注 凡是图形中需要借助文字或数字加以补充 说明的,均称为图注。图注部分的文字要少,字 号要小。
•
在制定统计表和统计图时,首先要对收集的数据 资料进行初步整理。整理的基本方式有排序和统 计分组两种。 • 一、数据排序 • 数据排序(sort或order),就是按照某种标准, 对收集到的杂乱无章的数据按照一定顺序标准进 行排列。数据排序是整理数据最简单的方法。 • 将一组数据按照数值大小、高低、长短、多少, 依升序(ascending order)或降序(descending order)排列后,就可显示出数据的分布情况。
统计图表教学案例
方程。
表 9-1 8 名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h)
编
号
1
23
4
5
6
7
8
年
龄
13
11 9
6
8 10 12
7
尿肌酐含量
3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65
Sep,22,2009
箱式图(box plot) 箱子上端为上四分位 数P75 ,下端为下四分位数P25,中间横 线是中位数M(P50),穿过箱子的连线, 两端分别是除异常值外的最小值和最大值。 箱式图一般使用5个统计量反映原始数据的 分布特征,适于多组数据的直观比较。
Sep,22,2009
二、常用统计图及绘制方法
条图(bar graph) 又称直条图,用等宽度 直条的长短表示比较指标的数值大小和它们 之间的对比关系。适于比较独立或离散变量 的统计指标。
按分组因素是一个还是两个分为单式和复式 两种
Sep,22,2009
例 2-1 某地 1990 年居民 3 种死因的死亡率比较情况见表 2-4。
173 30 19.07 157 62 39.89 121 62 51.23 P<0.01
90 37 40.11 78 51 63.65 70 62 81.14 P<0.01
P<0.01
P<0.01
P<0.01
Sep,22,2009
没有标题; 线条太多,有竖线和斜线; 不应有备注; %意义不明确且计算有误。
某市 1970~1985 年痢疾与百日咳死亡率(1/10 万)
痢疾死亡率(1/10 万) 百日咳死亡率(1/10 万)
第二章统计图表解析
3.4
资料来源:见《心理学报》1979年第1期103页,选部分引用
四、统计图 统计图一般采用直角坐标系,通常横坐标或横
轴表示事物的组别或自变量X,称为分类轴; 纵坐标或纵轴表示事物出现的次数或因变量Y, 称为数值轴。
圆形图——角度坐标
统计图一般由图号及图题、图目、图尺、图形、 图例、图注等构成。
缺失:指数据不全或缺项未填;例如一份资料 中未回答的问题占10%以上,或者缺少关键性 资料。
可疑:指难以辨认或怀疑其真实性的数据;例 如,有的被试填答的问卷全部选同一个选项 (如全选A或全选B);有的被试填答的结果可 以看到是一种规则的排列方式(如A B C D E D B C A B C D E……)。
失误:指存在明确差错的数据或答案。
在剔除数据的过程中,注意不能把一些不符合 自己主观假设的数据随意去掉。因此这项工作 一定要非常慎重。对于个别极端数据是否该剔 除,应遵循三个标准差法则。
(二)统计分组应注意的问题 1.分组要以被研究对象的本质特性为基础 2.分类标志要明确,要能包括所有的数据
最高组或最低组的下限最好是组距i的整数倍; 各分组区间一般在纵坐标上按顺序排列,数值大的
分组区间排在上面,数值小的分组区间排在下面;
在呈现表格时,各分组区间使用表述组限,并且为 了书写方便,通常只用整数写下限值,然后在右侧 画一横线。
登记次数:要特别注意处于分组区间分界点 上的几个值
计算次数f 编制分组次数分布表
2
K =1.87(N 1)5
N 为数据个数,K 取近似整数。
列出分组区间 分组区间:组限,一个组的起点值和终点值之间的
距离。起点值称组下限,终点值称组上限。组限有 表述组限和精确组限两种。
心理与教育统计学课件(张厚粲版)ch2统计图表
40 35 30 25 20 15 10 5 0 一年级 二年级 三年级 四年级 女生 男生
图2-1 某高校教育系各年级男女生人数
资料来源:表2-6
表2-6 某高校教育系各年级男女生人数统计表
一年级 二年级 三年级 四年级
女
人数
男
女
男
女
男
女
男
26
33
26
36
24
37
25
35
(二)统计图的种类
1.条形图(又称直条图) 条形图按图形中被比资料的组数不同,可 分为单式条形图和复式条形图;按条形 图的排列的方向不同,可分为纵条图和 横条图。
二、次数分布图
(一)直方图 (二)次数多边图 (三)累积次数分布图
㈠直方图
25 20 15 10 5 0
图2-7a 初二100名学生数学测验分数的次数直方图
㈡次数多边图
25 20 15 10 5 0 37 42 47 52 57 62 67 72 77 82 87 92 97
图2-7b 初二100名学生数学测验分数的次数多边图
复式横条图
优
良 女生 男生 中
差 0 5 10 15
图2-3b 某校初二.三班男女生学习成绩和人数
2.圆形图
优 良 中 差
图2-4 某校初二.三班学习成绩比较图
3.线形图
7 6 5 4 3 2 1 0 7 8 9 10 11 12 13 14 15 16 17 18 男生 女生
图2-5 我国城市7~18岁学生身高年增长情况
㈢累加次数分布图
120 100 80 60 40 20 0 35 40 45 50 55 60 65 70 75 80 85 90 95
《心理统计学》重要知识点
《心理统计学》重要知识点第二章 统计图表简单次数分布表的编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。
条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。
简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。
复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。
圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。
线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章 集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。
● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。
● 集中量数:描述数据分布集中趋势的统计量数。
● 离中趋势:是指数据分布中数据分散的程度。
● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 的平均数X b a Y +=2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。
中位数上下的数据出现次数各占50%。
3.众数(mode ,M O ):一组数据中出现次数最多的数据。
双列次数分布表
26名学生的身高、体重情况(单位cm、 kg)
被试 1 2 3 4 5 6 7 8 9 10 11 12 13 身高 165 160 162 160 161 166 157 160 167 170 155 155 169 体重 62.5 50 55 50 52 48 50 60 60 70 40 55 60 被试 14 15 16 17 18 19 20 21 22 23 24 25 26 身高 169 165 159 160 155 160 160 162 166 159 167 172 175 体重 62 50 45 55 60 52 55 56 55 49 60 72 65
第二章 统计图表
双列次数分布表
又称相关次数分布表,是对有联系的两列 变量用同一个表表示其次数分布。 所谓联系的两列变量,一般是指同一组被 试中每个被试两种心理能力的分数或两种 心理特点的指标,或同一组被试在两种实 验条件下获得的结果。
双列次数分布表编制步骤
1、按照分组次数分布表的编制方法,分别列 出各个变量的分组区间,将一列变量的分组 区间竖列,另一变量横列。竖列的小数端在 上,横列的小数端在左而大数端在右。
由上表结果确定体重组距为5kg,将其横列。身高组距为5cm,将其竖列。 编制双列次数分布表(板书)
小组任务分配情况
Hale Waihona Puke
第二章统计描述
G ' lg1(
fi lg Xi ) lg1(
1 0.6021 4 0.9031
1 2.709Байду номын сангаас )
fi
40
lg1(67.1282) 48 40
G 1: 48
中位数(median, M)
适合于表达偏态资料、或分布不明的资料的平 均水平,尤其适合于表达只知数据的个数、但 部分较大或较小数据的具体数值未准确知道的 资料的平均水平。
血清总胆固醇 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~
7.0~7.5 合计
频数f 1 8 9 23 25 17 9 6 2 1
101
fx 2.75 26 33.75 97.75 118.75 89.25 51.75 37.5 13.5 7.25 478.25
13
174
单侧正常值范围的上限为 1.81
14
188
(mol/L)。
1.69~
4
192
1.93~
4
196
2.17~
1
197
2.42~
2
199
2.66~
0
199
2.90~3.14
1
200
3.四分位数间距(quartile interval, Q)
Q=P75-P25
Q=QU-QL
优缺点:用四分位数间距作为描述数据分布离散 程度的指标,比极差稳定,但仍未考虑到每个数 据的大小,常用于描述偏态频数分布以及分布的 一端或两端无确切数值资料的离散程度。
第1四分位数记作Q1,第2、第3四分位数,分别记作 Q2、Q3;第1百分位数,记作P1。同理,还有第2、第 3、 ···、第99百分位数,分别记作P2、P3、 ···、P99。
应用统计学--第2章数据的图表展示
例如:说明词
员工满意度问卷调查 尊敬的员工:每年我们都对员工进行调查以 有助于我们为您提供最好的工作环境。请花费一 点时间填写如下简短的调查表。对您的回答内容 我们会绝对保密。提前谢谢您对本研究的参与和 支持!
问卷编排顺序
时间顺序 内容顺序,先易后难 类别顺序:静态、行为、态度 先封闭后开放等
例如:
您家里安装了空调吗
安装了
没有安装
目前的工作给我一种成就感。
很同意
同意
很难说 不同意
您的年收入是多少?
2万元以下 2万-3万 3万-4万 4万元以上
非结构型问卷 ✓ 开放型提问
即指所提问题不列出备选答案,答题类型也不作出任何 具体规定,而由被调查者根据自己的想法用文字表达自 己的意见。
例如:
*问卷组织者的行为和态度,不能对被调查者产生引导作用 。
• 问句常用的方式
是否式:用是、否、能、不能表示; 例:这种学习方式是否帮助您解决了学习矛盾?
是( ) 否( ) 选择式:包括类别型、条件型、等距型等; 例:类别型
如:您最喜欢的面对面的教学方式是: 系统讲授( ) 总结归纳( ) 讨论( ) 答疑( ) 辅导( ) 其他( ) 例:等距型 如:学校提供的上网服务适合您的需要吗? 适合( ) 基本适合( ) 一般( ) 基本不适合( ) 不适合( )
列标题
2.2.1 分类数据的整理与图示 2.2.2 数值型数据的整理与图示
1. 要弄清所面对的数据类型
不同类型的数据,采取不同的处理方式和方法
2. 对分类数据和顺序数据主要是作分类整理
3. 对数值型数据则主要是作分组整理
4. 适合于低层次数据的整理和显示方法也适合 于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
2统计图表的正确应用总结
1)
120
条图(bar graph)
106.2
97.8
© ò £ ¨1/10Í Ê £ öÂ À Í Ë
80 53.6 40 18.4 0
±Ð ¼ Ô ´ « È ¾ ² ¡ 53.6 18.4 Ô Ñ Ä ª ¹ Ü ² ¡ 38.9 106.2 ñ Ð ¶ Ô Ö ×Á ö 38.3 97.8
Ä ê
· Ý
5)半对数线图(semilogarithmic line graph)
³ µ Ä Ø 1950-1966Ä ê É Ë º ® Ó ë ½ á º Ë ² ¡ Ë À Í ö Â Ê
1000
Ë º É ¦ Ë À Í ö Â Ê á º ½ Ë ² ¡ Ë À Í ö Â Ê
¨1/10Í Ê £ ö Â © À Í Ë ò £
» Ä Ò ê ¼ ¶ Å ® ´ ó Ñ §É ú Ì å Ö Ø Ó ë · Î » î Á ¿ É ¢ µ ã Í ¼
其他图形
7)直方图(histogram) 以等宽矩形的面积表示频数的多少,用 于表示连续变量的频数分布。 绘制要点:横轴组段必须是等距的; 纵轴必须从0开始。 8)统计地图(statistical map) 用于表示某现象的数量在地域上的分 布。
第二章 统计表与统计图
一、统计表
统计表(statitical table)是将统计分析 的事物及其指标用表格列出,以代替冗长的
文字叙述,方便计算、分析、对比。正确绘
制统计表有助于提高统计分析质量。
1.统计表的结构和种类
统计表的基本结构:
表号 标题 纵标目(谓语)
横标目 (主语)
数字
统计表的种类
¡ Ý 3´ Î 0 1 ¡ ª 1
现代心理与教育统计学 张厚粲 课后习题答案
现代心理与教育统计学(张厚粲)课后习题答案第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.1858、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
明事物之间差异的大小。
顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属 性的多少或大小,按次序将各个事物加以排列后获得的数据资料。 等距数据是具有相等单位,但无绝对零点的数据。 比率数据既表明量的大小,也有相等单位,同时还具有绝对零点的数 据。
(1)数据排序 数据排序是指按照某种标准,对收集到的杂乱无章的数据按照一定 的顺序标准进行排列。 数据排序是整理数据最简单的方法。 (2)统计分组 统计分组是指根据被研究对象的特征,将所得数据划分到各个类别 中去。 对研究中所获得的大量数据进行统计分组是对数据进行整理的重要 步骤。
合计
意义
编制分组次数分布表,可将一堆杂乱无序的数据排列成序。从表
中可以发现各个数据的出现次数是多少,其分布的状态如何。
缺点
分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只 见到各分组区间及各组的次数。根据这样的统计表提供的数据资料计算
得到的平均值,会与用原始数据计算的值有一定的出入。
在一般的频数分布表上,只标出各分组区间的数据次数。如果想知道 某个数值以下或以上的数据的数目,就要用累加频数。
统计分组前的准备 将数据进行分组前,先要对观测数据做进一步的核对和校验。
校核数据的目的是为了尽可能地消去记录误差,以便后续的统计分
析建立在一个坚实的基础上。
统计分组时应注意的问题
① 分组要以被研究对象的本质特性为基础;
② 分类标志要明确,要能包括所有的数据。
(1)性质类别
主要是根据事物的属性不同将被观测的事物加以划分,反映事物
② 从分布表的大数端逐区间的次数累加,这种累加次数可回答某一分组
区间下限以上的次数是多少。
分数
50-
60-
70-
80-
90-
合计 30
组中值
频数 累积频数 累积百分比
55
1 1 3.33
65
4 5 16.67
75
5 10 33.33
85
5 15 50.00
95
15 30 100.00
分数 506070-
它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上 限或下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点 即可画成累加曲线,也叫S型曲线
示例:小教本011教育统计学单元考试学生成绩频 数分布多边图
(1)简单表 只列出名称、地点时序或统计指标名称的统计表。
(2)分组表(单向表)
统计图的绘制要求 按统计图的组成部分逐项说明绘制要点。
刻度标记
◦
Y轴名称 填充图案 轮廓线源自图尺尺 度 单 位 X轴名称 图题
基线
图目
图号
直方图(等距直方图)是以矩形的面积表示连续性随机变频数分布的 图形。 直方图一般用纵轴表示数据的次数(频数),横轴表示数据的等距分 组点(即各分组区间的下限)。在制作直方图时,以组距为底边,以分组 区间的精确上下限为底边二端点,以频数为高画矩形,各直条矩形之间不 留空隙,没有间隔。
按照数据是否具有连续性,把数据划分为离散数据和连 续数据。 离散数据一般取整数,在两个单位之间不能再划分细小 单位。
连续数据的单位可以划得很细微,细微的程度能达到只
可想象而不能看见的程度。
根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等
距数据和比率数据四种类型。
称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异, 它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说
16 14 12 10 8 6 4 2 0 5060- 70- 80- 90-
多边图表示连续性随机变量次数分布的线性图。 绘制多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐 标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐 标标点,连接各点,就成为一条折线。 多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布, 但多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。 如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。 这样就能够对于总体的理论次数分布的分析提供很多有用的信息
组中值 55 65 75
频数 1 4 5
累积频数 1 5 10
累积百分比 3.33 16.67 33.33
8090-
85
95
5
15
15
30
50.00
100.00
合计
30
一般分组次数分布表都是等距的。但实际研究中常遇到
不等距的情况,如工资级别,年龄分组等,若按等距分组不 能确切地反映实际情况,这时可采用不等距分组的方法。这
数据的类型 数据的初步整理
次数分布表
次数分布图 其他类型的统计图表
从数据的观测方法和来源划分,研究数据可区分为计数
数据和度量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的 是此类数据,它具有独立的分类单位,一般都取整数的形式。 度量数据是借助于一定的测量工具或一定的测量标准而 获得的数据。
在组别、种类上的不同,不说明事物之间的数量差异。 性质类别可根据事物的性质及研究的需要分成不同的层次,每个层 次又可分为不同数量的细目。 (2)数量类别 这是以数据的取值大小为分类标志,把数据按数值大小以分组或 不分组的形式排出一个顺序来。
统计表的作用 统计表是用来表达统计指标与被说明的事物数量关系的表格。它 可以将大量数据的分类结果,清晰、概括、一目了然地表达出来,明显 地反映出事物的全貌及其蕴涵的特性,具有简明、清晰、准确的特点, 表中的数据易于比较分析。 统计表的结构
(3)线形图 线形图更多地用于连续资料,凡欲表示两个变量之间的函数关系, 或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的 情形,用线性图表示是较好的方法。
(4)散点图 散点图是用相同大小圆点的多少或疏密表示统计资料数量的大小, 以及变化趋势的图。通常以圆点的分布的形态表示两种现象间相关程度。
累加频数是把各组的次数由下而上,或由上而下累加在一起。最后一
组的累加次数应等于数据的总次数。用累加次数表示的频数分布表称为累 加频数分布表。
累加频数分布表中,累加频数可用实际次数,亦可用相对次数。累加
频数的计算方法有两种:① 从分布表的小数值端,逐区间的进行次数累 加,这种累加次数可回答次数分布表某一分组区间上限以下的次数是多少。
统计表一般由表号、名称、标目、数字、表注等项构成。
统计表的编制要求 按统计表的结构逐项说明编制的要求。
表号
表2-1 80名员工对部门主管尽职程度调查结果 80名员工对主管尽职情况评定 表线 ①非常不尽职 ②不尽职 ③不置可否 ④尽职 ⑤非常尽职 总计
标题
顶线
标目
人数
标目
9 30 10 25 6 80
只有一个分类标志分组的统计表。 (3)复合表 统计分组的标志有两个或两个以上的表。
(1)条形图(直条图) 条形图主要用于表示离散型数据资料,它是以条形长短表示各事物间 数量的大小与数量之间的差异情况。
(2)圆形图 圆形图主要用于描述间断性资料,目的为显示各部分在整体中所占 的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如 百分数)为主。
样的不等距分组的分组次数分布表就叫做不等距次数分布表。
统计图的作用 统计图是用来表达统计指标与被说明的事物之间数量关系的图形。 它以直观形象的形式表达出事物的全貌及其分布特征,给人简明扼要、 清晰易懂的印象,便于学习与记忆。
统计图的结构 统计图由图号、图题、图目、图尺、图形、图例、图注等项构成。
2 5
1) R=xmax- xmin=100-58=42。 2)本例定为i=10,即每10分为一个组。组数: 42/10=4.2,应该分5组。 3)决定组限和组中值
组限就是每一组的起点值和终点值。
4)登记频数
分数 组中值 频数 50- 55 1 60- 65 4 70- 75 5 80- 85 5 90- 95 15 30
(1)求全距(R): R X max X min (2) 决定组数(K)与组距( i ):决定组距的大小,需要以全距为参 考。组数的多少要根据数据的多少来定。
如果数据的总体分布为正态,可用经验公式: K 1.87 N 1 来计算 R 组数,然后由公式:i K 来确定组距。 (3) 列出分组区间:列分组区间要注意以下几点:① 最高组区间内应 包含最大值的数据,最低组区间应能含最小值的数据; ② 最高组或最低组 的下限最好是组距的整数倍; ③ 各分组区间一般在纵坐标上按顺序排列, 数值大的分组区间排在上面,数值小的分组区间排在下面。 (4) 登记次数:依次将数据登记到各个相应的组别内,一般用划线记数 或写正字的方法。 (5) 计算次数:根据登记的结果计算各组的次数,计算各组次数的总和 即总次数。 (6) 抄录新表:新表包括的栏目有:第一列为分组区间,第二列为各分 组区间的组中值,第三列为次数。
数字
表注
* 注:表中的数据来源于例[2-1]
底线
当数据量很大时,应该把所有的数据先划分为若干分组 区间,然后将数据按其数值大小划归到相应的组别内,分别
统计各个组别中包括的数据个数,再用列表形式呈现出来,
就构成了频数(或次数)分布表。
示例:小教本011(30名)教育统计学单元考试成绩 58、61、88、74、81、66、70、93、72、91、 66、99、89、98、90、98、90、64、93、89、 100、91、92、97、90、94、99、92、92、90。
76 71 66 63 88 83 77 72 68 64