第二章 统计图表
张厚璨《现代心理与教育统计学》书后习题详...
5 91 85
6 48 68
7 55 47
8 82 76
9 32 25
10 75 56
解: (1)用积差相关方法解答如下: A X 86 58 B Y 83 52
7
2 2
被试 1 2
X
Y
XY
7138 3016
7396 3364
6889 2704
心理学统考专业资料店:/ 3 4 5 6 7 8 9 10 79 64 91 48 55 82 32 670 670 89 78 85 68 47 76 25 56 659 6241 4096 8281 2304 3025 6724 1024 5625 48080
QQ:382895420
fXc 67 248 342 416 752 1000 1258 672 432 242 153 84 ∑fXc=5666
X=
fXc = 5666 =36.09
N
157
1 * 157 64 Md=34.5+ 2 *5=36.46 37
答:平均数为 36.09,中数为 36.46。
QQ:382895420 51 48 43
解: i 40 51 48 43 182 T
i i
i i 2 i 2 i
i
40 90.5 51 91.0 48 92.0 43 89.5 90.8 182
S d
ST
解 : 因为5厘米组与10厘米组的标准差单位相同(都是厘米), 但平均数差异很大,5厘米组 标准差直接比较5厘米组和10厘米组的离散程度大小是无意义的,应采用差异系数比较 其离散程度的大小。具体计算如下: s 0.7 CV1 100% 100% 11.1% 6.3 s 1.2 CV2 100% 100% 8.39% 14.3 答:通过比较差异系数可知, 5厘米组的离散程度比10厘米组的离散程度大。
现代心理与教育统计学复习资料
现代心理与教育统计学复习资料第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量就是可以挑相同值的量。
统计数据观测的指标都就是具备变异的指标。
当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的x或y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本须要研究的同质对象的全体,称作总体。
每一个具体内容研究对象,称作一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。
4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ5、统计误差误差就是测量得值与真值之间的差值。
测出数值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。
对于个别极端数据与否该剔出,应当遵从三个标准差法则。
二、次数原产表中(一)简单次(频)数分布表(二)相对次数分布表将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n(三)累加次数分布表(四)双列次数分布表双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中则表示其次数原产。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
统计图表
表号 表号指表的序号,位于表的
左上方,一般以出现的先后顺序 排列。
名称
名称又称标题,是一个表格的名称,应写在表的上 方。标题用语要简练扼要,准确得体,一望即知该 表的内容。
表的序号和标题之间留一个汉字的空格。二者居中
排在顶线的上方,长度不宜超过表的宽度,若标题
字数过多,应转行排列。
标目
标目即分类的项目。标目的好坏决定统计表 的质量,要认真酌定。标目一般在表的上面 一行或左侧一列。如果分类的标志只有一个, 写在表的上行或左列都可以。如果分类的标 志有两个,且二者没有隶属关系,则左列与 上行各一个。如果两个分类标志有隶属关系, 则要放在一个方向(或上面或左侧)分两行 分述。标目确立了数据组织的逻辑,并确定 了栏目下数据栏的性质。
2、数量类别。这是以数据的取值大小为分类标志, 把数据按数值大小以分组或不分组的形式排出一个 顺序来。(等距、比率)
对原始数据排序和分类以后,数量小的就可以直接计算,数量大时再做进一 步分组,编制统计表、统计图为以后的分析打下基础。
三、统计表
1、定义:统计表是用来表达统计指标与被说明 事物之间数量关系的表格。 统计指标:在对数据进行统计分类以后,得到的 各种数量结果称为统计指标。 2、作用:简洁、清晰、准确、一目了然,明显 地反映出事物的全貌及其蕴含的特征,省去冗长 的文字叙述,便于分析、比较、计算和记忆。 3、结构
图题的文字要言简意赅,具有说明性和专指性,使
人一看就能知道该图所要显示的是何事、何物,发 生于何时、何地。如果图示资料比较复杂,这时图
题可用大标题与小标题呈现。图题的字体要与整个
图形的大小相称,一般是图中使用的最大号的文字。
现代心理与教育统计学(张厚粲)课后习题答案
现代心理与教育统计学(张厚粲)课后习题答案第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.1858、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
现代心理教育与统计学 第三版复习资料(张厚粲)
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
统计图表教学案例
方程。
表 9-1 8 名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h)
编
号
1
23
4
5
6
7
8
年
龄
13
11 9
6
8 10 12
7
尿肌酐含量
3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65
Sep,22,2009
箱式图(box plot) 箱子上端为上四分位 数P75 ,下端为下四分位数P25,中间横 线是中位数M(P50),穿过箱子的连线, 两端分别是除异常值外的最小值和最大值。 箱式图一般使用5个统计量反映原始数据的 分布特征,适于多组数据的直观比较。
Sep,22,2009
二、常用统计图及绘制方法
条图(bar graph) 又称直条图,用等宽度 直条的长短表示比较指标的数值大小和它们 之间的对比关系。适于比较独立或离散变量 的统计指标。
按分组因素是一个还是两个分为单式和复式 两种
Sep,22,2009
例 2-1 某地 1990 年居民 3 种死因的死亡率比较情况见表 2-4。
173 30 19.07 157 62 39.89 121 62 51.23 P<0.01
90 37 40.11 78 51 63.65 70 62 81.14 P<0.01
P<0.01
P<0.01
P<0.01
Sep,22,2009
没有标题; 线条太多,有竖线和斜线; 不应有备注; %意义不明确且计算有误。
某市 1970~1985 年痢疾与百日咳死亡率(1/10 万)
痢疾死亡率(1/10 万) 百日咳死亡率(1/10 万)
第二章统计图表解析
3.4
资料来源:见《心理学报》1979年第1期103页,选部分引用
四、统计图 统计图一般采用直角坐标系,通常横坐标或横
轴表示事物的组别或自变量X,称为分类轴; 纵坐标或纵轴表示事物出现的次数或因变量Y, 称为数值轴。
圆形图——角度坐标
统计图一般由图号及图题、图目、图尺、图形、 图例、图注等构成。
缺失:指数据不全或缺项未填;例如一份资料 中未回答的问题占10%以上,或者缺少关键性 资料。
可疑:指难以辨认或怀疑其真实性的数据;例 如,有的被试填答的问卷全部选同一个选项 (如全选A或全选B);有的被试填答的结果可 以看到是一种规则的排列方式(如A B C D E D B C A B C D E……)。
失误:指存在明确差错的数据或答案。
在剔除数据的过程中,注意不能把一些不符合 自己主观假设的数据随意去掉。因此这项工作 一定要非常慎重。对于个别极端数据是否该剔 除,应遵循三个标准差法则。
(二)统计分组应注意的问题 1.分组要以被研究对象的本质特性为基础 2.分类标志要明确,要能包括所有的数据
最高组或最低组的下限最好是组距i的整数倍; 各分组区间一般在纵坐标上按顺序排列,数值大的
分组区间排在上面,数值小的分组区间排在下面;
在呈现表格时,各分组区间使用表述组限,并且为 了书写方便,通常只用整数写下限值,然后在右侧 画一横线。
登记次数:要特别注意处于分组区间分界点 上的几个值
计算次数f 编制分组次数分布表
2
K =1.87(N 1)5
N 为数据个数,K 取近似整数。
列出分组区间 分组区间:组限,一个组的起点值和终点值之间的
距离。起点值称组下限,终点值称组上限。组限有 表述组限和精确组限两种。
心理与教育统计学课件(张厚粲版)ch2统计图表
40 35 30 25 20 15 10 5 0 一年级 二年级 三年级 四年级 女生 男生
图2-1 某高校教育系各年级男女生人数
资料来源:表2-6
表2-6 某高校教育系各年级男女生人数统计表
一年级 二年级 三年级 四年级
女
人数
男
女
男
女
男
女
男
26
33
26
36
24
37
25
35
(二)统计图的种类
1.条形图(又称直条图) 条形图按图形中被比资料的组数不同,可 分为单式条形图和复式条形图;按条形 图的排列的方向不同,可分为纵条图和 横条图。
二、次数分布图
(一)直方图 (二)次数多边图 (三)累积次数分布图
㈠直方图
25 20 15 10 5 0
图2-7a 初二100名学生数学测验分数的次数直方图
㈡次数多边图
25 20 15 10 5 0 37 42 47 52 57 62 67 72 77 82 87 92 97
图2-7b 初二100名学生数学测验分数的次数多边图
复式横条图
优
良 女生 男生 中
差 0 5 10 15
图2-3b 某校初二.三班男女生学习成绩和人数
2.圆形图
优 良 中 差
图2-4 某校初二.三班学习成绩比较图
3.线形图
7 6 5 4 3 2 1 0 7 8 9 10 11 12 13 14 15 16 17 18 男生 女生
图2-5 我国城市7~18岁学生身高年增长情况
㈢累加次数分布图
120 100 80 60 40 20 0 35 40 45 50 55 60 65 70 75 80 85 90 95
《心理统计学》重要知识点
《心理统计学》重要知识点第二章 统计图表简单次数分布表的编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。
条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。
简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。
复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。
圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。
线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章 集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。
● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。
● 集中量数:描述数据分布集中趋势的统计量数。
● 离中趋势:是指数据分布中数据分散的程度。
● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 的平均数X b a Y +=2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。
中位数上下的数据出现次数各占50%。
3.众数(mode ,M O ):一组数据中出现次数最多的数据。
双列次数分布表
26名学生的身高、体重情况(单位cm、 kg)
被试 1 2 3 4 5 6 7 8 9 10 11 12 13 身高 165 160 162 160 161 166 157 160 167 170 155 155 169 体重 62.5 50 55 50 52 48 50 60 60 70 40 55 60 被试 14 15 16 17 18 19 20 21 22 23 24 25 26 身高 169 165 159 160 155 160 160 162 166 159 167 172 175 体重 62 50 45 55 60 52 55 56 55 49 60 72 65
第二章 统计图表
双列次数分布表
又称相关次数分布表,是对有联系的两列 变量用同一个表表示其次数分布。 所谓联系的两列变量,一般是指同一组被 试中每个被试两种心理能力的分数或两种 心理特点的指标,或同一组被试在两种实 验条件下获得的结果。
双列次数分布表编制步骤
1、按照分组次数分布表的编制方法,分别列 出各个变量的分组区间,将一列变量的分组 区间竖列,另一变量横列。竖列的小数端在 上,横列的小数端在左而大数端在右。
由上表结果确定体重组距为5kg,将其横列。身高组距为5cm,将其竖列。 编制双列次数分布表(板书)
小组任务分配情况
Hale Waihona Puke
第二章统计描述
G ' lg1(
fi lg Xi ) lg1(
1 0.6021 4 0.9031
1 2.709Байду номын сангаас )
fi
40
lg1(67.1282) 48 40
G 1: 48
中位数(median, M)
适合于表达偏态资料、或分布不明的资料的平 均水平,尤其适合于表达只知数据的个数、但 部分较大或较小数据的具体数值未准确知道的 资料的平均水平。
血清总胆固醇 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~
7.0~7.5 合计
频数f 1 8 9 23 25 17 9 6 2 1
101
fx 2.75 26 33.75 97.75 118.75 89.25 51.75 37.5 13.5 7.25 478.25
13
174
单侧正常值范围的上限为 1.81
14
188
(mol/L)。
1.69~
4
192
1.93~
4
196
2.17~
1
197
2.42~
2
199
2.66~
0
199
2.90~3.14
1
200
3.四分位数间距(quartile interval, Q)
Q=P75-P25
Q=QU-QL
优缺点:用四分位数间距作为描述数据分布离散 程度的指标,比极差稳定,但仍未考虑到每个数 据的大小,常用于描述偏态频数分布以及分布的 一端或两端无确切数值资料的离散程度。
第1四分位数记作Q1,第2、第3四分位数,分别记作 Q2、Q3;第1百分位数,记作P1。同理,还有第2、第 3、 ···、第99百分位数,分别记作P2、P3、 ···、P99。
应用统计学--第2章数据的图表展示
例如:说明词
员工满意度问卷调查 尊敬的员工:每年我们都对员工进行调查以 有助于我们为您提供最好的工作环境。请花费一 点时间填写如下简短的调查表。对您的回答内容 我们会绝对保密。提前谢谢您对本研究的参与和 支持!
问卷编排顺序
时间顺序 内容顺序,先易后难 类别顺序:静态、行为、态度 先封闭后开放等
例如:
您家里安装了空调吗
安装了
没有安装
目前的工作给我一种成就感。
很同意
同意
很难说 不同意
您的年收入是多少?
2万元以下 2万-3万 3万-4万 4万元以上
非结构型问卷 ✓ 开放型提问
即指所提问题不列出备选答案,答题类型也不作出任何 具体规定,而由被调查者根据自己的想法用文字表达自 己的意见。
例如:
*问卷组织者的行为和态度,不能对被调查者产生引导作用 。
• 问句常用的方式
是否式:用是、否、能、不能表示; 例:这种学习方式是否帮助您解决了学习矛盾?
是( ) 否( ) 选择式:包括类别型、条件型、等距型等; 例:类别型
如:您最喜欢的面对面的教学方式是: 系统讲授( ) 总结归纳( ) 讨论( ) 答疑( ) 辅导( ) 其他( ) 例:等距型 如:学校提供的上网服务适合您的需要吗? 适合( ) 基本适合( ) 一般( ) 基本不适合( ) 不适合( )
列标题
2.2.1 分类数据的整理与图示 2.2.2 数值型数据的整理与图示
1. 要弄清所面对的数据类型
不同类型的数据,采取不同的处理方式和方法
2. 对分类数据和顺序数据主要是作分类整理
3. 对数值型数据则主要是作分组整理
4. 适合于低层次数据的整理和显示方法也适合 于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
2统计图表的正确应用总结
1)
120
条图(bar graph)
106.2
97.8
© ò £ ¨1/10Í Ê £ öÂ À Í Ë
80 53.6 40 18.4 0
±Ð ¼ Ô ´ « È ¾ ² ¡ 53.6 18.4 Ô Ñ Ä ª ¹ Ü ² ¡ 38.9 106.2 ñ Ð ¶ Ô Ö ×Á ö 38.3 97.8
Ä ê
· Ý
5)半对数线图(semilogarithmic line graph)
³ µ Ä Ø 1950-1966Ä ê É Ë º ® Ó ë ½ á º Ë ² ¡ Ë À Í ö Â Ê
1000
Ë º É ¦ Ë À Í ö Â Ê á º ½ Ë ² ¡ Ë À Í ö Â Ê
¨1/10Í Ê £ ö Â © À Í Ë ò £
» Ä Ò ê ¼ ¶ Å ® ´ ó Ñ §É ú Ì å Ö Ø Ó ë · Î » î Á ¿ É ¢ µ ã Í ¼
其他图形
7)直方图(histogram) 以等宽矩形的面积表示频数的多少,用 于表示连续变量的频数分布。 绘制要点:横轴组段必须是等距的; 纵轴必须从0开始。 8)统计地图(statistical map) 用于表示某现象的数量在地域上的分 布。
第二章 统计表与统计图
一、统计表
统计表(statitical table)是将统计分析 的事物及其指标用表格列出,以代替冗长的
文字叙述,方便计算、分析、对比。正确绘
制统计表有助于提高统计分析质量。
1.统计表的结构和种类
统计表的基本结构:
表号 标题 纵标目(谓语)
横标目 (主语)
数字
统计表的种类
¡ Ý 3´ Î 0 1 ¡ ª 1
现代心理与教育统计学 张厚粲 课后习题答案
现代心理与教育统计学(张厚粲)课后习题答案第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.1858、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 2.分类标志要明确,要能包括所有的数据 • 对数据进行分组时,所依据的特性称为分组或 分类的标志。 • (三)分组的标志 • 分类标志有各种各样。这些分类标志按形式大 致可分为性质类别与数量类别两种。 • 1.性质类别。主要是根据事物的属性不同将 被观测的事物加以划分,反映事物在组别、种类 上的不同,不说明事物之间的数量差异。 • 性质类别可根据事物的性质及研究的需要分成 不同的层次,每个层次又可分为不同数量的细目。
• 图目 写在图形基线上的各种不同类别、名称,或 时间、空间的统计数量值,即横坐标上所用的各 种单位名称。也叫刻度线标签。 • 图尺 在统计图的横坐标及纵坐标上都要用一定 的距离表示各种单位,这些单位称为图尺(ruler或 scale)。图尺分点(tick)要清楚,整个图尺大小要 包括所有的数据值,如果数据值大小相差悬殊, 图尺可用断尺法或回尺法,减少图幅。 • 图形 是图的主要部分,图形线条要清晰,一般 除图形线外,避免书写文字。要表示不同的结果, 用不同的图形线以示区别。 • 图例 用来表示并标明各种图形的含义。图例 (legend)的位置可选图中或图外适当的地方,注 意保证整个统计图的和谐美观和均衡。 • 图注 凡是图形中需要借助文字或数字加以补充 说明的,均称为图注。图注部分的文字要少,字 号要小。
•
在制定统计表和统计图时,首先要对收集的数据 资料进行初步整理。整理的基本方式有排序和统 计分组两种。 • 一、数据排序 • 数据排序(sort或order),就是按照某种标准, 对收集到的杂乱无章的数据按照一定顺序标准进 行排列。数据排序是整理数据最简单的方法。 • 将一组数据按照数值大小、高低、长短、多少, 依升序(ascending order)或降序(descending order)排列后,就可显示出数据的分布情况。
• K=1.87(N─1) 2/5(N为数据个数,K取近似整数) • 用这个公式计算出的组数,只是一个近似数。因为 究竟能分多少组,与分组时最低组的下限值和组距i 有关,因为i=全距/K。有关研究指出,经验和理论 都证明,如果任一组观测数值被分为10~15组,全 部信息就都被保留下来了。一般说来,分组数目或 组距小有变化时,对次数分布表作用的显示和计算 的准确性,不产生很大影响。因此对组数与组距并 不要求严格界定。 • 那么,应该如何掌握分组的标准呢?一般说,分 组数目多,则组距小,计算精确,但它要求总的数 据量大,否则会出现有的组距内无次数分布的现象, 那将使整个数据的分布规律显示不明显,也就不能 发挥次数分布表的作用了。如果分组少,组距就大, 计算简单,但引进计算误差较大。因此,要做到既 不增加搜集数据的工作量,又能使分组后的计算精 确到最大限度,使用上述公式分组是一个较好的方 法。
• 2.数量类别。这是以数据的取值大小为分类标志, 把数据按数值大小以分组或不分组的形式排出一 个顺序来。
• 三、统计表 • 统计表的结构一般包括几个组成要素,它们的 名称和编制要求如下: • 表号 表的序号位于表的左上方,一般以出现的 先后顺序排列。 • 名称 又称标题,是一个表格的名称,应写在表 的上方。标题用语要简练扼要,准确得体,一望 即知该表的内容。
表2—1 80名员工对部门主管尽职程 度调查结果
• 员工对主管尽职情况的评定 • ①非常不尽职 • ②不尽职 • ③不置可否 • ④尽职 • ⑤非常尽职 • 总计 人数 9 30 10 25 6 80
二、分组次数分布表
• 当数据量很大时,应该把所有的数据先划分为 若干分组区间,然后将数据按其数值大小划归到 相应的组别内,分别统计各个组别中包括的数据 个数,再用列表形式呈现出来,就构成了分组次 数分布表(grouped frequency table)。 • (一)编制分组次数分布表的步骤 • 1.求全距 • 全距(range)指最大数与最小数两个数据值之间 的差距。从被分组的数据中找出最大数与最小数, 二者相减所得差数就是全距。
第二章 统计图表
• 第一节 数据的初步整理 • 在对数据进行统计分类以后,得到的各种数量 结果称为统计指标,把统计指标和被说明的事物 之间的关系用表格的形式表示就成为统计表 (tabulation)。统计表具有简明、清晰、准确的特 点,表中的数据易于比较分析。统计图(graph或 chart)是依据数字资料,应用点、线、画、面、体、 色等描绘制成,简明而又有规律,并且能显示数 量的图形,它是统计数据资料的可视化显示方式。 图形比数字更为具体形象,能形象化地呈现事实 或现象的全貌,给人以简明扼要、清晰易懂的印 象,便于学习和记忆。
• 第四步,登记与计算次数。登记次数时要 特别注意处于分组区间分界点(breakpoint) 上的几个值。如:62.5,65.5,68.5,71.5, 74.5,77.5,80.5,83.5,86.5,89.5, 92.5,95.5,都应登记到上一组。表2—2 是登记结果。登记完毕后应再核实一次, 确保无误后,计算次数。表中∑f是指所有 各组的次数和。来自• •• • •
• •
二、统计分组 所谓统计分组(grouping),就是根据被研究对象 的特征,将所得数据划分到各个组别中去。 (一)统计分组前的准备 将数据进行分组前,先要对观测数据做进一步 的核对和校验。 如果要删除数据,也应遵循三个标准差准则, 即该数据是否落在平均数加减三个标准差之外。 对于不能解释其产生原因的异常数据,都应遵循 这个准则取舍。 (二)统计分组应注意的问题 1.分组要以被研究对象的本质特性为基础
统计图的结构和组成要素如图2—2 所示:
第二节 次数分布表
• 次数分布可区分为简单次数分布、分组次 数分布、相对次数分布、累积次数分布等。 次数分布表和次数分布图就是各种次数分 布的列表形式和图示形式。 • 一、简单次数分布表 • 简单次数分布表(simple frequency table) 就是依据每一个分数值在一列数据中出现 的次数或总计数资料编制成的统计表。
• 这一组学生成绩分数的分布范围在62~98之间,测验 分数属于连续性随机变量,编制分组次数分布表的方法 步骤如下: • 第一步,找出最大值与最小值分别为98.0、62.0,全 距为98-62=36。 • 第二步,确定组数与组距。 • 第三步,列分组区间。因为这组数据最小值为62,组 距定为3,因此,最低组的下限取为60,既可将最小值 62包含在最低组内,其值又是3的整数倍,这样比较好。 各组区间可写为:60~,63~,66~,69~,72~, 75~,78~,81~,84~,87~,90~,93~,96~, 最高组96~99,也可将最高分98包括进去。为书写方 便,这里各分组区间用整数表示。在对数据进行分组时, 按各组的精确组限归类,如:59.5~62.499,62.5~ 65.499,以下类推。
统计表的结构和组成要素可以用简 单统计表显示如下:
四、统计图
• 统计图一般采用直角坐标系,通常横坐标 (abscissa)或横轴(horizontalaxis)表示事物的组别 或自变量X,称为分类轴(category axis);纵坐标 (ordinate)或纵轴(vertical axis)表示事物出现的次 数或因变量Y,称为数值轴(scale axis)。除直角 坐标外,如圆形图还有角度坐标等。统计图一般 由下面几个部分组成: • 图号及图题 图号是图的序号。图题或标题是统 计图的名称。图题与图号之间也空一个汉字。与 统计表格不同的是,统计图形的标题常置于图的 正下方。图题的字体要与整个图形的大小相称, 一般是图中使用的最大号的文字。书写顺序一般 与图形标目一致,自左至右书写。
• 4.登记次数 • 依次将数据登记到各个相应的组别内,一般用画线记 数(丗)或写“正”字的方法。为确保登记准确,第一次 登记后需再核实。 • 5.计算次数 • 根据登记的结果计算各组的次数,计算各组次数的总 和即总次数。并核对各组次数总和与数据的总个数是否 相等。 • 然后,取消画线登记次数一栏,重新制表。新表包括 的栏目有:第一列为分组区间,第二列为各分组区间的 组中值。组中值是每组精确下限加上组距的二分之一, 或精确下限与精确上限之和的一半。第三列为次数(f)。 这样整理的统计表就是次数分布表,见表2—3。表2-3 中第四列和第五列为相对次数,分别用频数比率(f/N) 和百分次数表示,这两列有时可不用列出。
[例2—2]下面是100名学生在某项测验中的成 绩分数,试将它制成一个次数分布表。
76.0 88.0 89.0 75.0 79.5 66.0 71.5 77.5 73.5 94.0 77.5 81.0 78.0 84.0 80.5 83.0 83.0 75.0 76.0 79.0 82.0 76.5 78.0 90.0 73.0 87.0 91.0 79.0 88.5 80.0 90.5 67.0 80.0 80.0 93.0 82.5 96.0 79.0 85.0 75.5 81.0 83.0 78.5 86.0 83.0 79.5 75.5 80.5 89.5 83.5 85.5 84.0 76.5 84.5 72.0 80.0 89.0 74.5 78.5 82.0 71.0 84.0 75.0 68.5 68.0 82.0 87.5 77.0 76.0 65.0 80.5 92.5 77.0 62.0 79.0 72.0 79.5 86.0 81.5 71.0 86.0 81.5 71.0 87.0 78.0 81.0 86.5 83.5 69.0 74.0 70.0 82.5 72.5 73.5 74.0 98.0 73.0 74.5 80.0 70.5
• 2.决定组距与组数 • 组距(interval)是指任意一组的起点和终点之间的距离, 用符号i表示。决定组距的大小,需要以全距为参考。全 距大,则组距可大一些;全距小,则组距可小一些。组 距经常取2、3、5、10、20等数值,这样便于分组,便 于计算分组区间和组中值。如果先确定了组数,就可以 用全距除以组数后,取整数表示组距。 • 组数(分组数目)的多少要根据数据的多少来定。如果 数据个数在100以上,习惯上一般分10~20组,经常取 12~16组。数据个数较少时,一般分为7~9组。如果 数据的总体分布为正态,可用下面的经验公式计算组数 (K),这样可使分组满足渐近最优关系。