18第十八章计数数据的检验-刘红云版心理统计教材课后习题
医学统计学课后思考题答案(李晓松版)
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于 2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000人,分别测的其红细胞数,组成样本,其样本含量为 2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于 0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
教育统计学课后练习参考答案
教育统计学课后练习参考答案第一章1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。
教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。
从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。
2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。
推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。
3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。
随机现象具的特点:(1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验);(2)在实验之前不能确切知道哪种结果会发生;(3)在相同的条件下可以重复进行这样的实验。
4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。
当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。
通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。
5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。
6、反映总体特征的量数叫做总体参数,简称参数。
反映样本特征的量数叫做样本统计量,简称统计量。
参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。
调节效应分析的方法进展及其应用
调节效应分析方法的进展及其应用刘红云北京师范大学心理学部DIRECTORY目录01调节效应的应用趋势及其简介02调节效应常用分析方法及其进展03如何做一个好的调节效应的研究01(一)调节效应的应用趋势调节效应应用趋势及其简介(二)有关调节效应的基本概念1.应用越来越普遍:随着研究问题的深入,近40年来,对变量间调节效应分析的研究呈现明显的增长趋势。
以“moderation ”为主题,在“web of science ”中检索1057133549068616403683642601000200030004000500060007000文章篇数年份2.研究的问题越来越复杂,中介和调节结合的研究越来越多:随着研究问题的深入,近20年来,调节效应与中介效应结合的研究越来越多。
以“moderation ”和“mediation ”同时作为主题,在“web of science ”中检索491804931009200400600800100012002001-20052006-20102011-20152016-2020文章篇数年份3.分析方法越来越复杂,但潜变量的分析方法并不普及:随着研究问题的深入,近20年来,调节效应分析的方法越来越复杂,但相对比例较低。
在“web of science”中采用SEM 对moderation effect 进行分析的研究越来越多。
1.60% 3.17%4.21%6.96%0%1%2%3%4%5%6%7%8%2001-20052006-20102011-20152016-2020占比年份◆调节效应:在变量M取不同水平的值时,自变量X对结果变量Y的影响程度不同,这时称M调节了X与Y之间的关系。
•研究者探讨工作压力(X)和社会支持(M)与心理疾病(Y)之间的关系;•根据理论假设,研究者认为社会支持(M)缓冲了工作压力(X)对心理疾病(Y)的影响;即:研究者预计工作压力(X)对心理疾病(Y)有正向的影响,但是这一影响程度随着社会支持(M)的增加而减小;•社会支持(M)称作工作压力(X)对心理疾病(Y)影响的调节变量。
心理与教育统计学课后题答案心理统计学试题及答案
心理与教育统计学课后题答案心理统计学试题及答案张厚粲现代心理与教育统计学第一章答案张厚粲现代心理与教育统计学第一章答案第一章1 名词概念(1)随机变量)答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体)答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本)答:样本是从总体中抽取的一部分个体。
(4)个体)答:构成总体的每个基本单元。
(5)次数)是指某一事件在某一类别中出现的数目,又称作频数,用 f 表示。
(6)频率)答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率)答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件 A 在所有试验中发生的可能性大小的量值,称为事件 A 的概率,记为P(A)。
(8)统计量)答:样本的特征值叫做统计量,又称作特征值。
(9)参数)答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值)答:随机变量的取值,一个随机变量可以有多个观测值。
2 何谓心理与教育统计学?学习它有何意义?何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
0导论练习题-刘红云版心理统计教材课后习题
导论统计学入门1.如果在符合一定条件的100所大学中随机抽取20所大学,那么,此时的样本量等于多少?2.请简要说明统计量和参数的区别与联系?3.某一次美国总统选举前,某机构在进行民意调查时,把他们每周抽样的样本量大小从1500增加到5000人。
这个比较大的随机样本是否使得调查结果的偏差降低?是否使得调查结果的变异性降低?4.已有研究表明,不同颜色的食物会引起人们不同程度的食欲。
现在有两个研究者分别进行研究。
第一个研究者调查人们最喜欢吃什么颜色的食物。
第二个研究者让被试在同样的环境条件中选择自己带某种颜色的食物。
请问:(1)这两个研究使用的方法一样吗?为什么?(2)请指出每一个研究的变量是什么?5.假设某学校对该校所有学生进行了一项调查,用于了解父母的教养方式与学生在校行为的表现。
现在截取部分数据如下表:编号年级是否是独生子女父母教养方式自尊分数受欢迎程度1 高一是民主型34 62 高一是专制型21 43 高一否民主型37 74 高一是民主型28 95 高一是民主型30 86 高一是专制型27 67 高一否放任型19 78 高一是专制型25 5请据表回答下面的问题:(1)该测量包括几个变量?哪些不是数值型变量?那些是常量?(2)如果要了解学生的父母教养方式与在校受欢迎程度的关系,应该属于哪一种研究方法?(3)该样本的平均自尊分数和平均受欢迎程度是多少?[提示:∑X=∑[(X-C)+C]=∑(X-C)+NC利用这一特点进行转换,可以方便运算]6.请将例0.1中表0-4中的数据整理成类似下方的表格,然后计算给出的式子:编号X Y1 5 12 2 43 6 34 7 25 5 76 9 6(1)∑X+∑Y(2)∑X2+∑Y2(3)(∑X)2 +(∑Y)2(4)(∑X-Y)2+∑X∑Y(5)∑XY+∑0.5(X-Y)。
生物医学研究的统计学方法-课后答案(案例分析)
第1章绪论案例辨析及参考答案案例1-1某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。
得出的结论是:“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。
请问其结论合理吗?为什么?应该如何?案例辨析①样本不能代表总体。
总体是“大学生”,而样本仅为某地三年制职业技术学院学生;②社会学调查的样本含量显得不足;③“理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选"的意思,不符合统计学要求.正确做法应在论文的题目中明确调查的时间范围和地点,还应给“大学生"下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。
案例1—2两种药用于同一种病,A药治疗5例,4例好转;B药治疗50例,36例好转。
结论是:A药优于B药.请问其结论合理吗?为什么?应该如何?案例辨析①A药样本仅5例,样本含量太少;②得出“A药优于B药”没有交待是否采用了统计学推断方法,若用目测法得出结论,则结论没有说服力;③未明确研究目的和研究结果将被使用的范围.正确做法①应明确研究目的和研究结果将被使用的范围,若是个别研究者或临床医生想了解这两种药的大致疗效,属于小规模的临床观察,其结论仅供少数人在今后临床实践中参考,其样本含量可能不需要很大,因为观察指标是定性的(有效、无效),一般来说,每个药物组也需要几十例(以不少于20例为宜);若属于新药的Ⅱ期临床试验,那就要严格按有关规定,比较准确地估计出所需要的样本含量,不仅如此,还有很多严格的要求,详见本书中临床试验设计一章;②从明确定义的总体中随机抽样进行实验研究,得到的实验结果不能仅凭数据大小作出判断,应进行假设检验,以提高结论的可信度.案例1-3某研究者为了探讨原发性高血压患者肾小管早期损害的监控指标,选取尿常规、蛋白定性检查阴性,血肌酐、尿素氮均在正常范围内的原发性高血压患者74例作为病例组,其中男43例,女31例,平均年龄61岁(40 73岁)。
生物统计学课后习题解答李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。
1-数据清理与准备(高级心理统计PPT刘红云)
(3)诊断数据的缺失机制
对于MCAR缺失机制的诊断方法有:
1. 独立样本t检验 2. Little’s MCAR检验(Little & Rubin, 2002)
上述方法只能证明MCAR假设不成立,却不能证明其成 立。
(4)选择插补方法
如果缺失机制是完全随机缺失(MCAR)
1. 只使用有效数据 2. 使用替换值进行插补
如果异常值不属于总体,就删除 如果异常值可代表总体的一部分,或不确定是否
异常,尽量保留,转换变量降低极端值对分析结 果的影响
3.缺失数据的处理
缺失数据的定义和影响 处理缺失数据的一般步骤
3.1缺失数据的定义及影响
缺失数据是在一个数据集中,由于各种各样 的原因而导致的个案在一个或多个变量上信 息的缺失。
2.1异常值的定义
单变量异常值即在某个变量上的值明显高或者低。 多变量极端值指在两个或多个变量上值的奇怪组
合,使得该观测与其他观测明显不同。
存在一个有影响观测值的散点图
25
20
15
y
10
5
0
0
20
40
60
x
存在一个没有影响观测值的散点图
存在一个没有影响观测值的散点图
2.1异常值的定义
异常值的来源: 1. 过程性错误 2. 异常事件 3. 异常的观测 4. 各变量值正常,组合起来很异常
提纲
1 数据清理和准备的主要目的 2 极端数据的处理 3 缺失数据的处理 4 前提假设条件的检验 5 案例操作
1 数据清理和准备的主要目的
极端值会扭曲分析结果 缺失值在采集数据时很难避免 使用多元统计方法之前,需要确保数据集和前提
统计学课后习题答案(全章节)剖析
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
灯泡的使用寿命频数分布表3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1. 已知下表资料:试根据频数和频率资料,分别计算工人平均日产量。
解:根据频数计算工人平均日产量:687034.35200xf x f===∑∑(件) 根据频率计算工人平均日产量:34.35fx xf==∑∑(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
刘红云-SPSS基础与应用-第八章
第八章非参数检验OUTLINE计数数据的检验01独立样本的非参数检验02相关样本的非参数检验03计数数据的检验配合度的卡方检验操作过程打开数据文件“fit_test.sav”,在SPSS中选择“Data→Weight Cases…”;选择“Weight cases by”,在“Frequency Variable”下选择“freq”,点击“OK”;选择“Analyze→NonparametricTests→Legacy Dialogs→Chi-square…”;将“major”选入“Test Variable List”框中,在“Expected Values”框中选择“Values”,并将国家统计比例依次“Add”;这里我们选择“Add”选项,并依次输入各类别的比例。
如果假设各类别比例相同,则可以选择默认的“All categories equal”选项。
在“Exact…”选项框中选择“Asymptotic only”选项,点击“Continue→OK”配合度的卡方检验操作过程打开数据文件“fit_test.sav”,在SPSS中选择“Data→Weight Cases…”;选择“Weight cases by”,在“Frequency Variable”下选择“freq”,点击“OK”;选择“Analyze→NonparametricTests→Legacy Dialogs→Chi-square…”;将“major”选入“Test Variable List”框中,在“Expected Values”框中选择“Values”,并将国家统计比例依次“Add”;这里我们选择“Add”选项,并依次输入各类别的比例。
如果假设各类别比例相同,则可以选择默认的“All categories equal”选项。
在“Exact…”选项框中选择“Asymptotic only”选项,点击“Continue→OK”配合度的卡方检验操作过程打开数据文件“fit_test.sav”,在SPSS中选择“Data→Weight Cases…”;选择“Weight cases by”,在“Frequency Variable”下选择“freq”,点击“OK”;选择“Analyze→NonparametricTests→Legacy Dialogs→Chi-square…”;将“major”选入“Test Variable List”框中,在“Expected Values”框中选择“Values”,并将国家统计比例依次“Add”;这里我们选择“Add”选项,并依次输入各类别的比例。
数据统计与分析课后参考答案
附录2:《数据统计与分析——SPSS应用教程》习题答案本“习题答案”也适用于《统计分析应用教程—SPSS,LISREL & SAS实例精选》书中的习题。
习题1答案1.(1)答:有错误, 犯了水平互相嵌套的错误; 如“每周去 2次或 2次以上”把第1组的编码嵌套进去了。
又比如:“每周去 3次或 3次以上”又把第2组的编码嵌套进去了。
(2)答:正确的编码方案如下:1=每周去1次2=每周去2次3=每周去3次4=每周去4次或4次以上2.答:该编码问题严重。
(1)80岁不能是缺失值, 缺失值可用00岁。
(2)职业不编码不行, 而必须编码为:1=工人 2=农民等等。
(3)职业变量用全称(Occupation)超出8个字符。
(4)而且栏目位置占1列即可。
(5)颜色的第1个字母作为变量值会引起重复,应该用单词的前3-4个字符。
(6)Color 变量的栏目位置10被嵌套在“4-14”之内,这是严重的错误。
更正后的编码方案见图1-19:图1-19 纠错后的编码方案3.(1) 答:错。
错在变量名超过8个字符。
(2) 答:错。
错在变量名的首字符是数字领头。
(3) 答:错。
错在变量名中间冒出一个空格。
(4) 答:对,#号可以作为变量名。
但不提倡。
习题2答案1.答:合并后的大目标数据文件“BIGab.sav”中仍然有30个Cases、但每个Cases 各有(50+30)=80个变量,即v1、v2、v3、v4……v50、x1、x2、x3、x4……x30。
2.答:合并后的大目标数据文件“BIGab2.sav”中仍然是50个变量,即v1、v2、v3、v4……v50。
但是Cases数目增加为(20+30)=50个Cases。
3.答:请读者照着书中的方法去使用对话框。
排序的命令如下:SORT CASES BY xh (D)sex.LIST xh sex score。
4.答:对话框的解法请按照书中介绍的去举一反三。
命令解法如下:GET File=’9293.sav’.SELECT IF (location=2 AND sex=2).SORT Cases BY xh (D) sex.LIST xh sex score.5.答:对话框的解法请按照书中介绍的去举一反三。
心里统计课后习题1-6章习题解答
统计学参考答案第01章习题解答1. 随机变量:某一变量在实验、调查和观测之前,不能预知其数值的变量。
随机变量的特点是:离散性、变异性、规律性。
总体(population)又叫“母体”,是指具有某一种特征的一类事物的全体。
个体亦称“单位”、“样品”,统计学术语,统计学术语指总体中的每一个单位、样品或成员。
是统计调查、试验或观测的最基本对象,是构成样本、总体的最小单元。
在心理学研究中,个体根据研究目的的不同,可以是人,也可以是人在某种实验条件下的某个反应,或每个实验结果、每个数据。
在总体中按照一定的规则抽取的部分个体,称为总体的一个样本(sample)。
根据样本容量(通常以30为界线)的大小,可区分为大样本和小样本。
根据两样本来自的两总体是相关还是独立,可分为相关样本和独立样本。
次数:某一随机事件在某一类别中出现的数据多少,亦称频数(frequency)。
频率:某一事件发生的次数与总事件的比率。
概率(probability):某随机事件在某一总体中出现的比率。
表示样本的数字特征的量叫统计量。
如描述数据集中趋势的一些统计指标称为平均数;描述一组数据离散程度的统计指标称为标准差。
表示总体的数字特征的量叫参数。
如反应总体集中情况的统计指标称为总体平均数;反应总体离散程度的统计指标称为标准差。
观测值(observation):实验、调查和观测某些个体在某一变量上的具体的数值,即为观测值。
2. 何谓心理与教育统计学?学习它有何意义?心理与教育统计学是专门研究如何搜集、整理、分析在心理教育方面由实验和调查所获得的数据资料,并如何根据这些数字所传递的信息,进行科学推论找出客观规律的一门学科。
它是应用数理统计学的一个分支,是心理与教育研究中的科学工具。
意义:(1)研究心理与教育现象变化的统计规律;(2)为心理与教育研究提供科学的依据;(3)促进量化研究的发展……3.选用统计方法有哪几个步骤?(1)实验或调查设计是否合理,即所获得的数据是否适合用统计方法去处理,正确将其数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的;(2)要分析实验或调查数据的类型,不同数据类型所使用的统计方法有很大差别,针对不同的数据类型选用与之相应的统计方法至关重要;(3)要分析数据的分布规律,看数据是正态分布还是非正态分布,方差是否已知,以及是大样本数据还是小样本数据。
卫生统计学案例版丁元林课后思考题答案
卫生统计学案例版丁元林课后思考题答案第一章:ECDBB第二章:BDABC第三章:DEBCD AEA第四章:DCCDD DCBD第五章:DCBDB AEEEC第六章:CBEDC DDDDA第七章:ACCBB DACEA第八章:ABCDD BDADB第九章:DDBCD AEA第十章:BDCCE BDAEA第十一章:CAEDC DBCCD第十二章:BCAEE BA第十三章:DDBCC BCDE第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE第十八章:无第十九章:BDCDC CCADC《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型举例说明不同类型资料之间是如何转换的答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
数理统计课后答案
数理统计一、填空题1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。
不含任何未知参数2、设母体σσμ),,(~2N X 已知,则在求均值μ的区间估计时,使用的随机变量为nX σμ-3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。
025.01015u ⨯±4、假设检验的统计思想是 。
小概率事件在一次试验中不会发生5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。
0H :05.0≤p6、某地区的年降雨量),(~2σμN X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2σ的矩估计值为 。
1430.87、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2N 与)1,2(N , 2*22*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS +==χχ,已知)4(~),20(~222221χχχχ,则__________,==b a 。
用)1(~)1(222*--n S n χσ,1,5-==b a8、假设随机变量)(~n t X ,则21X 服从分布 。
)1,(n F 9、假设随机变量),10(~t X 已知05.0)(2=≤λX P ,则____=λ 。
用),1(~2n F X得),1(95.0n F =λ10、设子样1621,,,X X X 来自标准正态分布母体)1,0(N ,X为子样均值,而01.0)(=>λX P , 则____=λ01.04)1,0(~1z N nX=⇒λ 11、假设子样1621,,,X X X 来自正态母体),(2σμN ,令∑∑==-=161110143i i i iX XY ,则Y 的分布 )170,10(2σμN12、设子样1021,,,X X X 来自标准正态分布母体)1,0(N ,X 与2S 分别是子样均值和子样方差,令2*210S X Y =,若已知01.0)(=≥λY P ,则____=λ 。
2021年至2021年心理学考研真题《心理统计学》部分
2021年至2021年心理学考研真题《心理统计学》部分2021至2021年心理统计部分及正确答案2021年61、某次测验的标准误为2,被试甲在此测验中得分为80,则其真实水平99的�Z信区间为 A、74.24?~85.76 B、74.84~85.16 C、76.64~83.36 D、76.04~83.9662、已知某次学业成就测验的平均分数是80,标准差为4,如果某考生得分为92,则该分数转换为标准分后是A、1B、2C、3D、463、在标准正态分布曲线下,正、负1个标准差范围内的面积占曲线下总面积的 A、25.00% B、34.13% C、50.00% D、68.26%64、现有一列数据,它们是4,4,5,3,5,5,2。
这列数据的平均数、众数和全距依次是 A、4,4,2 B、4,5,3 C、5,4,4 D、5,5,165、以学习成绩为效标,得到某一智力测验的效标关联效度为0.8,将此测验用于预测时,其测验结果可解释学习成绩变异的A、6%B、20%C、64%D、80&202150.有一组数据:3,6,2,7,32,4,8,6,5。
要描述这组数据的特征,受极端数据值影响的统计量是()A.平均数 B.中数 C.四分位数 D.众数51.一项研究调查了不同性别的成年人对在公众场合吸烟的态度,结果如表所示。
那么,性别与对待吸烟的态度之间的相关系数是()A.0.12 B.0.32 C.0.48 D.0.5452.在某次考试中,小明的语文、数学成绩均为80,英语成绩为75。
已知全班三科平均成绩都为65,语文标准差为10,数学标准差为15,英语标准差为5。
小明三科的成绩按照标准分由大到小进行排序的结果是()A.语文、数学、英语 B.英语、数学、语文 C.英语、语文、数学 D.语文、英语、数学53.一组服从正态分布的数据,平均数为50,标准差为5,则Z值为-2.58的原始数据是() A.37.10 B.42.42 C.47.42 D.62.9054.对于具有线性关系的两列正态分布的连续变量,计算它们相关系数最恰当的公式是是() A. B. C. D.55.在回归分析中,考察回归效果使用的指标是() A.内部一致性系数B.决定系数 C.概化系数 D.列联系数61.在假设检验中,通常用来表示统计检验力(power of test)的是()A.1-α B.1-β C.α+β D.α-β202154 根据测验中不同维度或分测验的导出分数,绘制形成的折线图或柱形图称为 A结构图 B.碎石图 C剖面图 D茎叶图55.在格塞尔发展量表中,测量婴儿行为发展水平使用的指标为 A.教育商数B.情绪商数 C智力商数 D发展商数56 在标准正态曲线下,正、负三个标准差范围内的面积占总面积的比例是 A 99.73%B.99.00% C.95.46% D.95.00% 57下列关于χ2分布的表述,正确的是A.χ2取值永远不会大于0 B 其均值等于其自由度C 随着自由度的增大,χ2分布趋于正偏态D.多个标准正态分布变量的线性组合所得的新变量符合χ2分布58 在重复测量的方差分析中,如果各组均值不变,被试间差异增大,那么 A.F值会变小 B.F值保持不变 C.组间方差会变小 D.误差方差会变小59 教师的职称和薪水这两个变量的数据类型分别属于 A 命名数据和等比数据B.等距数据和等比数据 C.顺序数据和等距数据 D.顺序数据和等比数据60 一组数据中每个数的值都是5,那么这组数据的标准差和方差分别是 A.0,0 B.5,25 C.0,5 D.0,25 61.对R列C行的列联表进行χ2分析,其自由度为A.R×C B.(R+C)-1 C.R×C-1 D.(R-1)×(C一1) 62 下列智力测验中,属于文化公平测验的是 A 中国比内测验 B.斯坦福比内测验 C韦克斯勒智力测验 D.联合瑞文智力测验63.在一组正态分布的数据中,去掉两端极值后,一定不会受到影响的统计特征值是A 全距 B.平均值 C.标准差 D.众数64 在测量研究中,强调对测验情境关系进行考察的心理测量理论是 A 经典测量理论B项目反应理论 C 概化理论 D测验等值理论 65 如果要建立两个变量之间的数学模型,下列统计方法中,最恰当的是 A 方差分析法 B.因素分析法C.回归分析法 D.聚类分析法202150.运用相对累加次数分布曲线,可以快速计算出与学生原始分数相对应的统计量是A.百分等级 B.z分数 C.T分数 D.频次51.要把标准差转化为方差,研究者要完成的工作是A.计算标准差的平方根 B.用样本n除以标准差C.用1/z除以标准差 D.计算标准差的平方52.某心理学实验有相互独立的一个实验组和一个控制组,为了考察两组连续型数据平均值之间的差异是否具有统计学意义,最恰当的统计方法是A.回归分析 B.相关分析 C.t检验 D.x2检验53.某测验的信度为0.64,实得分数的标准差为5,该测验的标准误为A.0.36 B.1.04 C.3.00 D.4.3654.适用于描述某种心理属性在时间上变化趋势的统计分析图是A.茎叶图 B.箱形图 C.散点图 D.线形图55.在经典测量理论模型X=T+E中,关于E的表述,错误的是A.真分数和误差分数(E)之间的相关为零B.各平行测验上的误差分数(E)之间相关为零C.误差分数(E)是随机误差与系统误差之和D.误差分数(E)是一个服从均值为零的正态分布的随机变量56.一位研究者随机调查了50名城市居民为孩子购买课外读物的花费,另外还搜集了老师对这些孩子的总体评价,得到积差相关系数为0.53 ,下列推断中,正确的是A.如果另外再随机调查50名乡镇居民,他们为孩子购买课外读物的花费与老师对其孩子总体评价之间的相关系数会非常接近0.53B.用城市居民为孩子购买课外读物的花费预测老师对其孩子总体评价的准确率为53% C.城市居民为孩子购买课外读物的花费决定老师对其子女的总体评价D.城市居民为孩子购买课外读物的花费与老师对其孩子的总体评价之间存在中等程度的相关57.总体服从正态分布且方差已知时,其样本平均数的分布是A.x2分布 B.t分布 C.F分布 D.正态分布58.在回归方程中,其他条件不变,X与Y,相关系数趋近于零时,估计的标准误将会A.不变 B.提高 c.降低 D.趋近于零63.甲、丙两图表示的数据分布形态分别是A.正偏态和负偏态分布 B.正偏态和正态分布C.负偏态和正态分布 D.负偏态和正偏态分布64.描述甲、丙两图特征的集中量数中,数值最大的分别是A.甲图――众数、丙图――平均数B.甲图――中数、丙图――众数C.甲图――平均数、丙图――众数感谢您的阅读,祝您生活愉快。
13第十三章完全随机单因素方差分析-刘红云版心理统计教材课后习题
13第⼗三章完全随机单因素⽅差分析-刘红云版⼼理统计教材课后习题练习题1.因组内被试之间的差异造成的变异是()(A)处理内变异(B)偶然因素变异(C)处理间变异(D)实验误差变异2.完全随机单因素⽅差分析中,F检验对应的分⼦的⾃由度为3,分母的⾃由度为16,则参加实验的被试数量和因素的⽔平分别是()(A)16 ,3 (B)17 ,4(C)19 ,4 (D)20 ,43.对于单因素⽅差分析的处理内误差,下⾯说法正确的有()(多选)(A)反映了随机因素和系统因素的影响(B)处理内误差⼀定⼩于组间误差(C)其⾃由度为N—k(N为观测个数,k为组数)(D)反映了随机因素的影响4.⽅差分析中,我们常常⽤到事后检验。
请回答:(1)什么情况下需要进⾏事后检验?(2)如果只存在两个处理组,还需要进⾏事后检验么?为什么?(3)如果⽅差分析结果不显著,还需要进⾏事后检验么?为什么?5.在⼀个实验中,有三个处理组,每个处理组有7名被试。
如果采⽤Tukey的可靠显著差异法来进⾏事后检验,处理内均⽅MS 处理内=15.75,在显著性⽔平为0.05的条件下,临界HSD的值为多少?(A)7.66(B)5.42(C)6.25(D)8.126.下⾯是⼀个⽅差分析表,其中有⼀些空格。
将表中的空格填完整,并回答下⾯的问题:变异来源SS df MS F处理间42.596 —10.649 —处理内162.450 — 3.610总体——(1)这个实验的⾃变量有多少个⽔平?(2)假设每个处理组的⼈数相等,在每个处理组中多少被试?(3)如果显著性⽔平设定为0.05,那么F的临界值是多少?你能得出怎样的结论?(4)这个⽅差分析的测量效应是多少?(5)这个⽅差分析的效应值是多少?按照Cohen的标准,效应⼤⼩如何?7.下⾯的数据来⾃于⼀个完全随机单因素实验,该实验有三种处理⽔平。
如果采⽤⽅差分析的⽅法,在显著性⽔平为0.05的条件下,能否得出结论认为处理间存在显著差异?处理1 处理2 处理31 5 10 N=123 5 6 G=605 56 ∑x2=3923 1 10T1=22 T2=16 T3=32SS1=8 SS2=12 SS3=168.有研究者预研究三种不同刺激强度下,反应时间的变化,随机抽取13名被试,随机分成三组,每组被试分别接受⼀种实验处理,测定结果如下:处理1 处理2 处理318 20 2017 19 2016 17 1816 16 1621(1)该实验设计属于哪种类型的试验设计?对数据进⾏分析的⽅法是什么?(2)对上述资料进⾏分析,试回答三种刺激条件下,被试反应时之间是否存在显著差异(α=0.05,F(2,10)=4.10)9.下表中是⼀个完全随机单因素实验的数据,实验有4个处理组,每个处理组有5名被试。
统计学课后习题答案全章节剖析
第二章、练习题及解答2。
为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图.灯泡的使用寿命频数分布表3。
某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1。
已知下表资料:试根据频数和频率资料,分别计算工人平均日产量. 解:计算表根据频数计算工人平均日产量:(件)根据频率计算工人平均日产量:(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
现代心理与教育统计学课后题完整版
第一章绪论之南宫帮珍创作2.名词解释随机变量:在统计学上, 把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域, 指据有某种特征的一类事物的全体样本:从总体中抽取的一部份个体, 称为总体的一个样本个体:构成总体的每个基本单位称为个体次数:指某一事件在某一类别中呈现的数目, 又成为频数, 用f暗示频率:又称相对次数, 即某一事件发生的次数被总的事件数目除, 亦即某一数据呈现的次数被这一组数据总个数去除.频率通畅用比例或百分数暗示概率:又称机率.或然率, 用符号P暗示, 指某一事件在无限的观测中所能预料的相对呈现的次数, 也就是某一事物或某种情况在某一总体中呈现的比率统计量:样本的特征值叫做统计量, 又叫做特征值参数:总体的特性成为参数, 又称总体参数, 是描述一个总体情况的统计指标观测值:在心理学研究中, 一旦确定了某个值, 就称这个值为某一变量的观测值, 也就是具体数据3.何谓心理与教育统计学?学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法, 搜集.整理.分析心理与教育科学研究中获得的随机数据资料, 并根据这些数据资料传递的信息, 进行科学推论找出心理与教育活动规律的一门学科.4.选用统计方法有哪几个步伐?首先要分析一下试验设计是否合理, 即所获得的数据是否适合用统计方法去处置, 正确的数量化是应用统计方法的起步, 如果对数量化的过程及其意义没有了解, 将一些不着边缘的数据加以统计处置是毫无意义的其主要分析实验数据的类型, 分歧数据类型所使用的统计方法有很年夜分歧, 了解实验数据的类型和水平, 对选用恰当的统计方法至关重要第三要分析数据的分布规律, 如总体方差的情况, 确定其是否满足所选用的统计方法的前提条件5.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量随机变量的界说:①率先无法确定, 受随机因素影响, 成随机变动, 具有偶然性和规律性②有规律变动的变量6.怎样理解总体、样本与个体?总体N:据有某种特征的一类事物的全体, 又称为母体、样本空间, 经常使用N暗示, 其构成的基本单位为个体.特点:①年夜小随研究问题而变(有、无限)②总体性质由组成的个体性质而定样本n:从总体中抽取的一部份交个体, 称为总体的一个样本.样本数目用n暗示, 又叫样本容量.特点:①样本容量越年夜, 对总体的代表性越强②样天职歧, 统计方法分歧总体与样本可以相互转化.个体:构成总体的每个基本单位称为个体.有时个体又叫做一个随机事件或样本点7.何谓次数、频率及概率次数f:随机事件在某一类别中呈现的数目, 又称为频数, 用f暗示频率:即相对次数, 即某个事件次数被总事件除, 用比例、百分数暗示概率P:又称机率或然率, 用P暗示, 指某事件在无限管偏重所能预料的相对呈现次数.估计值(后验):几次观测中呈现m 次, P(A)=m/n真实值(先验):特殊情况下, 直接计算的比值(结果有限, 呈现可能性相等)8.统计量与参数之间有何区别和关系?参数:总体的特性称参数, 又称总体参数, 是描述一个总体情况的统计指标统计量:样本的特征值叫做统计量, 又称特征值二者关系:参数是一个常数, 统计量随样本而变动参数经常使用希腊字母暗示, 统计量用英文字母暗示当试验次数=总体年夜小时, 二者为同一指标当总体无限时, 二者分歧, 但统计量可在某种水平上作为参数的估计值9.试举例说明各种数据类型之间的区别?10.下述一些数据, 哪些是丈量数据?哪些是计数数据?其数值意味着什么?17人 25本是计数数据11.说明下面符号代表的意义μ反映总体集中情况的统计指标, 即总体平均数或期望值ρ暗示某一事物两个特性总体之间关系的统计指标, 相关系数r 样秘闻关系数σ反映总体分散情况的统计指标标准差s样本标准差β暗示两个特性中体之间数量关系的回归系数Nn第二章统计图表1.统计分组应注意哪些问题?①分类要正确, 以被研究对象的实质为基础②分类标识表记标帜要明确, 要包括所有数据③如删除过失所造成的变异数据, 要遵循3σ原则2.直条图适合哪种资料?条形图也叫做直条图, 主要用于暗示离散型数据资料, 即计数资料.3.圆形图适合哪种资料又称饼图, 主要用于描述间断性资料, 目的是为显示各部份在整体中所占的比重年夜小, 以及各部份之间的比力, 显示的资料多以相对数(如百分数)为主4.将下列的反应时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形.177.5 167.4 116.7 130.9 199.1 198.3 225.0 212.0 180.0 171.0 144.0 138.0 191.0 171.5 147.0 172.0 195.5 190.0 206.7 153.2 217.0 179.2 242.2 212.8 171.0 241.0 176.5 165.4 201.0 145.5 163.0 178.0 162.0 188.1 176.5 172.2 215.0 177.9 180.5 193.0 190.5 167.3 170.5 189.5 180.1 217.0 186.3 180.0 182.5 171.0 147.0 160.5 153.2 157.5 143.5 148.5 146.4 150.5 177.1 200.1 137.5 143.7 179.5 185.5 181.6N=65 代入公式K=1.87(N-1)2/5=9.8 所以K取10定组距13 最低组的下限取115表2-1 次数分布表分组区间组中值(Xc)次数(f)频率(P)百分次数(%)232~ 238 2 3 219~ 225 1 2 206~ 212 6 9 193~ 199 6 9180~ 186 14 22 167~ 173 16 25 154~ 160 5 8 141~ 147 11 17 128~ 134 3 5 115~ 121 1 2 合计65 100表2-2 累加次数分布表分组区间次数(f)向上累加次数向下累加次数实际累加次数(cf)相对累加次数实际累加次数(cf)相对累加次数232~ 2 65 2219~ 1 63 3206~ 6 62 9193~ 6 56 15180~ 14 50 29167~ 16 36 45154~ 5 20 50141~ 11 15 61128~ 3 4 64115~ 1 1 657.下面是一项美国高中生打工方式的调查结果.根据这些数据用手工方式和计算方式个制作一个条形图.并通过自己的体会说明两种制图方式的分歧和优缺点打工方式高二(%)高三(%)看护孩子商店销售餐饮服务其他零工左侧Y轴名称为:打工人数百分比下侧X轴名称为:打工方式第三章集中量数1.应用算术平均数暗示集中趋势要注意什么问题?应用算术平均数必需遵循以下几个原则:①同质性原则.数据是用同一个观测手段采纳相同的观测标准,能反映某一问题的同一方面特质的数据.②平均数与个体数据相结合的原则③平均数与标准差、方差相结合原则2.中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?中数适用于:①当一组观测结果中呈现两个极端数目时②次数分布表两端数据或个别数据不清楚时③要快速估计一组数据代表值时众数适用于:①要快速且粗略的求一组数据代表值时②数据分歧质时, 暗示典范情况③次数分布中有两极真个数目时④粗略估计次数分布的形态时, 用M-Mo作为暗示次数分布是否偏态的指标(正态:M=Md=Mo;正偏:M>Md>Mo; 负偏:M<Md<Mo)⑤当次数分布中呈现双众数时几何平均数适用于①少数数据偏年夜或偏小, 数据的分布成偏态②等距、等比量表实验③平均增长率, 按一定比例变动时调和平均数适用于①工作量固定, 记录各被试完成相同工作所用时间②学习时间一定, 记录一按时间内各被试完成的工作量3.对下列数据, 使用何种集中量数暗示集中趋势其代表性更好?并计算它们的值.⑴ 4 5 6 6 7 29 中数=6⑵ 3 4 5 5 7 5 众数=5⑶4.求下列次数分布的平均数、中数.解:组中值由“精确上下限”算得;设估计平均值在35~组, 即AM=37;中数所在组为35~, f MD=34,其精确下限Lb=34.5, 该组以下各组次数累加为Fb=21+16+11+9+7=645.求下列四个年级的总平均成果.n2363182152006.三个分歧被试对某词的联想速度如下表, 求平均联想速度被试 联想词数 时间(分)词数/分(Xi )A 13 2 13/2B 13 3 13/3 C1325-解:C 被试联想时间25分钟为异常数据, 删除7.下面是某校几年来结业生的人数,问平均增加率是几多?并估计10年后的结业人数有几多.年份 1978 1979 1980 1981 1982 1983 1984 1985 结业人数54260175076081093010501120解:用几何平均数变式计算:所以平均增加率为11%10年后结业人数为1120×10=3159人8.计算第二章习题4中次数分布表资料的平均数、中数及原始数据的平局数.解:组中值由“精确上下限”算得;设估计平均值在167~组, 即设AM=173;中数所在组为167~, f MD=16,其精确下限Lb=166.5,该组以下各组次数累加为Fb=1+3+11+5=20分组区间组中值(Xc)次数(f)d=(Xi-AM)/i fd 232~ 238 2 5 10 219~ 225 1 4 4 206~ 212 6 3 18 193~ 199 6 2 12 180~ 186 14 1 14 167~ 173 16 0 0 154~ 160 5 -1 -5 141~ 147 11 -2 -22 128~ 134 3 -3 -9 115~ 121 1 -4 -4 合计∑N=65 ∑fd=18第四章不同量数1.怀抱离中趋势的不同量数有哪些?为什么要怀抱离中趋势?怀抱离中趋势的不同量数有全距、四分位差、百分位差、平均差、标准差与方差等等.在心理和教育研究中, 要全面描述一组数据的特征, 不单要了解数据的典范情况, 而且还要了解特殊情况.这些特殊性常暗示为数据的变异性.如两个样本的平均数相同可是整齐水平分歧, 如果只比力平均数其实不能真实的反映样本全貌.因此只有集中量数不成能真实的反映出样本的分布情况.为了全面反映数据的总体情况, 除必需求出集中量数外, 这时还需要使用不同量数.2.各种不同量数各有什么特点?见课本103页“各种不同量数优缺点比力”3.标准差在心理与教育研究中除怀抱数据的离散水平外还有哪些用途?可以计算不同系数(应用)和标准分数(应用)4.应用标准分数求分歧质的数据总和时应注意什么问题?要求分歧质的数据的次数分布为正态5.计算下列数据的标准差与平均差6.计算第二章习题4所列次数分布表的标准差、四分差Q设估计平均值在167~组, 即AM=173, i=13分组区间Xc f d=(Xc-AM)/i fd fd2232~ 238 2 5 10 50219~ 225 1 4 4 16206~ 212 6 3 18 54193~ 199 6 2 12 24180~ 186 14 1 14 14167~ 173 16 0 0 0154~ 160 5 -1 -5 5141~ 147 11 -2 -22 44128~ 134 3 -3 -9 27115~ 121 1 -4 -4 16合计65 18 25065×75%=48.75 所以Q1、Q3分别在154~组(小于其组精确下限的各组次数和为15)和180~组(小于其组精确下限的各组次数和为36), 其精确下限分别为153.5和179.5, 所以有:7.今有一画线实验, 标准线分别为5cm和10cm, 实验结果5cm组的误差平均数为1.3cm, 标准差为0.7cm, 10cm组的误差平均数为 4.3cm, 标准差为 1.2cm, 请问用什么方法比力其离散水平的年夜小?并具体比力之.用不同系数来比力离散水平.×100%=()×100%=53.85%×100%=(1.2/4.3) ×100%=27.91%<CV1所以标准线为5cm的离散水平年夜.8.求下表所列各班成果的总标准差班级平均数标准差人数di1 402 513 484 43其值见上表9.求下表数据分布的标准差和四分差设估计平均数AM=52, 即在50~组, d=(Xc-AM)/I计算各值如下表所示:分组 f Xc 累加次数 d d2fd2fd 75~80 1 77 55 5 25 25 570~ 2 72 54 4 16 32 8 65~ 4 67 52 3 9 36 12 60~ 5 62 48 2 4 20 10 55~ 8 57 43 1 1 8 8 50~ 10 52 35 0 0 0 0 45~ 9 47 25 -1 1 9 -9 40~ 7 42 16 -2 4 28 -14 35~ 4 37 9 -3 9 36 -12 30~ 2 32 5 -4 16 32 -8 25~ 2 27 3 -5 25 50 -10 20~ 1 22 1 -6 36 36 -6 合计55 312 -1655×25%=13.75 55×75%=41.25 所以Q1在40~组, 其精确下限Lb1=39.5, 小于其组的次数为Fb1=9, 其组次数f1=7;Q2在55~组, 其精确下限Lb2=54.5, 小于其组的次数为Fb2=35, 其组次数f2=8.计算Q1、Q2如下:第五章相关关系1.解释相关系数时应注意什么?(1)相关系数是两列变量之间相关成都的数字暗示形式, 相关水平指标有统计特征数r和总体系数ρ(2)它只是一个比率, 不是相关的百分数, 更不是等距的怀抱值,只能说r年夜比r小相关密切, 不能说r年夜小=0.4的两倍(不能用倍数关系来解释)(3)当存在强相关时, 能用这个相关关系根据一个变量的的值预测另一变量的值(4)-1≤r≤1, 正负号暗示相关方向, 值年夜小暗示相关水平;(0为无相关, 1为完全正相关, -1为完全负相关)(5)相关系数年夜的事物间纷歧定有因果关系(6)当两变量间的关系收到其他变量的影响时, 两者间的高强度相关很可能是一种假象(7)计算相关要成对数据, 即每个个体有两个观测值, 不能随便2个个体计算(8)非线性相关的用r得可能性小, 但其实不能说不密切2.假设两变量为线性关系, 计算下列各情况的相关时, 应用什么方法?(1)两列变量是等距或等比的数据且均为正态分布(积差相关)(2)两列变量是等距或等比的数据且不为正态分布(品级相关)(3)一变量为正态等距变量, 另一列变量也为正态变量, 但人为分为两类(二列相关)(4)一变量为正态等距变量, 另一列变量也为正态变量, 但人为分为多类(多列相关)(5)一变量为正态等距变量, 另一列变量为二分称名变量(点二列相关)(6)两变量均以品级暗示(品级相关、交错系数、相容系数)3.如何区分点二列相关与二列相关?主要区别在于二分变量是否为正态.二列相关要求两列数据均为正态, 其中一列被人为地分为两类;点二列相关一列数据为等距或等比丈量数据, 且其总体分布为正态, 另一列变量是二分称名变量, 且两列数存在一一对应关系.4.品质相关有哪几种?各种品质相关的应用条件是什么?品质相关分析的总条件是两因素多项分类之间的关联水平, 分为一下几类:(1)四分相关, 应用条件是:两因素都为正态连续变量(eg.学习能力, 身体状态))人为分为两个类别;同一被试样品中, 分别调查两个分歧因素两项分类情况(2)Φ系数:除四分相关外的2×2表(最经常使用)(3)列联表相关C:R×C表的计数资料分析相关水平5.预考查甲乙丙丁四人对十件工艺美术品的品级评定是否具有一致性, 用哪种相关方法?品级相关6.下表是平时两次考试成果分数, 假设其分布成正态, 分别用积差相关与品级相关方法计算相关系数, 并回答, 就这份资料用哪种相关法更恰当?被试 A B A2B2AB R A R B R A R B D=R A-R B D21 86 83 7396 6889 7138 236-112 58 52 3364 2704 3016 7856-113 79 89 6241 7921 7031 414394 64 78 4096 6084 4992 6424245 91 85 8281 7225 7735 122-116 48 68 2304 4624 3264 9654397 55 47 3025 2209 2585 8972-118 82 76 6724 5776 6232 3515-249 32 25 1024 625 800 10101000010 75 56 5625 3136 4200 5735-24∑670 659 48080 47193 46993 555536834用积差相关的条件成立, 故用积差相关更精确7.下列两列变量为非正态, 选用恰当的方法计算相关本题应用品级相关法计算, 且含有相同品级X有3个数据的品级相同, 品级3.5的数据中有2个数据的品级相同, 品级为6.5和8.5的数据中也分别有2个数据相同;Y有3个数据品级相同, 品级为3的数据中有3个数据品级相同, 品级为5.5的数据中有2个数据品级相同, 品级为9的数据中有3个数据品级相同.被试X Y RX RYD=RX-RYD21 13 14 1 1 0 02 12 11 23 -1 13 10 11 34 10 11 35 8 7 56 67 1 17 6 5 78 5 4 99 5 4 910 2 4 10 9 1 1N=108.问下表中成果与性别是否相关?被试性别成果男成果女成果成果的平方1 男83 83 68892 女91 91 82813 女95 95 90254 男84 84 70565 女89 89 79216 男87 87 75697 男86 86 73968 男85 85 72259 女88 88 774410 女92 92 8464∑880 425 455 77570适用点二列相关计算法.p为男生成果, q为女生成果的平均成果从表中可以计算得:p=0.5 q=0.5相关系数为-0.83, 相关较高9.第8题的性别若是改为另一成果A ()正态分布的及格、不及格两类, 且知1、3、5、7、9被试的成果A 为及格, 2、4、6、8、10被试的成果A 为不及格, 请选用适当的方法计算相关, 并解释之.被试成果A 成果B 及格成果 不及格成果 成果的平方1 及格 83 83 68892 不及格 91 91 82813 及格 95 95 90254 不及格84 84 7056 5 及格 89 89 7921 6 不及格 8787 7569 7 及格 86 86 7396 8 不及格 85 85 7225 9 及格88 88 7744 10 不及格 92 92 8464 ∑880441 439 77570适用二列相关B 的标准差和平均数分别是成果A 及格和不及格时成果B 的平均数, p 为成果A 及格的比率, y 为标准正态曲线中p 值对应的高度或者10.11.下表是9名被试评价10名著名的天文学家的品级评定结果,问这9名被试的品级评定是否具有一致性?被评价者被试∑R i∑R i2 1 2 3 4 5 6 7 8 9A 1 1 1 1 1 1 1 1 1 9 81B 2 4 3 3 9 4 3 3 2 33 1089C 4 2 4 4 2 9 5 5 8 43 1849D 3 5 5 5 5 2 10 7 4 46 2116E 9 6 2 2 6 5 2 6 9 47 2209F 6 7 8 6 3 6 6 4 6 52 2704G 5 3 9 10 4 7 9 8 3 58 3364H 8 10 6 8 8 3 7 10 7 67 4489I 7 8 10 7 10 10 8 2 5 67 4489 J 10 9 7 9 7 8 4 9 10 73 5329 ∑495 27719适用肯德尔W系数.即存在一定关系但不完全一致12.将11题的结果转化为对偶比力结果, 并计算肯德尔一致性系数ABCDEFGHIJ已知N=10, K=9 选择对角线以下的择优分数或者选择对角线上的择优分数第六章概率分布1.概率的界说及概率的性质标明随机事件发生可能性年夜小的客观指标就是概率2.概率分布的类型有哪些?简述心理与教育统计中经常使用的概率分布及其特点概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述.概率分布依据分歧的标准可以分为分歧的类型:(一)离散分布与连续分布连续分布指连续随机变量的概率分布, 即丈量数据的概率分布, 如正态分布离散分布是指离散随机变量的概率分布, 即计数数据的概率分布, 如二项分布(二)经验分布与理论分布经验分布指根据观察或试验所获得的数据而编制的次数分布或相对频率分布理论分布有两个含义, 一是随机变量概率分布的函数-数学模型, 二是指按某种数学模型计算出的总体的次数分布(三)基本随机变量分布与抽样分布基本随机变量分布指理论分布中描述构成总体的基本变量的分布, 经常使用的有二项分布与正态分布抽样分布是样本统计量的理论分布, 又称随机变量函数的分布,如平均数, 方差等3.何谓样本平均数的分布所谓样本平均数的分布是指从基本随机变量为正态分布的总体(又称母总体)中, 采纳有放回随机抽样方法, 每次从这个总体中抽取年夜小为n的一个样本, 然后将这些个体放回去, 再次取n个个体, 又可计算出一个……再将n个个体放回去, 再抽取n个个体……, 这样如此反复, 理论及实验证明这无限多个平均数的分布为正态分布.4.从N=100的学生中随即抽样, 已知男生人数为35, 问每次抽取1人, 抽的男生的概率是几多?(35/100=0.35)5.两个骰子掷一次, 呈现相同点数的概率是几多?6.从30个白球20个黑球共50个球中随机抽取两次(放回抽样), 问抽一黑球与一白球的概率是几多?两次皆是白球与两次皆是黑球的概率各是几多?(一黑一白)(皆是黑球)(皆是白球)7.自一副洗好的纸牌中每次抽取一张.抽取下列纸牌的概率是几多?(1)一张K 4/54(2)一张梅花 13/54(3)一张红桃 13/54(4)一张黑心 13/54(5)一张不是J、Q、K牌的黑桃 10/548.掷四个硬币时, 呈现一下情况的概率是几多?服从二项分布b(4, 0.5)(1)(2)(3)(4)(5)9.在特异功能试验中, 五种符号分歧的卡片在25张卡片中各重复5次, 每次实验自25张卡片中抽取一张, 记下符号, 将卡片送回.共抽25次, 每次正确的概率是1/5.写出实验中的二项式.问这个二项式分布的平均数和标准差各即是几多?服从二项分布b(25, 0.2)10.查正态表求:(1)(2)(3)Z=±×2=(4)P=0.78 Z=? Y=? Z=0.77 Y=0.29659(5)P(6)11.在单位正态分布中, 找出有下列个案百分数的标准丈量Z的分值12.在单位正态分布中, 找出有下列个案百分数的标准丈量的Z值13.今有1000人通过一数学能力检验, 欲评为六个品级, 问各个品级评定人数应是几多?解:6σ÷6=1σ, 要使各品级等距, 每一品级应占1个标准差的距离, 确定各品级的Z分数界限, 查表计算如下:分组各组界限比率p 人数分布p×N1 2σ以上232 1σ~2σ1363 0~1σ3414 -1σ~0 3415 -2σ~-1σ1366 -2σ以下23 14.将下面的次数分布表正态化, 求正态化T分数分组组中值 f 上限以下累加各组中点以下累加次数累积百分比Z正态化T分数T=10Z+5055~ 52 2 100 99 99%50~ 47 2 98 97 97%45~ 42 6 96 93 93%40~ 37 8 90 86 86%35~ 32 12 82 76 76%30~ 27 14 70 63 63%25~ 22 24 56 44 44%20~ 17 12 32 26 26%15~ 12 16 20 12 12%10~ 7 4 4 2 2%15.掷骰子游戏中, 一个骰子掷6次, 问3次及3次以上6点向上的概率各是几多?服从二项分布:33次以上:16.今有四择一选择检验100题, 问答对几多题才华说是真的会答而不是猜想?解:服从二项分布, p=1/4, q=3/4, np=100×1/4=25>5, 此二项分布接近正态, 故:根据正态分布概率, 当Z=1.645时, 该点以下包括了全体的95%.如果用原是分数暗示, 则为即完全凭猜想, 100题中猜对33题以下的可能性为95%, 猜对33题及以上的概率仅为5%.所以答对33题才华说是真的会而不是猜想.17.一张考卷中有15道多重选择题, 每题有4个可能的回答, 其中至少有一个是正确谜底.一考生随机回答, (1)答对5至10题的概率, (2)答对的平均题数是几多?18.E字形试标检查儿童的视敏度, 每种视力值(1.0, 1.5)有4个方向的E字各有两个(共8个), 问:说对几个才华说真看清了而不是猜想对的?解:服从二项分布, n=8, p=1/4, np=2<5, 所以不能用正态分布概率算, 而直接用二项分布算:由以上计算可知说对5个及5个以上的概率总和为0.000015+0.000366+0003845+0.023071=0.027297=2.73%<5%而说对4个及以上概率总和为0.027297+0.0865=0.1138=11.38% 年夜年夜超越5%的误差范围,不成取.所以至少说对5个才华才华认为是看清了而不是猜想对的, 作此结论犯毛病的概率为2.73%.19.一学生毫无准备介入一项检验, 其中有20道是非题, 他纯洁是随机地选择“是”和“非”, 试计算:(1)该学生答对5题的概率;(2)该学生至少答对8题的概率解:服从二项分布 n=20, p=0.5 np=10>5, 可用正态分布概率作近似值.答对5至少答对8题的概率用正态分布概率近似计算如下:所以答对8题的Z20.设某城市年夜学录取率是40%, 求20个介入高考的中学生中至少有10人被录取的概率.解:服从二项分布 n=20, p=0.4, q=0.6.因为np=5, 可以用正态分布概率作近似计算人被录取时的Z至少10人被录取的概率即为Z=2.283以上的概率, 查表得Z=2.283时p=0.48870, 所以Z=2.283以上的概率为0.5-0.48870=0.0113, 即至少10人被录取的概率为1.13%解2:设X为录取人数, 则21.已知一正态总体μ=10, σ=2.今随机取n=9的样本求Z值, 及年夜于该Z以上的概率是几多?解:属于样天职布中总体正态, 方差已知的情况:22.从方差未知的正态总体(μ=50)中抽取n=10的样本, 算得平问年夜于该平均数以上的概率?解:总体正态方差未知, 服从t分布查表当df=9时没有准确的p对应, 采纳内插法单侧界限概率:t=1.383以上概率为p=0.1, t=1.833以上概率为p=0.05, 令t=1.581以上概率为p, 则:23.解, 查表得df=7时24.抽取样本n=15解:不知总体平均数时, df=n-1=14查表得df=14时0.25, 采纳内插法,p, 则解得p=0.27,25., 随机抽取n=10的样本为:10、20、17、19、25、24、22、31、26、26,, 并求年夜于该值的概率?解:正态总体平均数未知查df=9时26., , 年夜于该值以上的概率又是几多?解, 正态总体平均数已知27.已知从一正态总体中抽取解:同一总体方差相等样本方差比为第七章参数估计第八章假设检验第九章方差分析第十章X2检验第十一章非参数检验第十二章线性回归第十三章多变量统计分析简介第十四章抽样原理及方法O50IZF6l3OlC。
1第一章数据的整理-刘红云版心理统计教材课后习题
第一章数据的整理1.请说出下列变量为何种变量。
(1)角色:(导师、助教、学生);(2)社会阶层:(低级、生产、中产、上等);(3)书本的价钱:(元);(4)宗教:(基督教、非基督教);(5)所住地区:(邮政编码);(6)人口增长:(下降、没有改变、上升)(7)测验分数:(10,34,58……)。
2.判断下面的说法是否正确。
(1)计数数据大都是精确数。
(2)IQ为130的小孩比IQ为100的小孩聪明30%。
(3)30℃与20℃的温差与20℃与10℃的温差相同。
3.写出下面连续数据的精确界限,形式为(精确下限,精确上限)(1)180 (2)1.8 (3)1.804.选择题(1)按两个以上变量分组的统计表是:(A)简单表(B)相关表(C)双向表(D)复合表(2)若描述不同性别的儿童在小学阶段的自尊水平变化趋势,假设每一个学期测试收集一次数据,最能恰当描述的图形是:(A)条形图(B)圆形图(C)直方图(D)散点图(3)若描述不同性别的儿童在小学入学时和小学毕业时的自尊水平差异,应该使用:(A)圆形图(B)条形图(C)散点图(D)直方图(4)按照数据的获得方式,找出下列数据中与其他类型不同的数据:(A)80斤(B)80升(C)80米(D)80条(5)依据变量测量水平,找出下列数据中与其他不同类的变量取值:(A)10ml (B)10cm (C)10kg (D)10℃5.简答题X f5 14 33 52 21 2(1)一组数据的最大值为X=142,最小值为X=65。
问题是:a解释这些数据为什么不适合作常规的频数分布表?b计算适合这组数据分组分布表中的组距。
c计算分数段的起始区间。
(2)计算下列频数分布表中的N,∑X,∑X2。
6.制表绘图题(1)某实验从6~9岁儿童中随机抽取若干名,测试他们对小数和分数的平均理解水平,以1~10来评价。
请根据下表绘制最适合的统计图。
项目6岁7岁8岁9岁对小数的理解 2 3 5 7对分数的理解 3 6 8 9(2)下面是100名学生的数学测验成绩,请以5为组距,编制一个次数分布表,并绘制次数分布多边图。
康复计量、计数习题1
56
79
52.67
24~
38
117
78.00
36~
20
137
91.33
48~
10
147
98.00
60~72
3
150
100.00
4、为了研究某地黄连中小檗碱含量,随机抽查该地 20 份黄连中小檗碱含量( mg/100g)得平均数为 4.35,标准差为 0.20, 试计算: A、 总体均数的 95%和 99%可信区间。 B、 若样本含量为 200 份,试计算其总体均数的 95%和 99%可信区间,并与( A)相比较。
专业
班级
姓名
学号
应用题
1、某研究者为比较耳垂血和手指血的白细胞数,调查了 8 名成年人,同时采取了耳垂血和手指血,所得数据如下: 表 1 8 名成年人耳垂血和手指血的白细胞数
编号
1
2
3
4
5
6
7
8
耳垂血
9.7
6.2
7.0
5.3
8.1
9.9
4.7
5.8
手指血
6.7
5.4
5.0
7.5
8.3
4.6
4.2
7.5
5、某医生调查了 1301 名 20~25 岁的大骨节病妇女,她们都已经有第 1 次月经,记录其月经初潮年龄如下表,求其平均初 潮年龄及其标准差。
大骨节病妇女的月经初潮 年龄
初潮年龄
例数
11
19
12
45
13
133
14
206
15
284
16
280
17
203
18
89
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
练习题
1.以下表格是女主试帮助有魅力和无魅力男求职者的次数,请根据此次试验数据得出相应
结果并做出解释。
有魅力型无魅力型合计帮助17 13 30
不帮助24 27 51
合计41 40 81
2.王者之争一般持续4~7个游戏。
1922~1989年,每期持续的游戏个数分布为:
游戏个数 4 5 6 7
实际次数11 15 13 29
请问游戏次数的分布概率是否相同?
3.有人想研究幼儿的颜色喜好,实验数据如下表所示,请问幼儿对颜色的喜好是否不同?
色调红橙黄绿青蓝紫
喜欢人数55 57 40 53 60 46 39 4.以下是四种理财方式A、B、C、D,研究者对理财方式的选择和客户的收入情况之间的
关联比较感兴趣,因此,研究者对300名客户进行了调查,请问理财方式的选择和客户的收入情况是否存在关联,以及关联程度如何。
低收入高收入理财方式A 36 84
理财方式B 39 51
理财方式C 16 44
理财方式D 9 21
5.两名教师分别对全班同学的学业成绩进行了分类,其将学业成绩分为A优秀,B良好,
C合格,D不合格四种,以下是两名教师的评定结果,两名教师的评价是否一致?评价一致性程度如何?
教师1
A B C D
教师2 A 15 17 21 10
B 11 12 14 8
C 12 17 9 12
D 9 13 8 6
6.研究者做了一项关于记忆和情绪之间关系的实验,他们让50名被试回忆小时候和爸爸
在一起的情景以及和妈妈在一起的情景,然后再问及被试回忆情景时是高兴还是悲伤,以下是实验数据:
回忆妈妈回忆爸爸高兴35 31
悲伤15 19
研究者打算用x²检验分析这组数据,请问研究者的分析方法正确吗?请做出解释。
7.已知某区升学率为45%,其中某校300名毕业生中共升学162人,问该校升学率与全区的升学率是否相同?
8.目前有一调查,随机抽取两个班级的学生,一班200人中140人的英语通过四级考试,二班250人中有160人的英语通过四级考试,请问两个班学生的英语水平之间的差异是否显著?
9.研究员正在调查物理特性是否影响人们对一张脸美丽程度的判断。
研究者选择一张妇女的照片,然后作两项修改,把照片(1)移动眼睛,使其距离稍微变远,和(2)移动眼睛,使其距离稍微变近。
原来的照片和两张修改的照片,然后显示给样本n=150大学生,每名学生要求从上述三个新面孔选择最美丽的。
反应结果分布如下:
10.对有5个孩子的320户家庭做统计,结果如下表所示,试问所得结果与假设“男孩、女孩的出生比率一样”一致吗?
男女孩数5男0女4男1女3男2女2男3女1男4女0男5女总数家庭数28 66 110 88 50 18 360。