描述统计与推断统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
描述统计与推断统计-心理学统计与测量经典习题1
第一章描述统计
名词解释
1.描述统计(大学2002研)
答:描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据的全貌。
2.相关系数(大学2002研)
答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。作为样本的统计量用r表示,作为总体参数一般用ρ表示。相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。
3.差异系数(浙大2003研)
答:差异系数,又称变异系数、相对标准差等,它是一种相对差异量,为标准差对平均数的百分比。其公式如下:
常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。
4.二列相关(中科院2004研)
答:如果两列变量均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量虽然也是正态分布,但被人为地划分为两类。求这样两列变量的相关用二列相关。
5.集中量数与差异量数(浙大2000研,大学2002研)
答:集中趋势和离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。
6.中位数(南开大学2004研)
答:中位数,又称中点数,中数,是指位于一组数据中较大一半和较小一半中间位置的那个数,用Md 或Mdn来表示。
7.品质相关(师大2002研)
答:品质相关是指R×C表的两个因素之间的关联程度。两个因素只被划为了不同的品质类别,其数据一般都是计数的数据,而非测量的数据。品质相关可依二因素的性质及分类项目的不同,而有不同的名称和计算方法,较常见的有四分相关和Ф相关。
8.标准分数(华南师大2004研)
答:标准分数,又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
其计算公式为:
简答题
1.简述使用积差相关系数的条件。(首师大2004研)
答:一般来说,用于计算积差相关系数的数据资料,需要满足下面几个条件:
①要求成对的数据,即若干个体中每个个体都有两种不同的观测值。
②两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布。
③两个相关的变量是连续变量,也即两列数据都是测量数据。
④两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关。
2.简述算术平均数的使用特点。(浙大2003研,大学2002研)
答:算术平均数的优点有反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响。缺点有易受极端数据的影响;如果出现模糊不清的数据时,无法计算平均数,因为平均数的计算需要每个数据的加入。勤*思老师期待您的好消息。从算术平均数的这些特点可以看出,如果一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,用算术平均数表示其集中趋势最佳。
3.如果你不知道两个变量概念之间的关系,只知道两个变量的相关系数很高,请问你可能做出什么样的解释?(大学2004研)
答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。两个变量的相关系数很高,只能说明两变量间具有较高的共变关系,即一个变量的变化会引起另一个变量朝相同或相反方向发生变化。至于二者有无因果关系,或谁是因谁是果则无法确定。所以在解释时只能说两变量间存在较高的相关关系。
4.一组大学生的智力水平和性别之间求相关,设男为1,女为2。如果两变量的相关为负,请问说明了什么情况?请举例说明。(大学2004研)
答:根据题意,如果两变量的相关为负,则说明大学生的智力水平与性别存在负相关,即男生智力水平低,女生智力水平高。
举例提示:本题所求的相关是点二列相关,一列变量为等距变量(智力水平),另一列变量为名义变量(性别)。根据点列相关的数据特点,列出两组数据,运用相应公式计算即可。要注意的是,男生的智力水平平均分数应小于女生的。
5.某省进行了一次小学五年级的数学统考。已知不同小学教学水平相差较大,但同一个小学的五年级的不同班级教学水平很相近。以学生的考试成绩为原始数据,问:
①如何处理这些原始数据,使得数据处理的结果能够比较不同小学学生的数学学习潜能?
答:提示:使用标准分数。由于要考察的是不同学生的数学学习潜能,而非已有的数学水平,所以应该以每个学校的五年级学生为总体,求每个学生的标准分数,然后比较不同学校学生间的标准分数。
②如何处理这些原始数据,使得数据处理的结果能够反映一个学校的教学水平?(南开大学2004研)
答:提示:一个学校的教学水平主要体现在学生的学习成绩上,而学生成绩的好坏有两个标准:一是平均水平的高低,二是整体水平的差异。一般来说,平均水平越高,同时整体水平差异越小,表明该学校的教学水平高,反之则低。而同时反映了这两个指标的只有差异系数(CV)。其公式为:
6.举例说明相关程度很高的两个变量之间并不存在因果关系。(北师大2001研)
答:变量之间的因果关系必须符合以下几个条件:①二者之间必须有可解释的相关关系;②二者必须有一定的时间先后顺序,也就是说“因”的变化在前,“果”的变化在后,二者顺序不能变;③二者不能是虚假关系(即一种关系被另一种关系被另一种关系取代后,原来的关系被证明不成立);④因果决定的方向不能改变。
而变量之间的相关关系是一种共变关系,即一种变量发生变化,另一种变量也相应地朝相同或相反方向发生变化。但有高相关的两个变量之间并不一定存在因果关系,如一般情况下,数学成绩好的学生,物理成绩也会比较好,即两者存在很高的正相关。但是,数学成绩和物理成绩之间没有一定的时间先后顺序,而且无法确定二者谁决定了谁,即不能满足因果关系的②④两个条件,所以不是因果关系。
7.度量离中趋势的差异量数有哪些?为什么要度量差异量数?(西北师大2002研)
答:对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数。这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等。
一组数据集中量数的代表性如何,可由表示差异情况的量数来说明。差异量数越小,则集中量数的代表性越大;若差异量数越大,则集中量数的代表性越小。如差异量数为零,则说明该组数据彼此相等,其值都与集中量数相同。集中量数是指量尺上的一点,是点值,而差异量数是量尺上的一段距离,只有将二者很好地结合,才能对一组数据的全貌进行清晰的描述。所以需要度量差异量数。
8.用算术平均数度量集中趋势存在哪些缺点?试举例说明。(重大2004研)