推论统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行为统计科学概要
——描述统计
统计学指的是一套组织、总结和解释信息的数学过程。
统计学的重要性:慢慢体验,自有奥妙!
学好统计的方法:自学成才
一.描述统计
(一)统计图表
1)统计图
次数分布图:
①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。
②次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。
③累加次数分布图:分为:累加直方图和累加曲线图;
其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态),另一种是下枝长于上枝(负偏态),第三种是上枝,下枝长度相当(正态分布)。
其他统计图:条形图:用于离散型数据资料;
圆形图:用于间断性资料;
线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。
散点图:
2)统计表
①简单次数分布表
②分组次数分布表
③相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。
④累加次数分布表
⑤双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。
(二)集中量数
1)算术平均数M
优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;
缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数;
计算和运用平均数的原则:同质性原则;平均数与个体数值相结合的原则;平均数与标准差。方差相结合原则;
性质:
①在一组数据中每个变量与平均数之差的总和等于零
②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C
③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来
的平均数乘以常数C
2)中数:Md按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。注意计算方法;
3)众数:Mo是指在次数分布中出现次数最多的那个数值;
三者的关系:正偏态分布中,M>Md>Mo
负偏态分布中,M Mo=3Md-2M(自己推导一下) (三)差异量数 差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。 1)离差与平均差 离差:分布中的某点到均值得距离,其符号表示了某分数与均值之间的位置关系,而数值表示了它们之间的绝对距离。所有的离差之和始终为零。 =- x Xμ 平均差:次数分布中所有原始数据与平均数绝对离差的平均值。2)方差与标准差 (1)总体的方差和标准差 方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的均数。 作为样本统计量用符号s 2表示,作为总体参数用符号σ2表示,也叫均方。 标准差:方差的平方根 作为样本统计量用符号s 表示,作为总体参数用符号σ表示。 (2)样本的方差和标准差 样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计: 21 SS S n =- (3)性质 ①每一个观测值都加一个相同的常数C 之后,计算得到的标准差等于原来的标准差; ②每一个观测值都乘以一个相同的常数C ,所得到的标准差等于原标准差乘以这个常数。 3)变异系数 当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数。 ①两个或两个以上样本所使用的观测工具不同,所测的特质相同 ②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大 差异系数:一种最常用的相对差异量,为标准差对平均数的百分比 注题目:变异系数与标准差的区别于联系? 标准差反映了一个次数分布的离散程度,当对同一个特质,使用同一种测量工具进行测量,所测样本水平比较接近时,直接比较标准差的大小即可以知道样本间离散程度的大小;但是当遇到下列情况,则不能直接比较标准差: (1)两个或两个以上的样本所使用的观测工具不同,所测的特质不同; (2)两个或两个以上的样本使用的是同一种观测工具,测量的也是同一种特质,但样本间的水平相差较大; 在第一种情况下,标准差的单位不同,显然不能直接进行比较;第二种情况下,虽然标准差单位相同,但样本的水平不同,通常情况下,平均数的值较大,其标准差的值一般也较大;平均数的值越小,其标准差的值也越小; (四)相对量数 1)百分位数:第P百分位数就是指在其值为P的数值以下,包括分布中全部数据的百分之p,其符号是Pp; 2)百分等级:常模团体中低于该分数的人所占总体的百分比;百分位数的逆运算; 3)标准分数 (1)定义 标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数 离平均数有多远,即表示原始分数在平均数以上或以下几个标准 差的位置。 (2)性质 ①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量 ②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z 分数之和为零 ③原始数据的Z分数的标准差为1 ④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布 (3)优点 ①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较; ②可加性——不同性质的原始数据具有相同的参照点,因此可相加; ③明确性——知道了标准分数,利用标准正态分布表就能知道其百分等级; ④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样。 (4)缺点 ①标准分数过于抽象不易理解; ②在非正态分布下,分布形态不同的分数,仍然不能进行比较,也不能相加求和;