统计(名词解释)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计
第一章绪论
统计学:是研究统计方法和原理,一类是数理统计【以概率论为基础,对统计数据量关系模式加以解释,对统计原理和方法加以数学证明】,一类是应用统计【数理统计的方
法在各个邻域的应用】。
教育统计学:应用数理统计的方法和原理研究教育问题的一门学科。
从具体应用:描述统计:对已获得的数据进行整理概括显现其分布特征的统计
方法
推断统计:根据样本提供的信息,运用概率的理论分析,论证,
在一定可靠程度上对总体分布特征进行推测和估计
其内容包括假设检验和总体参数估计。
基本概念:随机变量:我们把能表示随机现象各个结果的变量称作随机变量。
总体:是我们研究的具有某种共同特性的个体的总和。总体中的每个单位称
作个体
样本:从总体中抽取的作为观察对象的一部分个体。
统计量:样本的数据特征
参数:总体的数据特征
第二章数据统计分类
按数据来源分:点计数据:指计算个数获得的数据
度量数据:指用一定工具或一定测量标准所获得的数据。
按随机变量:间断性随机变量:数据单位是独立的,两个单位之间不能在划分为更细小的单
位
连续性随机变量:取值个数无限。
统计图表:表示间断变量统计图:直条图、圆形图、
表示连续变量统计图:线形图、频数分布图【直方图、多边图、累计频数和累
计百分比】
第三四章集中量差异量【注意每个量的表示】
算数平均数:原始数据计算
频数分布表计算【每一段频数计算组中值,乘以个数求和】
方差标准差:离差平方的算数平均数是方差,开放后为表准差
原始数据的计算,定义式的计算。
中位数:是位于以一定大小顺序排列的一组数据中央位置的数据。
原始数据计算【个数分奇偶】频数计算方式。【大小】
四分位距:第三个四分位数与第一个四分位数的差的一半称之为四分位距
百分位距:两个百分位数之差,通常是90%和10%的差。
众数:理论众数:频数分布曲线最高点对应的横坐标上的一点。
粗略众数:一组数据中频数出现最多的那个数。
皮尔逊经验法、金氏插补法。
平均差:每一个数据和中位数离差的绝对值的算术平均数。
原始数据、频数计算
差异系数:标准差和算术平均数的百分比,【1】可以比较不同单位的差异程度、【2】比较单位相同但平均数差异较大的离散程度、【3】可判断特殊差异情况。
※平均数、众数、中位数三者之间的关系:
第五章概率的概念即分布
后验概率:以随机事件A在大量重复试验中出现的稳定频率值作为随机事件A的概率的估计值。
先验概率:又称古典概率,满足两个条件【1】实验结果有限【2】每一种结果出现的可能性相等。若所有结果总数为n,随机事件A包括着m个可能的结果则A的概率。
二项实验:满足一下实验条件的实验【1】一次试验只有两种结果,即成功与失败。【2】歌词实验相互独立。【3】各次实验中成功的概率相等,失败的概率也相等。
二项分布:用n次方的二项展开式来表达在n次试验中成功的事件出现的次数的概率分布称作二项分布
二项分布通式:
二项分布图:当p=q,不管n有多大,二项分布呈对称形。当n很大时,二项分布接近于正太分布。当p≠q的时候,且n很小,图形呈偏态。但当p q且np≤5二项分布出现向正太接近的趋势。 正太分布:是一种连续型随机变量的概率分布。 正态分布在测验记分应用:【1】将原始数据转化成标准分数、【2】确定录取分数线、【3】确 定等级评定人数、【4】品质评定数量化。 第六章抽样分布和总体平均数推断 抽样分布:某一种统计量的抽样分布 平均数抽样分布:一切可能样本的平均数进行频数分布,就形成一个实验性的平均数抽样分布。 标准误:某种统计量在抽样分布上的标准差称之为标准误。标准误越小,表明样本统计量和总体参数值越接近。 t分布:当总体标准差未知,需要用估计量S来代替,于是平均数标准误也被代替,这时,一切可能样本平均数与总体平均数的离差统计量呈t分布。 自由度:总体参数估计量中变量值独立变化的个数。 总体平均数估计:点估计:用某一样本统计量的值来估计总体参数值称为点估计。 无偏性(无偏估计量)【如果一切可能样本统计量的值与总统 参数值偏差的平均值等于0】有效性【总统参数多个无偏估量, 某种估计量的一切可能样本值发差小者为有效】一致性【样本 容量无限增大,估计量的值能越来越接近他所估计的总统参数 值。】 区间估计:一样本统计量的抽样分布为理论依据,按一定概率要求,由 样本统计量的值估计总统参数值的所在范围。 假设检验:根据一定概率,对总体参数或分布的某一假设做出拒绝或保留的决断,成为假设检验。 零假设:当前样本所属总体与假设总体无区别的假设。 备择假设:当前样本所属总体与假设总体相反的假设。 小概率事件:样本统计量的值在其抽样分布上的概率小于或等于事先规定的水 平,这是就认为小概率事件发生了。 显著性水平:把拒绝零假设的概率称作显著性水平。 两类错误及其控制:第一类错误就是如果样本统计量的总体参数值就是假设的总体参数值,但落入到拒绝区域遭到拒绝,我们就犯了第一类错误。 第二类错误就是保留了属于不真实的零假设。 控制方法:合理安排拒绝区域,双侧假设和单侧假设。 第七章平均数差异性显著性检验 概念:两个总体平均数之差等于0的一切可能样本平均数之差的概率分布。 平均数之差的标准误:就是两个样本平均数差的抽样误差 相关样本:两个样本存在一一对应的关系 独立样本:两个样本内的个体是随机抽取的,不存在一一对应的关系,称之为独立样本。方差齐性检验:对两个总体的方差是否哟显著性差异所进行的检验称为方差齐性检验。 第八章方差分析 方差分析:通过对组间差异和组内差异的比值的分析来推断几个相应平均数差异的显著性,这就是方差分析的逻辑 因素:试验中的自变量,只有一个自变量的实验称为单因素实验,有两个或两个以上的自变量称为多因素。某一个因素的不同情况称作因素的水平,包括量差和质别两 类情况。 完全随机设计:从同一个总体中随机抽取被试,在随机的分入各实验组。用方差分析法对多个独立样本的平均数差异性的显著性检验,称为完全随机设计的方差检验。随机区组设计:为减少被试间个别差异对结果的影响,把从统一整体中抽取的被试按条件相同的原则分成各个组,使每组内的被试尽量保持同质。对歌区组实行多个实 验处理后,用方差分析法对多个相关样本的平均数差异进行显著性检验。第十章卡方检验 卡方检验:对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。 单向表:把实得的点计数据按一种分类标准编制成表 双向表:把点计数据按两种分类标准编制成表 第十一章相关分析。 相关:两个变量不确定不稳定的变化关系称之为相关关系。它与函数关系区别就在于两个变量值不是一一对应的。分为正相关、负相关、零相关。 相关系数:用来描述两个变量之间变化方向及密切程度的数字特征称为相关系数。 积差相关:当两个变量都是正太连续变量,而且两者之间呈线性关系时,表示两个变量之间的相关程度。 等级相关:以等级次序排列或以等级次序表示时的变量之间的相关。 斯皮尔曼等级相关【以等级次序排列或以等级次序表示时,两个相应总体并不一 定呈正态分布,其样本容量也不一定大于30,表示这两个变量之间的相关】 肯德尔系数【当多个变量值以等级次序排列或表示的时候,描述这几个变量之间 的一致性程度 质与量的相关:一个变量为质,另一个变量为量,这两个变量之间的相关。 二列相关:当两个变量都是正太连续变量,其中一个变量被人为的划分为二分变量,表示这两个变量之间的相关 点二列相关:当两个变量,其中一个是正太连续变量,另一个是真正意义上的二分变量。 表示这两个变量之间的相关。