统计学复习资料
《统计学》复习提纲
第一章绪论第一节统计的产生和发展一、统计的产生:源于人类的计数与统计实践活动。
二、统计的发展1、英国的政治算术学派(17世纪)【“有实无名”的统计学】创始人:英国的威廉·配第(政治经济学之父)代表作:《政治算术》——统计学诞生的标志;文中针对英、法、荷兰的国情,利用数字、重量、尺度的方法,并配以朴素的图表(现代统计学广为采用的方法和内容)进行三国国力的比较,但没有使用“统计学”一词。
2、德国的国势学派(又称记述学派)(18世纪)【“有名无实”的统计学】代表人物:康令、阿亨瓦尔康令在大学开设“国势学”课程,以文字技术和比较为主,反映各国的国情国力;阿亨瓦尔继承和发展了康令的思想,并于1749年首次使用“统计学”代替“国势学”,认为统计学是关于各国基本制度的学问,但缺乏数字和内容。
3、数理统计学派(19世纪)代表人物:凯特勒(比利时)(古典统计学的完成者,近代统计学的先驱者)代表作:《社会物理学》——他将概率论引进统计学,完成了统计学和概率论的结合。
第二节统计学的性质和特点一、统计的三个含义:统计工作(过程)、统计资料(成果)和统计学(理论)。
二、统计学的研究对象:大量社会现象(主要是经济现象)的总体数量方面的方法论科学。
三、统计学的特点:数量性、总体性、具体性、社会性、广泛性。
第四节统计学中的几个基本概念一、统计总体与总体单位1、统计总体:是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
统计总体可以分为有限总体和无限总体,总体所包含的单位数有限的比如人口数、企业数,反之比如大海里的鱼资源数。
2、总体单位:是指构成总体的个别单位。
注:总体和总体单位的划分是相对的,它们随着统计研究对象和研究目的变化而相互转化。
二、统计标志与统计指标1、统计标志:用来说明总体单位所具有的属性或特征的名称。
可分为品质标志和数量标志。
品质标志是说明总体单位质的特征,不能用数字来表示的,如性别、籍贯、工种等;数量标志是说明总体单位量的特征,是可用数字来表示的,如年龄、身高、收入等。
统计学复习(含公式)
1、统计学:是收集、汇总和分析统计数据的科学和艺术。
2、统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
3、普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。
4、抽样调查的特点:经济性;时效性高;适应面广;准确性高。
5、调查方案:是指导整个过程的纲领性文件,其内容包括调查目的、调查对象和调查单位、调查项目和调查表等内容。
6、组距分组的几个步骤:一、确定组数二、确定组距三、确定组限和进行次数分配四、绘制统计图五、分析。
)7、为消除组距不同对频数分布的影响,需要计算频数密度,即频数密度=频数/组距,用频数密度才能准确反映频数分布的实际情况.8、以组中值作为代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。
9、描述统计的内容也包括频数分布、但主要是关于集中趋势和离中趋势的描述问题。
10、众数:是一组数据中出现次数最多的变量值。
从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数,记为M.11、众数是一组数据中心位置的一个代表值。
当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,实际上也可以认为有多个众数.12、协方差的大小会受到计量单位和数据均值水平的影响,从而使不同相关总体之间的相关程度缺乏可比性。
13、时间系列:是反映现象随时间的变化而变化的数据系列,也称为时间数列或动态数列。
14、用报告期水平减去基期水平,就等于增长量。
其中,当基期水平为上期水平时,就称为逐期增长量,当基期水平为某个时期的固定发展水平时,就称为累计增长量。
15、报告水平与基期水平之比,称为发展速度。
其中,当基期水平为上期水平时,就称为环比发展速度;当基期水平为某个时期的固定发展水平时,就称为定基发展速度。
16、序时平均数也称为动态平均数,它反映现象在一定时期内发展水平达到的一般水平.由于指标形式分绝对数、相对数和平均数等,所以对其平均的方法存在差异性。
统计学复习资料
1、统计学——是一门收集、整理、实和分析统计数据的科学,其目的使探索数据内在的数量规律。
2、统计学的两个含义指的什么?1当他以名词出现时表示一门科学名称—“统计学“。
2当他以复数名词出现时,表示”统计数据“或”统计资料“。
3、统计学分为哪两大类?其含义是什么??1描述统计——是用图形、表格和概括性的的数字对数据进行描述的统计方法。
2推断统计——是根据样本信息对总体进行估计、假设检验、预测的统计方法。
4、解释总体,变量,样本。
1总体就是我们所要研究的所有单位的总和2变量就是我们重点关注的是总体单位具有哪些特征或属性3样本就是总体的一部分。
5、数据的计量尺度分为哪几种?各有哪些特点?1列名尺度—最粗略的计量程度,2顺序尺度—比列名精确性高一些,3间隔尺度—可以对数据进行精确计量的尺度,4比列尺度—和间隔差别很小,主要在于对“0“的理解不同。
6、直接获取统计数据的方法有哪几种?1普查2抽样调查7、基尼系数反映的是什么问题?当基尼系数超过0.4说明什么?当基尼系数=0 表示收入绝对平均,基尼系数=1表示收入绝对不平均,基尼系数小于0.2表示分配平均,在0.2~0.4之间是比较合适的。
基尼系数为0.4时,被认为是收入分配不公的警戒线,超过0.4就应该采取缩小这一差距。
8、影响加权算数平均数的因素是什么?1组中值2权数3分组的组数。
9、众数、中位数、均值的关系是什么?1对称分布MO=ME=X 2右偏分布MO<ME<X 3左偏分布X<ME<MO。
10、反映现象集中趋势的主要指标有哪些?1众数2中位数3均值。
11、反映现象离散趋势的指标又哪些?1极差2方差3标准差。
12、为什么要计算离散系数而不是标准差系数?因为离散系数是从相对的角度观察变异和离散程度的,在比较相关事物的差异程度时,较之直接比较标准差要好些。
13、按抽样的组织方式如何分类?1简单随即抽样2分层抽样3系统抽样4正群抽样14、什么是参数?参数估计的方法又哪几种?参数——是描述总体数据分布特征的一个常量。
统计学复习资料
一、判断题:1.运用大量观察法,必须对研究对象的所有单位进行观察调查。
()2.一般地,凡是编制数量指标指数,均应以相应的基期质量指标作为同度量因素。
()3.间隔相等间断时点数列序时平均数的计算方法采用简单序时平均法。
()4.分布在各组之内的单位数称频率。
()5.我国的人口普查每10年进行一次,因此,它是一种经常性调查方式。
()6.变量数列中任一组标志值为零,则无法计算调和平均数。
()7.权数的绝对值越大,对算术平均数的影响也就越大。
()8.全距易受极端数值的影响。
()9. 抽样平均误差越大,样本的代表性越大。
()10.相邻两项的累积增长量之差等于相应的逐期增长量。
()11某生产组有5名工人,日产零件数分别为68件.69件.70件.71件.72件,因此说这些是5个数量标志或5个变量。
()12变量按其值是否连续出现,可以分为确定性变量与随机变量。
()13某地区国内生产总值为1000亿万元”是一个要素完整的指标。
14比例相对指标是在分组的基础上计算的。
15 中位数是位置平均数,不受极端数值的影响。
7.权数的绝对值越大,对算术平均数的影响也就越大。
()16时点指标数值大小与时间长短成正比。
()17 抽样极限误差可以小于.大于或等于抽样平均误差。
()18 相对数时间序列求序时平均数时,根据所给数列简单平均即可。
()19 发展水平是计算其他动态分析标志的基础,它只能用总量指标来表示。
()20 编制销售量指数,一般是用报告期价格作同度量因素。
()21抽样平均误差的大小与样本容量的大小成正比例关系。
()22建立指数体系时,首先要分析研究对象与其影响因素之间的内在经济了解。
()23环比速度与定基速度之间存在如下关系式:各环比增长速度的连乘积等于定基增长速度。
()24回归分析中,两个变量是对等关系。
()25在测定相关关系之前,一般在理论分析的基础上,要利用相关表和相关图粗略地判断现象之间的相关程度和相关形态。
()26总指数的平均性是以综合性为基础的,没有综合性就没有平均性。
《统计学》综合复习资料
《统计学》综合复习资料一、单选题1.统计一词的三种涵义是( A )A.统计活动、统计资料、统计学 B.统计调查、统计整理、统计分析C.统计设计、统计分组、统计预测 D.统计方法、统计分析、统计预测2.统计调查按其组织形式分类,可分为( C )A.普查和典型调查 B.重点调查和抽样调查C.统计报表和专门调查 D.经常性调查和一次性调查3.我国编制零售物价指数是采用( C )法来编制的。
A.综合指数 B.平均指标指数C.固定加权算术平均指数D.固定加权调和平均指数4.某商品价格比原先降低5%,销售量增长了5%,则销售额( B )。
A.上升B.下降C.不变D.无法确定5.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( C )。
A.算术平均数 B.调和平均数 C.几何平均数 D.众数6.欲以图形显示两变量X与y的关系,最好创建( D )。
A.直方图 B.圆形图 C.柱形图 D.散点图7.直接反映总体规模大小的指标是( A )。
A.总量指标 B.相对指标 C.平均指标 D.变异指标8.统计调查表可以分为( C )两种形式。
A.单一表和复合表B.简单表和复合表C.单一表和一览表D.简单表和分组表9.大量观察法的数学依据是(C )。
A.贝努里定律B.贝叶斯定理C.大数定律D.中心极限定理10.两变量的线性相关系数为 -1,说明两变量(C )。
A.完全正相关B.不完全相关C.完全负相关D.不存在线性相关关系11.若无季节变动,则季节比率理论上应该(B )。
A.小于1B.等于1C.大于1D.等于012.抽样平均误差的实质是(D )。
A.总体标准差B.样本的标准差C.抽样误差的标准差D.样本平均数的标准差13.某商品价格比上期下降5%,销售额比上期降低了5%,则销售量(C )。
A.上升B.下降C.不变D.无法确定14.几位工人的年龄分别是32岁,35岁,42岁,这几个数字是(C )。
统计学复习提纲
第一章导论1.什么是统计学?统计方法可以分为哪两大类?统计学是收集、分析、表述和解释数据的科学。
统计方法可分为:1。
描述统计是研究数据收集、整理和描述的统计学分支,是用图、表、统计量等方式对已有数据的特征进行描述。
内容包括:搜集数据、整理数据、展示数据、描述性分析。
目的:描述数据特征、找出数据的基本规律.2。
推断统计是研究如何利用样本数据推断总体特征统计学分支,是指利用这种概率关系,由样本统计量推估总体参数。
内容包括:参数估计、假设检验。
目的:对总体特征作出推断。
2.统计数据可分为哪几种类型?不同数据的类型各有什么特点?按计量尺度分:1。
分类数据:对事物进行分类的结果,数据表现为类别,用文字来表述.2。
顺序数据:对事物类别顺序的测度,数据表现为类别,用文字来表述。
3.数值型数据:对事物的精确测度,结果表现为具体的数值.按收集方法分:1。
观测的数据:通过调查或观测而收集到的数据。
2.试验的数据:在试验中控制试验对象而收集到的数据,在没有对事物人为控制的条件下而得到的。
按时间状况分:1.截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况。
2.时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况。
3.总体、样本、参数、统计量、变量的概念。
总体:所研究的全部元素的集合。
样本:从总体中抽取的一部分元素的集合。
构成样本的元素的数目称为样本容量。
参数:用来描述总体特征的概括性数字度量.统计量:用来描述样本特征的概括性数字度量。
变量:说明现象某种特征的概念.4。
变量的类型、特点及应用.类型和特点:1.分类变量的取值只有类别属性之分,无大小。
2.顺序变量的取值除类别属性之外,还有等级、次序的差别。
3.数值变量的取值:数值.应用:分类数据和数值数据都可以计算众数,但数值数据还能计算平均数,前者却不能。
第二章数据的收集1.简述普查和抽样调查的特点。
普查:1.为特定目的专门组织的非经常性全面调查。
统计学复习
第2章统计数据的搜集2.1 数据的来源对使用者,数据来源有两种方式:1 直接来源2 间接来源数据的直接来源(原始数据)通过调查方法获得的数据称为调查数据,而通过实验方法得到的数据称为实验数据. (1)调查方法常用于社会科学(通常取自有限总体)▽普查▽抽样调查(2)实验数据常用于自然科学, 目前也被逐渐运用到社会科学中.2.2 调查数据2.2.1 概率抽样与非概率抽样1 概率抽样(probability sampling)概率抽样也称随机抽样,主要有如下几个特点:(1)按一定的概率抽取样本,即抽取样本时使每个单位都有一定的机会被抽中.(2)每个单位被抽中的概率已知(或是可以计算出来的).(3)按样本对总体目标量的估计,估计量与每个样本单位被抽中的概率有关.1 概率抽样(probability sampling)抽取样本时是依据随机原则,主要方式有:(1)简单随机抽样(2)分层抽样(3)整群样本(4)系统抽样(5)多阶段抽样2 非概率抽样(non-probability sampling)抽取样本时并不是依据随机原则,而是根据研究目的和对数据的要求,采用某种方式从总体中选择部分单位进行调查.主要方式有:(1)方便抽样(2)判断抽样(3)自愿样本(4)滚雪球抽样(5)配额抽样3 概率抽样与非概率抽样的比较(1)概率抽样▽按随机原则抽选样本▽可以根据调查的结果推断总体(2)非概率抽样▽不按随机原则抽选样本▽不能根据调查的结果推断总体第二节统计数据的类型第 3 章数据的图表展示3.1 数据的预处理▽数据的审核—检查数据中的错误▽数据的筛选—找出符合条件的数据▽数据排序—升序和降序▽数据透视表—提取有用的信息图3-31数据的类型与图示方法第四章数据的概括性度量统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平均数;二是分布的离中趋势,反映各数据远离其中心值的程度,如标准差;三是分布的偏态和峰度,反映数据分布的形状。
统计学(复习)
第1章统计和统计数据1统计学的定义:是收集、处理、分析、解释数据并从数据中得出结论的科学描述统计与推断统计的含义、内容、目的.描述统计: 是研究数据收集,处理和描述的统计学方法。
其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合,概括与分析,得出所关心的数据特征。
推断统计:是研究如何利用样本数据来推断总体特征的统计学方法,内容包括两大类:参数估计: 是利用样本信息推断所关心的总体特征.假设体验:是利用样本信息判断对总体的某个假设是否成立.2、变量与数据:不同数据类型的含义,会判断已有数据的类型.变量:它们的特点是从一次观察到下一次观察会出现不同结果。
Ex:企业销售额,上涨股票的家数, 生活费支出,投掷一枚骰子观察其出现的点数数据:把观察到的结果记录下来。
总体:包含所研究的全部个体(数据)的集合样本: 从总体中抽取的一部分元素的集合样本量: 构成样本的元素的数目定量变量或数值变量:定量变量的观察结果称为定量数据或数值型数据。
可以用阿拉伯数据来记录其观察结果 .如“企业销售额"、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”定性变量:分类变量和顺序变量统称为定性变量分类变量:表现为不同的类别.如“性别”、“企业所属的行业”、“学生所在的学院”等.分类变量的观察结果就是分类数据顺序变量或有序分类变量:具有一定顺序的类别变量。
如考试成绩按等级,一个人对事物的态度。
顺序变量的观察结果就是顺序数据或有序分类数据离散型变量:只能取有限个值得随机变量连续型变量:可以取一个或多个区间中任何值得随机变量3、获得数据的概率抽样方法有哪些?根据一个已知的概率来抽取样本单位,也称随机抽样-简单随机抽样:从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中。
抽取元素的具体方法有重复抽样是抽取一个个体记录下数据后,再把这个个体放回到原来的总体中参加下一次抽选。
《统计学》复习资料
《统计学》复习资料(一)一单选题1. 下面的哪一个图形最适合描述结构性问题( )A. 条形图B. 饼图C. 对比条形图D. 直方图2. 下列描述正确的是A. 点估计比区间估计需要更大的样本容量B. 点估计相对于区间估计更加准确C. 点估计无法给出参数估计值的置信度和误差大小D. 区间估计无法给出参数估计值的置信度和误差大小3. 假设检验中所犯的错误有两种类型,β错误是指()A. 弃真错误,即拒绝正确的原假设。
B. 取伪错误,即接受一个错误的原假设。
C. 弃真错误,即接受一个错误的原假设。
D. 取伪错误,即拒绝正确的原假设。
4. 同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为 ( )。
A. 0.125B. 0.25C. 0.375D. 0.55. 根据概率的统计定义,可用以近似代替某一事件的概率的是 ( )。
A. 大量重复试验中该随机事件出现的次数占试验总次数的比重B. 该随机事件包含的基本事件数占样本空间中基本事件总数的比重C. 大量重复随机试验中该随机事件出现的次数D. 专家估计该随机事件出现的可能性大小6. 为了反映商品价格与需求之间的关系,在统计中应采用( )A. 划分经济类型的分组B. 说明现象结构的分组C. 分析现象间依存关系的分组D. 上述都不正确7. 1.指出下面的数据哪一个属于分类数据( )A. A 年龄B. B 工资C. C 汽车产量D. D 购买商品的支付方式(现金、信用卡、支票)8. 在成数估计中,样本容量的取得通常与总体成数有关,但总体成熟未知,通常A. 取成数为0.5B. 取成数为0C. 取成数的标准差最小D. 取抽样误差最小9. 样本或总体中各不同类别数值之间的比值称为( )A. 频率B. 频数C. 比例D. 比率10. 调查项目( )A. 是依附于调查单位的基本标志B. 与填报单位是一致的C. 与调查单位是一致的D. 是依附于调查对象的基本指标11. 要反映我国工业企业的整体业绩水平,总体单位是:A. 我国每一家工业企业B. 我国所有工业企业C. 我国工业企业总数D. 我国工业企业的利润总额12. 一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
统计学复习资料
第一章1.统计:包含三方面的含义,统计工作(或统计活动)、统计资料和统计学。
2.统计工作:是指为管理需要或科学研究需要,而对社会经济现象的数据进行搜集、整理和分析的一系列统计活动过程。
3.统计活动:一般包括统计设计、统计调查、统计整理、统计分析等这几个阶段依次进行。
4.统计资料:统计资料是指统计工作过程中所产生的统计数据、统计报表、统计图表、统计分析报告(文)以及与之相联系的其他资料的总称。
5.统计学:是指系统阐述统计实践活动基本原理和研究方法的理论。
它是一门研究如何搜集、整理和分析统计资料的理论和方法论的科学。
6.统计学特点:1)研究客观事物总体数量的方法论2)在大量观察的基础上,通过归纳推理获得总体数量方面的综合认识3)是一门多学科性的科学7.统计总体:1)概念:客观存在的,具有同一性质的多个个体,就是统计总体。
统计总体简称总体,与样本相对应。
统计总体分为有限总体与无限总体。
有限总体是指总体中包含的单位数是有限的。
无限总体是指总体中包含的单位数是无限的。
2)基本特征:①大量性;②局限性;③变异性8.总体单位:构成统计总体的每个基本单位或元素称为总体单位,总体单位简称单位或个体,它是各项统计特征的原始承担者。
9.标志:标志是总体单位特征的名称。
分品质标志与数量标志。
品质标志:表示事物的质的特征,是不能用数值表示的,一般用文字来表示;数量标志:表示事物的量的特征,即变量,是可以用数值表示的。
品质标志的具体表现是属性,数量标志的具体表现是数值。
数量标志的具体表现,也称为数量标志值,或标志值。
10.指标与指标体系1)定义:统计指标是说明总体数量特征的概念和具体数值,简称指标,用来反映事物质的规定性与量的确定性。
它是根据总体单位某一标志值汇总或综合而成,是用来说明总体某一数量特征的,或质的特征。
2)统计指标构成五要素:指标名称、计量单位、指标数值、时间、地点。
11.标志与指标的关系:标志与指标既有区别,又有联系。
(完整版)统计学总复习提纲
(完整版)统计学总复习提纲统计学复习提纲第⼀章:绪论1、1)统计的含义:统计⼀词有统计⼯作、统计资料、统计科学三种含义,但最基本的还是统计⼯作。
没有统计⼯作就不会有统计资料,没有丰富的统计实践经验就不会产⽣统计科学。
2)统计的研究对象:统计学的研究对象是统计⼯作的规律,即搜集、整理和分析统计数据的⽅法,是⼀门⽅法论科学。
3)统计的特点:数量性、具体性、综合性2、统计学的基本概念1)总体:总体是指在某种共性的基础上由许多个别事物结合起来的整体。
总体有三⽅⾯特征:同质性、⼤量性、差异性总体可分为有限总体和⽆限总体2)总体单位:构成总体的个别事物叫总体单位。
总体和总体单位是根据统计研究的⽬的来确定的。
3)标志:标志是指说明总体单位特征的名称。
标志可分为数量标志(⽤数字回答问题)和品质标志(⽤⽂字回答问题)。
标志还可分为不变标志和可变标志。
不变标志:所有总体单位共同具有的特征。
它是构成总体的必要条件和确定总体范围的标准。
可变标志:在总体各单位之间必然存在差异的标志。
4)变量:可变标志中既有品质标志也有数量标志。
可变的数量标志就叫变量。
变量的具体数值叫变量值。
凡变量值只能以整数出现的变量,叫离散变量。
凡变量值可作⽆限分割的变量,叫连续变量。
5)指标与指标体系:指标:说明总体数量特征的概念。
指标体系:以共同的研究⽬的为纽带⽽相互联系的⼀系列统计指标。
6)指标与标志的区别与联系区别有⼆:第⼀,指标说明总体的特征;⽽标志说明总体单位的特征。
第⼆,指标只反映总体的数量特征,所有指标都要⽤数字来回答;标志则既有反映总体单位的数量特征(⽤数字回答),也有反映总体单位的品质特征(⽤⽂字回答)。
⼆者联系:主要表现:许多标志的数值都是由总体各单位的数量标志的标志值汇总⽽得来的。
品质标志虽然本⾝不具有数值,但有些指标是按品质标志分组分组计算得出。
由于总体和总体单位可随统计研究的⽬的⽽易位,故指标和数量标志在⼀定的条件下可以变换。
统计学(版)期末复习资料
第七章 分类变量的推断。 名词解释 1. χ2 拟合优度检验:利用 χ2 停机梁来判断某个分类变量个类别的观察频数与某一理论频数或期望 频数是否一直的检验方法。文档来自于网络搜索 2.列联表:有两个或两个以上分类变量交叉分类的频数分布表。 3. χ2 独立性检验:利用 χ2 统计量来判断两个分类变量是否独立的检验方法。
3/7
期望概率,而独立性检验中,原假设则假设两个变量之间相互独立。最后,计算期望频数时,在拟合优 度检验中利用原假设中的期望概率,用观察频数乘以期望概率,直接得到期望频数,如果独立性检验, 则假设两个变量的分类是独立的,因而两个水平的联合概率是两个单独的概率的乘积。文档来自于网络搜
统计学复习资料
统计学复习资料(简答题)1、简述统计数据的类型及预处理。
答:1)按照所采用的不同的计量尺,统计数据分为分类数据、顺序数据和数值型数据。
2)按照统计数据的收集方法,统计数据可分为观测数据和实验数据3)按照被描述的现象和时间关系,统计数据可分为截面数据和时间序列数据。
2、统计数据的具体收集方法有哪些答:1)询问调查:具体包括方为调查、邮寄调查、电话调查、电脑辅助调查、座谈会和个别深访调查2)观察与实验:具体包括观察法和实验法3、从应用的数据类型、画图及作用三方面谈谈你对箱线图的认识。
答;箱线图由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而形成的,反应原始数据分布的图形。
通过箱线图,不仅可以反应出一组数据分布的特征,还可以进行多组数据分布特征的比较。
箱线图由一个箱子和两条线组成,他用中位数来描述一组数据的集中趋势,有两个四分位数形成的箱子和两个极值与箱子相连的实线分别描述数据的离散程度。
4、简述饼图和环形图的区别。
答:环形图与饼图相似,但又有区别。
环形图有一个空洞,样本或总体中的每一部分数据用环中的一段表示,饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体和样本的数据系列,每一个总体或样本的数据系列为一个环。
因此,环形图可显示多个总体或样本各部分所占的相应比例,从而利于进行比较研究。
5、平均数、众数、中位数在应用上有哪些区别?答:平均数、中位数和众数是描述数据集中趋势的三个主要统计量。
平均数在实践中较多用,主要缺点是易受极端值得影响,对于偏态分布的数据,平均数的代表性较差,中位数和众数提供的信息不像平均数那样多,但他们也有优点,比如不受极端值得影响,就有统计上的稳定性,当数据为偏态分布,可以考虑选择中位数或者是众数,这是他们代表性要比平均数好。
6、简述时间序列的构成要素。
答:时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。
统计学复习资料
考試題型:單選題10题/2分多選題5题/2分填空題10空/0.5分名詞解釋5个/3分簡答題1个/5分計算分析題3个/10+15+15考试时间:1.18統計學09:00~11:00第一章绪论名词解释统计学原理:阐述统计学的基本理论和方法,即阐述关于统计调查、统计整理、统计分析的基本理论和方法。
总体:指在某种共性的基础上由许多个别事物结合起来的整体。
总体单位:构成总体的个别事物。
标志:指说明总体单位特征的名称。
变异:总体单位间品质和数量上的差异。
变量:可变的数量标志。
指标:是说明总体数量特征的概念。
概念理解统计学的学派:记述学派、政治算术学派、图表学派、数理学派、社会学派。
统计的特点:❤数量性。
统计最基本的特点就是以数字为语言,用数字说话。
具体来说,是用规模、水平、速度、结构和比例关系,去描述和分析客观事物的数量表现、数量关系和数量变化,揭示事物的本质,反映事物发展的规律,推断事物发展的前景。
❤具体性。
统计所研究的量不是抽象的量,而是与客观事物的质密切相关的量,是体现事物相互关系和发展的变化的量,具有明显的时空特点和事物属性的特点。
统计不能离开事物的质去研究事物的量;研究事物的量,目的也在于认识事物的质及其发展变化的规律。
统计不研究抽象的量,也没有自我的目的,不应当为统计而统计,更不应该搞数字游戏。
❤综合性。
作为认识武器的统计,是从总体上研究客观事物的。
它虽然也是研究个体,但只是为了研究综合个体来认识总体。
不与总体密切联系的量,不具有体现事物运动规律的重复性和稳定性,不是统计研究的量。
统计学研究的对象:统计工作的规律性,即搜集、整理和分析统计数据的方法。
总体的特征:①同质性。
构成总体的各个单位必须具有某一方面的共性,这个共性是我们确定总体范围的标准②大量性。
总体是由许多单位所组成的,而不是只有个别单位。
③差异性。
总体单位之间,除了必须在某一方面有共性之外,在其他方面必然存在差异。
第二章统计调查概念理解统计调查的基本原则:要实事求是,如实反映情况(准确性原则)要及时反映,及时预报(及时性原则)要数字与情况相结合(完整性原则)统计调查的组织形式(给出一个例子,要懂得判断是用了哪种调查方法)调查误差的总类:※代表性误差(一部分推断总体时必然存在的误差,影响因素包括样本的大小、总体的差异性)※工作误差(由于调查工作中的失误造成的误差,包括抽样框误差、回答误差、调查员误差等)产生调查误差的原因◎因调查方案不妥而产生的误差◎因调查过程中记录不准和转抄有误而产生的记录误差◎因计量器具不准,计量单位折算和数据汇总有误而产生的计算误差◎因调查者故意弄虚作假而产生的立意误差名词解释调查误差:指调查所得的同居数据与调查对象实际数量之间的差异。
统计学复习资料
统计学 (统计学的应用领域(工商管理方面)1.企业发展战略,2.产品质量管理,3市场研究,4.财务分析,5.经济预测,6.人力资源管理)主要术语概念(选择判断) 1. 总体:包含所研究的全部个体(数据)的集合。
2. 样本:从总体中抽取的一部分元素的集合。
3. 参数:用来描述总体特征的概括性数字度量。
4. 统计量:用来描述样本特征的概括性数字度量。
5. 变量:说明现象某种特征的概念。
6. 简单随机抽样:也称纯随机抽样,它是从含有N 个元素的总体中,抽取n 个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
7. 分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
8. 系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取n 个元素形成一个样本。
9.整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随后再对抽中的各个群中所包含的所有元素进行观察。
10. 估计量:用来估计总体参数的统计量的名称,用符号θˆ表示。
11. 估计值:用来估计总体参数时计算出来的估计量的具体数值。
12. 点估计:用样本统计量θˆ的某个取值直接作为总体参数θ的估计值。
13. 区间估计:在点估计的基础上,给出总体参数估计的一个范围。
14. 置信区间:由样本统计量所构造的总体参数的估计区间。
15. 置信水平:也称为置信系数,它是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比率。
16. 假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
17. 单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验。
18. 拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。
《统计学》复习资料精选全文完整版
可编辑修改精选全文完整版《统计学》复习资料一、单项选择题1.对某城市工业企业未安装设备进行普查,则个体是( )。
A.工业企业全部未安装设备B.工业企业每一台未安装设备C.每个工业企业的未安装设备D.每一个工业企业2.工业企业的设备台数、产品产值是( )。
A.连续变量B.离散变量C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量3.调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于( )。
A.普查B.重点调查C.典型调查D.抽样调查4.统计分组的结果表现为()A.组内的差异性和组间的同质性B.组内的同质性和组间的差异性C.组内的差异性和组间的差异性D.组内的同质性和组间的同质性5.对百货商店工作人员进行普查,调查对象是()A.所有的百货商店B.每一个百货商店C.各百货商店的全体工作人员D.每一位工作人员6.对一批商品进行质量检验,最适宜采用的方法是( )。
A.全面调查B.抽样调查C.典型调查D.重点调查7.在分组时,凡遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是( )。
A.将此值归入上限所在组B.将此值归入下限所在组C.此值归入两组均可D.另立一组8.在总量指标中,其数值受时期长短影响的指标是()A.实物指标B.价值指标C.时期指标D.时点指标9.计划规定单位产品成本应比上年降低5%,实际降低了3%,则单位产品成本计划完成程度为( ) A.97.94% B.8% C.2% D.102.11%10.反映社会经济现象发展总规模、总水平的综合指标是( )。
A.质量指标B.总量指标C.相对指标D.平均指标11.采用加权算术平均计算时,当各组的权数都增加1倍时,平均数( ) A.不变 B.增加1倍C.是原来的一半D.无法判断12.我国人口中,男女人口的性别比为 106:100,这是( )。
A.比例相对指标B.比较相对指标C.强度相对指标D.平均指标 13.在出生婴儿中,男婴比重53%,女婴比重47%,这两个指标是( ) A.比例相对数 B.强度相对数 C.结构相对数D.比较相对数14.序时平均数中的“首尾折半法”适用于计算( ) A.时期数列的资料B.间隔相等的间断的时点数列的资料C.间隔不等的时点数列的资料D.由两个时期数列构成的相对数动态数列资料15.动态数列中的发展水平( )A.只能是总量指标B.只能是相对指标C.只能是平均指标D.上述三种指标均可以16.已知各环比增长速度分别为5%、8%、6%和10%,则相应的定基增长速度计算方法() A. 105%×108%×106%×110%B.(105%×108%×106%×110%)-100%C.(5%×8%×6%×10%)-100%D.5%+8%+6%+10%17.编制数量指标综合指数时,其同度量因素最好固定在( ) A.报告期 B.计划期 C.基期D.任一时期18.按综合指数变形的要求,采用加权调和平均数指数形式编制质量指标总指数时,其权数应该是( )A.11pq B.01p q C.10p q D.00p q19.设p 为商品价格,q 为销售量,则指数∑∑010qp qp 的实际意义是综合反映( )A.商品销售额的变动程度B.商品价格变动对销售额的影响程度C.商品销售量变动对销售额的影响程度D.商品价格和销售量变动对销售额的影响程度20.某企业的产值,2013年比2012年增长21%,其原因是() A.产品价格上升9%,产量增长了12% B.产品价格上升10%,产量增长了11% C.产品价格上升10.5%,产量增长了10.5% D.产品价格上升了10%,产量增长了10%21.某省教育主管部门要了解所属高校教学设备的使用状况,则统计研究的总体单位是() A.该省每一所高校B.该省全部高校的全部设备C.该省每一所高校的每一台设备D.该省每一所高校的每一台教学设备22.次数分布中的频数愈大,该组的标志值对总体平均水平所起的作用() A.愈大B.愈小C.可能大,也可能小D.无法确定23.在同一变量数列中,组距的大小与组数的多少之间的关系是() A.成正比 B.成反比 C.不确定D.无关24.下列关于标志变异指标的说法正确的是() A.反映现象总体的一般水平 B.反映现象总体的集中程度C.反映现象总体的联系程度D.反映现象总体各单位标志值分布的差异程度25.是非标志的标准差为() A.1-p B.pq C.)p 1(p -D.p (1-p)26.定基发展速度等于() A.环比发展速度之和 B.环比发展速度之积 C.环比增长速度之和 D.环比增长速度之积 27.1011q p q p ∑-∑表明() A.由于销售量变化对销售额的影响 B.由于价格变化对销售量的影响 C.由于价格变化对销售额的影响D.由于销售量变化对价格的影响 28.编制数量指标综合指数的一般原则是() A.采用基期的数量指标作为同度量因素 B.采用基期的质量指标作为同度量因素C.采用报告期的数量指标作为同度量因素D.采用报告期的质量指标作为同度量因素29.若两数列平均水平不同,在比较两数列离散程度时,应采用()A.全距B.平均差C.标准差D.标准差系数30.累计增长量等于()A.报告期水平与基期水平之差B.报告期水平与前一期水平之差C.报告期水平与某一固定基期水平之差D.逐期增长量之差31.工业企业的设备台数和利润额( )A.均是连续型变量B.均是离散型变量C.前者是连续型变量,后者是离散型变量D.前者是离散型变量,后者是连续型变量32.下列属于全面调查的是( )A.对一批产品质量进行抽检B.对工业设备的普查C.对某市工业企业进行典型调查D.调查几大彩电厂商,借此了解全国彩电的生产情况33.统计分组是根据统计研究的目的和任务,将总体按照一个或几个分组标志分成( )A.性质相同的若干部分B.性质不同的若干部分C.数量相同的若干部分D.数量不同的若干部分34.在出生婴儿中,男婴比重53%,女婴比重47%,这两个指标是( )A.比例相对数B.强度相对数C.结构相对数D.比较相对数35.在下列平均数中,不.受.极端数值影响的是( )A.中位数B.调和平均数C.几何平均数D.算术平均数36.增长速度的计算公式是( )A.增长速度=增长量/报告期水平B.增长速度=增长量/基期水平C.增长速度=增长量/平均水平D.增长速度=增长量/最末水平37.根据个体价格指数和报告期销售额计算的价格总指数是( )A.固定构成指数B.可变构成指数C.加权调和平均指数D.加权算术平均指数38.抽样调查应遵循的基本原则是( ) A.随机原则B.准确性原则C.系统原则D.及时性原则39.统计指数按其所反映的指标性质不同可分为( ) A.个体指数和总指数 B.数量指标指数和质量指标指数 C.综合指数和平均数指数 D.算术平均数指数和调和平均数指数40.某企业2003年比2002年产量增长了10%,产值增长了20%,则产品的价格提高了( ) A.10% B.30% C.100% D.9.09% 二、多项选择题1. 我国统计调查的方法有( )A.统计报表B.普查C.抽样调查D.重点调查E.典型调查 2.时期指标的特点有( )A.只能间断计数B.数值大小与时期长短有关C.具有可加性D.不具有可加性E.数值大小与间隔长短无关 3.已知各时期的环比发展速度,便能计算出()A.平均发展速度B.平均增长速度C.平均增长量D.平均发展水平E.定基发展速度4.对某商店某时期商品销售额变动情况分析,其指数体系包括 ( ) A.销售量指数 B.销售价格指数 C.总平均价格指数 D.销售额指数 E.个体指数5.受两极端值影响的平均数有() A.算术平均数 B.调和平均数C.几何平均数D.众数E.中位数 6.加权算术平均数的数学性质是( ) A.0)X X (=-∑B.)X X (-∑f=0C.)X X (-∑为最小D.2)X X (-∑为最小E.2)X X (-∑f 为最小7.关于趋势直线方程,bt a yˆt +=下列表述正确的有( ) A.a 是t 等于零时的趋势值 B.b 是趋势线在y 轴上的截距 C.b 是趋势线的斜率D.b表示时间t变动一个单位时,趋势值t yˆ平均变动的数量E.当b前面是负号时,说明y t与t是负相关8.常用的统计调查方法有()A.普查B.抽样调查C.统计报表D.典型调查E.重点调查9.用综合指数形式计算的价格总指数,所能够反映的是()A.价格的总体变动情况B.销售额的总体变动情况C.销售量的总体变动情况D.价格水平固定时的销售额变动情况E.销售量水平固定时的销售额变动情况10.时期数列的特点是()A.指标数值具有可加性B.指标数值不能直接相加C.指标数值通过连续登记加总取得D.指标数值只能间断计量E.指标数值的大小与时间长短有直接关系三、简答题1.简述统计的三种含义。
统计复习 知识点整理
统计学期末总复习(知识点整理)第一、二、三章☐1、P3:统计的含义统计工作、统计资料、统计学三者互相结合、密切联系形成的有机整体。
☐2、P6:统计工作过程(统计设计、统计调查、统计整理、统计分析)☐3、P7:总体与总体单位(定义、关系)/ 总体:由客观存在的、在同一性质基础上结合起来的许多个别单位所形成的集合。
总体单位:指构成总体的个体即个别单位。
总体与总体单位的相互关系:1)总体与总体单位是集合与元素的关系(同质性) 。
2)随着研究目的的不同, 总体与总体单位可以互相转化。
如:研究一个企业的职工情况,则企业是总体,职工是单位,若研究一个城市的企业规模时,则该市所有企业是总体,企业又成为总体单位。
☐4、P8:标志与指标(标志的定义和分类;指标的定义和分类;)统计标志定义:用来说明总体单位特征的名称。
如:职工性别、工资水平、所有制性质、职工人数等。
分类: 品质标志(表示总体单位质的特征,用文字表示)数量标志(表示总体单位单位数量的特征,用数值表示。
)统计指标定义:是反映社会经济现象总体数量特征的概念和具体数值。
分类:按说明的总体内容不同:数量指标、质量指标按对比关系不同:总量指标、相对指标、平均指标按时间状况不同:时点指标、时期指标按计量单位不同:实物指标、价值指标☐5、P10:变量(变量与变量值的定义;分类:离散型和连续型)变异: 反映组成总体的各单位不同的具体表现。
变异分品质变异和数量变异。
变量值: 变量的具体取值。
变量定义:一般在数量上的变异。
分类:①连续型变量:在整数间可插入小数的变量。
如:工业总产值、身高等。
②离散型变量:变量值只能表现为整数的变量。
如工厂数、工人数等。
☐6、P18:统计调查方案设计(主体部分包括的六部分内容;调查对象、调查单位、填报单位、调查时间、调查期限等概念的理解)六部分内容:调查目的和任务;调查对象和调查单位;调查项目;调查时间和调查期限;调查的组织实施计划。
调查对象:指总体范围。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章统计学与统计数据一.统计工作流程:①统计设计(主要内容是指标设计),②统计调查(获得原始数据),③统计整理(主要内容是统计分组),④统计分析(主要内容是统计分析报告)。
统计学:定义:统计学是收集、整理、分析和解释统计数据的方法论和科学。
分类:①描述统计学②推断统计学③理论统计学④应用统计学二.总体:研究对象的全体(“对象”通常指特征指标),记为X。
样本:从总体X中随机抽取n个个体(X1,X2,…,Xn), n 为样本容量.关系:样本就是由总体中抽出部分个体组成的集合,构成样本的个体的数目称为样本容量,也就是样本大小。
三.1.参数:总体的某种特征值。
如总体平均数,总体方差。
2.统计量:样本(X1 , X2 , … , Xn)的不含任何未知参数的函数g(X1 , X2 , … , Xn).如样本平均数,样本标准差。
四.标志定义用来说明总体中各个个体普遍具有的属性或特征。
分类:品质标志,数量标志指标定义:是反映总体数量特征的概念及其数值。
分类:数量指标,质量指标。
五.统计数据的类型:1.依据计量尺度划分:分类数据,顺序数据,数值型数据。
2.依据收集方法划分:观察数据,实验数据。
3.依据对象与时间划分:截面数据,时间序列数据。
第2章统计数据的收集整理与显示一、统计数据的收集1、常用的统计调查方法①普查:是专门组织的一般用来调查属于一定时点上社会经济现象数量的全面调查。
优点:全面、系统。
缺点:只限于有限总体、工作量大、时间性强。
②重点调查:只在对象中选择一部分重点单位(比较重大)进行调查以了解总体情况的一种非全面调查。
优点:省时、省力、不带主观性。
③典型调查:在对研究对象进行全面分析的基础上,有意识地选择部分有代表性单位(人为选择的典型单位)进行调查。
优点:调查范围小、省时省力、具体深入。
缺点:具有主观性。
④抽样调查:是从调查对象中随机抽取一部分单位作为样本进行调查的一种非全面调查优点:经济灵活、时效性强、适应面广和准确性高⑤统计报表:是按照国家有关法规的规定,自上而下地逐级提供统计数据的一种调查方式。
特点:是由政府部门组织、采用统一的表格、自上而下布置、自下而上报告。
统计报表是经常性的全面调查。
2、问卷的基本结构:问卷是调查者根据调查目的和要求所设计的,一般由开头部分、甄别部分、主体部分和背景部分组成。
3、设立问卷问题的注意事项:①提问的内容尽可能短。
②问题设计的用词要准确,用语要含义明确。
4、问卷设计的基本原则①主题鲜明目的明确,重点突出,没有可有可无的问题。
②结构合理,先封闭后开放,先易后难。
封闭性问题:事先设计好答案。
开放性问题:自由回答。
③适当控制回答时间(尽量不超过30分钟)④便于计算机处理易于编码、录入、汇总和数据出表5、统计数据的误差来源:登记性误差和代表性误差。
二、统计数据的整理1、统计数据整理的中心任务:分组和编制频数分布表。
2、统计数据分组:①按品质标志分组品质型数据:主要是做分类整理。
②按数量标志分组数值型数据:主要是按照数值进行分组。
3、品质标志的分组方法:按品质标志分组就是按事物的品质特征进行分组。
由于品质数据是用文字来表现的,每种表现即为一种类别,因此对品质型数据主要是做分类整理。
4、单项式分组条件:只适于离散变量且变量值较少的情况等距式分组条件:适用于变量值的变动比较均匀5、等距分组的步骤和组中值的计算公式等距分组的基本步骤:①数据排序②分组数目的确定,使每组所包含的数据个数,平均不少于4个或5个,或采用斯特吉斯经验公式,即k=1+3.322lgN(k为组数;N为总体中的个体数。
)③组距的确定,即组距=(最大值-最小值)÷组数。
★④组限的确定,(1)第一组的下限应略低于最小变量值,最后一组的上限应高于最大变量值。
(2)对于离散型变量,相邻组的上下限可以不重叠;如:2-4,5-6,7-8,对于连续型变量,相邻两组的上下限应重叠,用“上限不在内”原则解决不重问题(左闭右开)如:[2,4)[4,6)[6,8)(3)开口组:当变量值变动范围较大时,最小组为“……以下”,或最大组为“……以上”。
如:2以下,[2,4),[4,6),[6,8),8以上组中值的确定:组中值=(上限+下限)÷2开口组的组中值=下限+邻组组距/2(缺上限)=上限-邻组组距/2(缺下限)6.频数=分布在各组内的数据个数. 频率=各组频数/全部频数之和频数分布表:将频数分布用表格的形式表现出来。
频数分布:①品质频数分布:按品质标志分组。
②变量频数分布:按数量标志分组(a单项式频数分布:每一组只有一个值。
b组距式频数分布:按组距式分组)累计频数:频数逐级累加。
累计频率或百分比:频率逐级累加。
累计频数(率)方法:向上累加:变量值从小到大;向下累加:变量值从大到小。
三、统计表与统计图1、统计表的一般结构:统计表的结构一般由表头、行标题、列标题、数字资料组成。
2、从内容上看,统计表的构成:包括主词和宾词两个部分。
主词就是统计表要说明的总体及其各组成部分,宾词是用来说明总统的各种统计指标。
3、统计表的设计原则:(1) 表头设计要明确地表达其内容。
(2) 左右两边通常不封口,列标题之间通常用竖线分开,而行标题之间通常不用横线分开。
(3) 应注明数字资料的计量单位。
(4) 数字应对准位数。
4、常用的统计图有哪些:条形图,饼形图,直方图(单式直方图、复式直方图),线形图第3章统计数据的特征描述§3.1 集中趋势的描述:平均数/众数/中位数/分位数/各测定指标之间的关系§3.2 离散程度的描述:极差和四分位差/方差和标准差/变异系数和异众比率1.算术平均数1) 简单算术平均数:全部数据的算术平均适用条件:未经分组整理的原始数据资料。
公式=2) 加权算术平均数:各组标志值与各组频数相乘的总和除以各组频数之和。
适用:已经分组整理并编制出频数分布的数据资料。
公式=2.调和平均数1)简单调和平均数(算数平均数的变形):各观测值倒数的算术平均数的倒数适用:未分组资料且各标志值对应的标志总量相等公式=2) 加权调和平均数P64适用条件:分组资料且各标志值对应的标志总量不等公式=二、众数(未分组)适用条件:分类数据、顺序数据以及数值型数据。
三、中位数(未分组)适用条件:顺序数据和数值型数据四、分位数(未分组)P71,72五、极差和四分位差(未分组)1、极差R:一组数据的最大值与最小值之差。
未分组或单项式分组数据: R=max(xi)-min(xi) 优点:计算简便缺点:易受极端值的影响2、四分位差: 注:反映中间50%数据的离散程度,不受极端值影响六、方差和标准差(未分组)七、变异系数和异众比率(未分组)P791、变异系数:是一组数据的标准差与其相应的平均数之比,是测度数据离散程度的相对指标。
系数越大,离散程度越大。
公式=2、异众比率:是一组数据的非众数的频数与全部数据个数的比率,是测度数据离散程度的相对指标。
越接近0,众数的代表性越好;越接近1,代表性越差。
公式=八、偏度和峰度1.偏度:一组数据分布的偏斜方向和程度2.峰度:一组数据分布的陡缓程度,它是与标准正态分布相比较而言的。
一、两类判断错误的定义和关系1. 第Ⅰ类错误(弃真错误):原假设为真时拒绝原假设,第Ⅰ类错误的概率记为α,被称为显著性水平2.第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为β关系:α和β的关系就像翘翘板,α小β就大,α大β就小,不能同时减少两类错误二、P值和显著性水平α的含义1.显著性水平α是一个概率值,是人们事先指定的犯第I类错误的概率的最大允许值2.P值:检验统计量的p值为t统计值“外侧”概率的2倍。
即检验统计量的p值=2p(T>t),称检验统计量的p值为统计值的显著性概率。
三、根据实际建立假设(单边、双边)P143 P146五、如何用P值进行决策利用P 值进行决策1)双侧检验:若p 值≥α, 不能拒绝Ho;若p 值< α, 拒绝Ho 。
2)单侧检验:若p/2 值>α, 不能拒绝Ho ;若p /2值< α, 拒绝Ho。
六、均值的t检验(包括单样本、独立样本、配对样本)、方差的检验的条件和步骤,(重点会用SPSS软件处理并熟悉输出结果解读)一、SPSS的中文全称:社会科学统计程序二、SPSS数据编辑窗口左下角两个视区:左下方是窗口切换标签区,包含Data View和Variable View 两个标签。
Data View指数据视区,显示具体的数据内容,可以输入编辑数据;Variable View指变量视区,显示数据文件中变量的定义,包括变量的名称、类型、宽度、小数点位数等。
三、定义变量包括: Name变量名称,Type变量类型,Width数据或字符串的宽度,Decimals小数位数,Label变量标签,Values变量值标签,Missing缺失值,Columns显示数据的宽度,Align字符排列方向,Measure数据测量类型。
四、分类整理(功能选项及输出表解读)P102data→aggregate→将分类变量选到break variable→汇总变量选到summaries of variable→name&label→重命名continue→aggregate data→function选需要的汇总统计量continue五、频数分析(功能选项及输出表解读)P110①analyze→descriptive statistics→frequencies②左侧变量选到右侧的variable③display frequency tables④statistics→frequencies:statistics 在对话框可进行输出基本描述统计量的设置。
六、计算基本描述统计量(功能选项及输出表解读)P108①analyze→descriptive statistics→descriptives②从左侧选变量到右侧variable列表③如需标准化变量,save standardized values as variables复选框→OK④options→弹出descriptives:options,制定计算统计量八、假设检验(单样本、独立样本、配对样本三种,功能选项及输出表解读)。