应用统计学(贾俊平版)综合复习提纲

合集下载

贾俊平《统计学》复习笔记课后习题详解及典型题详解(参数估计)【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解(参数估计)【圣才出品】
2.点估计与区间估计 (1)点估计

定义:点估计是用样本统计量θ的某个取值直接作为总体参数 θ 的估计值。 局限性:一个点估计值的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点 估计值无法给出估计的可靠性的度量,因此不能完全依赖于一个点估计值,而应围绕点估计 值构造总体参数的一个区间。 (2)区间估计 区间估计的基本思想:在点估计的基础上,给出总体参数估计的一个区间范围,该区间 通常由样本统计量加减估计误差得到。进行区间估计时,根据样本统计量的抽样分布能够对 样本统计量与总体参数的接近程度给出一个概率度量。 置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间。
著性水平表示区间估计的不可靠概率。置信度愈大(即估计的可靠性愈大),则置信区间相
应也愈大(即估计准确性愈小)。
3.评价估计量的标准
2 / 57
圣才电子书

(1)无偏性
十万种考研考证电子书、题库视频学习平台
指估计量抽样分布的数学期望等于被估计的总体参数。



设总体参数为 θ,所选择的估计量为θ,若有 E(θ)=θ,则称θ为 θ 的无偏估计量。
1 / 57
圣才电子书 十万种考研考证电子书、题库视频学习平台

置信下限:置信区间的最小值。
置信上限:置信区间的最大值。
置信水平(也称为置信度或置信系数):将构造置信区间的步骤重复多次,置信区间中
包含总体参数真值的次数所占的比例。


区间估计的数学定义:若用两个统计量θ1(x1,x2,…,xn)和θ2(x1,x2,…,xn)
存在“可能包含”或“可能不包含”的问题。
③在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第四章至第六章【圣才出品】

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第四章至第六章【圣才出品】

第4章数据的概括性度量4.1考点归纳【知识框架】【考点提示】(1)集中趋势、离散趋势的度量指标,包括每个指标的含义、计算公式、特点、意义、适用范围(选择题、简答题、计算题考点);(2)众数、中位数和平均数三个指标的特点和应用场合,偏态分布下三个指标的关系(选择题、简答题、计算题考点);(3)分布形状的测度指标:偏态系数和峰态系数的数值含义(选择题、简答题考点)。

(4)标准分数的计算公式及应用(选择题、简答题、计算题考点);(5)经验法则、切比雪夫不等式的具体应用(选择题考点)。

【核心考点】考点一:集中趋势的度量表4-1集中趋势度量指标【注意】不同偏态程度的分布中集中趋势度量指标的关系:①对称分布中,众数、中位数和平均数相等;②左偏分布中,数据存在极小值,拉动平均数向极小值一方靠,而众数和中位数不受极值的影响,有_x<M e<M o;③右偏分布中,数据存在极大值,必然拉动平均数向极大值一方靠,因此M o<M e<_x。

【知识拓展】不同的教材分位数的计算公式不同,除了表中的计算公式,一种比较精确的计算公式:下四分位数Q L的位置=(n+1)/4,上四分位数Q U的位置=(3n+1)/4。

【真题精选】假定标志值所对应的权数都缩小1/10,则算术平均数()。

[浙江财经大学2019研]A.不变B.无法判断C.缩小百分之一D.扩大十倍【答案】A【解析】假设标志值为x,其对应的权数为f,则算术平均数为_x=∑xf/∑f;若各权数都缩小1/10,则新的算术平均数为110110xf xf x x f f '===∑∑∑∑考点二:离散程度的度量数据的离散程度反映了各变量值远离其中心值的程度,离散程度越小,代表性就越好。

表4-2离散程度的度量指标【注意】①表中方差和标准差的计算公式均为样本数据的方差和标准差。

若为总体数据,则分母应为n。

②标准差系数,也称变异系数或离散系数。

③表中平均差、样本方差、样本标准差仅给出了未分组数据的计算公式,分组数据的计算公式实质是等于未分组数据的计算公式,会运用即可。

统计学贾俊平考研学习知识点情况总结

统计学贾俊平考研学习知识点情况总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

统计学-贾俊平-考研-知识点总结

统计学-贾俊平-考研-知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计.(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征.(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等.(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的.(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

(完整版)统计学贾俊平考研知识点总结

(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

贾俊平《统计学》复习笔记课后习题详解及典型题详解(时间序列分析和预测)【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解(时间序列分析和预测)【圣才出品】

第13章时间序列分析和预测13.1 复习笔记一、时间序列及其分解1.时间序列(1)概念:时间序列是同一现象在不同时间上的相继观察值排列而成的序列,也称动态数列或时间数列。

(2)时间序列的两要素任何一个时间序列都具有两个基本要素:一是统计指标所属的时间,也称为时间变量;二是统计指标在特定时间的具体指标值。

(3)研究时间序列的目的①在编制时间序列的基础上,可以计算平均发展水平,进行动态水平分析;②可以计算各种速度指标,进行速度分析;③利用相关的数学模型,对现象的变动进行趋势分析。

2.时间序列的类型(1)平稳序列它是基本上不存在趋势的序列。

这类序列中的各观察值基本上都在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。

(2)非平稳序列它是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能含有几种成分,因此非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

3.时间序列的4种成分(1)趋势(T)也称长期趋势,它是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动。

时间序列中的趋势可以是线性的,也可以是非线性的。

(2)季节性(S)也称季节变动,它是时间序列在一年内重复出现的周期性波动。

季节性中的“季节”一词是广义的,它不仅仅是指一年中的四季,其实是指任何一种周期性的变化。

(3)周期性(C)也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。

(4)随机性(I)也称不规则波动,它是时间序列中除去趋势、周期性和季节性之后的偶然性波动。

4.时间序列的分解模型将时间序列分解成长期趋势、季节变动、周期变动和随机变动四个因素后,可以认为时间序列Y t是这四个因素的函数,即Y t=f(T t,S t,C t,I t),其中较常用的是加法模型和乘法模型,其表现形式为:加法模型:Y t=T t+S t+C t+I t乘法模型:Y t=T t×S t×C t×I t注意:时间序列组合模型中包含了四种因素,这是时间序列的完备模式,但是并不是在每个时间序列中这四种因素都同时存在。

考试点专业课:贾俊平《统计学》考研考点大全

考试点专业课:贾俊平《统计学》考研考点大全
o s h i d i a n c o m ) 名师精品课程㊀电话: 4 0 0- 6 8 8 5- 3 6 5
第一章 ㊀ 导 论
基本内容
统计学的含义、 统计数据及其分类、 统计学常用的基本概念。
重点内容
统计学常用的基本概念。
学习目标
1 . 理解统计学的含义, 能区分描述统计与推断统计 2 . 了解统计学的应用领域 3 . 理解统计数据的含义、 基本类型及特点 4 . 熟悉总体、 样本、 参数、 统计量、 变量等基本概念的含义
课程辅导的目标
1 . 更加深刻地理解统计学主要概念及统计背景, 了解在社会经济应用及分析中的重要作用, 系统 掌握统计描述和统计推断的基本内容与基本方法; 2 . 在掌握统计学基础知识的基础上, 能较容易理解其他课程中的一些数量分析方法, 并能独立完 成对有关资料的搜集、 整理、 分析。 3 . 为深入研究社会经济问题和学习其它专业课程提供数量分析的方法。 4 . 为进一步学习专业统计和数量经济课程打好基础。 要求学生能在教师的指导下, 掌握统计学的基本理论和方法, 熟悉统计软件的基本操作, 并能够 结合经济学和工商管理理论加以应用。 — 1—
内容体系和章节分配
描述统计: 前四章 推断统计: 第五章至第十一章 统计应用: 第十二章至第十四章 第 1章㊀导论㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第 2章㊀数据的搜集 第 3章㊀数据的图表展示 第 5章㊀概率与概率分布 第 7章㊀参数估计 第 9章㊀列联分析 第1 1章㊀一元线性回归 第1 3章㊀时间序列分析和预测 第 4章㊀数据的概括性度量 第 6章㊀统计量及其抽样分布 第 8章㊀假设检验 第1 0章㊀方差分析 第1 2章㊀多元线性回归 第1 4章㊀指数
目㊀录
第一章㊀导论 ( 2 ) 第一节㊀统计及其应用领域 ( 2 ) 第二节㊀统计数据类型 ( 4 ) 第三节㊀统计学的常用基本概念 ( 4 ) 第二章㊀数据的搜集 ( 6 ) 第一节㊀数据的来源 ( 6 ) 第二节㊀调查数据 ( 7 ) 第三节㊀数据的误差 ( 1 0 ) 第三章㊀数据的图表展示 ( 1 2 ) 第一节㊀数据的预处理 ( 1 2 ) 第二节㊀品质数据的整理与展示 ( 1 3 ) 第三节㊀数值型数据的整理与展示 ( 1 8 ) 第四节㊀合理使用图表 ( 2 4 ) 第四章㊀数据的概括性度量 ( 2 6 ) 第一节㊀集中趋势的度量 ( 2 6 ) 第二节㊀离散程度的度量 ( 3 1 ) 第三节㊀偏态与峰态的度量 ( 3 4 ) 第五章㊀概率与概率分布 ( 3 6 ) 第一节㊀随机事件及概率 ( 3 6 ) 第二节㊀概率的性质与运算法则 ( 3 9 ) 第三节㊀离散型随机变量及其分布 ( 4 4 ) 第四节㊀连续型随机变量的概率分布 ( 4 9 ) 第六章㊀统计量及其抽样分布 ( 5 4 ) 第一节㊀统计量 ( 5 4 ) 第二节㊀由正态分布导出的几个重要分布 ( 5 5 ) 第三节㊀样本均值的分布 ( 5 8 ) 第四节㊀样本方差和样本比例的分布 ( 6 1 ) 第七章㊀参数估计 ( 6 2 ) 第一节㊀参数估计的基本原理 ( 6 2 ) 第二节㊀一个总体参数的区间估计 ( 6 6 ) 第三节㊀两个总体参数的区间估计 ( 7 0 ) 第四节㊀样本量的确定 ( 7 3 )

统计学(贾俊平版)重点【精选文档】

统计学(贾俊平版)重点【精选文档】

第一章统计:收集、处理、分析、解释数据并从数据中得出结论的科学。

数据1. 分类数据对事物进行分类的结果数据,表现为类别,用文字来表述。

例如,人口按性别分为男、女两类2。

顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3. 数值型数据对事物的精确测度,结果表现为具体的数值.例如:身高为175cm ,168cm,183cm总体–所研究的全部元素的集合,其中的每一个元素称为个体–分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的。

无限总体所包括的元素是无限的,不可数的样本–从总体中抽取的一部分元素的集合–构成样本的元素数目称为样本容量参数:描述总体特征。

有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。

样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。

经验,理论变量描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法.推断统计是研究如何利用样本数据进行推断总体特征第二章间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。

再一个是实验。

概率抽样:也称随机抽样。

按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中–每个单位被抽中的概率是已知的,或是可以计算出来的–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的分层抽样:优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查优点:抽样时只需群的抽样框,可简化工作量–调查的地点相对集中,节省调查费用,方便调查的实施–缺点是统计的精度较差系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计的精度多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查–群是初级抽样单位,第二阶段抽取的是最终抽样单位.将该方法推广,使抽样的段数增多,就称为多阶段抽样非概率抽样:方便抽样(自行确定入抽样本单位),判断抽样(根据经验判断),自愿样本(被调查者自愿参加),滚雪球抽样(对稀少群体的调查),配额抽样(先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位)。

统计学 复习重点 贾俊平 2

统计学 复习重点 贾俊平 2

二手数据的特点:搜集比较容易,采集数据成本低,能很快得到。

局限性不是为特定研究问题产生有欠缺,需要评估。

、二手数据的评估:谁收集,目的,怎么搜集,什么时侯收集?概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。

操作简便,时效快,成本低,专业要求不很高。

概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。

提出精度要求。

数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求实验中的若干问题:人的意愿,心理问题,道德问题回答误差:理解误差,记忆误差,有意识误差误差的控制:抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。

选择合适改进的抽样框,设计好的调查问卷,调查过程的质量控制。

抽样误差因素:样本量大小,总体变异性大大抽样方式选组织形式数据审核的目的:检查数据是否有错误,原始数据完整性准确性,二手适用性时效性。

数据筛选的目的:根据需要找出符合特定条件的某类数据。

数据排序是按一定的顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。

数据透视表作用:可以对数据表重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表数据分布表的制作步骤:确定组数,确定组距,根据分组整理成频数分布表,上组限不在内不重不漏直方图与条形图的差别:首先条形图是用条形的长度表示各类别频数的多少,宽度是固定的;直方图用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,高宽均有意义。

其次由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。

最后条形图主要用于展示分类数据,直方图主要用于展示数值型数据。

茎叶图与直方图的区别:茎叶图既能给出数据的分布情况,又能保留原始数据的信息。

统计学复习精要(贾俊平版)

统计学复习精要(贾俊平版)

《统计学》复习精要(贾俊平 第五版 中国人大出版社)neijiangrui第4章 概率分布1.总体与样本:在统计学中称随机变量(或向量)X 为总体,并把随机变量(或向量)X 的分布称为总体的分布。

称)...,,(21n X X X 为总体X 的一个简单随机样本,若n X X X ...,,21是独立同分布的随机变量,且与总体X 同分布。

n 为样本容量。

2. 四个重要的分布(正态分布、2χ分布、F 分布、t 分布)①正态分布:设随机变量X 有概率密度+∞<<∞-=--x ex f x ,21)(22)(σμπσ其中μ,0>σ为常数。

则称X 服从参数为μ,σ的正态分布,简记为),(~2σμN X 。

特别当μ=0,σ=1时,称X 服从标准正态分布。

简记为X ~N (0,1)。

②2χ分布 设X 1,X 2,…,X n 是相互独立的随机变量,且X i ~N (0,1) (i =1,2,…,n ),则称随机变量22221...n X X X X +++=服从自由度为n 的2χ分布,简记为X ~2χ(n )。

③F 分布 设)(~2m X χ,)(~2n Y χ,且X ,Y 相互独立,则称随机变量nY m X F //=服从F 分布,简记为F ~F (m ,n )。

④t 分布 设)1,0(~N X ,)(~2n Y χ,且X ,Y 相互独立,则称随机变量nY XT /=服从自由度为n 的t 分布,记为)(~n t T 。

3.抽样分布①单总体:设)...,,(21n X X X 是容量为n 的一个样本,X 与2S 分别为此样本的样本均值与样本方差(212)(11X X n S ini --=∑=)则:②双总体:设(1,,1n X X )是取自总体X 的一个样本,(2,,1n Y Y )是取自总体Y 的一个样本,且这两个样本相互独立,即假定1,,1n X X ,2,,1n Y Y 是n 1+n 2个相互独立的随机变量。

统计学-贾俊平-考研-知识点总结精编版

统计学-贾俊平-考研-知识点总结精编版

统计学-贾俊平-考研-知识点总结精编版-CAL-FENGHAI.-(YICAI)-Company One1统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第一章至第三章【圣才出品】

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第一章至第三章【圣才出品】

第1章导论1.1考点归纳【知识框架】【考点提示】(1)统计学的目的(选择题考点);(2)描述统计和推断统计的区分、参数估计和假设检验的区分(选择题考点);(3)统计数据类型、分类、各自特点及其具体应用(选择题、简答题考点)(非常重要);(4)统计学中的基本概念(选择题、简答题考点)。

【核心考点】考点一:统计数据的类型(见表1-1)表1-1统计数据的类型【注意】①分类数据和顺序数据说明的是事物的品质特征,其结果均表现为类别,因而也统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,因此也称为定量数据或数量数据。

②对不同类型的数据采用不同的统计方法来处理和分析。

对分类数据可以计算出各类别的频率,而数值型数据则可以进行数学运算。

【真题精选】1.在对数据进行汇总时,往往将男性用“1”来表示,女性用“0”来表示,所以将性别视为数值型变量。

[对外经济贸易大学2018研]【答案】×【解析】数值型变量是说明事物数字特征的一个名称,其取值是数值型数据,数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值;分类变量是说明事物类别的一个名称,其取值是分类数据,分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

性别是分类变量,为便于统计处理,对于分类变量可以用数字代码来表示各个类别。

2.下列数据不属于时间序列数据的是()。

[四川大学2016研]A.1990~2014年我国每年进出口总额B.2014年某品牌手机在中国各个省市的销售量C.成都市2014年每个月的PM2.5月平均浓度D.某股票在2015年1月的日收盘价【答案】B【解析】时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。

本题中B项是在相同的时间点、不同的空间上获得的数据,属于截面数据。

考点二:统计中的基本概念1.总体和样本(1)总体、个体(2)样本、样本量2.参数和统计量(1)参数:用于描述总体特征,是未知的常数。

应用统计学(贾俊平版)综合复习提纲

应用统计学(贾俊平版)综合复习提纲

1.统计学:收集处理分析解释数据并从数据中得出结论的科学。

2.描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。

3.推断统计:研究如何利用样本数据来推断总体特征的统计方法。

4.分类数据:只能归于某一类别的非数字型数据。

5.顺序数据:只能归于某一有序类别的非数字型数据。

6.数值型数据:按数字尺度测量的观察值。

7.观测数据:通过调查或观测而收集到的数据。

8.实验数据:在实验中控制实验对象而收集到的数据。

9.截面数据:在相同或近似相同的时间点上收集的数据。

10.时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。

11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。

12.普查:为特定目的而专门组织的全面调查。

13.总体:包含所研究的全部个体(数据)的集合。

14.样本:从总体中抽取的一部分元素的集合。

15.样本容量:也称样本量,是构成样本的元素数目。

16.参数:用来描述总体特征的概括性数字度量。

17.统计量:用来描述样本特征的概括性数字度量。

18.变量:说明现象某种特征的概念。

19.分类变量:说明事物类别的一个名称。

20.顺序变量:说明事物有序类别的一个名称。

21.数值型变量:说明事物数字特征的一个名称。

22.离散型变量:只能取可数值的变量。

25.实验数据:通过实验方法获得的数据26.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

27.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

28.简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。

29.抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺30.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。

31.整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用统计学复习提纲梦翔儿应用统计学复习提纲梦翔儿1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。

2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。

3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。

4. 分类数据:只能归于某一类别的非数字型数据。

5. 顺序数据:只能归于某一有序类别的非数字型数据。

6. 数值型数据:按数字尺度测量的观察值。

7. 观测数据:通过调查或观测而收集到的数据。

8. 实验数据:在实验中控制实验对象而收集到的数据。

9. 截面数据:在相同或近似相同的时间点上收集的数据。

10. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。

11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。

12. 普查:为特定目的而专门组织的全面调查。

13. 总体:包含所研究的全部个体(数据)的集合。

14. 样本:从总体中抽取的一部分元素的集合。

15. 样本容量:也称样本量,是构成样本的元素数目。

16. 参数:用来描述总体特征的概括性数字度量。

17. 统计量:用来描述样本特征的概括性数字度量。

18. 变量:说明现象某种特征的概念。

19. 分类变量:说明事物类别的一个名称。

20. 顺序变量:说明事物有序类别的一个名称。

21. 数值型变量:说明事物数字特征的一个名称。

22. 离散型变量:只能取可数值的变量。

25. 实验数据:通过实验方法获得的数据26. 概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

27. 非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

28. 简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。

29. 抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺30. 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。

31. 整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。

32. 系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则确定其它样本单位。

33. 多阶段抽样:首先抽取群,再进一步抽样,从选中的群中抽取出若干个单位进行计查,二阶段抽样。

34. 方便抽样:依据方便原则,自行确定入抽样本的单位。

35. 判段抽样:研究人员根据经验,判断研究对象的了解,有目的选择一些单位作为样本。

36. 自愿样本:被调查者自愿参加,成为样本中一分子,向调查人员提供有关信息37. 滚雪球抽样:对稀少群体调查中,首选选择一组调查单位,调查后,请他们提供另外属于研究总体的调查对象,调查人员根据所提供的线索,进行此后调查。

38. 配额抽样:将总体中所有单位按一定的标志分若干类,然后每类采用方便抽样或判断抽样的方案选取样本单位。

39. 自填式:没有调查员协助,被调查者自已填写,完成调查问卷。

40. 面访式:面对面,调查员提问,被调查者回答。

41. 电话式:打电话方式调查。

42. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差。

43. 非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其它原因引起的样本观察结果与总体真值之间的差异。

44. 抽样框误差:统计推论的错误是由于抽样框不完善造成的45. 频数:落在某一特定类别或组中的数据个数。

46. 频数分布:各个类别及其相应的频数形成的分布。

47. 比例:一个样本(或总体)中各个部分的数据占全部数据比值。

48. 比率:一个样本(或总体)中各不同类别数据之间的比值。

49. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。

50. 累积频率或累积百分比:将有序类别或组百分比逐级累加起来。

51. 数据分组:根据统计研究需要,将原始数据按某种标准化分成不同的组别,。

52. 组距是一个组的上限与下限的差53. 组距分组是将全部变量依次划分为若干个区间,将这一区间的变量值作为一组。

54. 等距分组,在组距分组时,如果各组的组距相等。

55. 组中值=下限值+上限值/2 上下限的中间值56. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。

57. 茎叶图:由茎和叶两部分组成的、反应原始数据分布的图形。

58. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布图形。

心点的位置所在。

60. 众数:一组数据中出现频数最多的数值61. 中位数:一组数据排序后处于中间位置上的数值。

62. 四分位数:一组数据排序后处在25%和75%位置上的数值。

63. 平均数:又称均值,是全部数据的算术平均值64. 简单平均数:未经分组数据计算的平均数称为简单平均数。

根据分组。

加权平均数。

65. 几何平均数:是n个变量值乘积的n次方根。

常用于比例数据的平均。

66. 异众比率:指非众数组的频数占总频数的比例.67. 四分位差:75%位置上的四分位数与25%位置上的四分位数之差。

顺序数据。

68. 极差:也称全距,一组数据的最大值与最小值之差。

69. 平均差:也称平均绝对离差,它是各变量值与其平均数离差的绝对值的平均数。

70. 方差:各数据与其平均数离差平方的平均数。

71. 标准差:方差的平方根。

72. 标准分数:也称标准化值或 z 分数,某个数据与其平均数的离差除以标准差后的值。

73. 离散系数:一组数据的标准差与其相应的平均数之比。

74. 偏态:对数据分布对称性的测度。

测度偏态的统计量偏态系数。

75. 偏态系数:对数据分布不对称性的度量值。

76. 峰态:对数据分布平峰或尖峰程度的测度,测度峰态的统计量则是峰态系数。

件,也叫偶然事件79. 必然事件:在同一组条件下,每次试验一定出现的事件。

80. 不可能事件:在同一组条件下,每次试验一定不出现的事件。

81. 基本事件:如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件。

82. 概率:对事件发生的可能性大小的度量值。

83. 主观概率:对一些无法重复的试验,确定其结果的概率只能根据经验,人为确定这个事件的概率。

84. 条件概率:当某事件B已发生,求事件A发生的概率,称为事件B发生条件下事件A发生的条件概率。

85. 独立事件:两个事件中不论哪一个事件发生与否并不影响另一个事件发生的概率。

86. 随机变量:事先不能确定其取值的变量。

87. 离散型随机变量:只能取有限个值的随机变量。

88. 连续型随机变量:可以取一个或多个区间中任何值的随机变量。

89. 期望值、数学期望:随机变量的平均取值,各可能值与对应概率乘积之和。

90. 方差:随机变量的每一取值与期望值的离差平方的期望值。

91. 泊松分布:用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的个数的分布。

92. 概率密度函数:对连续型随机变量用函数f(x)来表示。

大于等于0全积分为1 94. 充分统计量:统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。

95. 抽样分布:样本统计量的概率分布,是由样本统计量的所有可能取值形成相对频数分布。

96. 渐近分布:当n 比较大时,用极限分布作为抽样分布的一种近似,这种极限分布常称为99. 估计值:估计总体参数时计算出来的估计量的具体数值100. 点估计:用样本估计量 的取值直接作为总体参数θ的估计值101. 区间估计:在点估计的基础上,给出总体参数估计的一个估计区间,该区间通常由样本统计量加减估计误差组成102. 置信区间:由样本统计量构造出的总体参数在一定置信水平下的估计区间。

103. 置信水平:也称为置信度或置信系数,在重复构造的总体参数的多个置信区间中包含总体参数真值的次数所占的比例。

104. 无偏性:估计量抽样分布的期望值等于被估计的总体参数105. 有效性:对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。

106. 一致性:随着样本量的增大,估计量的值越来越接近总体参数。

107. 独立样本:一个样本中的元素与另一个样本中的元素相互独立。

108. 匹配样本:又称配对数据,一个样本中的数据与另一个样本中的数据相对应。

设是否成立的过程。

110. 原假设:也称零假设,是研究者想收集证据予以反对的假设,用0H 表示。

111. 备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用1H 或a H 表示。

112. 第Ⅰ类错误:原假设正确时拒绝原假设,犯第Ⅰ类错误概率记α。

113. 第Ⅱ类错误:当原假设为错误时没有拒绝原假设,犯第Ⅱ类错误的概率通常记为β。

114. 显著性水平:假设检验中发生第Ⅰ类错误的概率,记为α。

115. 小概率原理:进行假设检验利用,指发生概率很小的随机事件在一次试验中是几乎不可能发生的。

116. 检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量 117. 拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。

118. 临界值:根据给定的显著性水平确定的拒绝域的边界值。

119. P 值:也称观察到的显著性水平,如果原假设0H 是正确的,那么所得的样本结果出现实际观测结果或更极端结果出现的概率。

P 值很小说明发生概率很小,拒绝原假设,P 越小,拒绝原假设的理由就越充分。

双侧P<0.025 单侧p<0.05 拒绝原假设。

120. 单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验。

121. 双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“≠”的假设检验。

123. 条件分布、频数:列联表中的观察值分布称为条件分布,每个具体观察值就是条件频数。

124. 拟合优度检验:如果样本是从总体的不同类别中分别抽取,研究目的是对不同类别的目标量之间是否存在显著性差异进行检验,我们就把它称为拟合优度检验或一致性检验。

125. 独立性检验:判断两个分类变量之间是否存在联系的问题,两组或多组的资料是否相互关联,如果不关联,就称为独立。

这类问题的值型因变量是否有显著影响。

127. 因素:也称因子,是方差分析中所要检验的对象。

128. 处理:因素的不同表现称为水平或处理 129. 组内误差:来自水平内部的数据误差。

130. 组间误差:来自不同水平之间的数据误差。

131. 总平方和:反映全部数据误差大小的平方和,记为SST 。

自变量效应加残差效应。

n-1132. 组内平方和:反映组内误差大小的平方和,记为SSE 。

残差变量,残差效应;n-k 133. 组间平方和:反映组间误差大小的平方和,记为SSA 。

相关文档
最新文档