贾俊平 统计学 总结
贾俊平统计学知识点
统计学知识点导论部分描述统计及推断统计概念比较,举例说明。
统计数据的类型:有三种分类方式,重点关注(分类数据、顺序数据、数值型数据)这三种的概念和特点。
几个基本概念:总体和样本、参数和统计量、变量(分类变量、顺序变量、数值型变量)概念及举例明。
数据搜集部分数据的间接来源:二手数据的特点数据的直接来源:调查数据和实验数据(实验数据相关知识参见风笑天笔记)调查数据:概率抽样和非概率抽样的比较。
简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样、方便抽样、判断抽烟、滚雪球抽样、配额抽样的概念、优缺点及抽样过程的简单描述。
搜集数据的基本方法:自填式、面谈时、电话式优缺点。
数据误差:抽样误差和非抽样误差(系统误差和随机误差)。
抽样框误差、回答误差、无回答误差、测量误差概念。
误差的控制方法。
数据的概括性度量集中趋势:众数、中位数、平均数概念、计算方法、分布上的关系、各自特点和应用场合。
离散趋势:异众比率、四分位差、方差和标准差、离散系数的概念、计算、特点等。
偏态和峰态的概念。
概率部分(全部是概念)随机事件及其概率:随机事件、必然事件、不可能事件、基本事件、独立事件和条件概率。
离散型随机变量及其分布:随机变量及其分类、泊松分布。
连续型随机变量及其分布:概率密度、正态分布的曲线及其性质统计量和抽样分布部分(参数估计的基础)常用统计量抽样分布的概念正态分布及由正态分布导出的几个分布及其特点(正态、卡方、t、F)。
另外标准正态分布和正态分布的概念特点,条件分布的概念。
中心极限定理样本均值的分布、样本比例的分布、样本均值之差的分布、样本方差的分布从下面开始就要做题了,每章的例题都要做三遍,课后习题有选择的做一些。
参数估计部分参数估计、点估计、区间估计的概念及基本原理、置信区间的概念及解释、评价估计量的标准。
一个总体参数的估计(均值、比例、方差),两个总体参数的区间估计(均值之差、比例之差、方差之比)、样本量的确定(估计均值时的、估计比例时的)假设检验部分建设检验、原假设、备择假设的概念、假设检验的基本流程和决策准则。
贾俊平《统计学》考研考点大全
目录第一章导论(2)第一节统计及其应用领域(2)第二节统计数据类型(4)第三节统计学的常用基本概念(4)第二章数据的搜集(6)第一节数据的来源(6)第二节调查数据(7)第三节数据的误差(10)第三章数据的图表展示(12)第一节数据的预处理(12)第二节品质数据的整理与展示(13)第三节数值型数据的整理与展示(18)第四节合理使用图表(24)第四章数据的概括性度量(26)第一节集中趋势的度量(26)第二节离散程度的度量(31)第三节偏态与峰态的度量(34)第五章概率与概率分布(36)第一节随机事件及概率(36)第二节概率的性质与运算法则(39)第三节离散型随机变量及其分布(44)第四节连续型随机变量的概率分布(49)第六章统计量及其抽样分布(54)第一节统计量(54)第二节由正态分布导出的几个重要分布(55)第三节样本均值的分布(58)第四节样本方差和样本比例的分布(61)第七章参数估计(62)第一节参数估计的基本原理(62)第二节一个总体参数的区间估计(66)第三节两个总体参数的区间估计(70)第四节样本量的确定(73)第八章假设检验(75)第一节假设检验的基本问题(75)第二节一个总体参数的检验(80)第三节两个总体参数的检验(85)第九章列联分析(91)第一节分类数据与列联表(91)第二节χ2检验(93)第三节列联表中的相关测量(95)第十章方差分析(99)第一节方差分析引论(99)第二节单因素方差分析(102)第三节双因素方差分析(110)第十一章一元线性回归(116)第一节变量间关系的度量(116)第二节一元线性回归(121)第三节利用回归方程进行预测(128)第四节残差分析(129)第十二章多元线性回归(132)第一节多元线性回归模型(132)第二节回归方程的拟合优度(133)第三节显着性检验(134)第四节多重共线性(136)第五节变量选择与逐步回归(138)第十三章时间序列分析和预测(140)第一节时间序列及其分解(140)第二节时间序列的描述性分析(142)第三节时间序列预测的程序(145)第四节平稳序列的预测(149)第五节趋势型序列的预测(154)第六节复合型序列的分解预测(162)第十四章指数(168)第一节基本问题(168)第二节总指数编制方法(169)第三节指数体系(174)第四节几种典型的指数(176)第五节综合评价指数(179)课程简介统计学是一门关于大量数据如何进行搜集、整理和分析的方法论科学,它是统计学专业的一门专业基础课程,也是经济学类和工商管理类各专业的一门核心课程,众多学科必备的考研专业课程,主要介绍如何运用统计方法对社会经济现象的总体特征和发展规律进行描述、分析,包括:统计指标、数字特征、动态分析、指数分析和简单的趋势模型及抽样推断、相关和回归分析等。
统计学复习概念重点贾俊平
1. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。
2. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。
3. 分类数据:只能归于某一类别的非数字型数据。
4. 顺序数据:只能归于某一有序类别的非数字型数据。
5. 数值型数据:按数字尺度测量的观察值。
6. 观测数据:通过调查或观测而收集到的数据。
7. 实验数据:在实验中控制实验对象而收集到的数据。
8. 截面数据:在相同或近似相同的时间点上收集的数据。
9. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。
10. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。
11. 普查:为特定目的而专门组织的全面调查。
12. 总体:包含所研究的全部个体(数据)的集合。
13. 样本:从总体中抽取的一部分元素的集合。
14. 样本容量:也称样本量,是构成样本的元素数目。
15. 参数:用来描述总体特征的概括性数字度量。
16. 统计量:用来描述样本特征的概括性数字度量。
17. 变量:说明现象某种特征的概念。
18. 分类变量:说明事物类别的一个名称。
19. 顺序变量:说明事物有序类别的一个名称。
20. 数值型变量:说明事物数字特征的一个名称。
21. 离散型变量:只能取可数值的变量。
23. 调查数据:通过调查方法获得的数据24. 实验数据:通过实验方法获得的数据25. 概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
26. 非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
27. 简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。
28. 抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺29. 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。
(完整版)统计学贾俊平考研知识点总结
统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。
(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
(1)分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。
(2)顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。
(3)数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
统计学(贾俊平版)重点
统计学(贾俊平版)重点第一章统计:收集、处理、分析、解释数据并从数据中得出结论的科学。
数据1. 分类数据对事物进行分类的结果数据,表现为类别,用文字来表述.例如,人口按性别分为男、女两类2. 顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3. 数值型数据对事物的精确测度,结果表现为具体的数值.例如:身高为175cm ,168cm,183cm总体–所研究的全部元素的集合,其中的每一个元素称为个体–分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的.无限总体所包括的元素是无限的,不可数的样本–从总体中抽取的一部分元素的集合–构成样本的元素数目称为样本容量参数:描述总体特征。
有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。
样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。
经验,理论变量描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计是研究如何利用样本数据进行推断总体特征第二章间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。
再一个是实验。
概率抽样:也称随机抽样。
按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中–每个单位被抽中的概率是已知的,或是可以计算出来的–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的分层抽样:优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查优点:抽样时只需群的抽样框,可简化工作量–调查的地点相对集中,节省调查费用,方便调查的实施–缺点是统计的精度较差系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计的精度多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查–群是初级抽样单位,第二阶段抽取的是最终抽样单位。
统计学(贾俊平版)重点
第一章统计:收集、处理、分析、解释数据并从数据中得出结论得科学。
数据1、分类数据对事物进行分类得结果数据,表现为类别,用文字来表述、例如,人口按性别分为男、女两类2、顺序数据对事物类别顺序得测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3、数值型数据对事物得精确测度,结果表现为具体得数值、例如:身高为175cm ,168cm,183cm总体–所研究得全部元素得集合,其中得每一个元素称为个体–分为有限总体与无限总体、有限总体得范围能够明确确定,且元素得数目就是有限得、无限总体所包括得元素就是无限得,不可数得样本–从总体中抽取得一部分元素得集合–构成样本得元素数目称为样本容量参数:描述总体特征。
有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。
样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。
经验,理论变量描述统计研究得就是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计就是研究如何利用样本数据进行推断总体特征第二章间接数据(查询得)与直接数据:调查(通常就是对社会现象而言得)普查信息全面完整。
再一个就是实验。
概率抽样:也称随机抽样。
按一定得概率以随机原则抽取样本,抽取样本时使每个单位都有一定得机会被抽中–每个单位被抽中得概率就是已知得,或就是可以计算出来得–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中得概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本得概率就是相等得分层抽样:优点:保证样本得结构与总体得结构比较相近将抽样单位按某种特征或某种规则划分为不同得层,然后从不同得层中独立、随机地抽取样本,从而提高估计得精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层得目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中得所有单位全部实施调查优点:抽样时只需群得抽样框,可简化工作量–调查得地点相对集中,节省调查费用,方便调查得实施–缺点就是统计得精度较差系统抽样:将总体中得所有单位(抽样单位)按一定顺序排列,在规定得范围内随机地抽取一个单位作为初始单位,然后按事先规定好得规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计得精度多阶段抽样:先抽取群,但并不就是调查群内得所有单位,而就是再进行一步抽样,从选中得群中抽取出若干个单位进行调查–群就是初级抽样单位,第二阶段抽取得就是最终抽样单位。
统计学原理贾俊平期末考试重点
统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
分析数据:分为描述统计方法和推断统计方法两种方法。
描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计:是研究如何利用样本数据来推断总体特征的统计方法。
推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。
数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。
(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。
3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。
在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。
统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。
4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。
样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。
抽样的目的是根据样本提供的信息推断总体的特征。
5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。
样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。
统计学(贾俊平版)重点
统计学(贾俊平版)重点统计学是一门研究数据分析、推断和决策的科学。
它在计量、自然科学、社会科学等领域中都扮演着重要的角色。
统计学被广泛应用于探索数据中的规律,揭示数据背后的信息和因果关系,提供决策和预测支持。
以下是统计学中的一些重要概念和方法。
1.总体和样本在统计学中,总体指的是研究对象的全体,无论是人群、产品、自然事物还是其他随机变量。
而样本则是从总体中随机抽取的一部分数据。
通过对样本的研究和分析,可以推断出总体的性质和规律。
2.描述统计描述统计是一种通过统计指标和图表来描述数据特征的方法。
其中比较重要的统计指标包括平均数、中位数、众数、标准差等。
描述统计旨在提供数据的概括性信息,以便人们更好地理解和解释数据。
3.推断统计推断统计是一种通过样本数据推断总体特征和性质的方法。
其中最重要的概念是抽样误差和置信区间。
抽样误差是指样本和总体之间的误差,而置信区间则是通过样本数据得到总体特征的区间估计值。
4.假设检验假设检验是一种判断总体特征是否符合某种假设的方法。
在假设检验中,研究人员提出一个关于总体的假设,然后利用样本数据进行检验。
假设检验的结果通常表现为拒绝或者接受原始假设的结论。
5.回归分析回归分析是一种推断变量之间关系的方法。
在回归分析中,一个或多个自变量被用来预测某个因变量的值。
回归分析可以帮助研究人员发现因变量和自变量之间的关系,并作出预测和决策。
6.方差分析方差分析是一种分析不同组之间差异的方法。
在方差分析中,数据被分成几个组,然后比较这些组之间的方差。
方差分析可以帮助确定如何将数据进行分组,以便得到更好的比较结果。
7.贝叶斯统计贝叶斯统计是一种利用先验概率和样本数据计算后验概率的方法。
在贝叶斯统计中,先验概率是在进行实证研究前已知的条件概率,而后验概率则是在考虑实证研究的结果后计算出来的条件概率。
贝叶斯统计可以帮助人们理解和理性决策不确定和风险。
综上,统计学是一门重要的科学,它为各种领域的研究和决策提供了支持和基础。
统计学原理贾俊平期末考试重点
统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
分析数据:分为描述统计方法和推断统计方法两种方法。
描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计:是研究如何利用样本数据来推断总体特征的统计方法。
推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。
数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。
(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。
3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。
在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。
统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。
4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。
样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。
抽样的目的是根据样本提供的信息推断总体的特征。
5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。
样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。
统计学 贾俊平 考研 知识点总结
统计学重点笔记第一章导论一、比较描述统计与推断统计:数据分析就是通过统计方法研究数据,其所用的方法可分为描述统计与推断统计。
(1)描述性统计:研究一组数据的组织、整理与描述的统计学分支,就是社会科学实证研究中最常用的方法,也就是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理与显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:就是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的就是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计就是基础,推断统计就是主体二、比较分类数据、顺序数据与数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
(1)分类数据就是只能归于某一类别的非数字型数据。
它就是对事物进行分类的结果,数据表现为类别,就是用文字来表达的,它就是由分类尺度计量形成的。
(2)顺序数量就是只能归于某一有序类别的非数字型数据。
也就是对事物进行分类的结果,但这些类别就是有顺序的,它就是由顺序尺度计量形成的。
(3)数值型数据就是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都就是数值型数据。
总之,分类数据与顺序数据说明的就是事物的本质特征,通常就是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的就是现象的数量特征,通常就是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量与变量:(1)总体就是包含所研究的全部个体的集合。
通常就是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
统计学 复习重点 贾俊平 2
二手数据的特点:搜集比较容易,采集数据成本低,能很快得到。
局限性不是为特定研究问题产生有欠缺,需要评估。
、二手数据的评估:谁收集,目的,怎么搜集,什么时侯收集?概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。
操作简便,时效快,成本低,专业要求不很高。
概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。
提出精度要求。
数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求实验中的若干问题:人的意愿,心理问题,道德问题回答误差:理解误差,记忆误差,有意识误差误差的控制:抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。
选择合适改进的抽样框,设计好的调查问卷,调查过程的质量控制。
抽样误差因素:样本量大小,总体变异性大大抽样方式选组织形式数据审核的目的:检查数据是否有错误,原始数据完整性准确性,二手适用性时效性。
数据筛选的目的:根据需要找出符合特定条件的某类数据。
数据排序是按一定的顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。
数据透视表作用:可以对数据表重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表数据分布表的制作步骤:确定组数,确定组距,根据分组整理成频数分布表,上组限不在内不重不漏直方图与条形图的差别:首先条形图是用条形的长度表示各类别频数的多少,宽度是固定的;直方图用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,高宽均有意义。
其次由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
最后条形图主要用于展示分类数据,直方图主要用于展示数值型数据。
茎叶图与直方图的区别:茎叶图既能给出数据的分布情况,又能保留原始数据的信息。
统计学(第六版)贾俊平 公式整理
E ( X ) x1 p1 x 2 p 2 x n p n xi pi
2 D( X ) [ xi E ( X )]2 pi
PX x C p x q n x E ( X ) np E ( X ) npq
x n i 1
P( X )
n n
( z 2 ) 2 2 E2 ( z 2 ) 2 (1 ) E2
假设检验
名称 总体均值检验的统计量(正态总体, 已知) z 总体均值检验的统计量( 未知,大样本) 公式
x 0
z
/ n x 0
s/ n x 0 p 0
总体均值检验的统计量(正态总体, 未知, t 小样本) s/ n 总体比例检验的统计量
z
0 (1 0 )
n (n 1) s 2
总体方差检验的统计量 两个总体均值之差检验的统计量( 1 , 2 已 知)
2 2
2
z
02
12
n1
2 2
( x1 x2 ) ( 1 2 ) n2
两个总体均值之差检验的统计量( 1 , 2 未 知但相等,小样本)
x e
x!
E ( X ) xf ( x)d ( x) D ( X ) [ x E ( X ) ]2 f ( x ) d ( x ) 2
2 ( x )2 1 f ( x) e 2 2 1
标准正态分布的概率密度函数
1 x2 ( x) e 2
n 个两两互斥事件 A1 , A2 ,… An 之和
的概率 事件 A 与其逆事件 A 之和的概率 两个任意事件之和的概率 概率的乘法公式 两个独立事件之积的概率
贾俊平-统计学-总结
第一章导论概念:统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。
统计的分类:描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。
推断统计:是研究如何利用样木数据进行推断总体特征。
数据:1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。
例如,人口按性别分为男、女两类2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3.数值型数据对事物的精确测度,结果表现为具体的数值。
例如:身高为175cm,190cm,200cm 参数:描述总体特征。
有总体均值(μ)、标准差()总体比例(T)统计量:描述样本特征,样本标准差(s),样木比例(p)第二章 数据的搜集1. 数据来源包括直接来源(一手数据)和间接来源(二手数据)2. 抽样方式包括概率抽样与非概率抽样3. 概率抽样:也称随机抽样。
按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中。
4.5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。
抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述的是所有样本可能的结果与总体真值之间的平均差异。
统计数据的分类按计量层次分类的数据顺序的数据数值型数据 按时间状况截 面 的 数 据时序的数据按收集方法 观察的数据 实验的数据6.抽样误差的大小与样本量的大小和总体的变异程度有关。
第三章数据的图表展示计算机实训内容,要求:1.数据筛选,自动筛选2.高级筛选,3.数据排序4.分类汇总-利用数据透视表5.对比条形图6.环形图7.累计频数图8.散点图9.雷达图等等频数分布图两种方法:工具-数据分析-直方图数值型和顺序数据数据-数据透视表数据透视表第四章数据的概括性度量集中趋势:算数平均数:几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的平均年利率,最常用的一种计算公式为,几何平均数≤算术平均数。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】第12章多元线性回归12.1 考点归纳【知识框架】【考点提⽰】(1)多元线性回归模型,包括回归模型的基本假定(简答题考点),最⼩⼆乘估计(选择题、计算题考点);(2)回归模型的拟合优度评价(简答题、计算题考点);(3)显著性检验(计算题考点);(4)多重共线性的含义、产⽣的问题、判别及处理⽅式(简答题考点)。
【核⼼考点】考点⼀:多元线性回归模型1.回归模型假定(1)E (ε)=0;(2)D (ε)=σ2;(3)()2cov ,0i j i j i j σεε?==?≠?2.参数的最⼩⼆乘估计使残差平⽅和Q =∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x 1-β∧2x 2-…-β∧k x k )2达到最⼩的β∧0,β∧1,β∧2,…,β∧k 。
由此可以得到求解β∧0,β∧1,β∧2,…,β∧k 的标准⽅程组为:00?0?00,1,2,,i i ββi ββQ βQ i k β==??===???多元线性回归的最⼩⼆乘估计是最优线性⽆偏估计。
考点⼆:回归⽅程的拟合优度表12-1 多元线性回归⽅程的评价【提⽰】实际应⽤中,采⽤调整的判定系数来评价多元回归⽅程的拟合优度。
【真题精选】多元线性回归模型的调整的多重判定系数取值范围在0⾄1之间。
[对外经济贸易⼤学2018研]【答案】√【解析】多重判定系数R2=SSR/SST是多元回归中的回归平⽅和占总平⽅和的⽐例,它是度量多元回归⽅程拟合程度的⼀个统计量,反映了在因变量y的变差中被估计的回归⽅程所解释的⽐例,取值为0~1。
调整的多重判定系数R a2与多重判定系数R2不同之处在于:R a2同时考虑了样本量n和模型中⾃变量的个数k的影响,这就使得R a2的值永远⼩于R2,⽽且R a2的值不会由于模型中⾃变量个数的增加⽽越来越接近1,因此R a2的取值也为0~1。
《统计学》贾俊平
概率论与数量统计一、连续型随机变量分布函数及其概率密度 1.概率密度与它的基本性质设对于随机变量ξ的分布函数F (x ),如果存在非负可积函数f (x ), 使得对任意的实数x ,都有⎰∞-=≤=xdtt f x P x F )(}{)(ξ成立,则称ξ为连续型随机变量,f (x )便是ξ的概率密度(或分布密度)。
概率密度具有如下基本性质:(1)0)(≥x f (非负性);(2)⎰∞∞-=1)(dx x f (规范性);(3)对任何实数c ,有0}{==c P ξ;对任意的实数a ,b (a <b ),有⎰=≤<badx x f b a P )(}{ξ。
且只要区间的端点不变,ξ取值于开区间或闭区间或半开半闭区间的概率都是相等的。
2.连续型随机变量的数学期望和方差P47 3.随机变量的矩与切比雪夫不等式 4.常用的连续型分布常用的连续型分布有均匀分布、指数分布、正态分布等。
(1)均匀分布若随机变量ξ取值在有限区间(a , b )上,其概率密度为⎪⎩⎪⎨⎧<<-=.其它,0,,1)(b x a ab x f其中b >a 为常数。
则称ξ服从区间(a , b )上的均匀分布,简记为],[~..b a U v r ξ。
均匀分布是等可能概型在连续情形下的推广。
(4)正态分布设随机变量ξ有概率密度+∞<<∞-=--x ex f x ,21)(222)(σμπσ其中μ,0>σ为常数。
则称ξ服从参数为μ,σ的正态分布,简记为 ),(..2σμξN v r ~。
特别,当μ=0,σ=1时,有+∞<<-∞=-x ex x ,21)(22πϕ。
此时称ξ服从标准正态分布。
简记为..v r ξ~N (0,1)。
5.概率密度与分布函数的互求当概率密度给定时,运用逐段积分可求得分布函数。
即⎰∞-=≤=xdt t f x P x F )(){)(ξ,如此得到的分布函数是定义在整个实数轴上的连续函数。
贾俊平《统计学》考研考点大全
— 2—
贾俊平《统计学》考点精讲
数据分析方法分类:描述统计方法和推断统计方法,描述是推断统计的前提,推断统计是描述统 计的发展。
描述统计是研究数据收集、处理、汇总、图表描述、概括与分析等的统计方法,通常采用集中量数、 差异量数、地位量数、相关系数等概括性的度量工具;反映研究总体的直观特征、外在联系或横向比较 结果等浅表性信息。
第十一章 一元线性回归 (116) 第一节 变量间关系的度量 (116) 第二节 一元线性回归 (121) 第三节 利用回归方程进行预测 (128) 第四节 残差分析 (129)
第二章 数据的搜集 (6) 第一节 数据的来源 (6) 第二节 调查数据 (7) 第三节 数据的误差 (10)
第七章 参数估计 (62) 第一节 参数估计的基本原理 (62) 第二节 一个总体参数的区间估计 (66) 第三节 两个总体参数的区间估计 (70) 第四节 样本量的确定 (73)
内容体系和章节分配
描述统计:前四章
推断统计:第五章至第十一章
统计应用:第十二章至第十四章
第 1章 导论 第 2章 数据的搜集
第 3章 数据的图表展示
第 4章 数据的概括性度量
第 5章 概率与概率分布
第 6章 统计量及其抽样分布
第 7章 参数估计
第 8章 假设检验
第 9章 列联分析
第十章 方差分析 (99) 第一节 方差分析引论 (99) 第二节 单因素方差分析 (102) 第三节 双因素方差分析 (110)
第 10章 方差分析
第 11章 一元线性回归
第 12章 多元线性回归
第 13章 时间序列分析和预测
第 14章 指数
贾俊平:统计学逻辑体系与经典方法
贾俊平是我国统计学界的著名学者,他对统计学的逻辑体系和经典方法做出了重要贡献。
他的研究成果不仅在学术界具有重要影响力,还在实际应用中发挥着重要作用。
本文将从以下几个方面对贾俊平的统计学逻辑体系与经典方法进行介绍和分析。
一、贾俊平的学术背景贾俊平出生于湖南省,是我国科学院数学与系统科学研究院院士、国家统计科学研究中心主任、国家自然科学基金委员会数学学科评议组成员,长期从事统计学理论和方法研究,曾主持完成多项国家自然科学基金项目和973项目。
二、统计学逻辑体系贾俊平对统计学的逻辑体系进行了深入研究,提出了一系列系统的理论框架和逻辑模型,为统计学的发展奠定了坚实的基础。
他从统计学的基本理论出发,探讨了统计学与概率论、数学分析等学科的内在通联,构建了完整的统计学逻辑体系,深化了人们对统计学基本原理和方法的理解。
三、经典方法的改进与创新贾俊平在统计学的经典方法方面做出了许多创新性成果。
他对传统的统计学方法进行了改进和优化,提出了许多新的统计学方法,并在实际问题中取得了显著的成果。
贾俊平的工作不仅在理论上有重要意义,还为实际问题的解决提供了有力的工具和支持。
四、贾俊平的学术成就与影响贾俊平在统计学领域取得了丰硕的学术成果,发表了大量高水平的学术论文,出版了多部著作,对统计学理论和方法的发展做出了重要贡献。
他的学术成就不仅在国内具有重要影响力,还在国际上备受关注,为我国的统计学研究赢得了良好的声誉。
五、贾俊平的学术团队与合作关系贾俊平领导的学术团队在统计学领域取得了显著的成绩,培养了一大批优秀的统计学人才,为国家的统计学研究和人才培养做出了重要贡献。
他与国内外许多知名学者建立了广泛的合作关系,开展了多项重要的学术合作项目,推动了统计学研究的国际交流与合作。
六、未来发展展望贾俊平的统计学逻辑体系和经典方法为统计学的发展指明了方向,为统计学的研究和应用提供了重要的思想支持和方法体系。
展望未来,贾俊平希望进一步深化统计学理论框架,提高统计学方法的效率和准确性,开展更多领域的交叉研究,为统计学的发展开辟新的道路。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章导论
概念:
统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。
统计的分类:
描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。
推断统计:是研究如何利用样木数据进行推断总体特征。
数据:
1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。
例如,人口按性别分为男、女两类
2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等
3.数值型数据对事物的精确测度,结果表现为具体的数值。
例如:身高为175cm,190cm,200cm 参数:描述总体特征。
有总体均值(μ)、标准差()总体比例(T)
统计量:描述样本特征,样本标准差(s),样木比例(p)
第二章 数据的搜集
1. 数据来源包括直接来源(一手数据)和间接来源(二手数据)
2. 抽样方式包括概率抽样与非概率抽样
3. 概率抽样:也称随机抽样。
按一定的概率以随机原则抽取样本,抽取样本时使每个单位都
有一定的机会被抽中。
4.
5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。
抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述
的是所有样本可能的结果与总体真值之间的平均差异。
统计数据的分类
按计量层次
分类的
数据
顺序的数据
数值型数
据 按时间状况
截 面 的 数 据
时序的数据
按收集方法 观察的数
据 实验的数
据
6.抽样误差的大小与样本量的大小和总体的变异程度有关。
第三章数据的图表展示
计算机实训内容,
要求:
1.数据筛选,自动筛选
2.高级筛选,
3.数据排序
4.分类汇总-利用数据透视表
5.对比条形图
6.环形图
7.累计频数图
8.散点图
9.雷达图
等等
频数分布图两种方法:工具-数据分析-直方图数值型和顺序数据
数据-数据透视表数据透视表
第四章数据的概括性度量
集中趋势:
算数平均数:
几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的平均年利率,最常用的一种计算公式为,几何平均数≤算术平均数。
中位数:有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。
(平均家庭收入)(记忆的重要性)
离散程度:
异众比率:异众比率指的是总体中非众数次数与总体全部次数之比。
(了解)四分位差:(了解)
方差:var
标准差:STDEV
平均差:
相对位置的度量:
标准分数:
离散系数:
形状:
偏态:SK>0,正值,正偏或者右偏,,小数集中
SK<0,负值,负偏或者左偏,,大数集中。
绝对值0, 0.5, 1三个界线。
峰态:K>0,尖峰,数据分布集中,
K<0,扁平,数据分布分散。
第五章 概率与概率分布
1.概率的分类:1.概率的古典定义,概率的统计定义,概率的主观定义。
2.期望值:在离散型随机变量X 的一切可能取值的完备组中,各可能取值x i 与其取相对应的概率p i 乘积之和,描述离散型随机变量取值的集中程度,记作E(X),或者μ,其实为加权平均数。
3. 二项分布的数学期望为 E ( X ) = np 方差为
D ( X ) = npq
标准差?
区别二项分布的概率值与期望值。
4. 当二项分布中n 很大,p 很小时,二项分布就变成为Poisson 分布 计算机计算
二项分布计算时候, 已知:1,目标概率 2,实验次数 3,成功次数 公式:失败的次数
成功的次数
成功的次数
实验的次数目标概率)
((目标概率)
-1C 二项分布换泊松分布,已知:1,入=np=1*2 2,成功的次数 (揉合在一起,因为都是那种目标概率小、实验次数多的实验) 入=数学期望值E (X )=方差D(X)=np P119例子,P121例子 5. 正态分布
主要特点:钟型,离μ近的概率大,离μ远的概率小。
标准差小,集中;标准差大,分散。
正态曲线的最高点在均值μ,它也是分布的中位数和众数。
正态分布是一个分布族,每一特定正态分布通过均值μ和标准差σ来区分。
曲线f(x)相对于均值μ对称,尾端向两个方向无限延伸,且理论上永远不会
与横轴相交
正态曲线下的总面积等于1。
计算机计算:已知:1,正态分布(的形状)(μ与σ), 2.临界值(右端值,即默认计算的是改值以左部分的面积)
6.标准正态分布:期望值μ=0,(即曲线图象对称轴为Y轴),
标准差σ=1条件下的正态分布,
记为N(0,1)。
(N是正态英文的首字母)
计算:由于形状已知(N(0,1)),所以只需要知道临界值(右端值)
7.此段内容只供理解,不是知识。
概率函数:横轴表示“统计对象”,纵轴表示”概率”。
故称概率函数。
概率密度函数:将直方图组距缩小到很密的程度,故称概率密度函数。
分布函数:分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率。
(把概率函数的面积转换成分布函数的纵轴值)
所以:找一个的具体值的概率应该在密度函数上的值,范围区间(-∞,x]是在分布函数上的值,一个范围区间(X1~X2)是分布函数上X2的值-X1的值
8. 正态分布的3σ原则:只要是正态分布,不论标准与否,(可以反过来理解)
数值分布在(μ-σ,μ+σ)中的概率为0.6826
数值分布在(μ-2σ,μ+2σ)中的概率为0.9544
数值分布在(μ-3σ,μ+3σ)中的概率为0.9974
可以认为,Y 的取值几乎全部集中在(μ-3σ,μ+3σ)]区间内,超出这个范围的可能性仅占不到0.0026
9.正态分布表
10.其他公式:
11.正态分布的标准化公式:Z=(X-μ)/σ~N(0,1) (EXCEL实例)
第六章统计量及抽样分布
中心极限定理:设从均值为μ、方差为σ^2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。
(那么标准差呢?)
理解:m为总体个数,n为抽样时每个样本的个数,可以抽出n
C个样本,这些样本符合正
m
态分布。
第七章:参数估计
1.参数估计:根据统计量计算推断出总体低的参数,包括点估计和区间估计
2.点估计:点估计
3.区间估计:条件 1.均值 2.标准差 3.置信水平(区间应包括几个标准差)
置信水平越大,区间应该越长;置信水平越小,区间可以越短。
主要在求上下限(因为均值已知,知道上下限即可知道区间)
4.
第八章假设检验
1.已知均值,标准差,上下限,求置信水平(与几个标准差相关)。