贾俊平统计学知识点

合集下载

贾俊平统计学知识点

贾俊平统计学知识点

统计学知识点导论部分描述统计及推断统计概念比较,举例说明。

统计数据的类型:有三种分类方式,重点关注(分类数据、顺序数据、数值型数据)这三种的概念和特点。

几个基本概念:总体和样本、参数和统计量、变量(分类变量、顺序变量、数值型变量)概念及举例明。

数据搜集部分数据的间接来源:二手数据的特点数据的直接来源:调查数据和实验数据(实验数据相关知识参见风笑天笔记)调查数据:概率抽样和非概率抽样的比较。

简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样、方便抽样、判断抽烟、滚雪球抽样、配额抽样的概念、优缺点及抽样过程的简单描述。

搜集数据的基本方法:自填式、面谈时、电话式优缺点。

数据误差:抽样误差和非抽样误差(系统误差和随机误差)。

抽样框误差、回答误差、无回答误差、测量误差概念。

误差的控制方法。

数据的概括性度量集中趋势:众数、中位数、平均数概念、计算方法、分布上的关系、各自特点和应用场合。

离散趋势:异众比率、四分位差、方差和标准差、离散系数的概念、计算、特点等。

偏态和峰态的概念。

概率部分(全部是概念)随机事件及其概率:随机事件、必然事件、不可能事件、基本事件、独立事件和条件概率。

离散型随机变量及其分布:随机变量及其分类、泊松分布。

连续型随机变量及其分布:概率密度、正态分布的曲线及其性质统计量和抽样分布部分(参数估计的基础)常用统计量抽样分布的概念正态分布及由正态分布导出的几个分布及其特点(正态、卡方、t、F)。

另外标准正态分布和正态分布的概念特点,条件分布的概念。

中心极限定理样本均值的分布、样本比例的分布、样本均值之差的分布、样本方差的分布从下面开始就要做题了,每章的例题都要做三遍,课后习题有选择的做一些。

参数估计部分参数估计、点估计、区间估计的概念及基本原理、置信区间的概念及解释、评价估计量的标准。

一个总体参数的估计(均值、比例、方差),两个总体参数的区间估计(均值之差、比例之差、方差之比)、样本量的确定(估计均值时的、估计比例时的)假设检验部分建设检验、原假设、备择假设的概念、假设检验的基本流程和决策准则。

贾俊平《统计学》考研考点大全

贾俊平《统计学》考研考点大全

目录第一章导论(2)第一节统计及其应用领域(2)第二节统计数据类型(4)第三节统计学的常用基本概念(4)第二章数据的搜集(6)第一节数据的来源(6)第二节调查数据(7)第三节数据的误差(10)第三章数据的图表展示(12)第一节数据的预处理(12)第二节品质数据的整理与展示(13)第三节数值型数据的整理与展示(18)第四节合理使用图表(24)第四章数据的概括性度量(26)第一节集中趋势的度量(26)第二节离散程度的度量(31)第三节偏态与峰态的度量(34)第五章概率与概率分布(36)第一节随机事件及概率(36)第二节概率的性质与运算法则(39)第三节离散型随机变量及其分布(44)第四节连续型随机变量的概率分布(49)第六章统计量及其抽样分布(54)第一节统计量(54)第二节由正态分布导出的几个重要分布(55)第三节样本均值的分布(58)第四节样本方差和样本比例的分布(61)第七章参数估计(62)第一节参数估计的基本原理(62)第二节一个总体参数的区间估计(66)第三节两个总体参数的区间估计(70)第四节样本量的确定(73)第八章假设检验(75)第一节假设检验的基本问题(75)第二节一个总体参数的检验(80)第三节两个总体参数的检验(85)第九章列联分析(91)第一节分类数据与列联表(91)第二节χ2检验(93)第三节列联表中的相关测量(95)第十章方差分析(99)第一节方差分析引论(99)第二节单因素方差分析(102)第三节双因素方差分析(110)第十一章一元线性回归(116)第一节变量间关系的度量(116)第二节一元线性回归(121)第三节利用回归方程进行预测(128)第四节残差分析(129)第十二章多元线性回归(132)第一节多元线性回归模型(132)第二节回归方程的拟合优度(133)第三节显着性检验(134)第四节多重共线性(136)第五节变量选择与逐步回归(138)第十三章时间序列分析和预测(140)第一节时间序列及其分解(140)第二节时间序列的描述性分析(142)第三节时间序列预测的程序(145)第四节平稳序列的预测(149)第五节趋势型序列的预测(154)第六节复合型序列的分解预测(162)第十四章指数(168)第一节基本问题(168)第二节总指数编制方法(169)第三节指数体系(174)第四节几种典型的指数(176)第五节综合评价指数(179)课程简介统计学是一门关于大量数据如何进行搜集、整理和分析的方法论科学,它是统计学专业的一门专业基础课程,也是经济学类和工商管理类各专业的一门核心课程,众多学科必备的考研专业课程,主要介绍如何运用统计方法对社会经济现象的总体特征和发展规律进行描述、分析,包括:统计指标、数字特征、动态分析、指数分析和简单的趋势模型及抽样推断、相关和回归分析等。

统计学复习概念重点贾俊平

统计学复习概念重点贾俊平

1. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。

2. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。

3. 分类数据:只能归于某一类别的非数字型数据。

4. 顺序数据:只能归于某一有序类别的非数字型数据。

5. 数值型数据:按数字尺度测量的观察值。

6. 观测数据:通过调查或观测而收集到的数据。

7. 实验数据:在实验中控制实验对象而收集到的数据。

8. 截面数据:在相同或近似相同的时间点上收集的数据。

9. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。

10. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。

11. 普查:为特定目的而专门组织的全面调查。

12. 总体:包含所研究的全部个体(数据)的集合。

13. 样本:从总体中抽取的一部分元素的集合。

14. 样本容量:也称样本量,是构成样本的元素数目。

15. 参数:用来描述总体特征的概括性数字度量。

16. 统计量:用来描述样本特征的概括性数字度量。

17. 变量:说明现象某种特征的概念。

18. 分类变量:说明事物类别的一个名称。

19. 顺序变量:说明事物有序类别的一个名称。

20. 数值型变量:说明事物数字特征的一个名称。

21. 离散型变量:只能取可数值的变量。

23. 调查数据:通过调查方法获得的数据24. 实验数据:通过实验方法获得的数据25. 概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

26. 非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

27. 简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。

28. 抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺29. 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。

统计学(贾俊平版)重点

统计学(贾俊平版)重点

统计学(贾俊平版)重点第一章统计:收集、处理、分析、解释数据并从数据中得出结论的科学。

数据1. 分类数据对事物进行分类的结果数据,表现为类别,用文字来表述.例如,人口按性别分为男、女两类2. 顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3. 数值型数据对事物的精确测度,结果表现为具体的数值.例如:身高为175cm ,168cm,183cm总体–所研究的全部元素的集合,其中的每一个元素称为个体–分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的.无限总体所包括的元素是无限的,不可数的样本–从总体中抽取的一部分元素的集合–构成样本的元素数目称为样本容量参数:描述总体特征。

有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。

样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。

经验,理论变量描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计是研究如何利用样本数据进行推断总体特征第二章间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。

再一个是实验。

概率抽样:也称随机抽样。

按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中–每个单位被抽中的概率是已知的,或是可以计算出来的–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的分层抽样:优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查优点:抽样时只需群的抽样框,可简化工作量–调查的地点相对集中,节省调查费用,方便调查的实施–缺点是统计的精度较差系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计的精度多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查–群是初级抽样单位,第二阶段抽取的是最终抽样单位。

统计学公式-贾俊平-精华版

统计学公式-贾俊平-精华版

()()()()()扁平尖峰分布;,3s *n 组数*X-分组峰态系数正值,右偏分布越大偏斜越大,,该组的中值;s *n 组数*X -SK 分组s*2-n 1-n X-n SK 未分组偏态系数04.%99/%95/%68个标准差3/2/1经验法则:.03,越大,离散系数越大X s小)离散系数(衡量差异大-离散程度标准差/数值型数据:方差顺序数据:四分位差总频数(众数频数)f -1V 分类数据:异众比率离散程度02.x几何平均X 加权平均数.01443333s mr n<>===±====∑∑∑∏∑∑ii i i iii M K SK M M X V G W X W PS :()0.3P x μ-≤=x P ⎛⎫≤≤ 双侧:H 0≠A无显著差异,同α/2比较 左单侧:希望数值越大越好H 0 μ ≥A右单侧:希望数值越小越好 H 0μ ≤A ;同α比较P 值检验方法,求出Z ,若x >μ,计算P (Z>Z 值)值 双侧:P<α/2 拒绝原假设单侧P<α 拒绝原假设 运用置信区上下限比较nZ σα2(边际误差)=∇(单侧为α)n总体标准差抽样标准误差=若∇>0-x μ,则拒绝H 若σ未知,用s 代替,使用t 分布()()遇小数点向前进一)()1(定估计比例时样本量的确.22(边际误差):定一个估计时样本量的确.211-n 自由度s )1n (s )1n (总体方差.13)1(总量)的区间估计(样本样本比率.12)1(方差未知,小样本,总体正态)2(置信区间为。

即,该样本平均或:未知/大样本且方差已知)1(计一个总体均值的区间估.1122222222222/12222/2222EP P Z n n Z E E Z n nP P Z P P nS n t X nSZ X -⋅=⎪⎪⎭⎫⎝⎛==-≤≤--±÷-±∂±-αααααααασσλλσλσ()()(),则不拒绝1-n 1-n 1总体方差的检验:.33)1(:总体比例检验统计量321自由度,/:未知小样本,,/已知小样本,,/或:大样本一个参数的假设检验.3122/222/1222ααλλλσλπππμσσμσσμ≤≤-=--=-=-=-=-=-S n nP Z n nS X t nX Z nS X Z()()()()()()()()()()()⎪⎪⎭⎫ ⎝⎛=≤≤-+-±--±±-⎪⎪⎭⎫ ⎝⎛+-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛+±-≠≠⎪⎪⎭⎫ ⎝⎛+-+±-=≠-+-+-=⎪⎪⎭⎫ ⎝⎛+-+±-=+±-≥--212/212/12/1222122212/2221222111221d 2d22222212121222212122212122121212221212122121212122221122122122121222121212121n ,n 1n ,n s /s /s /s 两个总体方差比.13)1()1(:两个总体比例之差.12ns )1(d 小样本2ns d 大样本1的总平均数为每一组对应样本之差d 本)的估计,两个总体之差(匹配样).5(1s 1s s s v s s )v (,未知,正态,,小样本)4(s s )2(,未知,正态,,小样本)3(2s 1s 1s 11s )2(,未知正态,,小样本)2(s s 可以互换/未知/已知,),30,(大样本)1(:独立样本)的区间估计(两个总体均值之差.11ααααααααααασσσσσσσσσσσF F F F n p p n p p Z p pn t Z n n n n n n n n t X Xn n n n n n t X X n n n n n nn n n n t X Xn n Z X X S n n pp()()()()()()()()222121221122211121021212121222121212121212122121212221212121222112221222212221总体方差的相似性:.33)1()1(d)0(多设为d 、样本比例11)1(、:两个总体比率之差32)比较1n (t 同,n s ˆ匹配样本:计算)4(值自由度同左,s s X小样本,)3()2(自由度,11X小样本,)2(,XZ 大样本)1(两个参数的假设检验.31边际误差)1()1(p 5.0;21定估计比例时样本量的确.22n n :量的确定两个估计均值差时样本21ππππσμμσσμμσσσσμμσσαα=++=⎪⎪⎭⎫⎝⎛-+---==-⎪⎪⎭⎫⎝⎛+--==-=⎪⎪⎭⎫⎝⎛+---=≠-+⎪⎪⎭⎫⎝⎛+---==+---=-⋅-====+==S S F n n p n p n p n p p n p p p p Z B n n p p p p Z A V n n X t n n n n S X t n n X E Ep p p Z n p p n n EZ p连列分析连列表:条件频数/行百分数/列百分数/总百分数 期望值:行百分数x 条件总值方差分析:检验各个总体的均值是否相等,判断分类自变量对数值因变量的影响()()()()()()()()()()1-c ,1-r min *n 相关系数.5nc 列联相关系数.4越大,相关程度越大,cd ab排列:d b c a d c b a bc-ad n相关系数.3比较df 同)总数列总和行总和(依赖关系)独立性检验(是否存在.2,拒绝原假设df 比较,若df 同)1-)(列数1-(行数自由度:两数之间相关程度.1期望值频数)观察值频数(2222222222220λλλϕλϕλλλλλλααα=+=+++++==+=-=>=-=∑∑V CTRT f f f ff f ff f e e e ee e 1.单因素方差分析关系是比较每两组数据间的,拒绝,有显著差异-X ,k -n 自由度为11最小显著差异.3占总的自变量对因变量的影响,关系量强度.2,拒绝若,统计量.1k-n SSE组内均方_;1-k SSA 组间均方MSA 1-n 自由度;的误差)的平方的总和x :(每一个观测值与k-n 自由度的总和)的平方)的误差x 均值:(每组内频数与组平1-k 自由度和的误差)的平方))总x ((各组间平均值与*(组内频数:组的个数k 总数,n 个值,:其中第个条件;:第总平均数x 一个条件组的平均数;x ,组内误差,,组间误差总平方和(总误差)j i j i222LSD LSD X n n MSE t LSD R SSESSAR F F MSEMSAF MSE SST SSE SSA j j i i SSE SSA SST >⎪⎪⎭⎫⎝⎛+==>===αα2.双因素方差分析 A.独立双因素22i j 的影响占总的这两个自变量对因变量,关系量强度.2,拒绝,即差异显著若))1k )(1r (,1-r (~列因素显著性))1k )(1r (,1-k (~行因素显著性.1同理、,1)1k )(1r (;随机误差平方和)1-r ( df ,列因素误差和),1-k (df ,行因素误差和1-kr :df ,自由度总平方和(总误差)为总平均数x ;x ,每行平均i ,因素k 行数;x ,每列平均值j ,因素r 列数R SSTSSCSSR R F F F MSEMSCF F MSE MSRF MSE MSC K SSRMSR SSESSC SSR SST df SSE SSC SSR SST C R +=>--=--=-=++=--α B.交互作用双因素K,个行因素;m ,行因素数值的行数 R,个列因素;n ,观察值总数误差来源 平方和 自由度 均方 F 值行因素 SSR K-1 MSR MSR/MSE 列因素 SSC R-1 MSC MSC/MSE 交互左右 SSRC (K-1)(R-1) MSRC/MSE 误差 SSE KR(M-1) 总和 SST N-1()()()()()()()()y预测y ˆ,y ˆ-y 标准化残差y ˆ-y e 残差.56x x x x n1**)1(y y 时,得到的置信区间估计,取值y .55n1,t 回归系数1-k -n 自由度;自由度2-n ,1~线性关系线性关系显著性检验.54估计标准误差:越大拟合越好,拟合优度.53强度的线性关系r 拒绝,即存在,,t 若)2-n (~r-12-n rt2右偏分布r 较大,负值,左偏r 较大,正值,总体相关系数1的显著性检验,r ,无关0负线性相关;,0,正线性相关;0度,两个关系间的关系强r 相关系数.52,:和截距估计的回归方程的斜率:程估计的简单线性回归方一元线性回归模型.5100ei 002i20200022ˆˆ222122ee I I ee iiii i S Z S n t X X X S S S AB SSE K SSR F MSEMSRF MSES SSTSSRR t t xb y A n xx n y x y x B Bx A y ==--+-±-=-====>==<>-=--=+=∑∑∑∑∑∑∑∑αββααρ()),拒绝,即存在1-k -n (若均数,各个自变量之间相关系多重共线性判定.64)1-k -n (~S t 回归系数:)1,(~)1/(/显著性检验:线性关系.63估计标准误差:k ,自变量数量n 样本数量1k 111修正的多重判定::多重判定系数拟合优度.62:之间的关系,,:多元回归方程:多元线性回归模型.612iii 22222110ααββεββββt t k n k F k n SSE KSSR F MSES n n R R SSTSSRR SSESSR SST SSE SSR SST x x x y e a p p >=----==---⋅--==+=++⋅⋅⋅+++=71.时间序列平稳序列非平稳序列(趋势T/季节性S/周期性C/随机性I )平均增长率=环比增长率的几何平均值-1()季节性顺序.75修正指数曲线指数曲线线性趋势趋势型预测.74-F 指数平滑:个值作为一期的平均数选择F 移动平均:Yt1F 简单平均法平稳序列的预测.73和求平均每一个误差平方后的总均方误差和求平均全部误差取绝对值后总平均绝对误差所有预测误差的平均数平均误差,预测值个观测值i 第预测方法评估.72t t t 1t 1t ti1t ii F Y F K MSE MAD ME F Y α+======+++∑回归分析的一些数据P1:MR:相关系数;RS判定系数,ARS调整的判定系数;标准误差s,观测值nP2:df自由度;总平方和SS;均方MS;线性关系F (Ps:回归R,残差E,总计T)P3,:INTER,截距;XV,斜率;t-stat 回归系数P值检验,P >α,不拒绝;<α,拒绝WelcomeTo Download !!!欢迎您的下载,资料仅供参考!。

统计学复习概念重点-贾俊平

统计学复习概念重点-贾俊平
i=4
n —1
n
'(X -X)2
i-1
n —1
估计总体比例时的样本容 量
加权样
k
2
(Mi-x) fi
iA
n —1
总体均值检验的统计量
(正态总体,匚已知)
加权样 本标准 差
’(Mi-X)2fi
『广n—1
总体比例检验的统计量
判定系 数
相关系 数检验 的统计 量
标准分

指数平 滑法预 测
移动平 均法预 测
R2
SSR「(?i-y)2
SST「、⑶-y)2
总体方差检验的统计量
t
~t(n- 2)
-X
一S
Xi
-
散数
离«系
Ft 1Tt(1-〉)Ft
拉氏
权均数售q1又
加平指销P1q划
Y*丫一2•…匕Yt
Ft1二Yt
k
Ip
P(1-P)
1」
N
2 2(n -1)s岂_2岂(n -1)s
P-乙.2
' pg ' qpo
P0q0q'q°P0
21.离散型变量:只能取可数值的变量。
22.连续型变量:可以在一个或多个区间中取任何值的变量。
23.调查数据:通过调查方法获得的数据
24.实验数据:通过实验方法获得的数据
25.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
26.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施 调查。
nn
年度化
增长率
Y
r?-1
均方预测 误差
n

统计学(贾俊平版)重点

统计学(贾俊平版)重点

第一章统计:收集、处理、分析、解释数据并从数据中得出结论得科学。

数据1、分类数据对事物进行分类得结果数据,表现为类别,用文字来表述、例如,人口按性别分为男、女两类2、顺序数据对事物类别顺序得测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3、数值型数据对事物得精确测度,结果表现为具体得数值、例如:身高为175cm ,168cm,183cm总体–所研究得全部元素得集合,其中得每一个元素称为个体–分为有限总体与无限总体、有限总体得范围能够明确确定,且元素得数目就是有限得、无限总体所包括得元素就是无限得,不可数得样本–从总体中抽取得一部分元素得集合–构成样本得元素数目称为样本容量参数:描述总体特征。

有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。

样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。

经验,理论变量描述统计研究得就是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计就是研究如何利用样本数据进行推断总体特征第二章间接数据(查询得)与直接数据:调查(通常就是对社会现象而言得)普查信息全面完整。

再一个就是实验。

概率抽样:也称随机抽样。

按一定得概率以随机原则抽取样本,抽取样本时使每个单位都有一定得机会被抽中–每个单位被抽中得概率就是已知得,或就是可以计算出来得–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中得概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本得概率就是相等得分层抽样:优点:保证样本得结构与总体得结构比较相近将抽样单位按某种特征或某种规则划分为不同得层,然后从不同得层中独立、随机地抽取样本,从而提高估计得精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层得目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中得所有单位全部实施调查优点:抽样时只需群得抽样框,可简化工作量–调查得地点相对集中,节省调查费用,方便调查得实施–缺点就是统计得精度较差系统抽样:将总体中得所有单位(抽样单位)按一定顺序排列,在规定得范围内随机地抽取一个单位作为初始单位,然后按事先规定好得规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计得精度多阶段抽样:先抽取群,但并不就是调查群内得所有单位,而就是再进行一步抽样,从选中得群中抽取出若干个单位进行调查–群就是初级抽样单位,第二阶段抽取得就是最终抽样单位。

统计学原理贾俊平期末考试重点

统计学原理贾俊平期末考试重点

统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

分析数据:分为描述统计方法和推断统计方法两种方法。

描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计:是研究如何利用样本数据来推断总体特征的统计方法。

推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。

注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。

数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。

(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。

(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。

3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。

在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。

统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。

4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。

样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。

抽样的目的是根据样本提供的信息推断总体的特征。

5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。

样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。

统计学(贾俊平版)重点

统计学(贾俊平版)重点

统计学(贾俊平版)重点统计学是一门研究数据分析、推断和决策的科学。

它在计量、自然科学、社会科学等领域中都扮演着重要的角色。

统计学被广泛应用于探索数据中的规律,揭示数据背后的信息和因果关系,提供决策和预测支持。

以下是统计学中的一些重要概念和方法。

1.总体和样本在统计学中,总体指的是研究对象的全体,无论是人群、产品、自然事物还是其他随机变量。

而样本则是从总体中随机抽取的一部分数据。

通过对样本的研究和分析,可以推断出总体的性质和规律。

2.描述统计描述统计是一种通过统计指标和图表来描述数据特征的方法。

其中比较重要的统计指标包括平均数、中位数、众数、标准差等。

描述统计旨在提供数据的概括性信息,以便人们更好地理解和解释数据。

3.推断统计推断统计是一种通过样本数据推断总体特征和性质的方法。

其中最重要的概念是抽样误差和置信区间。

抽样误差是指样本和总体之间的误差,而置信区间则是通过样本数据得到总体特征的区间估计值。

4.假设检验假设检验是一种判断总体特征是否符合某种假设的方法。

在假设检验中,研究人员提出一个关于总体的假设,然后利用样本数据进行检验。

假设检验的结果通常表现为拒绝或者接受原始假设的结论。

5.回归分析回归分析是一种推断变量之间关系的方法。

在回归分析中,一个或多个自变量被用来预测某个因变量的值。

回归分析可以帮助研究人员发现因变量和自变量之间的关系,并作出预测和决策。

6.方差分析方差分析是一种分析不同组之间差异的方法。

在方差分析中,数据被分成几个组,然后比较这些组之间的方差。

方差分析可以帮助确定如何将数据进行分组,以便得到更好的比较结果。

7.贝叶斯统计贝叶斯统计是一种利用先验概率和样本数据计算后验概率的方法。

在贝叶斯统计中,先验概率是在进行实证研究前已知的条件概率,而后验概率则是在考虑实证研究的结果后计算出来的条件概率。

贝叶斯统计可以帮助人们理解和理性决策不确定和风险。

综上,统计学是一门重要的科学,它为各种领域的研究和决策提供了支持和基础。

统计学原理贾俊平期末考试重点

统计学原理贾俊平期末考试重点

统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

分析数据:分为描述统计方法和推断统计方法两种方法。

描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计:是研究如何利用样本数据来推断总体特征的统计方法。

推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。

注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。

数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。

(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。

(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。

3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。

在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。

统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。

4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。

样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。

抽样的目的是根据样本提供的信息推断总体的特征。

5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。

样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。

统计学贾俊平考研知识点总结

统计学贾俊平考研知识点总结

统计学贾俊平考研知识点总结Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

统计学 贾俊平 考研 知识点总结

统计学 贾俊平 考研 知识点总结

统计学重点笔记第一章导论一、比较描述统计与推断统计:数据分析就是通过统计方法研究数据,其所用的方法可分为描述统计与推断统计。

(1)描述性统计:研究一组数据的组织、整理与描述的统计学分支,就是社会科学实证研究中最常用的方法,也就是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理与显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:就是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的就是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计就是基础,推断统计就是主体二、比较分类数据、顺序数据与数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。

(1)分类数据就是只能归于某一类别的非数字型数据。

它就是对事物进行分类的结果,数据表现为类别,就是用文字来表达的,它就是由分类尺度计量形成的。

(2)顺序数量就是只能归于某一有序类别的非数字型数据。

也就是对事物进行分类的结果,但这些类别就是有顺序的,它就是由顺序尺度计量形成的。

(3)数值型数据就是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都就是数值型数据。

总之,分类数据与顺序数据说明的就是事物的本质特征,通常就是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的就是现象的数量特征,通常就是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量与变量:(1)总体就是包含所研究的全部个体的集合。

通常就是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

考试点专业课:贾俊平《统计学》考研考点大全

考试点专业课:贾俊平《统计学》考研考点大全
o s h i d i a n c o m ) 名师精品课程㊀电话: 4 0 0- 6 8 8 5- 3 6 5
第一章 ㊀ 导 论
基本内容
统计学的含义、 统计数据及其分类、 统计学常用的基本概念。
重点内容
统计学常用的基本概念。
学习目标
1 . 理解统计学的含义, 能区分描述统计与推断统计 2 . 了解统计学的应用领域 3 . 理解统计数据的含义、 基本类型及特点 4 . 熟悉总体、 样本、 参数、 统计量、 变量等基本概念的含义
课程辅导的目标
1 . 更加深刻地理解统计学主要概念及统计背景, 了解在社会经济应用及分析中的重要作用, 系统 掌握统计描述和统计推断的基本内容与基本方法; 2 . 在掌握统计学基础知识的基础上, 能较容易理解其他课程中的一些数量分析方法, 并能独立完 成对有关资料的搜集、 整理、 分析。 3 . 为深入研究社会经济问题和学习其它专业课程提供数量分析的方法。 4 . 为进一步学习专业统计和数量经济课程打好基础。 要求学生能在教师的指导下, 掌握统计学的基本理论和方法, 熟悉统计软件的基本操作, 并能够 结合经济学和工商管理理论加以应用。 — 1—
内容体系和章节分配
描述统计: 前四章 推断统计: 第五章至第十一章 统计应用: 第十二章至第十四章 第 1章㊀导论㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第 2章㊀数据的搜集 第 3章㊀数据的图表展示 第 5章㊀概率与概率分布 第 7章㊀参数估计 第 9章㊀列联分析 第1 1章㊀一元线性回归 第1 3章㊀时间序列分析和预测 第 4章㊀数据的概括性度量 第 6章㊀统计量及其抽样分布 第 8章㊀假设检验 第1 0章㊀方差分析 第1 2章㊀多元线性回归 第1 4章㊀指数
目㊀录
第一章㊀导论 ( 2 ) 第一节㊀统计及其应用领域 ( 2 ) 第二节㊀统计数据类型 ( 4 ) 第三节㊀统计学的常用基本概念 ( 4 ) 第二章㊀数据的搜集 ( 6 ) 第一节㊀数据的来源 ( 6 ) 第二节㊀调查数据 ( 7 ) 第三节㊀数据的误差 ( 1 0 ) 第三章㊀数据的图表展示 ( 1 2 ) 第一节㊀数据的预处理 ( 1 2 ) 第二节㊀品质数据的整理与展示 ( 1 3 ) 第三节㊀数值型数据的整理与展示 ( 1 8 ) 第四节㊀合理使用图表 ( 2 4 ) 第四章㊀数据的概括性度量 ( 2 6 ) 第一节㊀集中趋势的度量 ( 2 6 ) 第二节㊀离散程度的度量 ( 3 1 ) 第三节㊀偏态与峰态的度量 ( 3 4 ) 第五章㊀概率与概率分布 ( 3 6 ) 第一节㊀随机事件及概率 ( 3 6 ) 第二节㊀概率的性质与运算法则 ( 3 9 ) 第三节㊀离散型随机变量及其分布 ( 4 4 ) 第四节㊀连续型随机变量的概率分布 ( 4 9 ) 第六章㊀统计量及其抽样分布 ( 5 4 ) 第一节㊀统计量 ( 5 4 ) 第二节㊀由正态分布导出的几个重要分布 ( 5 5 ) 第三节㊀样本均值的分布 ( 5 8 ) 第四节㊀样本方差和样本比例的分布 ( 6 1 ) 第七章㊀参数估计 ( 6 2 ) 第一节㊀参数估计的基本原理 ( 6 2 ) 第二节㊀一个总体参数的区间估计 ( 6 6 ) 第三节㊀两个总体参数的区间估计 ( 7 0 ) 第四节㊀样本量的确定 ( 7 3 )

贾俊平-统计学-总结

贾俊平-统计学-总结

第一章导论概念:统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。

统计的分类:描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。

推断统计:是研究如何利用样木数据进行推断总体特征。

数据:1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。

例如,人口按性别分为男、女两类2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3.数值型数据对事物的精确测度,结果表现为具体的数值。

例如:身高为175cm,190cm,200cm 参数:描述总体特征。

有总体均值(μ)、标准差()总体比例(T)统计量:描述样本特征,样本标准差(s),样木比例(p)第二章 数据的搜集1. 数据来源包括直接来源(一手数据)和间接来源(二手数据)2. 抽样方式包括概率抽样与非概率抽样3. 概率抽样:也称随机抽样。

按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中。

4.5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。

抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述的是所有样本可能的结果与总体真值之间的平均差异。

统计数据的分类按计量层次分类的数据顺序的数据数值型数据 按时间状况截 面 的 数 据时序的数据按收集方法 观察的数据 实验的数据6.抽样误差的大小与样本量的大小和总体的变异程度有关。

第三章数据的图表展示计算机实训内容,要求:1.数据筛选,自动筛选2.高级筛选,3.数据排序4.分类汇总-利用数据透视表5.对比条形图6.环形图7.累计频数图8.散点图9.雷达图等等频数分布图两种方法:工具-数据分析-直方图数值型和顺序数据数据-数据透视表数据透视表第四章数据的概括性度量集中趋势:算数平均数:几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的平均年利率,最常用的一种计算公式为,几何平均数≤算术平均数。

贾俊平统计学第1章导论

贾俊平统计学第1章导论

统计中的几个基本概念
总体

☺ ☺
☺ ☺
☺☺☺
样本
☺☺ ☺
参数
统计量平均数x Nhomakorabea标准差
s
比例
p
1 -5
成人教育系列
统计学基础
几种常用的统计软件
(Software)
典型的统计软件
SAS SPSS
SAS SPSS
1 -6
STATISTICA MINITAB Excel
成人教育系列
统计学基础
1.3
统计中的几个基本概念
• 总体和样本 • 参数和统计量 • 变量
1 -1
成人教育系列
统计学基础
总体和样本
• 总体(population)
所研究的全部元素的集合 ,其中的每一个元素称为 个体
分为有限总体和无限总体
有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的
分类变量(categorical variable) :说明事物类别的一个名称 顺序变量(rank variable ) :说明事物有序类别的一个名称 数值型变量(metric variable ) :说明事物数字特征的一个名称
离散变量:取有限个值 连续变量:可以取无穷多个值
1 -4
成人教育系列
统计学基础
• 样本 (sample)
从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量
1 -2
成人教育系列
统计学基础
参数和统计量
• 参数(parameter)
研究者想要了解的总体的某种特征值 所关心的参数主要有总体均值()、标准差()
、总体比例()等 总体参数通常用希腊字母表示

《统计学》贾俊平

《统计学》贾俊平

概率论与数量统计一、连续型随机变量分布函数及其概率密度 1.概率密度与它的基本性质设对于随机变量ξ的分布函数F (x ),如果存在非负可积函数f (x ), 使得对任意的实数x ,都有⎰∞-=≤=xdtt f x P x F )(}{)(ξ成立,则称ξ为连续型随机变量,f (x )便是ξ的概率密度(或分布密度)。

概率密度具有如下基本性质:(1)0)(≥x f (非负性);(2)⎰∞∞-=1)(dx x f (规范性);(3)对任何实数c ,有0}{==c P ξ;对任意的实数a ,b (a <b ),有⎰=≤<badx x f b a P )(}{ξ。

且只要区间的端点不变,ξ取值于开区间或闭区间或半开半闭区间的概率都是相等的。

2.连续型随机变量的数学期望和方差P47 3.随机变量的矩与切比雪夫不等式 4.常用的连续型分布常用的连续型分布有均匀分布、指数分布、正态分布等。

(1)均匀分布若随机变量ξ取值在有限区间(a , b )上,其概率密度为⎪⎩⎪⎨⎧<<-=.其它,0,,1)(b x a ab x f其中b >a 为常数。

则称ξ服从区间(a , b )上的均匀分布,简记为],[~..b a U v r ξ。

均匀分布是等可能概型在连续情形下的推广。

(4)正态分布设随机变量ξ有概率密度+∞<<∞-=--x ex f x ,21)(222)(σμπσ其中μ,0>σ为常数。

则称ξ服从参数为μ,σ的正态分布,简记为 ),(..2σμξN v r ~。

特别,当μ=0,σ=1时,有+∞<<-∞=-x ex x ,21)(22πϕ。

此时称ξ服从标准正态分布。

简记为..v r ξ~N (0,1)。

5.概率密度与分布函数的互求当概率密度给定时,运用逐段积分可求得分布函数。

即⎰∞-=≤=xdt t f x P x F )(){)(ξ,如此得到的分布函数是定义在整个实数轴上的连续函数。

贾俊平《统计学》考研考点大全

贾俊平《统计学》考研考点大全
图 1-1 统计研究的过程
— 2—
贾俊平《统计学》考点精讲
数据分析方法分类:描述统计方法和推断统计方法,描述是推断统计的前提,推断统计是描述统 计的发展。
描述统计是研究数据收集、处理、汇总、图表描述、概括与分析等的统计方法,通常采用集中量数、 差异量数、地位量数、相关系数等概括性的度量工具;反映研究总体的直观特征、外在联系或横向比较 结果等浅表性信息。
第十一章 一元线性回归 (116) 第一节 变量间关系的度量 (116) 第二节 一元线性回归 (121) 第三节 利用回归方程进行预测 (128) 第四节 残差分析 (129)
第二章 数据的搜集 (6) 第一节 数据的来源 (6) 第二节 调查数据 (7) 第三节 数据的误差 (10)
第七章 参数估计 (62) 第一节 参数估计的基本原理 (62) 第二节 一个总体参数的区间估计 (66) 第三节 两个总体参数的区间估计 (70) 第四节 样本量的确定 (73)
内容体系和章节分配
描述统计:前四章
推断统计:第五章至第十一章
统计应用:第十二章至第十四章
第 1章 导论 第 2章 数据的搜集
第 3章 数据的图表展示
第 4章 数据的概括性度量
第 5章 概率与概率分布
第 6章 统计量及其抽样分布
第 7章 参数估计
第 8章 假设检验
第 9章 列联分析
第十章 方差分析 (99) 第一节 方差分析引论 (99) 第二节 单因素方差分析 (102) 第三节 双因素方差分析 (110)
第 10章 方差分析
第 11章 一元线性回归
第 12章 多元线性回归
第 13章 时间序列分析和预测
第 14章 指数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学知识点
导论部分
描述统计与推断统计概念比较,举例说明。

统计数据的类型:有三种分类方式,重点关注(分类数据、顺序数据、数值型数据)这三种的概念和特点。

几个基本概念:总体和样本、参数和统计量、变量(分类变量、顺序变量、数值型变量)概念及举例明。

数据搜集部分
数据的间接来源:二手数据的特点
数据的直接来源:调查数据和实验数据(实验数据相关知识参见风笑天笔记)
调查数据:概率抽样和非概率抽样的比较。

简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样、方便抽样、判断抽烟、滚雪球抽样、配额抽样的概念、优缺点及抽样过程的简单描述。

搜集数据的基本方法:自填式、面谈时、电话式优缺点。

数据误差:抽样误差和非抽样误差(系统误差和随机误差)。

抽样框误差、回答误差、无回答误差、测量误差概念。

误差的控制方法。

数据的概括性度量
集中趋势:众数、中位数、平均数概念、计算方法、分布上的关系、各自特点和应用场合。

离散趋势:异众比率、四分位差、方差和标准差、离散系数的概念、计算、特点等。

偏态和峰态的概念。

概率部分(全部是概念)
随机事件及其概率:随机事件、必然事件、不可能事件、基本事件、独立事件和条件概率。

离散型随机变量及其分布:随机变量及其分类、泊松分布。

连续型随机变量及其分布:概率密度、正态分布的曲线及其性质
统计量和抽样分布部分(参数估计的基础)
常用统计量
抽样分布的概念
正态分布及由正态分布导出的几个分布及其特点(正态、卡方、t、F)。

另外标准正态分布和正态分布的概念特点,条件分布的概念。

中心极限定理
样本均值的分布、样本比例的分布、样本均值之差的分布、样本方差的分布
从下面开始就要做题了,每章的例题都要做三遍,课后习题有选择的做一些。

参数估计部分
参数估计、点估计、区间估计的概念及基本原理、置信区间的概念及解释、评价估计量的标准。

一个总体参数的估计(均值、比例、方差),两个总体参数的区间估计(均值之差、比例之差、方差之比)、样本量的确定(估计均值时的、估计比例时的)
假设检验部分
建设检验、原假设、备择假设的概念、假设检验的基本流程和决策准则。

两类错误的概念、控制、关系。

显著性水平的概念解释。

P值决策相关概念和原理、准则。

单侧检验的形式和假设建立。

假设检验的具体内容
主要公式
分类数据分析部分
多看课本例题,2014年的真题就是分类数据的分析,弄懂那道题目,本章搞定了大半。

卡方统计量
拟合优度检验和独立性检验的操作
方差分析部分
方差分析的三个基本假定、假设的提法
单因素方差分析的一般流程(不太需要看双因素的)
总平方和、组内方差、组间方差的概念和计算方式。

一元线性回归(一元和多元回归部分多看书中的表格,理解表格,会补充表格)
函数关系、相关关系、相关系数、回归系数的概念
最小二乘法、同方差和异方差
一元线性回归的计算(两个参数),拟合优度的计算,三个平方和、残差的概念,判定系数的计算,标准误差的估计
高斯马尔可夫定理
多元线性回归
多元回归模型
多重共线性概念、对回归模型的影响、多重共线性的识别和处理。

相关文档
最新文档