统计学第六版贾俊平第9章

合集下载

贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】

贾俊平《统计学》配套题库  【课后习题】详解  第9章~第10章【圣才出品】

第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。

答:列联表是由两个以上的变量进行交叉分类的频数分布表。

列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。

次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。

表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。

而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。

由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。

3.说明计算2χ统计量的步骤。

答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。

(完整版)统计学贾俊平考研知识点总结

(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

统计学第九章课后习题答案

统计学第九章课后习题答案

9.1(1)设原假设为H:不同收入群体对某种特定商品的购买习惯相同:即不同收入群体对某种特定商品的购买习惯不完全相同H1(2)由SPSS计算可得χ2值为17.626(3)自由度=(3-1)×(4-1)=6,当α=0.1时,χ0.12(6)=10.64∵χ2=17.626>10.64=χ0.12(6)故拒绝原假设,即不同收入群体对某种特定商品的购买习惯不完全相同。

(4)由SPSS计算可得φ系数为0.183、c系数为0.180、V系数为0.1299.2解:设原假设为H0:现在情况与经验数据相比没有发生变化;H1:现在情况与经验数据相比发生了变化。

由已知条件可得χ2值为:χ2=(28−0.1×200)20.1×200+(56−0.2×200)20.2×200+(48−0.3×200)20.3×200+(36−0.2×200)20.2×200+(32−0.2×200)20.2×200=14P[χ2(5−1)>14]=0.007295<0.1=α,故拒绝原假设。

9.3设原假设为H0:π1=π2=π3=π4(即阅读习惯与文化程度无关)H1:π1,π2,π3,π4不完全相等(即阅读习惯与文化程度有关)表中各项的期望值:E11=n1×n1n=77×50254=15.16E12=n2×n1n=91×50254=17.91E13=n3×n1n=42×50254=8.27E14=n4×n1n=44×50254=8.66E21=n1×n2n=77×44254=13.34E22=n2×n2n=91×44254=15.76E23=n3×n2n=42×44254=7.28E24=n4×n2n=44×44254=7.62E31=n1×n3n=77×95254=28.80E32=n2×n3n=91×95254=34.04E33=n3×n3n=42×95254=15.71E34=n4×n3n=44×95254=16.46E41=n1×n4n=77×65254=19.70E42=n2×n4n=91×65254=23.29E43=n3×n4n=42×65254=10.75E44=n4×n4n=44×65254=11.26所以χ2=(6-15.16)2/15.16+(12-13.34)2/13.34+……+(13-11.26)2/11.26=31.86。

《统计学》完整袁卫-贾俊平

《统计学》完整袁卫-贾俊平

总体 N
N1 N2
n1
n2
样本 n
n1 n2 nk
等额
k
n ni
i 1
等比例
n1
Ni N
n
··· ···
N k nk
最优
n1
Ni
2 i
Ni
2 iBiblioteka n整群抽样方法:首先把总体中的N个单位划分成为若干个群, 并要求每个群对整个总体都具有代表性,然后对群进 行简单随机抽样,并对抽中群内的所有单位进行调查 研究。
1. 描述统计
关于搜集、展示一批数据,并反映这 批数据特征的各种方法,其目的是为 了正确地反映总体的数量特点。
2. 推断统计 根据样本统计量估计和推断总体参 数的技术和方法。
描述统计是推断统计的前提, 推断统计是描述统计的发展。
二、数据
(一) 为何需要数据 ?
统计学要研究各种随机变量,通过对这些随机变量的 观察所获取的数据包含了我们所需的信息,这些信息 能有助于我们在许多场合中做出更为正确的决策。
就是把定量数据按从大到小或从小到大的顺序排列, 把定性数据按习惯的文字顺序排列,便于我们研究其 条理。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。

统计学第六版贾俊平

统计学第六版贾俊平
9 - 26
精品教材
统计学
拟合优度检验
(例题分析)
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
0 3.0319 6.215 c2
9 - 27
统计量:
r
c2
c (fij eij)2 3.0319
i1 j1
eij
结论:
可以认为广告后各公司产品
0
5.99 8.18 c
市场占有率发生显著变化
9 - 29
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选
“CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域
的百分比,称为百分比分布
行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
总百分比:每一个观察值除以观察值的总个数( fij / n )
9 - 15
精品教材
统计学
百分比分布
(图示)
行百分比
列百分比
总百分比
0.3000
e
36 0.9730 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
Z 检验 Z 检验 c 检验

统计学第六版贾俊平 无水印

统计学第六版贾俊平 无水印
Johann Gregor Mendel (孟德尔 )
率各为1/2;投掷一枚骰子出现1~6点的频率 各为1/6 3. 农作物的产量与施肥量之间存在相关关系
统计方法
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
(descriptive statistics)
1. 内容

? 搜集数据
50
? 整理数据
? 展示数据
25? 描述性分析2. 目的0? 描述数据特征
什么是统计学 ?
? 收集、分析、表述和解释数据的科学
1. 数据搜集:取得数据 2. 数据分析:分析数据 3. 数据表述:图表展示数据 4. 数据解释:结果的说明
statistics 的定义 (不列颠百科全书)
statistics : the science of collecting, analyzing, presenting, and interpreting data.
election forecasting and projection (选举预测和策划 )
engineering (工程)
epidemiology (流行病学 )
finance (金融)
fisheries research (水产渔业研究 )
gambling (赌博)
genetics (遗传学)
geography (地理学)
? 找出数据的基本规律
Q1 Q2 Q3 Q4
x = 30 s2 = 105
推断统计
(inferential statistics)
1. 内容
总体
? 参数估计
? 假设检验
2. 目的
? 对总体特征作出

统计学基础(第六版)教学课件第8章

统计学基础(第六版)教学课件第8章

2009
呈现出一定的抛物
2008
趋势;管理成本则
2007
现一定的指数变化
2005
净利润呈现一定的
2006
2005
线性趋势;产量呈
净利润
《统计学基础》(第六版)
管理成本
第8章
8.3 时间序列预测的程序和方法
确定时间序列的成分
4000
年份
8 - 13
第8章
《统计学基础》(第六版)

8.3 时间序列预测的程序和方法
84
60
233
2007
2938
124
73
213

第2步,找出适合该时间序列的预测方法。
2008
3125
214
121
230
2009
3250
216
126
223
第3步,对可能的预测方法进行评估,以确定最
2010
3813
354
172
240

2011
4616
420
218
208
佳预测方案。
2012
4125
514
110.94
110.61
109.60
110.29
110.50
110.00
108.61

119.87
133.41
148.01
163.71
179.42
197.89
218.63)根据式(8.5)得:
ҧ =


− 1 × 100 =
0
9
27563
− 1 × 100 = 11.26%
2021/11/5

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析第6章方差分析6.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。

6.2 579.48234.1501.0=>=F F (或01.000001.0=<=-αvalue P ),拒绝原假设。

6.3 4170.50984.1001.0=>=F F (或01.0000685.0=<=-αvalue P ),拒绝原假设。

6.4 6823.37557.1105.0=>=F F (或05.0000849.0=<=-αvalue P ),拒绝原假设。

6.5 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。

85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设;85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。

6.6554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假设。

第7章相关与回归分析7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。

(2)920232.0=r 。

(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。

7.2 (1)散点图(略)。

(2)8621.0=r 。

7.3 (1)0?β表示当0=x 时y 的期望值。

(2)1?β表示x 每变动一个单位y 平均下降0.5个单位。

(3)7)(=y E 。

7.4 (1)%902=R 。

(2)1=e s 。

7.5 (1)散点图(略)。

贾俊平第六版统计学课后思考题答案——张云飞

贾俊平第六版统计学课后思考题答案——张云飞

第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计是研究如何利用样本数据来推断总体特征的统计方法。

3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

顺序数据:是只能归于某一有序类别的非数字型数据。

虽然也有列别,但这些类别是有序的。

数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。

4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。

5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。

比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。

在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。

我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。

6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。

顺序变量:一个变量由顺序数据来记录就称为顺序变量。

数值型变量:一个变量由数值型数据来记录就称为数值型变量。

离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。

统计学(第六版)贾俊平-课后习题答案

统计学(第六版)贾俊平-课后习题答案

第一章导论1.1.1(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

1.3(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数(5)推断统计方法。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。

使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手资料时,要注明数据来源。

2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。

每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。

如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。

它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试。

3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。

统计学(第六版)贾俊平——_课后习题答案

统计学(第六版)贾俊平——_课后习题答案

第一章导论1.1.1(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

1.3(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数(5)推断统计方法。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。

使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手资料时,要注明数据来源。

2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。

每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。

如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。

它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试。

3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下(4)帕累托图(略)。

2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。

(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。

2.72.8(1)属于数值型数据。

2.9(1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.10A 班分散,且平均成绩较A 班低。

2.11 (略)。

2.12 (略)。

2.13 (略)。

2.14 (略)。

2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

(2)5.5=L Q ;12=U Q 。

(3)24=x ;65.6=s 。

(4)08.1=SK ;77.0=K 。

(5)略。

3.3 (1)略。

(2)7=x ;71.0=s 。

(3)102.01=v ;274.02=v 。

(4)选方法一,因为离散程度小。

3.4 (1)x =(万元);M e= 。

统计学课后题答案(袁卫庞皓曾五一贾俊平)

统计学课后题答案(袁卫庞皓曾五一贾俊平)

第1章绪论5.简要说明抽样误差和非抽样误差。

答:统计调查误差可分为非抽样误差和抽样误差。

非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。

抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。

b5E2RGbCAP6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。

因此,他们开始检查供货商的集装箱,有问题的将其退回。

最近的一个集装箱装的是2 440加仑的油漆罐。

这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。

装满的油漆罐应为 4.536 kg。

要求:p1EanqFDPw(1>描述总体;(2>描述研究变量;(3>描述样本;(4>描述推断。

答:(1>总体:最近的一个集装箱内的全部油漆;(2>研究变量:装满的油漆罐的质量;(3>样本:最近的一个集装箱内的50罐油漆;(4>推断:50罐油漆的质量应为4.536×50=226.8kg。

7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。

这场战役因影视明星、运动员的参与以及消费者对品尝实验优先权的抱怨而颇具特色。

假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝实验(即在品尝实验中,两个品牌不做外观标记>,请每一名被测试者说出A品牌或B品牌中哪个口味更好。

要求:DXDiTa9E3d(1>描述总体;(2>描述研究变量;(3>描述样本;(4>描述推断。

答:(1>总体:市场上的“可口可乐”与“百事可乐”(2>研究变量:更好口味的品牌名称;(3>样本:1000名消费者品尝的两个品牌(4>推断:两个品牌中哪个口味更好。

第2章统计数据的描述思考题4. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。

统计学第六版贾俊平 无水印

统计学第六版贾俊平 无水印
2. 顺序数据(rank data)
? 对事物类别顺序的测度 ? 数据表现为类别,用文字来表述 ? 例如,产品分为一等品、二等品、三等品、次品等
3. 数值型数据(metric data)
? 对事物的精确测度 ? 结果表现为具体的数值 ? 例如:身高为 175cm、168cm、183cm
统计数据的分类
management science (管理科学 )
marketing (市场营销学 )
medical diagnosis (医学诊断 )
meteorology (气象学 )
military science (军事科学 )
nuclear material safeguards (核材料安全管理 )
ophthalmology (眼科学 )
统计中的几个基本概念
总体
?
? ?
?????
样本
?? ?
参数 ? ? ?
平均数 标准差 比例
统计量 ?x s p
几种常用的统计软件
(Software)
?典型的统计软件
? SAS ? SPSS
? MINITAB
? STATISTICA ? Excel
SAS SPSS
STATISTICA MINITAB Excel
? 有限总体的范围能够明确确定,且元素的数目是有限的 ? 无限总体所包括的元素是无限的,不可数的
2. 样本 (sample)
? 从总体中抽取的一部分元素的集合 ? 构成样本的元素的数目称为样本容量
参数和统计量
1. 参数(parameter)
? 研究者想要了解的总体的某种特征值 ? 所关心的参数主要有总体均值(? )、标准差(? )、

贾俊平统计学思考题答案

贾俊平统计学思考题答案

贾俊平统计学思考题答案(总9页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--第一章:1、什么是统计学统计学是一门收集、分析、表述、解释数据的科学和艺术。

2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。

推断统计:研究的是如何利用样本数据来推断总体特征。

3、统计学据可以分成哪几种类型,个有什么特点按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的,非数字型数据。

顺序数据:只能归于某一有序类别的,非数字型数据。

数值型数据:按数字尺度测量的观察值,结果表现为数值。

按收集方法不同。

分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。

按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。

时间序列数据:在不同时间收集的数据。

4、举例说明总体、样本、参数、统计量、变量这几个概念。

总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。

参数:用来描述总体特征的概括性数字度量。

(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。

(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。

(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

)5、变量可以分为哪几类分类变量:说明事物类别;取值是分类数据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。



列边缘分布
列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为 100 人, 120 人, 90人,110人
2. 条件分布与条件频数


变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变 量 X 的分布 每个具体的观察值称为条件频数
9 - 13
精品教材
统计学
条件频数
观察值的分布
9 - 27
c2
可以认为四个分公司对改革方 案的赞成比例是一致的
精品教材
统计学
拟合优度检验
(例题分析)
【例】为了提高市场占有率, A 公司 和B 公司同时开展了广告宣传。在广 告宣传战之前, A 公司的市场占有率 为 45% , B 公司的市场占有率为 40% ,其他公司的市场占有率为15%。为 了了解广告战之后 A 、 B 和其他公司 的市场占有率是否发生变化,随机抽 取了 200 名消费者,其中 102 人表示 准备购买A公司产品,82人表示准备 购买B公司产品,另外16人表示准备 购买其他公司产品。检验广告战前后 各公司的市场占有率是否发生了变化 ( 0.05)
(例题分析)
统计量:
c 2
i 1 j 1 r c
H0:地区与原料等级之间独立 H1:地区与原料等级之间不独立 = 0.05 df = (3-1)(3-1)= 4 临界值(s): =0.05
( f ij eij ) 2 eij
19.82
决策:
在 = 0.05的水平上拒绝H0
9 - 28
精品教材
统计学
拟合优度检验
(例题分析)
H0: 1=0.45 2=0.4 3= 0.15 统计量: H1:原假设中至少有一个不成立 r = 0.1 c2 df = (2-1)(3-1)= 2 i 1 临界值(s):

j 1
c
( f ij eij ) 2 eij
8.18
学习目标
拟合优度检验 独立性检验
3. 测度列联表中的相关性
9-3
精品教材
统计学
数据的类型与列联分析
数据
定量数据
(数值型数据)
定性数据
(品质数据)
离散数据
9-4
连续数据
列联分析
精品教材
统计学

分类数据
例如:性别 (男, 女)
1. 分类变量的结果表现为类别 2. 各类别用符号或数字代码来测度 3. 使用分类或顺序尺度
1. 2. 3. 4. 5.
列联表
(contingency table)
由两个以上的变量交叉分类的频数分布表 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组 合,所以称为列联表 6. 一个 r 行 c 列的列联表称为 r c 列联表
一分公司 二分公司 三分公司 四分公司 赞成该方案 反对该方案
合计 279 141 420
68 32
75 75
57 33
79 31
合计
9 - 11
100
120
90
110
精品教材
统计学
列联表的分布
9 - 12
精品教材
统计学
1. 边缘分布


观察值的分布
行边缘分布
行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人
(r c 列联表的一般表示)
列(cj) 合计
j =1
j=2

… … : …
i =1 i=2 : 合计
9 - 10
f11 f21
:
f12 f22
:
r1 r2
:
c1
c2
n
fij 表示第 i 行第 j 列的观察频数
精品教材
统计学
列联表
(例题分析)
【例】一个集团公司在四个不同的地区设有分公司,现该集 团公司欲进行一项改革,此项改革可能涉及到各分公司的利 益,故采用抽样调查方式,从四个分公司共抽取 420个样本 单位(人),了解职工对此项改革的看法,调查结果如下表
r1 c1 n n
由于观察频数的总数为n ,所以f11 的期望频数 e11 应为
r1 c1 r1c1 279 100 e11 n 66.43 66 420 n n n
9 - 18
精品教材
决策:
=0.05 在 = 0.05的水平上拒绝H0
结论:
0
9 - 29
5.99 8.18
c
可以认为广告后各公司产品 市场占有率发生显著变化
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选 “CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域 在对话框“Expected_range”输入期望数据区域 得到P值为0.016711,所以拒绝原假设
(图示)
行边缘分布
一分公司 二分公司 三分公司 四分公司 赞成该方案 反对该方案
合计 279 141 420
68 32
75 75
57 33
79 31
合计
100
120
90
110
列边缘分布
9 - 14
精品教材
统计学
百分比分布
(概念要点)
1. 条件频数反映了数据的分布,但不适合对比 2. 为在相同的基数上进行比较,可以计算相应 的百分比,称为百分比分布
i 1 j 1 r c
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
( f ij eij ) 2 eij
3.0319
决策:
在 = 0.1的水平上不能拒绝H0
结论:
0 3.0319 6.215
9 - 22
— 列联表中第i行第j列类别的实际频数
eij — 列联表中第i行第j列类别的期望频数
精品教材
统计学
实际频数 期望频数
c 统计量
(例题分析)
(eij)
66 80 60 73 34 40 30 37
(fij)
68 75 57 79 32 45 33 31
9 - 23
fij - eij
2 -5 -3 6 -2 5 3 -6
统计学
期望频数的分布
(例题分析)
一分公司 二分公司 三分公司 四分公司
赞成该 方案
实际频数 期望频数
实际频数 期望频数
68 66
32 34
75 80
75 40
57 60
33 30
79 73
31 37
反对该 方案
9 - 19
精品教材
统计学
9.2 拟合优度检验
一. c 统计量
二. 拟合优度检验
9 - 20
结论:
i 1 j 1
r
c
( f ij eij ) 2 eij

进行决策

9 - 32
根据显著性水平和自由度(r-1)(c-1)查出临界值c2 若c2c2,拒绝H0;若c2<c2,接受H0
精品教材
统计学
独立性检验
(例题分析)
【例】一种原料来自三个不同的地区,原料质量被分成三个 不同等级。从这批原料中随机抽取 500件进行检验,结果如 下表。检验各地区与原料之间是否存在依赖关系( 0.05)
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
独立性检验
Z 检验
Z 检验
两个总体
c 检验
c 检验
9 - 25
精品教材
统计学
拟合优度检验
(goodness of fit test)
1. 检验多个比例是否相等 2. 检验的步骤

提出假设

H0:1 = 2 = … = j;H1: 1 , 2 , … , j 不全相等
(fij - eij)2 4 25 9 36 4 25 9 36
(fij- eij)2
f
0.0606 0.3125 0.1500 0.4932 0.1176 0.6250 0.3000 0.9730
2 ( f e ) c2 e 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
地区
甲地区
乙地区 丙地区
一级
二级
三级
合计
52
60 50
64
59 65
24
52 74
140
171 189 500
合计
9 - 33
162
188
150
精品教材
统计学
1. 提出假设


独立性检验
(例题分析)
H0:地区与原料等级之间独立 H1:地区与原料等级之间不独立
2. 计算检验的统计量
c
2 i 1 j 1 r c
用Excel计算p值
9 - 30精品教材 Nhomakorabea统计学
9.3 独立性检验
9 - 31
精品教材
统计学
1. 2.
独立性检验
(test of independence)
检验列联表中的行变量与列变量之间是否独立 检验的步骤为
相关文档
最新文档