统计学第六版贾俊平第9章

合集下载

贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】

贾俊平《统计学》配套题库  【课后习题】详解  第9章~第10章【圣才出品】

第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。

答:列联表是由两个以上的变量进行交叉分类的频数分布表。

列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。

次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。

表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。

而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。

由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。

3.说明计算2χ统计量的步骤。

答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。

(完整版)统计学贾俊平考研知识点总结

(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

统计学九章PowerPoint 演示文稿

统计学九章PowerPoint 演示文稿

F ( n ,m )
F
案例
5· 应用一元回归模型进行区间估计 给定x0,y0的置信度(1-α)的置信区间为: n≥30时 特定值估计 n<30时
ˆ y0 y Z Sxy
2
(a bx0 ) Z Sxy
2
ˆ y0 y t
1 ( x0 x ) 2 Sxy 1 2 ( n2) n ( x x ) 2
第九章 相关与回归
相关和回归分析是研究事物的相互关系,测定它们 联系的紧密程度,揭示其变化的具体形式和规律性 的统计方法,是构造各种经济模型、进行结构分析、 政策评价、预测和控制的重要工具。
主要内容
相关分析 回归分析
第一节 相关关系的概念和种类 相关分析
概念160页
种类162页
种类
正相关 负相关
y na b x xy a x b x
2
b
n xy x y n x ( x)
2 2
y x a b n n
参见书169页例9-2
练习172页四
回归系数b表明自变量x每变化一个单位因变量y的增(减)量。 •b与r的关系: r>0 r< 0 r=0
Y的数学期望E(Y) 随机误差
总体多元线性回归模型的一般形式
案例
表明自变量 x1、x2 , 共同变动引起的Y 的平均变动。也称总体的二元线性回归方差。 常数项, x1 x2和Y构成的平面与Y轴的截距 0
E(Y)= 0+1 x1+ 2 x2 ,
1
偏回归系数,表示在 x2 固定时 x1每变化一个单位引起的 Y的平均变动;
平均值估计
1 ( x0 x ) 2 (a bx0 ) t Sxy 1 2 ( n2) n ( x x ) 2

统计学(第六版)第九章分类数据分析(课后习题答案)

统计学(第六版)第九章分类数据分析(课后习题答案)

H 0 : 1 2 3 4 0.3 H1: 1 , 2 , 3 , 4不全相等
(2)计算样本统计量 χ2 fo 25 40 47 46 69 51 74 57 36 fe 39 35 42 42 62 56 67 67 29 fo-fe -14 5 5 4 7 -5 7 -10 7 (fo-fe)2 196 25 25 16 49 25 49 100 49 (fo-fe)2/fe 5.025641026 0.714285714 0.595238095 0.380952381 0.790322581 0.446428571 0.731343284 1.492537313 1.689655172
9.2 从总体中随机抽取了 n=200 的样本,调查后按不同属性归类,得到如下 结果: n1=28,n2=56,n3=48,n4=36,n5=32 依据经验数据,各类别在总体中的比例分别为: π1=0.1,π2=0.2,π3=0.3,π4=0.2,π5=0.2 以 α=0.1 的显著性水平进行检验, 说明现在的情况与经验数据相比是否发生 了变化(用 P 值) 解:虚拟假设 H0:样本数据的各类数据的比例与总体中各类数据的比例相同 H1:样本数据的各类数据的比例与总体中各类数据的比例不同 计算样本统计量 χ2 fo 28 56 48 36 32 fe 20 40 60 40 40 fo-fe 8 16 -12 -4 -8 (fo-fe)2 64 256 144 16 64 (fo-fe)2/fe 3.2 6.4 2.4 0.4 1.6 14 χ2 的自由度为(5-1)=4,P=0.007 远小于显著性水平 α=0.1,故拒绝 H0,现 在的情况与经验数据相比已经发生了变化(显著差异) 。
26 19 37

《统计学》完整袁卫-贾俊平

《统计学》完整袁卫-贾俊平

总体 N
N1 N2
n1
n2
样本 n
n1 n2 nk
等额
k
n ni
i 1
等比例
n1
Ni N
n
··· ···
N k nk
最优
n1
Ni
2 i
Ni
2 iBiblioteka n整群抽样方法:首先把总体中的N个单位划分成为若干个群, 并要求每个群对整个总体都具有代表性,然后对群进 行简单随机抽样,并对抽中群内的所有单位进行调查 研究。
1. 描述统计
关于搜集、展示一批数据,并反映这 批数据特征的各种方法,其目的是为 了正确地反映总体的数量特点。
2. 推断统计 根据样本统计量估计和推断总体参 数的技术和方法。
描述统计是推断统计的前提, 推断统计是描述统计的发展。
二、数据
(一) 为何需要数据 ?
统计学要研究各种随机变量,通过对这些随机变量的 观察所获取的数据包含了我们所需的信息,这些信息 能有助于我们在许多场合中做出更为正确的决策。
就是把定量数据按从大到小或从小到大的顺序排列, 把定性数据按习惯的文字顺序排列,便于我们研究其 条理。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。

统计学第六版贾俊平 无水印

统计学第六版贾俊平 无水印
Johann Gregor Mendel (孟德尔 )
率各为1/2;投掷一枚骰子出现1~6点的频率 各为1/6 3. 农作物的产量与施肥量之间存在相关关系
统计方法
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
(descriptive statistics)
1. 内容

? 搜集数据
50
? 整理数据
? 展示数据
25? 描述性分析2. 目的0? 描述数据特征
什么是统计学 ?
? 收集、分析、表述和解释数据的科学
1. 数据搜集:取得数据 2. 数据分析:分析数据 3. 数据表述:图表展示数据 4. 数据解释:结果的说明
statistics 的定义 (不列颠百科全书)
statistics : the science of collecting, analyzing, presenting, and interpreting data.
election forecasting and projection (选举预测和策划 )
engineering (工程)
epidemiology (流行病学 )
finance (金融)
fisheries research (水产渔业研究 )
gambling (赌博)
genetics (遗传学)
geography (地理学)
? 找出数据的基本规律
Q1 Q2 Q3 Q4
x = 30 s2 = 105
推断统计
(inferential statistics)
1. 内容
总体
? 参数估计
? 假设检验
2. 目的
? 对总体特征作出

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析第6章方差分析6.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。

6.2 579.48234.1501.0=>=F F (或01.000001.0=<=-αvalue P ),拒绝原假设。

6.3 4170.50984.1001.0=>=F F (或01.0000685.0=<=-αvalue P ),拒绝原假设。

6.4 6823.37557.1105.0=>=F F (或05.0000849.0=<=-αvalue P ),拒绝原假设。

6.5 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。

85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设;85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。

6.6554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假设。

第7章相关与回归分析7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。

(2)920232.0=r 。

(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。

7.2 (1)散点图(略)。

(2)8621.0=r 。

7.3 (1)0?β表示当0=x 时y 的期望值。

(2)1?β表示x 每变动一个单位y 平均下降0.5个单位。

(3)7)(=y E 。

7.4 (1)%902=R 。

(2)1=e s 。

7.5 (1)散点图(略)。

贾俊平第六版统计学课后思考题答案——张云飞

贾俊平第六版统计学课后思考题答案——张云飞

第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计是研究如何利用样本数据来推断总体特征的统计方法。

3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

顺序数据:是只能归于某一有序类别的非数字型数据。

虽然也有列别,但这些类别是有序的。

数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。

4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。

5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。

比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。

在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。

我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。

6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。

顺序变量:一个变量由顺序数据来记录就称为顺序变量。

数值型变量:一个变量由数值型数据来记录就称为数值型变量。

离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。

统计学(第六版)贾俊平——_课后习题答案

统计学(第六版)贾俊平——_课后习题答案

第一章导论1.1.1(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

1.3(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数(5)推断统计方法。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。

使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手资料时,要注明数据来源。

2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。

每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。

如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。

它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试。

3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下(4)帕累托图(略)。

2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。

(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。

2.72.8(1)属于数值型数据。

2.9(1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.10A 班分散,且平均成绩较A 班低。

2.11 (略)。

2.12 (略)。

2.13 (略)。

2.14 (略)。

2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

(2)5.5=L Q ;12=U Q 。

(3)24=x ;65.6=s 。

(4)08.1=SK ;77.0=K 。

(5)略。

3.3 (1)略。

(2)7=x ;71.0=s 。

(3)102.01=v ;274.02=v 。

(4)选方法一,因为离散程度小。

3.4 (1)x =(万元);M e= 。

统计学(第六版)贾俊平 中国人民大学出版社——课后习题答案

统计学(第六版)贾俊平 中国人民大学出版社——课后习题答案

第二章数据的搜集
1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在, 是由别人调查和实验得来的, 并会被我们利用的 资料称为“二手资料” 。 使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、 搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免 错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点, 举例说明什么情况下适合采用概率抽样, 什么情 况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。 每个单位被抽中的概率已知或可 以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽 样的技术含量和成本都比较高。 如果调查的目的在于掌握和研究总体的数量特征, 得到总体 参数的置信区间,就使用概率抽样。
3.3 某百货公司连续 40 天的商品销售额如下: 单位:万元 41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35
20 10 0
售后服务等级的帕累托图
3.2 某行业管理局所属 40 个企业 2002 年的产品销售收入数据如下: 152 105 117 97 要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: K 1 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取 10 124 119 108 88 129 114 105 123 116 115 110 115 100 87 107 119 103 103 137 138 92 118 120 112 95 142 136 146 127 135 117 113 104 125 108 126

统计学第六版贾俊平 无水印

统计学第六版贾俊平 无水印
2. 顺序数据(rank data)
? 对事物类别顺序的测度 ? 数据表现为类别,用文字来表述 ? 例如,产品分为一等品、二等品、三等品、次品等
3. 数值型数据(metric data)
? 对事物的精确测度 ? 结果表现为具体的数值 ? 例如:身高为 175cm、168cm、183cm
统计数据的分类
management science (管理科学 )
marketing (市场营销学 )
medical diagnosis (医学诊断 )
meteorology (气象学 )
military science (军事科学 )
nuclear material safeguards (核材料安全管理 )
ophthalmology (眼科学 )
统计中的几个基本概念
总体
?
? ?
?????
样本
?? ?
参数 ? ? ?
平均数 标准差 比例
统计量 ?x s p
几种常用的统计软件
(Software)
?典型的统计软件
? SAS ? SPSS
? MINITAB
? STATISTICA ? Excel
SAS SPSS
STATISTICA MINITAB Excel
? 有限总体的范围能够明确确定,且元素的数目是有限的 ? 无限总体所包括的元素是无限的,不可数的
2. 样本 (sample)
? 从总体中抽取的一部分元素的集合 ? 构成样本的元素的数目称为样本容量
参数和统计量
1. 参数(parameter)
? 研究者想要了解的总体的某种特征值 ? 所关心的参数主要有总体均值(? )、标准差(? )、

贾俊平统计学(第六版)思考题答案

贾俊平统计学(第六版)思考题答案

第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。

2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。

推断统计:研究的是如何利用样本数据来推断总体特征。

3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的,非数字型数据。

顺序数据:只能归于某一有序类别的,非数字型数据。

数值型数据:按数字尺度测量的观察值,结果表现为数值。

按收集方法不同。

分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。

按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。

时间序列数据:在不同时间收集的数据。

4、举例说明总体、样本、参数、统计量、变量这几个概念。

总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。

参数:用来描述总体特征的概括性数字度量。

(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。

(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。

(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。

顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。

变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。

统计学贾俊平课后习题答案

统计学贾俊平课后习题答案

附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是该城市所有的职工家庭”样本是抽取的2000个职工家庭”(2)城市所有职工家庭的年人均收入,抽取的“ 200个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是所有的网上购物者”(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下服务质量等级评价的频数分布(3)条形图(略)(4)帕累托图(略)。

2.2(1)频数分布表如下40个企业按产品销售收入分组表(2)某管理局下属40个企分组表2.3 频数分布表如下某百货公司日商品销售额分组表直方图(略)。

2.4 茎叶图如下箱线图(略)。

2.5(1)排序略。

(2)频数分布表如下100只灯泡使用寿命非频数分布690~700 700~710 710~720 720~730 730~740 261813103261813103合计100 100(3)直方图(略)(4)茎叶图如下茎叶65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 7(1)频数分布表如下按重量分组频率/包40 〜42 242 〜44 344 〜46 746 〜48 1648 〜50 1752 〜52 1052 〜54 202.62.7 2.854 〜56 856 〜58 1058 〜60 460 〜62 3合计100(2)直方图(略)。

统计学第六版贾俊平第9章PPT课件

统计学第六版贾俊平第9章PPT课件

合计
9 - 16
7.6% 10.7% 7.9% 7.4% — 23.8% 28.6% 21.4% 26.2% 100%
精品教材
统计学
期望频数的分布
1. 假定行变量和列变量是独立的 2. 一个实际频数 fij 的期望频数 eij ,是总频
数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即
6. 一个 r 行 c 列的列联表称为 r c 列联表
9 -8
精品教材
统计学
列联表的结构
(2 2 列联表)
列(cj)
列( cj )
行 (ri)
j =1
j =1
i =1
f11
f12
合计
f11+ f12
i =2
f21
f22
f21+ f22
合计
f11+ f21 f12+ f22
n
9 -9
精品教材
统计学
r1 c1 n n
由于观察频数的总数为n ,所以f11 的期望频数 e11 应为
e1 1n r n 1 c n 1 r1 n c1247 1290 060 .4 6 3 66
9 - 18
精品教材
统计学
期望频数的分布
(例题分析)
一分公司 二分公司 三分公司 四分公司
实际频数 赞成该
一分公司 二分公司 三分公司 四分公司 合计
赞成该方案 24.4% 26.9% 20.4% 28.3% 66.4%
68.0% 62.5% 63.35 71.8% —
16.2% 17.8% 13.6% 18.8% —
反对该方案 22.7% 31.9% 23.4% 22.0% 33.6%
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一分公司 二分公司 三分公司 四分公司 合计
赞成该方案 68
75
57
79 279
反对该方案 32
75
33
31 141
合计 100 120 90 110 420
9 - 11
精品教材
统计学
列联表的分布
9 - 12
精品教材
统计学
观察值的分布
1. 边缘分布
行边缘分布
行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人
c ( fij eij )2 19.82
i1 j1
eij
临界值(s):
决策:
=0.05
在 = 0.05的水平上拒绝H0
结论:
地区和原料等级之间存在依
0
9.488 19.82 c
赖关系
9 - 35
精品教材
统计学
9.4 列联表中的相关测量
一. 相关系数
二. 列联相关系数 三. V 相关系数
9 - 36
提出假设
H0:行变量与列变量独立 H1:行变量与列变量不独立
计算检验的统计量
r
c2
c ( f ij eij ) 2
i1 j 1
eij
进行决策
根据显著性水平和自由度(r-1)(c-1)查出临界值c2 若c2c2,拒绝H0;若c2<c2,接受H0
9 - 32
精品教材
统计学
独立性检验
在 = 0.05的水平上拒绝H0
结论:
可以认为广告后各公司产品
0
5.99 8.18 c
市场占有率发生显著变化
9 - 29
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选
“CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域
的百分比,称为百分比分布
行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
总百分比:每一个观察值除以观察值的总个数( fij / n )
9 - 15
精品教材
统计学
百分比分布
(图示)
行百分比
列百分比
总百分比
一分公司 二分公司 三分公司 四分公司 合计
赞成该方案 24.4% 26.9% 20.4% 28.3% 66.4%
68.0% 62.5% 63.35 71.8% —
16.2% 17.8% 13.6% 18.8% —
反对该方案 22.7% 31.9% 23.4% 22.0% 33.6%
32.0% 37.5% 36.7% 28.2% —
eij
n
ri n
ci n
ric j n
9 - 17
精品教材
统计学
期望频数的分布
(例题分析)
例如,第1行和第1列的实际频数为 f11 ,它落在第1行 的概率估计值为该行的频数之和r1除以总频数的个数 n ,即:r1/n;它落在第1列的概率的估计值为该列的频 数之和c1除以总频数的个数 n ,即:c1/n 。根据概率的 乘法公式,该频数落在第1行和第1列的概率应为
9 - 33
精品教材
统计学
独立性检验
(例题分析)
1. 提出假设
H0:地区与原料等级之间独立 H1:地区与原料等级之间不独立
2. 计算检验的统计量
r
c2
c ( fij eij )2 19.82
i1 j1
eij
3. 根 据 显 著 性 水 平 = 0.05 和 自 由 度 (3-1)(3-
6. 一个 r 行 c 列的列联表称为 r c 列联表
9 -8
精品教材
统计学
列联表的结构
(2 2 列联表)
列(cj) 行 (ri)
i =1
i =2 合计
9 -9
列( cj )
j =1
j =1
f11 f21 f11+ f21
f12 f22 f12+ f22
合计
f11+ f12 f21+ f22
n
反对该 实际频数 32
方案
期望频数 34
75 57 79 80 60 73 75 33 31 40 30 37
9 - 19
精品教材
统计学
9.2 拟合优度检验
一. c 统计量 二. 拟合优度检验
9 - 20
精品教材
统计学
c 统计量
9 - 21
精品教材
统计学
c 统计量
1. 用于检验列联表中变量间拟合优度和独立性
1. 检验多个比例是否相等
2. 检验的步骤
提出假设
H0:1 = 2 = … = j;H1: 1 , 2 , … , j 不全相等
计算检验的统计量
r
c2
c ( fij eij )2
i1 j1
eij
进行决策
根据显著性水平和自由度(r-1)(c-1)查出临界值c2
若c2>c2,拒绝H0;若c2<c2,接受H0
精品教材
统计学
列联表的结构
(r c 列联表的一般表示)
列(cj)
列(cj)
行(ri)
j =1
j =2

i =1
f11
f12

i=2
f21
f22

:
:
:
:
合计
c1
c2

fij 表示第 i 行第 j 列的观察频数
9 - 10
合计
r1 r2
:
n
精品教材
统计学
列联表
(例题分析)
【例】一个集团公司在四个不同的地区设有分公司,现该集 团公司欲进行一项改革,此项改革可能涉及到各分公司的利 益,故采用抽样调查方式,从四个分公司共抽取420个样本 单位(人),了解职工对此项改革的看法,调查结果如下表
2. 用于测定两个分类变量之间的相关程度
3. 计算公式为
r
c2
c ( fij eij ) 2
i1 j 1
eij
9 - 22
其自由度为(r 1)(c 1) 式中:fij — 列联表中第i行第j列类别的实际频数
eij — 列联表中第i行第j列类别的期望频数
精品教材
统计学
c 统计量
(例题分析)
实际频数 期望频数
拟合优度检验 独立性检验 3. 测度列联表中的相关性
9 -3
精品教材
统计学
数据的类型与列联分析
数据
定量数据
(数值型数据)
离散数据 连续数据
9 -4
定性数据
(品质数据)
列联分析
精品教材
统计学
分类数据
1. 分类变量的结果表现为类别
例如:性别 (男, 女)
2. 各类别用符号或数字代码来测度 3. 使用分类或顺序尺度
(fij)
(eij)
68
66
75
80
57
60
79
73
32
34
45
40
33
30
31
37
9 - 23
fij - eij
2 -5 -3 6 -2 5 3 -6
(fij - eij)2
(fij- eij)2 f
4
0.0606
25 0.3125
9
0.1500
36 0.4932
4
0.1176
25 9
0.6250 c 2 ( f e)2
(例题分析)
【例】一种原料来自三个不同的地区,原料质量被分成三个 不同等级。从这批原料中随机抽取500件进行检验,结果如 下表。检验各地区与原料之间是否存在依赖关系( 0.05)
地区
一级
二级
三级
合计
甲地区
52
64
24
140
乙地区
60
59
52
171
丙地区
50
65
74
189
合计 162 188 150 500
合计
9 - 16
7.6% 10.7% 7.9% 7.4% — 23.8% 28.6% 21.4% 26.2% 100%
精品教材
统计学
期望频数的分布
1. 假定行变量和列变量是独立的 2. 一个实际频数 fij 的期望频数 eij ,是总频
数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即
2. 对于22 列联表, 系数的值在0~1之间 3. 相关系数计算公式为
一分公司 二分公司 三分公司 四分公司 合计
赞成该方案 68
75
57
79 279
反对该方案 32
75
33
31 141
合计 100 120 90 110 420
9 - 14
列边缘分布
精品教材
统计学
百分比分布
(概念要点)
1. 条件频数反映了数据的分布,但不适合对比
2. 为在相同的基数上进行比较,可以计算相应
在对话框“Expected_range”输入期望数据区域 得到P值为0.016711,所以拒绝原假设
用Excel计算p值
9 - 30
精品教材
统计学
9.3 独立性检验
9 - 31
精品教材
统计学
独立性检验
(test of independence)
相关文档
最新文档