贾俊平版统计学课件 第9章
贾俊平统计学ppt正式完整版
假设检验
假设检验的基本思想
单样本t检验
阐述假设检验的原理、步骤和类型,包括原 假设和备择假设的设立、检验统计量的选择 等。
介绍单样本t检验的原理、方法和应用场景, 包括检验步骤、p值的计算和解释等。
双样本t检验
方差分析
阐述双样本t检验的原理、方法和应用场景, 包括独立双样本t检验和配对双样本t检验的 区别和联系。
要点三
其他综合评价方法的 比较
除了上述方法外,还有如层次分析法、 模糊综合评价法等多种综合评价方法。 这些方法在原理、适用范围和优缺点等 方面各有不同,需要根据具体问题和需 求进行选择和使用。
THANKS
感谢观看
数据分析流程
明确分析目的、收集数据、 数据预处理、数据分析、 结果呈现。
统计软件简介
常用统计软件
01
SPSS、SAS、Stata、Excel等。
软件选择原则
02
根据分析目的、数据类型和统计分析方法选择合适的统计软件。
软件使用技巧
03
熟练掌握软件的基本操作,了解常用命令和函数,注意数据的
导入和导出格式。
08
统计指数与综合评价
Chapter
统计指数的编制原理与方法
统计指数的概念
统计指数是用于反映复杂现象总 体数量上的变动,分析现象总体 变动中受各个因素变动影响的程 度。
统计指数的编制原理
统计指数编制的基本原理是综合 比较法和平均法。通过选定同度 量因素,对不能直接相加的现象 进行过渡性综合,以得到总量指 标,再通过对比分析揭示现象之 间的数量差异和程度。
几种常见的综合评价方法比较
要点一
主成分分析法与因子 分析法的比较
主成分分析法通过降维技术将多个指标 转化为少数几个综合指标,而因子分析 法则是通过寻找公共因子来解释原始变 量之间的相关关系。两种方法在原理和 目的上有所不同,但都可以用于综合评 价。
贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】
第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。
答:列联表是由两个以上的变量进行交叉分类的频数分布表。
列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。
次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。
表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。
而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。
由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。
3.说明计算2χ统计量的步骤。
答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。
统计学九章PowerPoint 演示文稿
F ( n ,m )
F
案例
5· 应用一元回归模型进行区间估计 给定x0,y0的置信度(1-α)的置信区间为: n≥30时 特定值估计 n<30时
ˆ y0 y Z Sxy
2
(a bx0 ) Z Sxy
2
ˆ y0 y t
1 ( x0 x ) 2 Sxy 1 2 ( n2) n ( x x ) 2
第九章 相关与回归
相关和回归分析是研究事物的相互关系,测定它们 联系的紧密程度,揭示其变化的具体形式和规律性 的统计方法,是构造各种经济模型、进行结构分析、 政策评价、预测和控制的重要工具。
主要内容
相关分析 回归分析
第一节 相关关系的概念和种类 相关分析
概念160页
种类162页
种类
正相关 负相关
y na b x xy a x b x
2
b
n xy x y n x ( x)
2 2
y x a b n n
参见书169页例9-2
练习172页四
回归系数b表明自变量x每变化一个单位因变量y的增(减)量。 •b与r的关系: r>0 r< 0 r=0
Y的数学期望E(Y) 随机误差
总体多元线性回归模型的一般形式
案例
表明自变量 x1、x2 , 共同变动引起的Y 的平均变动。也称总体的二元线性回归方差。 常数项, x1 x2和Y构成的平面与Y轴的截距 0
E(Y)= 0+1 x1+ 2 x2 ,
1
偏回归系数,表示在 x2 固定时 x1每变化一个单位引起的 Y的平均变动;
平均值估计
1 ( x0 x ) 2 (a bx0 ) t Sxy 1 2 ( n2) n ( x x ) 2
人大统计学课件(中国人民大学贾俊平第三版)(2024)
2024/1/30
31
统计指数概述
统计指数的概念
统计指数是用于反映复杂社会经 济现象总体数量综合变动的相对 数,具有综合性和平均性的特点 。
统计指数的作用
统计指数可以反映现象总体数量 变动的方向和程度,分析现象总 体变动中各组成部分的变动对总 体变动的影响程度,以及研究现 象总体变动趋势和规律。
2024/1/30
2024/1/30
统计学定义
统计学是一门收集、整理、分析 和解释数据,以推断所研究问题 的本质和规律性的科学。
应用领域
统计学广泛应用于社会科学、自 然科学、工程技术、医学、经济 、金融、管理等各个领域。
4
统计学基本概念
01
02
03
总体与样本
总体是研究对象的全体, 样本是从总体中随机抽取 的一部分。
统计指数的种类
按所反映的内容不同,统计指数 可分为数量指数和质量指数;按 计入指数的项目多少不同,可分 为个体指数和综合指数;按计算 形式不同,可分为简单指数和加 权指数。
32
综合评价原理及应用
综合评价的概念
综合评价是对多个指标、多个单位同时进行评价的方法,它将多个 指标转化为一个能够反映综合情况的指标来进行评价。
综合评价的作用
综合评价可以全面、客观地反映被评价对象的整体情况,为决策者 提供科学依据。
综合评价的方法
常见的综合评价方法包括综合评分法、功效系数法、TOPSIS法、秩 和比法等。这些方法各有特点,适用于不同的场合和需求。
2024/1/30
33
常见综合评价方法比较
2024/1/30
综合评分法与功效系数法的比较
2024/1/30
10
03
2024版统计学完整(贾俊平)人大课件ppt课件
统计学完整(贾俊平)人大课件ppt课件•引言•数据收集与整理•描述性统计分析目录•概率论基础•推断性统计分析•方差分析与回归分析•时间序列分析与预测•统计决策与风险管理目录•总结与展望01引言统计学是一门研究如何收集、整理、分析和解释数据的科学。
统计学的定义统计学的历史统计学的分支统计学的发展经历了古典统计学、近代统计学和现代统计学三个阶段。
统计学可以分为描述统计学和推断统计学两大分支。
030201统计学概述社会科学医学与健康工程与技术商业与经济统计学应用领域01020304在社会科学领域,统计学被广泛应用于调查研究、民意测验、市场分析等方面。
在医学和健康领域,统计学被用于临床试验、流行病学研究、健康风险评估等方面。
在工程和技术领域,统计学被用于质量控制、可靠性分析、信号处理等方面。
在商业和经济领域,统计学被用于市场分析、财务分析、经济预测等方面。
通过学习,学生应掌握统计学的基本概念和方法,包括数据收集、整理、描述和分析等方面的内容。
掌握统计学基本概念和方法具备数据处理和分析能力了解统计学的应用领域培养批判性思维学生应具备独立处理和分析数据的能力,能够运用适当的统计方法进行数据分析和解释。
学生应了解统计学的应用领域,能够运用所学知识解决实际问题。
学生应培养批判性思维,能够对统计结果进行合理的解释和评估。
学习目标与要求02数据收集与整理数据来源及类型数据来源包括原始数据和二手数据,原始数据是通过直接调查、实验或观察获得的数据;二手数据则是已经经过他人收集、整理和处理过的数据。
数据类型包括定性数据和定量数据,定性数据是描述性的、非数值的,如文字、图像等;定量数据则是可以用数值表示的,如年龄、收入等。
此外,还可以根据数据的测量尺度将其分为名义型数据、顺序型数据、间隔型数据和比率型数据。
调查法实验法观察法大数据收集数据收集方法通过问卷、访谈、电话调查等方式收集数据,可以获取大量的、详细的信息。
直接观察研究对象的行为、状态等,记录相关数据,适用于无法控制或干预的情况。
2024版统计学贾俊平人大PPT课件
课件•引言•统计数据的收集与整理•统计描述目•概率论基础•统计推断录•统计指数与因素分析•相关与回归分析•统计决策目•统计学的应用与发展录引言统计学概述统计学的定义统计学的发展历史统计学的分支领域1 2 3统计学在决策中的应用统计学在科学研究中的应用统计学在社会生活中的应用统计学的重要性统计学的研究对象01020304数据的收集数据的整理数据的分析数据的解释统计数据的收集与整理原始数据二手数据定性数据定量数据时序数据030201数据的收集方法观察法调查法实验法数据的整理与显示数据整理数据显示通过图表、图像等方式将数据呈现出来,以便于直观理解和分析。
常见的数据显示方式包括表格、条形图、折线图、饼图等。
统计描述集中趋势的描述算术平均数适用于数值型数据,反映数据的平均水平。
中位数适用于顺序数据,反映数据的中等水平。
众数适用于分类数据,反映数据的多数水平。
离散程度的描述四分位数间距极差上四分位数与下四分位数之差,反映中间50%数据的离散程度。
方差与标准差分布形态的描述偏态峰态统计图表的应用适用于分类数据,表示各类别的频数或频率。
适用于时间序列数据,表示事物随时间的变化趋势。
适用于分类数据,表示各类别在总体中的占比。
适用于两个数值型变量,表示它们之间的相关关系。
条形图折线图饼图散点图概率论基础随机事件与概率随机试验与样本空间随机试验是具有某些基本特点的试验,其所有可能结果构成的集合称为样本空间。
随机事件随机试验的某个(些)样本点构成的集合称为随机事件。
概率的定义概率是描述随机事件发生的可能性大小的数值,常用P(A)表示。
概率的性质与运算法则概率的性质01概率的加法公式02概率的乘法公式03事件的独立性如果事件A 与事件B 相互独立,则P(A∩B)=P(A)P(B)。
条件概率在事件B 发生的条件下,事件A 发生的概率称为条件概率,记作P(A|B)。
多个事件的独立性如果事件A1,A2,...,An 相互独立,则对于任意k 个事件Ai1,Ai2,...,Aik(1≤i1<i2<...<ik≤n),都有P(Ai1∩Ai2∩...∩Aik)=P(Ai1)P(Ai2)...P(Aik)。
统计学课件贾俊平人大课件-2024鲜版
常用的统计软件包括SPSS、SAS、Stata、R等,这些软件提供了丰富的统计功能和数据分析工具,方便研 究者进行数据分析和挖掘。
6
02
描述统计学
2024/3/28
7
数据收集与整理
数据来源
明确数据的来源,包括观察、实 验、调查等。
数据类型
区分数据的类型,如定量数据、 定性数据。 2024/3/28
时间序列图
将时间序列数据绘制成图形,直观展示数据的波动情况。
自相关图
展示时间序列数据与其自身不同时间延迟版本之间的相关性。
2024/3/28
偏自相关图
在给定其他时间延迟的情况下,展示时间序列数据与其自身某个 时间延迟版本之间的相关性。
26
时间序列的预测方法
移动平均法
通过计算历史数据的移动平均值来预测 未来值。
无交互作用的双因素方差分析
当两个因素相互独立时,分别考虑各自对试 验结果的影响
2024/3/28
有交互作用的双因素方差分析
当两个因素存在交互作用时,需同时考虑两 个因素及其交互作用对试验结果的影响
19
05
相关与回归分析
2024/3/28
20
相关分析
2024/3/28
相关关系的概念
介绍相关关系的定义、特点和分类,阐述相关分析与回归分析的关 系。
相关系数的计算与检验
详细讲解皮尔逊相关系数、斯皮尔曼等级相关系数的计算方法和假 设检验,包括检验步骤、检验统计量和决策规则。
相关系数的解释
阐述相关系数的大小、方向和显著性水平对所研究变量的意义,以 及需要注意的问题。
21
一元线性回归分析
一元线性回归模型
介绍一元线性回归模型的形式、 假设和参数估计方法,包括最小 二乘法和最大似然法。
2024版统计学课件贾俊平人大课件
统计学课件贾俊平人大课件•课件背景与目标•统计学基本概念•数据收集与整理目•统计描述分析•概率论基础与抽样分布录•参数估计与假设检验•非参数统计方法•统计决策与预测目•统计软件应用与实践录课件背景与目标贾俊平,中国人民大学统计学系教授,具有丰富的统计学教学和科研经验。
作者背景课件来源适用对象该课件是贾俊平教授在人大授课时所使用的教学材料,经过整理和优化后形成。
适用于统计学专业的学生、教师以及对统计学感兴趣的人士。
030201背景介绍掌握统计学的基本概念、原理和方法,能够运用统计学知识解决实际问题。
知识与技能通过案例分析、实践操作等方式,培养学生的统计思维和实践能力。
过程与方法培养学生对统计学的兴趣和热爱,认识到统计学在各个领域的重要性和应用价值。
情感态度与价值观教学目标与要求教材《统计学》(贾俊平等编著),该教材系统介绍了统计学的基本理论和方法,是该课件的主要参考教材。
参考资料包括相关统计学著作、学术论文、案例分析等,为学生提供更广泛的学习资源和参考。
网络资源推荐一些优质的统计学学习网站、在线课程等,方便学生进行自主学习和拓展。
教材与参考资料统计学基本概念统计学是一门研究数据收集、整理、分析和解释的科学。
统计学具有广泛的应用性,可以应用于各个领域的数据分析。
统计学是一门方法论科学,提供了一套系统的数据处理和分析方法。
统计学的定义与性质02030401统计学的研究对象及方法统计学的研究对象是数据,包括数值数据和分类数据。
统计学的研究方法包括描述统计和推断统计。
描述统计是对数据进行整理、概括和描述的方法。
推断统计是通过样本数据推断总体特征的方法。
总体和样本变量和指标概率和随机性统计量和抽样分布统计学中的基本概念01020304总体是研究对象的全体,样本是从总体中抽取的一部分。
变量是描述现象特征的属性,指标是反映现象数量特征的概念和数值。
概率是某一事件发生的可能性,随机性是指事件发生的不确定性。
统计量是样本的函数,抽样分布是统计量的概率分布。
《统计学》完整袁卫-贾俊平PPT课件
例如,对企业按经营管理的水平和取得 的效益划分为一级企业、二级企业等。
最新课件
10
定距数据
也称间距数据,是比定序数据的描述功能 更好一些的定量数据。
如10℃、20℃等。它不仅有明确的高低 之分,而且可以计算差距,如20℃比 10℃高10℃,比5℃高15℃等。
计数
产业分类
2. 定序测定 分类;排序 计数;排序 企业等级
3. 定距测定 分类;排序; 计数;排序;温度
有基本测量单位 加减
4. 定比测定 分类;排序; 计数;排序;商品销售
有基本测量单位;加减
额
有绝对零点 乘除
最新课件
12
4. 截面数据和时间序列数据
截面数据:所搜集的不同单位在同一时间的数据。例 如,所有上市公司公布的2004年年度的净利润。
如人口按性别分组、企业按所有制分组等 定量变量编制:分为单项数列和组距数列两种形式。
单项数列:即变量的一个取值为一组,适用于离散
型变量,并且变量的取值较少。
组距数列:即每一组有一个上限值和一个下限值所
形成的区间,适用于连续性变量,或离散型变量且
变量的取值较多的情况最。新课件
34
注意以下三个方面的问题 1.确定组数 2.确定组距:组距为上限与下限之差。
2. 统计数据:统计工作所产生的成果,用以描述我们所 研究现象的属性和特征 。如统计图表,统计分析报告 等。
3. 统计学:一门研究总体数量特征的方法论科学。
统计工作 统计资料 统 计学
工作与工作成果关系
最新课件
实践与理 论关系
3
(二)四个重要的术语
总体 所研究的具有某些相同性质的全部单位或 事件的整体。
统计学(第四版)袁卫 庞皓 贾俊平 杨灿 第4版《统计学》第9章_统计指数(课件)2_杨灿
9 -2
统计学
STATISTICS
9.1
指数的概念与分类
9.1.1 指数的概念 一种专门的对比分析指标,具有相对数形式(%) 对比方式:不同时间、不同空间、实际与计划
9.1.2 指数的分类 1.质量指标指数 与 数量指标指数 2.个体指数 与 总指数 3.动态指数 与 静态指数 4.其他,如综合指数与平均指数、简单指数与 加权指数、环比指数与定基指数等
p0q1
p1q1
p0q0 ( q1 p0
q0 p0) (
p1q1
p 0 q1 )
9 - 13
统计学
9.4 STATISTICS 几种常用的经济指数
9.4.1 消费者价格指数 和 商品零售 价格指数
9.4.2 生产指数 和 生产者价格指数 9.4.3 股票价格指数
9 - 14
统计学
个因素指数的乘积。 指数体系的分析作用:因素分析、指数
推算
9 - 12
统计学
STATISTIC9S.3.2
总量变动的因素分析
通常考虑以下的连锁替换顺序:
q0 p0 q变化 q1 p0 p变化 q1 p1
其相对数和绝对数分析体系为:
p1q1
q1 p0
p1q1
p0q0
q0 p0
的问题,必须引入一个媒介因素,使其转化为相 应的价值总量形式;
⑵为了在综合对比过程中单纯反映对比指标的变动 或差异程度,又必须将前面引入的媒介因素的水 平固定起来。
综合指数的两个问题:同度量因素指标的确定,同 度量因素固定水平的选择。
9 -6
S统TAT计IS2T学IC. S加权平均指数的编制原理
⑴为了对复杂现象总体进行对比分析,首先对构成 总体的个别元素计算个体指数,所得到的无量纲 化的相对数是编制总指数的基础;
统计学(第四版)袁卫 庞皓 贾俊平 杨灿 第4版《统计学》第9章_统计指数(课件)2_杨灿
统计学
STATISTICS
9.4 几种常用的经济指数
9.4.1 消费者价格指数 和 商品零售
价格指数
9.4.2 生产指数 和 生产者价格指数 9.4.3 股票价格指数
9 - 14
STATISTICS 9.4.1
统计学
消费者价格指数和商品零售价格指数
消费者价格指数CPI:综合反映一定时期内居民所购买
9 - 18
统计学
STATISTICS
本章小结
指数的概念、形式和种类;
总指数的两种编制方法:基本原理和
异同关系;
指数体系及其因素分析的内容和方法;
常用经济指数:CPI、PPI、生产指数、
股价指数,等等。
9 - 19
第 9 章 结束
1 0
1 1
统计学
STATISTICS
3. 拉氏与帕氏指数的比较
PL PP QL QP
计算结果的差异:
分析意义的差异:侧重基期或计算期的同度量
因素(物量或价格)水平和结构。 一般数量比较关系:
PL PP
QL QP
原因或条件:数量指标个体指数与质量个体指 数之间一般存在负相关关系(反之则反是)。
⑵为了在综合对比过程中单纯反映对比指标的变动 或差异程度,又必须将前面引入的媒介因素的水 平固定起来。 综合指数的两个问题:同度量因素指标的确定,同 度量因素固定水平的选择。
9 -6
统计学
STATISTICS
2. 加权平均指数的编制原理
⑴为了对复杂现象总体进行对比分析,首先对构成 总体的个别元素计算个体指数,所得到的无量纲 化的相对数是编制总指数的基础; ⑵为了反映个别元素在总体中的重要性的差异,必 须以相应的总值指标作为权数对个体指数进行加 权平均,就得到说明总体现象数量对比关系的总 指数。 平均指数的两个问题: 平均数“型”的选择,指数“权”的选择。
统计学ppt课件贾俊平完整版
时间序列预测的评价指标
平均误差、均方误差、均方根误差和平均绝 对误差等。
08
统计计算与软件应用
统计计算基础
描述性统计
计算数据的中心趋势( 均值、中位数、众数) 和离散程度(方差、标 准差、四分位距)。
概率论基础
理解概率、期望、方差 等基本概念,掌握常见 概率分布(如正态分布 、t分布、F分布等)。
数据分布的图形表示
介绍直方图、箱线图等图形表示方法 ,用于直观展示数据的分布形态。
03
概率论基础
随机事件与概率
随机事件
在一定条件下,并不 总是发生,也不总是 不发生的事件。
概率
描述随机事件发生的 可能性大小的数值。
பைடு நூலகம்
概率的性质
非负性、规范性、可 加性。
条件概率
在给定另一事件发生 的条件下,某一事件 发生的概率。
专注于数据管理和统计分析,提供丰富的计量经济学方法,适 合经济学和金融学等领域。
开源且易学的编程语言,拥有强大的数据处理和可视化库(如 pandas、matplotlib等),适合数据科学和机器学习领域。
R语言在统计学中的应用实例
数据清洗和整理
使用R中的dplyr等包进行数据清洗、 筛选和变换。
02
统计学的研究方法
描述统计方法
描述统计方法是统计学中最基础 的方法,它通过对数据进行整理 、概括和可视化,帮助我们了解
数据的基本情况和分布特征。
推断统计方法
推断统计方法是统计学中更高级 的方法,它基于概率论和数理统 计的理论,通过对样本数据的分 析来推断总体数据的特征和规律
。
实验设计方法
实验设计方法是统计学中用于研 究因果关系的方法,它通过设计 和实施实验来控制和观察各种因 素的变化,从而揭示出因素之间
2024版统计学课件(贾俊平)人大课件
统计学课件(贾俊平)人大课件contents •统计学概述•统计数据的收集与整理•统计描述分析•统计推断分析•统计决策分析•统计软件应用与实践目录统计学概述统计学的定义与特点定义统计学是一门研究数据收集、整理、分析和解释的方法论科学,旨在探索数据内在的数量规律性。
特点统计学具有广泛的应用性、严密的数学性和明确的目的性。
它通过收集和分析数据来揭示总体特征,为决策提供依据。
03现代统计学时期计算机技术的广泛应用,使得大规模数据处理和复杂模型分析成为可能,推动了统计学的快速发展。
01古典统计学时期主要关注国家管理和人口统计,如古希腊、罗马和中国的古代统计实践。
02近代统计学时期概率论和数理统计学的形成与发展,为现代统计学奠定了基础。
统计学的发展历史统计学的研究对象与分类研究对象统计学的研究对象是数据,包括各种类型、来源和形式的数据。
分类根据研究目的和方法的不同,统计学可分为描述统计学和推断统计学两大类。
描述统计学主要关注数据的整理、描述和可视化;推断统计学则通过样本数据推断总体特征。
社会经济领域生物医药领域工程技术领域环境科学领域统计学的应用领域人口普查、经济分析、市场调研等。
质量控制、可靠性分析、优化设计等。
临床试验、基因测序、流行病学调查等。
环境监测、生态评估、气候变化研究等。
统计数据的收集与整理数据的来源与类型数据来源包括直接来源(如调查、实验)和间接来源(如文献资料、网络数据)。
数据类型包括定性数据和定量数据,其中定量数据又可分为离散型和连续型。
数据收集的方法与步骤方法包括问卷调查、访谈、观察、实验等。
步骤明确调查问题、确定调查对象、选择调查方法、设计调查问卷或实验方案、实施调查或实验、收集并整理数据。
数据整理的原则与方法原则确保数据的准确性、完整性、及时性和一致性。
方法包括数据清洗(如去除重复、异常值处理)、数据转换(如标准化、归一化)、数据分组与编码等。
数据质量的评估与控制评估指标包括准确性、完整性、及时性、一致性、可比性和可解释性等。
统计学第六版贾俊平第9章PPT课件
合计
9 - 16
7.6% 10.7% 7.9% 7.4% — 23.8% 28.6% 21.4% 26.2% 100%
精品教材
统计学
期望频数的分布
1. 假定行变量和列变量是独立的 2. 一个实际频数 fij 的期望频数 eij ,是总频
数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即
6. 一个 r 行 c 列的列联表称为 r c 列联表
9 -8
精品教材
统计学
列联表的结构
(2 2 列联表)
列(cj)
列( cj )
行 (ri)
j =1
j =1
i =1
f11
f12
合计
f11+ f12
i =2
f21
f22
f21+ f22
合计
f11+ f21 f12+ f22
n
9 -9
精品教材
统计学
r1 c1 n n
由于观察频数的总数为n ,所以f11 的期望频数 e11 应为
e1 1n r n 1 c n 1 r1 n c1247 1290 060 .4 6 3 66
9 - 18
精品教材
统计学
期望频数的分布
(例题分析)
一分公司 二分公司 三分公司 四分公司
实际频数 赞成该
一分公司 二分公司 三分公司 四分公司 合计
赞成该方案 24.4% 26.9% 20.4% 28.3% 66.4%
68.0% 62.5% 63.35 71.8% —
16.2% 17.8% 13.6% 18.8% —
反对该方案 22.7% 31.9% 23.4% 22.0% 33.6%
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( f0 fe ) 4 fe
2 2
2 0.05 (3) 7.81
2 2 0.05
(3)
决策:在 = 0.05的水平上不能拒绝H0 结论:可以认为空调安装数在四个区域中是均匀分布的 。
拟合优度检验(练习题)
从历史数据可知,创维电视的销售量中,有40%是小 屏幕电视(小于21寸),40%是中等屏幕的电视(21— 29),还有20%是大屏幕(超过29寸),为了指定下个月 适合的生产计划,从现在的购买者中随机抽取了100人的 一个样本,发现购买的电视中有55台是小屏幕的,35台是 中等屏幕的,还有10台是大屏幕的。在0.01的显著性水平 下,检验销售量的历史模式是否成立。
观察值的分布(图示)
条件频数
行边缘分布
一分公司 二分公司 三分公司 四分公司 赞成该方案 反对该方案
合计 279 141 420
68 32
75 75
57 33
79 31
合计
100
120
90
110
列边缘分布
2.百分比分布
条件频数反映了数据的分布,但不适合对比,为在相 同的基数上进行比较,可以计算相应的百分比,称为百分 比分布。 行百分比:行的每一个观察频数除以相应的行合计数 (fij / ri)
79
279 ( 73 ) 31 141 ( 37 ) 110 420
如果各个分公司对改革方案的看法相同,观察值和期 望值就应当非常接近。
9.2 拟合优度检验
2 9.2.1 统计量 1.常用于检验列联表中变量之间是否独立的检验,尤其适
合于两个定类变量之间是否独立的检验, 或多个总体是否有相
同的分布. 2. 2 统计量为
由(9.1)式得
2 ( f e ) 2 i i ei i 1 3
(102 90)2 (82 80) 2 (16 30) 2 90 80 30 8.18
续
由(9.2)式,得自由度 f (2 1)(3 1) 2. 取 0.05 时,查 表得
9.1.1 分类数据
定类和定序数据都是定性数据,或称分类数据. 分类数据
表现为类别.
例如:性别 (男, 女) 各类别也可用符号或数字代码来表示. 例如:1. 男;2. 女 对定类或定序数据的描述和分析通常使用列联表,并采用
2 检验.
9.1.2 列联表(contingency table)的构造
279 66.4%
列百分数%
总百分数% 反对该方案 行百分数% 列百分数% 总百分数% 合计 %
68.0%
16.2% 32 22.7%
62.5%
17.8% 45 31.9%
63.35%
13.6% 33 23.4%
71.8%
18.8% 31 22.0%
—
— 141 33.6%
32.0%
7.6% 100 23.8%
拟合优度检验(例题分析)
例 某空调系统的区域销售商将该地区划分为四个区 域。一个想购买该空调销售权的人被告知这四个区域中 的销售情况基本相同。这个期望购买者在该公司的文档 记录中随意抽取了40份空调安装记录,结果如表。检验 原假设是否成立。( = 0.05)
解:
H0 :空调安装数在四个区域中是均匀分布的 H1 :原假设中至少有一个不成立
20.05 (2) 5.991
由于
2 2 0 .05 (2)
从而拒绝 H 0 ,即可以认为广告后各公司产品市场占有率发生显 著变化 .
用Excel计算 p 值
第1步:将观察值和期望值输入. 第2步: 选择【插入】菜单. 第3步:选择【函数】选项. 第4步:先在函数分类中选【统计】,然后在函数名中选 【CHITEST】,再点击【确定】. 第5步:在对话框【Actual range】输入观察数据区域,在
ni n j ni n j eij n( )( ) n n n
计算例
根据表9-1,第一行第一列的实际频数 f11 68 ,相应的
期望频数的估计则为
e11 420 ( 279 100 279 100 )( ) 66.4 420 420 420
类似可求得各个实际频数的期望频数的估计列于表 9-4.
列合计 n j f ij , j 1 , 2 , , c . 而样本容量 n f ij
r i 1
i 1 j 1
r
c
例
一个集团公司在四个不同的区域设有分公司,现该集团公 司欲进行一项改革,此项改革可能涉及到各分公司的利益,故 采用抽样调查方法,从四个分公司共抽取 420 名职工,了解职 工对此项改革的看法,调查结果见表 9-1. 表 9-1
所以拒绝H0,即比例发生了变化,小增加,大减少了。
由(9.1)式得
2
i 1 j 1
2
4
( f ij eij ) 2 eij
3.03
由(9.2)式,得自由度 f (2 1)(4 1) 3 . 取 0.1 时,查表得
20.1 (3) 6.251
由于
2 2 0 .1 (3)
从而接受 H 0 ,即认为四个分公司对改革方案的赞成比例是一致 的.
对话框【Expected range】输入期望数据区域,得 p 值为
0.0167114 所以拒绝原假设.
第一步:
依次单击“插入” → “函数”
第二步:
依次单击“统计”→“CHITEST”→“确定”
第三步:
先在对话框【Actual range】输入观察数据区域,然后在对 话框【Expected range】输入期望数据区域得到p值 0.0167114。
列百分比:列的每一个观察频数除以相应的列合计数 ( fij / cj ) 总百分比:每一个观察值除以观察值的总个数( fij / n )
表 9-2
包含百分比的 2×4 列联表
二分公司 三分公司 四分公司 合计
一分公司 赞成该方案 行百分数%
68 24.4%
75 26.9%
57 20.4%
79 28.3%
解:
H0 : 在售出的所有电视中,小、中、大屏幕所占的比例 分别为40%、40%、20% H1 :比例发生变化
2 2 2 ( 55 40 ) ( 35 40 ) ( 10 20 ) 2 11.25 40 40 20 2 0.01 9.21
2 2 0.01
37.5%
10.7% 120 28.5%
36.7%
7.9% 90 21.5%
28.2%
7.4% 110 26.2%
—
— 420 100%
3.期望值的分布
(1) 假定行变量和列变量相互独立
(2) 实际频数 fij 的期望频数的估计 eij 是总频数的个数 n
乘以该实际频数 fij 落入第i行和第j列的概率,即
表9-5
2 计算表
步骤一 步骤二
( fij eij )
2
步骤三
( fij eij ) / eij
2
2
步骤四
( f ij eij ) 2 eij
f ij
eij
fij eij
68 75 57 79 32 45 33 31
66 80 60 73 34 40 30 37
2 -5 -3 6 -2 5 3 -6
4 25 9 36 4 25 9 36
0.0606 0.3125 0.15 0.4932 0.1176 0.625 0.3 0.973
3.0319
9.2.2 拟合优度检验(goodness of fit test)
1.检验多个变量之间是否存在显著差异 2.检验的步骤 (1)例如提出原假设和备择假设
H0 : 1 2 k H 1 : 1 , 2 , , k 不全相等 (2)计算检验的统计量
eij (3)对规定的显著性水平 ,若
i 1 j 1
2 (r 1)(c 1) 2
2
r
c
( f ij eij ) 2
则拒绝 H 0 . 否则不能拒绝 H 0 ,即接受 H 0.
例9.1
某集团公司欲进行一项改革,分别从所属的四个分公司中 共随机抽取了420名职工,了解他们对改革方案的态度(见表9 -1),并对职工态度是否与所在单位有关这个问题在 0.1 的显著性水平上进行检验.
解:
H0 : 1 2 3 4 H 1 : 1 , 2 , 3 , 4 不全相等
2
i 1 j 1
r
c
( f ij eij ) 2 eij
(9.1)
其自由度为 ( r 1)(c 1) 式中:fij
2
— 列联表中第i行第j列类别的实际频数
3. 值愈大则表明实际频数与由 H 0 确定的期望频数的差 异愈大.
eij — 列联表中第i行第j列类别的期望频数
例9.2
为了提高市场占有率,A公司和B公司同时开展了广告宣传. 在广告宣传战之前,A公司的市场占有率为0.45,B公司的市场 占有率为0.40,其他公司的市场占有率为0.15. 为了了解广告 战之后A、B和其他公司的市场占有率是否发生变化,随机抽取
了200名消费者.其中102人表示准备购买A公司产品,82人表示
表9-4 实际频数和估计的期望频数分布表
部门 态度 赞成 实际频数 该方案 期望频数 反对 实际频数 该方案 期望频数 合计
一分公司 二分公司 三分公司 四分公司 合计
68
( 66 ) 32 ( 34 ) 100
75
( 80 ) 45 ( 40 ) 120
57