管理统计学课件-第07章
合集下载
第07章管理统计学
;
根据置信水平,查标准正态分布表确定其 z / 2 值;
实际抽样,并计算样本的均值
X
和抽样误差 X ;
确定置信区间:
X Z X
管理统计学
Management statist值的 区间估计
总体比例的 区间估计
总体方差的 区间估计
单一总体
两个总体 均值之差
• 即=0.01, =0.05, =0.10
管理统计学
Management statistics
置信区间
X Z
X Z n X
X
_
X
2.58 X 1.645 X 1.645 X 2.58 X
1.96 X 1.96 X
Sp
1 1 n1 n2
两个总体均值之差的区间估计(小样本1222 )
1
两个样本均值之差的标准化
t
( X 1 X 2 ) ( 1 2 ) Sp 1 1 n1 n2
~ t (n1 n2 2)
2
两个总体均值之差1-2在1- 置信水平下的置信区间为
X
1
点估计的评价准则
区间估计引例
为了估计目前北京市场二手房交易的平均价格,制定相应的营销策略,某房地产 中介公司在2005年第四季度的二手房交易中,随机抽取40个交易作为样本,得到 二手房交易价格如下表所示(单位:万元)。
48 33 73.5 36.5 40.5 52.4 39.5 16 27 35.4 36 21 65 46.2 22.5 45 58.1 48 33.5 41 80 72 102 41 50.8 19.9 36.6 37.5 56 38 44 51 42.8 58.5 34.2 60.5 49 48 39 43
管理统计学第7章PPT学习教案
符号
第19页/共34页
2. 大样本情况下,正负号个数检验法的处理
p=0.5
第20页/共34页
第21页/共34页
例7.1.1 用两套问卷测试20个管理人员的 素质,两套问卷的满分都是200分。测试 结果如下表所示。问:两套问卷有无显 著差异(本质是两套问卷的结果的分布 是否相同?)
配对数据 卷A 147 150 152 148 155 146 149 148 151 150 卷B 146 151 154 147 152 147 148 146 152 150
配对
1 2 3 4 5 6 7 8 9 10 11 12
得 实验组 分
X1
18
20
26
14
25 25
21
12
14 17
20
19
对照组 X2 14 20 23 12 29 18 21 10 16 13 17 25
第15页/共34页
解:(1)建立假设。H0 :颜色教学无显著效果; H1 :颜色教学有显著效果
+ - - ++ - ++ - 0
卷A 147 148 147 150 149 149 152 147 154 153 卷B 146 146 148 153 147 146 148 149 152 150
++ - - +++ - ++
此时,正负号的总个数m=19,所要检验的参数
p=0.5,m×p≈10(略小于10),还可勉强作为大
管理统计学第7章
会计学
1
实际问题中,经常要检验两种不同的处 理方法效果是否相同。
例如,比较在不同钻机、不同操作人员、 不同地质条件下,钻机效率是否相同等等。
第19页/共34页
2. 大样本情况下,正负号个数检验法的处理
p=0.5
第20页/共34页
第21页/共34页
例7.1.1 用两套问卷测试20个管理人员的 素质,两套问卷的满分都是200分。测试 结果如下表所示。问:两套问卷有无显 著差异(本质是两套问卷的结果的分布 是否相同?)
配对数据 卷A 147 150 152 148 155 146 149 148 151 150 卷B 146 151 154 147 152 147 148 146 152 150
配对
1 2 3 4 5 6 7 8 9 10 11 12
得 实验组 分
X1
18
20
26
14
25 25
21
12
14 17
20
19
对照组 X2 14 20 23 12 29 18 21 10 16 13 17 25
第15页/共34页
解:(1)建立假设。H0 :颜色教学无显著效果; H1 :颜色教学有显著效果
+ - - ++ - ++ - 0
卷A 147 148 147 150 149 149 152 147 154 153 卷B 146 146 148 153 147 146 148 149 152 150
++ - - +++ - ++
此时,正负号的总个数m=19,所要检验的参数
p=0.5,m×p≈10(略小于10),还可勉强作为大
管理统计学第7章
会计学
1
实际问题中,经常要检验两种不同的处 理方法效果是否相同。
例如,比较在不同钻机、不同操作人员、 不同地质条件下,钻机效率是否相同等等。
《管理统计学》课件
ABCD
指数平滑法
利用历史数据的加权平均值进行预测,其中较近 的数据给予较大的权重。
神经网络和机器学习方法
利用复杂的算法和大量的数据训练模型,进行长 期和短期预测。
时间序列分析的应用场景
股票市场预测
通过分析历史股票价格数据,预测未来的股 票走势。
销售预测
基于历史销售数据,预测未来的产品需求和 销售量。
统计学的作用
统计学在各个领域都有广泛的应用, 可以帮助人们更好地理解数据,预测 未来趋势,制定科学决策,解决实际述统计学主要研究如何用图表、图像、数学公式等手段整理
、展示和解释数据,以便更好地理解数据。
推断统计学
02
推断统计学则更注重通过样本数据来推断总体特征,如预测、
和因果关系。
社会科学
用于研究社会现象、人类行为等,如 教育、犯罪、婚姻等领域的实证分析
。
金融分析
用于股票、债券等金融产品的价格预 测和风险评估,以及市场趋势分析。
医学研究
用于疾病诊断、治疗方法和药物效果 的研究,以及健康状况与生活习惯之 间的关联分析。
06 时间序列分析
时间序列分析的基本概念
时间序列分析是一种统计 方法,用于研究随时间变 化的数据序列。
图表解读
说明如何解读图表,理解数据分布、变化趋势和异常点,以及如何通过图表进行数据可视化表达。
数据的数值描述
均值、中位数和众数
介绍均值、中位数和众数的概念和计算方法,以及它们在描述数据集中趋势时 的优缺点。
方差和标准差
介绍方差和标准差的概念和计算方法,以及它们在描述数据离散程度时的应用 。
03 推断性统计学
无偏性、有效性和一致性。
假设检验
管理统计学课件
单样本t检验
用于检验单个样本的平均值与已知的某个 值是否显著不同。
方差分析
用于比较多个样本的平均值是否有显著差 异,特别是当样本之间相互独立且总体方
差相等时。
双样本t检验
用于比较两个独立样本的平均值是否有显 著差异。
卡方检验
用于检验实际观测频数与期望频数之间的 差异是否显著,常用于分类数据的统计分 析。
推断性统计
03
推断性统计则是通过样本数据推断总体特征的方法,如参数估
计和假设检验等。
统计学的应用领域
市场营销
通过统计学方法分析市场数据,了解客 户需求和市场趋势,制定营销策略。
金融投资
在投资领域,统计学用于风险评估、 资产定价和股票市场分析等方面。
医学研究
在医学领域,统计学用于临床试验、 流行病学调查和疾病控制等方面。
统计学意义
统计学在各个领域都有广泛的应用, 如社会科学、医学、经济学等,为决 策提供数据支持,帮助人们更好地理 解现象和解决问题。
统计学的基本概念
数据类型
01
统计学中常见的数据类型包括定量数据和定性数据,离散数据
和连续数据等。
描述性统计
02
描述性统计是统计学中的基础概念,包括数据的集中趋势、离
散程度和分布形态等。
数据的数字特征
均值
反映数据的集中趋势,计算所 有数值的和除以数值个数。
中位数
将数据按大小排序后,位于中 间位置的数值。
众数
出现次数最多的数值。
标准差
反映数据离散程度的指标,计 算各数值与均值之差的平方和
的平均值。
03
概率论与数理统计
概率论基础
概率的定义与性质
概率是描述随机事件发生可能性的数学工具,具有规范性、规范性 、确定性和可操作性等性质。
用于检验单个样本的平均值与已知的某个 值是否显著不同。
方差分析
用于比较多个样本的平均值是否有显著差 异,特别是当样本之间相互独立且总体方
差相等时。
双样本t检验
用于比较两个独立样本的平均值是否有显 著差异。
卡方检验
用于检验实际观测频数与期望频数之间的 差异是否显著,常用于分类数据的统计分 析。
推断性统计
03
推断性统计则是通过样本数据推断总体特征的方法,如参数估
计和假设检验等。
统计学的应用领域
市场营销
通过统计学方法分析市场数据,了解客 户需求和市场趋势,制定营销策略。
金融投资
在投资领域,统计学用于风险评估、 资产定价和股票市场分析等方面。
医学研究
在医学领域,统计学用于临床试验、 流行病学调查和疾病控制等方面。
统计学意义
统计学在各个领域都有广泛的应用, 如社会科学、医学、经济学等,为决 策提供数据支持,帮助人们更好地理 解现象和解决问题。
统计学的基本概念
数据类型
01
统计学中常见的数据类型包括定量数据和定性数据,离散数据
和连续数据等。
描述性统计
02
描述性统计是统计学中的基础概念,包括数据的集中趋势、离
散程度和分布形态等。
数据的数字特征
均值
反映数据的集中趋势,计算所 有数值的和除以数值个数。
中位数
将数据按大小排序后,位于中 间位置的数值。
众数
出现次数最多的数值。
标准差
反映数据离散程度的指标,计 算各数值与均值之差的平方和
的平均值。
03
概率论与数理统计
概率论基础
概率的定义与性质
概率是描述随机事件发生可能性的数学工具,具有规范性、规范性 、确定性和可操作性等性质。
管理统计学 第2版 第七章 回归分析
相关关系的种类
3、按相关方向划分 (1)正相关:当两个变量的变化同方向时,这种同方向变动的关系称为正相关。 (2)负相关:当两个变量的变化反方向时,这种反方向变动的关系称为负相关。 4、按相关形式划分 (1)线性相关 (2)非线性相关
相关程度的衡量:散点图
相关程度的衡量: 相关系数
相关系数:对两个变量之间线性相关程度进行分析的主要工具是单相关系数。 总体相关系数的定义式为: 样本相关系数:
相关系数的显著性检验(例题分析)
各相关系数检验的统计量
线性回归模型的基本问题 参数的最小二乘估计 回归直线的拟合优度检验 显著性检验什么是回归分析?(Regression)
从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度
内容与学习目标
1.了解相关与回归的基本概念及其应用领域
2.掌握一元、多元回归模型的构建、检验
3.掌握利用SPSS软件进行回归分析的程序、步骤和结果报告分析
内容
学习目标
相关分析
函数关系与相关关系 1、函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种确定性的关系为函数关系。 2、相关关系:当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定范围内变化,变量间的这种具有不确定性的相互关系,称为相关关系。
2008年8月
相关关系的种类
7.1.2相关关系的种类
1、按相关程度划分 (1)、完全相关:当一种现象的数量变化完全由另一种现象的数量变化所确定时,称这两种现象间的关系为完全相关。 (2)、不完全相关:当两个现象之间的关系介于完全相关和不相关之间时,称其为不完全相关。 (3)、不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。 2、按变量多少划分 (1)、单相关:我们把两个变量间的相关,即一个变量对另一变量的相关关系,称为单相关,单相关关系只有一个自变量。 (2)、复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。 (3)、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为偏相关。
3、按相关方向划分 (1)正相关:当两个变量的变化同方向时,这种同方向变动的关系称为正相关。 (2)负相关:当两个变量的变化反方向时,这种反方向变动的关系称为负相关。 4、按相关形式划分 (1)线性相关 (2)非线性相关
相关程度的衡量:散点图
相关程度的衡量: 相关系数
相关系数:对两个变量之间线性相关程度进行分析的主要工具是单相关系数。 总体相关系数的定义式为: 样本相关系数:
相关系数的显著性检验(例题分析)
各相关系数检验的统计量
线性回归模型的基本问题 参数的最小二乘估计 回归直线的拟合优度检验 显著性检验什么是回归分析?(Regression)
从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度
内容与学习目标
1.了解相关与回归的基本概念及其应用领域
2.掌握一元、多元回归模型的构建、检验
3.掌握利用SPSS软件进行回归分析的程序、步骤和结果报告分析
内容
学习目标
相关分析
函数关系与相关关系 1、函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种确定性的关系为函数关系。 2、相关关系:当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定范围内变化,变量间的这种具有不确定性的相互关系,称为相关关系。
2008年8月
相关关系的种类
7.1.2相关关系的种类
1、按相关程度划分 (1)、完全相关:当一种现象的数量变化完全由另一种现象的数量变化所确定时,称这两种现象间的关系为完全相关。 (2)、不完全相关:当两个现象之间的关系介于完全相关和不相关之间时,称其为不完全相关。 (3)、不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。 2、按变量多少划分 (1)、单相关:我们把两个变量间的相关,即一个变量对另一变量的相关关系,称为单相关,单相关关系只有一个自变量。 (2)、复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。 (3)、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为偏相关。
管理统计学PPT课件
(1)算术平均数(Arithmetic average) 表3-1 某校125位大学一年级新生体重表
体重(公斤) 46—48 49—51 52—54 55—57 58—60 61—63 64—66
组中值(x) 47 50 53 56 59 62 65
人数(f) 4 20 25 38 21 12 5
(4)在图3-4中的横线叫做须线(whisker),须线从方盒的边线出发,直至在上、下限之内的最大值 和最小值。
(5)最后,任一异常值的位置以符号“*”标出。
3.5 盒形图
盒形图例图
图3-2
3.1.3 中位数(Median)
定义:一组n个观测值按数值大小排列,处于中央位置的值称为中位数以 表示,Me即x,当n为奇数
Me
1 2
x
n 2
n 1 2
x
n 1 2
,当n为偶数
3.1.4 百分位数( Percentile) 定义:
一组n个观测值按数值大小排列如x1,x2,x3,x4… 处于p%位置的值称第p百分位数。
第2步:计算指数
i np%
第3步
1.若i不是整数,将i向上取整。大于I 的毗邻整数为第p百分位数的位置。 2.若i是整数,则第P百分位数是第i项与第(i+l)项数据的平均值。
3.2 表示变异(分散)程度的特征数
产品质量检查的结果
说明生产 是否稳定
学
数据的变
生
异程度
的
成
绩
测量的结果
说明测量方法或 仪器是精密还是粗糙
3.2.4变异系数(Coefficient of Variation) • 定义 变异系数C
C s 100(%) x
是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高 与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。
管理统计学马庆国著PPT课件
第35页/共78页
集中趋势测度
--未分组数据
中位数 (Md) --
1.将n个观察值按升序或降序排列
2.如果观察值个数是奇数,则中位数就是位于最中心位置的那个观察值,即数据集中的
第
个观察值
3的.如第果观察值个个和数第是偶数,则个中观(位察n数2值就1的)是平th位均于值正中心两个观察值的平均值,即数据集中
第41页/共78页
集中趋势测度
--未分组数据
B组 age: 9, 14, 8, 10, 13, 7, 9, 11, 16, 10, 12, 9
均值
9 14 ... 9 10.67
12
中位数 10
众数 9
第42页/共78页
集中趋势测度
--未分组数据
均值、中位数和众数之间的关系 -1. 对称分布 (均值 = Md = Mo)
第3页/共78页
整理数据 --频数分布
将数据值分成几组 显示各组中有多少数值 很容易发现数据的图形特点 无法保留原始数据的值
第4页/共78页
频数分布
定义 分布
某个变量所有可能值的集合 显示了变量的图形特点
当数据集为小型时,数据之间的变化特点很容易观察出来 随着数据集变为中型或大型,变量的特性一般表现得越来越不明显
SPSS统计软件给我们的工作 带来了方便
直方图 : 图形
直方图
选择关心的变量
茎叶图形 : 分析 描述统计学 寻找
选择绘图选项
第31页/共78页
定义 均值 中位数 众数
集中趋势测度
--未分组数据
所有观察值 的平均值 所有观察值中位于最中心位置的那个值 出现最频繁的数据值
第32页/共78页
均值 --
集中趋势测度
--未分组数据
中位数 (Md) --
1.将n个观察值按升序或降序排列
2.如果观察值个数是奇数,则中位数就是位于最中心位置的那个观察值,即数据集中的
第
个观察值
3的.如第果观察值个个和数第是偶数,则个中观(位察n数2值就1的)是平th位均于值正中心两个观察值的平均值,即数据集中
第41页/共78页
集中趋势测度
--未分组数据
B组 age: 9, 14, 8, 10, 13, 7, 9, 11, 16, 10, 12, 9
均值
9 14 ... 9 10.67
12
中位数 10
众数 9
第42页/共78页
集中趋势测度
--未分组数据
均值、中位数和众数之间的关系 -1. 对称分布 (均值 = Md = Mo)
第3页/共78页
整理数据 --频数分布
将数据值分成几组 显示各组中有多少数值 很容易发现数据的图形特点 无法保留原始数据的值
第4页/共78页
频数分布
定义 分布
某个变量所有可能值的集合 显示了变量的图形特点
当数据集为小型时,数据之间的变化特点很容易观察出来 随着数据集变为中型或大型,变量的特性一般表现得越来越不明显
SPSS统计软件给我们的工作 带来了方便
直方图 : 图形
直方图
选择关心的变量
茎叶图形 : 分析 描述统计学 寻找
选择绘图选项
第31页/共78页
定义 均值 中位数 众数
集中趋势测度
--未分组数据
所有观察值 的平均值 所有观察值中位于最中心位置的那个值 出现最频繁的数据值
第32页/共78页
均值 --
统计学 第7章 假设检验ppt课件
在对客观事物及其现象进行观测和实验中,随着观测或实验的次数增 多,事件发生的频率和均值逐渐地趋于某个常数。
(1)贝努利定理(Bernoulli Theorem)
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
完整版PPT课件
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
3.抽样分布
抽样分布(Sampling Distribution)是指从同分布总体中,独立抽 取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分 布的概率分布,抽样分布是抽样理论的研究对象。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
完整版PPT课件
《统计学教程》
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
ln i m Fn
x
n lim k1Xk
nx
x
n n
1
t2
e 2dt
(6.3)
2பைடு நூலகம்
(1)贝努利定理(Bernoulli Theorem)
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
完整版PPT课件
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
3.抽样分布
抽样分布(Sampling Distribution)是指从同分布总体中,独立抽 取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分 布的概率分布,抽样分布是抽样理论的研究对象。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
完整版PPT课件
《统计学教程》
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
ln i m Fn
x
n lim k1Xk
nx
x
n n
1
t2
e 2dt
(6.3)
2பைடு நூலகம்
《管理统计学》第七章
步骤
建立假设、计算检验统计量、确定显著性水平、 作出决策。
注意事项
样本的独立性、正态性、方差齐性。
多因素方差分析
原理
同时考虑多个因素对因变量的影响,通过比较不同因素水平组合 下样本均值的差异,推断总体均值是否存在显著差异。
步骤
建立假设、计算检验统计量、确定显著性水平、作出决策。
注意事项
样本的独立性、正态性、方差齐性;因素之间的交互作用。
随机变量是定义在样本空间上的实值函数 ,常用大写字母X,Y,Z等表示。
离散型随机变量只能取有限个或可列个值 ,其分布律用概率函数表示。
连续型随机变量及其概率密度
常见分布
连续型随机变量的取值充满某个区间,其 分布用概率密度函数表示。
二项分布、泊松分布、均匀分布、指数分 布、正态分布等。
04
推断性统计
学习成果
通过本章的学习,读者可以了解统计学在管理领域中的应用,掌握基本的统计方法和技能 ,培养数据分析和解决问题的能力,为今后的学习和工作打下坚实的基础。
学习建议与展望
学习建议
在学习本章内容时,建议读者注重理论与实践的结合,多进行案例分析和实际操作练习。同时,要注重对基本概 念和方法的理解和掌握,避免死记硬背和机械套用。此外,还要关注统计学领域的最新发展动态,不断拓展自己 的知识面和视野。
离散数据
可以量化的数据,如身 高、体重、温度等。
描述性质的数据,如性 别、婚姻状况、职业等。
只能取特定值的数据, 如整数、有限集合中的
元素等。
连续数据
可以在某个范围内取任 意值的数据,如长度、
时间、温度等。
频数分布
频数
某一特定值或特定范围内的数 据出现的次数。
建立假设、计算检验统计量、确定显著性水平、 作出决策。
注意事项
样本的独立性、正态性、方差齐性。
多因素方差分析
原理
同时考虑多个因素对因变量的影响,通过比较不同因素水平组合 下样本均值的差异,推断总体均值是否存在显著差异。
步骤
建立假设、计算检验统计量、确定显著性水平、作出决策。
注意事项
样本的独立性、正态性、方差齐性;因素之间的交互作用。
随机变量是定义在样本空间上的实值函数 ,常用大写字母X,Y,Z等表示。
离散型随机变量只能取有限个或可列个值 ,其分布律用概率函数表示。
连续型随机变量及其概率密度
常见分布
连续型随机变量的取值充满某个区间,其 分布用概率密度函数表示。
二项分布、泊松分布、均匀分布、指数分 布、正态分布等。
04
推断性统计
学习成果
通过本章的学习,读者可以了解统计学在管理领域中的应用,掌握基本的统计方法和技能 ,培养数据分析和解决问题的能力,为今后的学习和工作打下坚实的基础。
学习建议与展望
学习建议
在学习本章内容时,建议读者注重理论与实践的结合,多进行案例分析和实际操作练习。同时,要注重对基本概 念和方法的理解和掌握,避免死记硬背和机械套用。此外,还要关注统计学领域的最新发展动态,不断拓展自己 的知识面和视野。
离散数据
可以量化的数据,如身 高、体重、温度等。
描述性质的数据,如性 别、婚姻状况、职业等。
只能取特定值的数据, 如整数、有限集合中的
元素等。
连续数据
可以在某个范围内取任 意值的数据,如长度、
时间、温度等。
频数分布
频数
某一特定值或特定范围内的数 据出现的次数。
统计基础第七章课件
2019/12/16
30
例如,对某天生产的2000件电子元件的耐用时间进行全面检 测,又抽取5%进行抽样复测,资料如下表。根据规定耐用时 间在3000小时以下为不合格。根据以上资料按重置抽样法计 算该电子元件平均耐用时间的抽样平均误差和合格率的抽样 平均误差,并以95.45%的把握估计该电子元件平均耐用时间 和合格率的区间范围。
32
2019/12/16
p 2 0 .02 100
2 0 .02 0 .98 0 .0196
0 .0196 0 .014
p
100
t 2 0 .014 0 .028
p
p
0 .02 0 .028 P 0 .02 0 .028
0 .008 P 0 .048
大写字母N代表全及 单位数。组成样本的每个
总体单位数。
单位称为样本单位。
2019/12/16
7
(二)全及指标和抽样指标
全及指标 抽样指标
2019/12/16
8
1. 全及指标
(1)全及平均数 X :X,X XF
N
F
(2)全及成数P:N1 N
(3)总体数量标志标 :准差(X X)2,
2019/12/16
16
(三)影响抽样误差的因素
抽取样本单位数目的多少 总体单位之间标志值的差异程度 抽样调查的组织形式 抽样方法
2019/12/16
17
二、抽样平均误差的概念及计算
抽样平均误差的概念 抽样平均误差的计算
2019/12/16
18
(一)抽样平均误差的概念
抽样误差随着样本的不同而变化,是一个随机 变量。
《质量管理学》第七章:统计技术方法.ppt
2019-9-9
感谢你的欣赏
22
2019-9-9
感谢你的欣赏
23
第四节 正交试验设计
一、正交试验设计的含义
利用正交表进行试验设计,称为正交试验或正交试 验设计、多因素优选法等。
(一) 正交表
(二) 正交试验设计的用途
正交试验是多因素方差分析的延伸,越是因素多、 水平多越能显示出它的优越性。在企业的科研工作,确 定生产工艺,分析影响质量问题的主要原因,制定解决 问题的对策,以及进行质量改进活动方案方面都可以得 到广泛的应用。
2019-9-9
感谢你的欣赏
28
感谢你的欣赏
15
(二) t检验(均值检验)
1. 单个总体情形 条件:χ~N(μ0,σ02),σ0未知,但可用样本 的S来取代。
2. 两个总体的情形 条件:χ1~N(μ1,σ12),χ2~N(μ2,σ22), n1,n2≤30(小样本),σ1,σ2未知,但水平相同即 σ1=σ2(也可通过F检验证实其无显著性差异)。
感谢你的欣赏
3
(2) 正态分布的两个参数。
如图所示,当σ不变时,μ决定曲线的位移,μ不 变时,σ决定曲线的高低、胖瘦。
2019-9-9
感谢你的欣赏
4
2. 标准正态分布
(1) 标准正态转换
(2) 标准正态分布的概率密度和概率分布函数标准正态分 布的概率密度函数φ(u)的图形,见图8-4。把该图横轴 上任一U≤u的随机事件上发生的概率φ(u)都计算出来, 可形成表8-1,正态分布函数表(表中只给出了右侧u≥0 的φ(u)值)。
(1) u检验,适合于均值检验; (2) t检验,适合于均值检验; (3) Χ2检验,适合于单个总体的标准偏差检验; (4) F检验,适合于两个总体的标准偏差检验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=15。试在95%的置信水平下估计二手房平均价格的置信区间。
北京理工大学
Beijing institute of technology
管理统计学
Management statistics
已知n=40, =15;
计算得到样本均值
n
x xi / n 45.48
;
i 1
由1- =0.95,查标准正态分布概率表得:
管理统计学
Management statistics
区间估计的步骤
以总体均值的区间估计为例:
确定置信水平 1 ;
根据置信水平,查标准正态分布表确定其 z / 2 值;
实际抽样,并计算样本的均值 X 和抽样误差 X ;
确定置信区间: X Z X
北京理工大学
Beijing institute of technology
2
根据样本统计量的抽样分布能够对样本统计量与总体参数 的接近程度给出一个概率度量
样本统计量
置信区间
置信下界
北京理工大学
Beijing institute of technology
置信上界
管理统计学
Management statistics
置信区间
1
未知总体参数落在区间内的概率
2
3
北京理工大学
Beijing institute of technology
45 58.1 48 33.5 41
80 72 102 41 50.8
19.9 36.6 37.5 56 38
44 51 42.8 58.5 34.2
60.5 49 48 39 43
根据上述数据如何估计总体的平均价格?如果需要进一步推断房屋款项在43万元 以上的交易占全部交易的比例,应当如何分析呢?
6. 计算样本容量
管理统计学
Management statistics
统计方法
统计方法
统计描述
统计推断
参数估计
假设检验
点估计
北京理工大学
Beijing institute of technology
区间估计
管理统计学
Management statistics
矩估计法
借助样本矩去估计总体的矩,从而得到总体相应的未知参数的估计值。
X
X
X
X
1.96 X
1.96 X
90% 样本
95% 样本
99% 样本
影响区间宽度的因素
区间的宽度
X Z , X Z
X
X
影响因素:
• 数据离散度 s • 样本容量 n • 置信水平 (1-)
北京理工大学
Beijing institute of technology
第七章 参数估计
演讲者: XXX
管理统计学
Management statistics
北京理工大学 管理与经济学院
北京理工大学
Beijing institute of technology
目录
1. 点估计 2. 区间估计的概念和原理 3. 对总体均值的区间估计
3. 统计数据的来源 4. 对总体比例的区间估计 5. 对总体方差的区间估计
为了估计目前北京市场二手房交易的平均价格,制定相应的营销策略,某房地产 中介公司在2005年第四季度的二手房交易中,随机抽取40个交易作为样本,得到 二手房交易价格如下表所示(单位:万元)。
48 33 73.5 36.5 40.5
52.4 39.5 16 27 35.4
36 21 65 46.2 22.5
管理统计学
Management statistics
无偏性
估计量抽样分布的数学 期望等于被估计的总体
参数
E( )
有效性
D(则1 )称 D(2 )是较 1
有效2 的估计量
一致性
lim P( ) 1
n
(ε为任意小的正数)
点估计的评价准则
区间估计引例
z0.025 1.96
于是在95%的置信水平下的置信区间为:
x z / 2
n
45.48 1.96
30)
2 使用正态分布统计量Z
Z X ~ N (0,1) n
3 总体均值 在1-置信水平下的置信区间为
X z 2
n
或 X z 2
S ( 未知)
n
示例1
沿用引例,假定房地产中介公司从上季度的二手房交易记录中得到 以下信息:交易价格的标准差为15万元,于是我们假定总体标准差
1 用样本的一阶原点矩来估计总体的均值μ
2
用样本的二阶中心矩来估计总体的方差σ2
矩估计法示例
设某批产品的寿命在上服从均匀分布,但是参数未知,随机地抽取五个产品, 测得寿命分别是1265小时,1257小时,1276小时,1269小时和1266小时,试 求的矩估计值。
北京理工大学
Beijing institute nagement statistics
极大似然估计法
1. 由总体概率密度写出 样本的似然函数
2. 建立似然方程
L( ) L(x1, x2 ,..., xn ; )
d L( ) 0 d
3. 求解似然方程
•得
(x1, x2 ,..., xn )
北京理工大学
Beijing institute of technology
表示为 (1-) % = 置信水平
• 其中是参数不落在区间内的概率
通常取值 99%, 95%, 90%
• 即=0.01, =0.05, =0.10
管理统计学
Management statistics
置信区间
X
Z
X
X
Z
n
X_
X
2.58 1.645 1.645 2.58
区间估计过程
总体
均值 是 未知的
随机样本
均值 X = 45
有 95% 的把握 认为 在40和
50之间。
北京理工大学
Beijing institute of technology
管理统计学
Management statistics
区间估计初步
1
在点估计的基础上,给出总体参数估计的一个区间范围, 该区间由样本统计量加减抽样误差而得到的
管理统计学
Management statistics
区间估计的内容
区间估计
总体均值的 区间估计
总体比例的 区间估计
单一总体
两个总体 均值之差
已知或大样本
未知且小样本
总体方差的 区间估计
总体均值的区间估计(大样本)
1 假定条件
总体服从正态分布,且方差(2) 已知
如果不是正态分布,可由正态分布来近似 (n
北京理工大学
Beijing institute of technology
管理统计学
Management statistics
已知n=40, =15;
计算得到样本均值
n
x xi / n 45.48
;
i 1
由1- =0.95,查标准正态分布概率表得:
管理统计学
Management statistics
区间估计的步骤
以总体均值的区间估计为例:
确定置信水平 1 ;
根据置信水平,查标准正态分布表确定其 z / 2 值;
实际抽样,并计算样本的均值 X 和抽样误差 X ;
确定置信区间: X Z X
北京理工大学
Beijing institute of technology
2
根据样本统计量的抽样分布能够对样本统计量与总体参数 的接近程度给出一个概率度量
样本统计量
置信区间
置信下界
北京理工大学
Beijing institute of technology
置信上界
管理统计学
Management statistics
置信区间
1
未知总体参数落在区间内的概率
2
3
北京理工大学
Beijing institute of technology
45 58.1 48 33.5 41
80 72 102 41 50.8
19.9 36.6 37.5 56 38
44 51 42.8 58.5 34.2
60.5 49 48 39 43
根据上述数据如何估计总体的平均价格?如果需要进一步推断房屋款项在43万元 以上的交易占全部交易的比例,应当如何分析呢?
6. 计算样本容量
管理统计学
Management statistics
统计方法
统计方法
统计描述
统计推断
参数估计
假设检验
点估计
北京理工大学
Beijing institute of technology
区间估计
管理统计学
Management statistics
矩估计法
借助样本矩去估计总体的矩,从而得到总体相应的未知参数的估计值。
X
X
X
X
1.96 X
1.96 X
90% 样本
95% 样本
99% 样本
影响区间宽度的因素
区间的宽度
X Z , X Z
X
X
影响因素:
• 数据离散度 s • 样本容量 n • 置信水平 (1-)
北京理工大学
Beijing institute of technology
第七章 参数估计
演讲者: XXX
管理统计学
Management statistics
北京理工大学 管理与经济学院
北京理工大学
Beijing institute of technology
目录
1. 点估计 2. 区间估计的概念和原理 3. 对总体均值的区间估计
3. 统计数据的来源 4. 对总体比例的区间估计 5. 对总体方差的区间估计
为了估计目前北京市场二手房交易的平均价格,制定相应的营销策略,某房地产 中介公司在2005年第四季度的二手房交易中,随机抽取40个交易作为样本,得到 二手房交易价格如下表所示(单位:万元)。
48 33 73.5 36.5 40.5
52.4 39.5 16 27 35.4
36 21 65 46.2 22.5
管理统计学
Management statistics
无偏性
估计量抽样分布的数学 期望等于被估计的总体
参数
E( )
有效性
D(则1 )称 D(2 )是较 1
有效2 的估计量
一致性
lim P( ) 1
n
(ε为任意小的正数)
点估计的评价准则
区间估计引例
z0.025 1.96
于是在95%的置信水平下的置信区间为:
x z / 2
n
45.48 1.96
30)
2 使用正态分布统计量Z
Z X ~ N (0,1) n
3 总体均值 在1-置信水平下的置信区间为
X z 2
n
或 X z 2
S ( 未知)
n
示例1
沿用引例,假定房地产中介公司从上季度的二手房交易记录中得到 以下信息:交易价格的标准差为15万元,于是我们假定总体标准差
1 用样本的一阶原点矩来估计总体的均值μ
2
用样本的二阶中心矩来估计总体的方差σ2
矩估计法示例
设某批产品的寿命在上服从均匀分布,但是参数未知,随机地抽取五个产品, 测得寿命分别是1265小时,1257小时,1276小时,1269小时和1266小时,试 求的矩估计值。
北京理工大学
Beijing institute nagement statistics
极大似然估计法
1. 由总体概率密度写出 样本的似然函数
2. 建立似然方程
L( ) L(x1, x2 ,..., xn ; )
d L( ) 0 d
3. 求解似然方程
•得
(x1, x2 ,..., xn )
北京理工大学
Beijing institute of technology
表示为 (1-) % = 置信水平
• 其中是参数不落在区间内的概率
通常取值 99%, 95%, 90%
• 即=0.01, =0.05, =0.10
管理统计学
Management statistics
置信区间
X
Z
X
X
Z
n
X_
X
2.58 1.645 1.645 2.58
区间估计过程
总体
均值 是 未知的
随机样本
均值 X = 45
有 95% 的把握 认为 在40和
50之间。
北京理工大学
Beijing institute of technology
管理统计学
Management statistics
区间估计初步
1
在点估计的基础上,给出总体参数估计的一个区间范围, 该区间由样本统计量加减抽样误差而得到的
管理统计学
Management statistics
区间估计的内容
区间估计
总体均值的 区间估计
总体比例的 区间估计
单一总体
两个总体 均值之差
已知或大样本
未知且小样本
总体方差的 区间估计
总体均值的区间估计(大样本)
1 假定条件
总体服从正态分布,且方差(2) 已知
如果不是正态分布,可由正态分布来近似 (n