应用统计学(前言)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
nM N
方差 p q n p q
nM ( N M )( N n ) N 2 ( N 1)
P( x ) p x (1 p)1 x
X=0,1 ( 0<p<1)
x x P ( x ) C n p (1 p) n x
X=0,1,…,n(0<p<1)
超几何分布 H(n,M,N)
离散随机变量的数学期望表达式:
E
x px
i 1 i i
连续随机变量的数学期望表达式:
E
xx dx
随机变量及其分布
随机变量与分布的研究类似于高等
数学中变量与函数的研究 函数的研究着重讨论六大类基本初 等函数,随机分布的研究则讨论其 常用分布
概率论与数理统计的区别
概率论的特点:先从一个数学模型出发,比如已知 随机变量的分布,然后去研究它的性质、特点和规 律性;
数理统计的特点:观测随机现象所得到的数据,利 用这些资料选择或检验数学模型,并对所考察的问 题作出推断或预测,即靠抽验得到的数据来推断整 体的情况,主要任务是统计推断,包括:参数估计 和假设检验。
假设检验
1、假设检验:先把一些结论当作某种假设,然后选取 适当的统计量,再根据实测资料的具体值对假设进行 检验,判断是否可以认为假设是成立的,从而得出有 关结论。 2、类型可分为:参数检验和非参数检验
参数检验:如果总体分布函数的类型已知,检验的目的是为了 对总体的参数及有关性质作出判断; 非参数检验:如果总体分布的类型不确定(或完全未知),检 验的目的是作出一般性论断(如分布属于某种类型;两变量是 独立的;两分布是相同的,等等)。
概率论与数理统计(复习)
概率、频率
对概率的再认识:古典概率、经验 概率、统计概率 概率是唯一的、客观存在的 频率是随着试验的变化而变化 频率稳定性问题
抛硬币试验
实验者
Buffon Pearson
掷硬币的次数
4040 12700
正面出现次数
2048 6019
正面出现频率
0.5069 0.5016
1 p
q p2
常用分布及其数学期望与方差
名称及记号 均匀分布 U(0,1) 概率密度 数学期望 a≤x≤b x <a 或x >b 方差
1 ( x ) b a 0
ab 2
(b a ) 2 12
正态分布 N(μ ,σ )
( x )
1 2
e
( x ) 2 22
应用统计学的内容
《应用统计学》也称为多元统计分析,简称多元分析, 是统计学的一个重要分支,它是处理多维数据不可缺少 的重要工具,并日益显示出无比的魅力。 本课程介绍常用的各种多元统计分析方法,包括方差分 析、正交试验设计、回归分析、聚类分析、判别分析、 主成分分析、因子分析等方法。
通过对所考虑的包括多个变量的统计问题进行分析,以 了解各变量的关系、建立合理的模型等。
应用统计学的作用
通过本课程的学习,使学生系统地了解多元统计分析 的基本概念和基本原理,掌握一些常用的多元统计思 想和统计方法;
结合上机实习学会利用统计软件(SPSS或Excel)进 行数据处理和统计分析;
ห้องสมุดไป่ตู้
侧重于多元统计分析方法的应用,掌握应用多元统计 学解决实际问题的主要环节和方法,并能灵活应用于 科学研究、生产和经营管理中。
μ
σ
2
-∞<x<+∞ 指数分布 e(λ ) x>0
e x ( x ) 0 (λ >0)
x≤0
1
1 2
数字特征的讨论
期望与样本均值 方差与样本方差
矩与样本矩
样本均值与样本方差是统计中的两
大类指标
多维随机变量的学习方法
边缘概率(分布) 条件概率(分布)
理论分布与统计分布
理论分布也称为概率分布 统计分布也称为频率分布
由概率与频率的关系,得知:
理论分布是客观存在的,反映了随机 事件发生的概率的一般规律;频率分 布是现实的反映,随着试验的变化而 变化
常用分布及其数学期望与方差
名称及记号 “0-1”分布 二项分布 B(n,p) 概率分布 数学期望 p n p
要求先修课程: 高等数学、统计学原理、概率论与数理统计 教 材:《多元统计分析与SPSS应用》. 汪冬华编著. 参考书: 《实用多元统计分析》 方开泰编著. 华东师范大学出 版社,1989年9月 《应用多元分析》王学民著. 上海财经大学出版社, 1999年 《实用多元统计分析》王学仁,王松桂著. 上海科技 出版社,1990年 《SPSS 11统计分析教程》张文彤著. 希望电子出版 社,2002年
Pearson
24000
12012
0.5005
随机事件与随机变量
随机变量的引入是对随机事件的抽
象 对随机事件的研究可以转化为对随 机变量的研究,可以借助于高等数 学的知识 离散随机变量与连续随机变量的数 学处理方法实质上是一致的
抛硬币的试验中出现正面的事件可
以表示为:
1 出现正面 0 出现反面
随机变量的独立性
大数定律与中心极限定理
小概率事件实际不可能性原理 一般情况下,随机分布的极限分布
是正态分布
x x CM Cn NM P ( x ) Cn N
泊松分布 P(x) 几何分布 G(p)
X=0,1,…min(n,M) (0≤M≤N,0≤n≤N) x P ( x ) e x! X=0,1,…(λ >0)
λ
λ
P( x ) p(1 p) x 1
X=1,2…(0<p<1)
参数估计
1、参数估计:根据样本给出参数的估计值,即选定一个统计 量,然后用样本值代入,算出该统计量的值。 2、参数估计的提法 已知总体分布类型,只是其中一个或几个参数未知,这时 只要求出这些参数值来,总体分布就可以完全确定; 关心的不是分布类型,而是某些数字特征,如期望、方差 等等。 3、参数估计的方式:点估计和区间估计 4、点估计量的求法:矩估计法和极大似然估计法 5、估计量的评选标准:无偏性、最小方差性、相合性 6、区间估计包括:数学期望和方差的置信区间估计
方差 p q n p q
nM ( N M )( N n ) N 2 ( N 1)
P( x ) p x (1 p)1 x
X=0,1 ( 0<p<1)
x x P ( x ) C n p (1 p) n x
X=0,1,…,n(0<p<1)
超几何分布 H(n,M,N)
离散随机变量的数学期望表达式:
E
x px
i 1 i i
连续随机变量的数学期望表达式:
E
xx dx
随机变量及其分布
随机变量与分布的研究类似于高等
数学中变量与函数的研究 函数的研究着重讨论六大类基本初 等函数,随机分布的研究则讨论其 常用分布
概率论与数理统计的区别
概率论的特点:先从一个数学模型出发,比如已知 随机变量的分布,然后去研究它的性质、特点和规 律性;
数理统计的特点:观测随机现象所得到的数据,利 用这些资料选择或检验数学模型,并对所考察的问 题作出推断或预测,即靠抽验得到的数据来推断整 体的情况,主要任务是统计推断,包括:参数估计 和假设检验。
假设检验
1、假设检验:先把一些结论当作某种假设,然后选取 适当的统计量,再根据实测资料的具体值对假设进行 检验,判断是否可以认为假设是成立的,从而得出有 关结论。 2、类型可分为:参数检验和非参数检验
参数检验:如果总体分布函数的类型已知,检验的目的是为了 对总体的参数及有关性质作出判断; 非参数检验:如果总体分布的类型不确定(或完全未知),检 验的目的是作出一般性论断(如分布属于某种类型;两变量是 独立的;两分布是相同的,等等)。
概率论与数理统计(复习)
概率、频率
对概率的再认识:古典概率、经验 概率、统计概率 概率是唯一的、客观存在的 频率是随着试验的变化而变化 频率稳定性问题
抛硬币试验
实验者
Buffon Pearson
掷硬币的次数
4040 12700
正面出现次数
2048 6019
正面出现频率
0.5069 0.5016
1 p
q p2
常用分布及其数学期望与方差
名称及记号 均匀分布 U(0,1) 概率密度 数学期望 a≤x≤b x <a 或x >b 方差
1 ( x ) b a 0
ab 2
(b a ) 2 12
正态分布 N(μ ,σ )
( x )
1 2
e
( x ) 2 22
应用统计学的内容
《应用统计学》也称为多元统计分析,简称多元分析, 是统计学的一个重要分支,它是处理多维数据不可缺少 的重要工具,并日益显示出无比的魅力。 本课程介绍常用的各种多元统计分析方法,包括方差分 析、正交试验设计、回归分析、聚类分析、判别分析、 主成分分析、因子分析等方法。
通过对所考虑的包括多个变量的统计问题进行分析,以 了解各变量的关系、建立合理的模型等。
应用统计学的作用
通过本课程的学习,使学生系统地了解多元统计分析 的基本概念和基本原理,掌握一些常用的多元统计思 想和统计方法;
结合上机实习学会利用统计软件(SPSS或Excel)进 行数据处理和统计分析;
ห้องสมุดไป่ตู้
侧重于多元统计分析方法的应用,掌握应用多元统计 学解决实际问题的主要环节和方法,并能灵活应用于 科学研究、生产和经营管理中。
μ
σ
2
-∞<x<+∞ 指数分布 e(λ ) x>0
e x ( x ) 0 (λ >0)
x≤0
1
1 2
数字特征的讨论
期望与样本均值 方差与样本方差
矩与样本矩
样本均值与样本方差是统计中的两
大类指标
多维随机变量的学习方法
边缘概率(分布) 条件概率(分布)
理论分布与统计分布
理论分布也称为概率分布 统计分布也称为频率分布
由概率与频率的关系,得知:
理论分布是客观存在的,反映了随机 事件发生的概率的一般规律;频率分 布是现实的反映,随着试验的变化而 变化
常用分布及其数学期望与方差
名称及记号 “0-1”分布 二项分布 B(n,p) 概率分布 数学期望 p n p
要求先修课程: 高等数学、统计学原理、概率论与数理统计 教 材:《多元统计分析与SPSS应用》. 汪冬华编著. 参考书: 《实用多元统计分析》 方开泰编著. 华东师范大学出 版社,1989年9月 《应用多元分析》王学民著. 上海财经大学出版社, 1999年 《实用多元统计分析》王学仁,王松桂著. 上海科技 出版社,1990年 《SPSS 11统计分析教程》张文彤著. 希望电子出版 社,2002年
Pearson
24000
12012
0.5005
随机事件与随机变量
随机变量的引入是对随机事件的抽
象 对随机事件的研究可以转化为对随 机变量的研究,可以借助于高等数 学的知识 离散随机变量与连续随机变量的数 学处理方法实质上是一致的
抛硬币的试验中出现正面的事件可
以表示为:
1 出现正面 0 出现反面
随机变量的独立性
大数定律与中心极限定理
小概率事件实际不可能性原理 一般情况下,随机分布的极限分布
是正态分布
x x CM Cn NM P ( x ) Cn N
泊松分布 P(x) 几何分布 G(p)
X=0,1,…min(n,M) (0≤M≤N,0≤n≤N) x P ( x ) e x! X=0,1,…(λ >0)
λ
λ
P( x ) p(1 p) x 1
X=1,2…(0<p<1)
参数估计
1、参数估计:根据样本给出参数的估计值,即选定一个统计 量,然后用样本值代入,算出该统计量的值。 2、参数估计的提法 已知总体分布类型,只是其中一个或几个参数未知,这时 只要求出这些参数值来,总体分布就可以完全确定; 关心的不是分布类型,而是某些数字特征,如期望、方差 等等。 3、参数估计的方式:点估计和区间估计 4、点估计量的求法:矩估计法和极大似然估计法 5、估计量的评选标准:无偏性、最小方差性、相合性 6、区间估计包括:数学期望和方差的置信区间估计