随机变量、概率和概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s n
所需条件:总体为正态
数据类型:区间
统计描述指标:变异度参数
检验统计量:
c2
(n 1)s2
2
n 1
100(1−)%总体置信区间:
(n 1)s2 , (n 1)s2
c2 2
c2 1 2
所需条件:总体为正态
数据类型:名义 分类数:二分类
参数:
检验统计量: z
p 0
0 (1 0 ) n
n 1
两个总体的比较
区间
数据类型? 有序
统计描述 指标的类型?
集中位置
变异度
试验设计? 完全随机设计
配对设计
F 检验与1/ 的区间估计
总体分布?
差值的 总体分布?
正态
极度偏离正态
总体方差?
齐同
不齐
正态
t 检验与 1 的区间估计
t'检验与 1 的区间估计
t 检验与 d 的区间估计
名义 第1章
列联表的c2 检验
α是事先给定的,表示作出拒绝H0的 决定时,可能犯(I型)错误的概率
未知总体 与已知总体
的比较
配对设计 资料的
均数比较
两总体 均数比较
t检验还是Z检验
总体方差已知 总体方差未知
Z检验 t检验
配对t检验
总体方差已知 总体方差未知
Z检验
方差 齐性 检验
方差齐同 方差不齐
t检验 t‘检验
一个样本总体与一个已知总体的比较
,
0
“接受”H1。
如果样本证据不足,即P>
,
则只能不拒绝H
0
,
暂且认为H
正确;
0
如果证据充分,即P ,则有理由拒绝H0,认为差异有统计学意义。
两类错误
真实结果
H0成立 H0不成立
由样本推断的结果
拒绝H0
Ⅰ型错误
不拒绝H0
推断正确(1- )
推断正确(1-) Ⅱ型错误
P值与α的区别
P值为H0成立的前提下,比样本数据得到的统 计量(t、Z、F、c2)更极端的概率。
x!
二项分布
Poisson分
二项分布与Poisson分布 的正态近似
二项分布的正态近似
(n大,不接近0、1),比如n≥5,且 n(1-≥5, 则二项分布近似服从正态分布: N(, 1-/n )
❖ Poisson分布的正态近似
相当大(比如 ≥20)时,Poisson分布近似服 从正态分布:N(, )
则拒绝H0 ,否则不拒绝。)
检验假设:
1. H0 : 0(null hypothesis,零假设或无效假设,检验假设) 2. H1 : 0(alternative hypothesis,备择假设;或 research hypothesis,研究假设)
假设检验是在H
0成立的前提下,从样本数据中寻找证据来拒绝H
正态分布、标准正态分布
正态分布 N(,2)
正态分布 N(,2/n)
Z x
Z x / n
❖ 正态分布的特点?
❖ 曲线下面积规律?
标准正态分布 N(0,1)
f(t)
ν─>∞(标准正态曲线)
ν=5
ν=1
f (t) ( 1) 2 (1 t 2 / )( 1) 2
( 2)
-5.0
-4.0
-3.0
-2.0
第1单元总复习
数据类型:
(二)三类数据间的关系
()
例:一组2040岁成年人的血压
有 <8
低血压
序 8 正常血压
区间(定量)
等 12 轻度高血压
级 15 中度高血压
名义(定性)
17 重度高血压 以12kPa为界分为正常与异常两组,统计每组例
数
统计学基本概念(注意英文单词)
总体 样本
参数:
,,
概率
100(1−)%总体置信区间: p z 2
p(1 p) n
所需条件:n ≥ 5,且 n(1− )≥ 5(假设检验);
np ≥ 5,且 n(1-p) ≥ 5(区间估计)
数据类型:名义 分类数:两个及以上分类 参数:1 1
检验统计量: c2 k (Oi Ei)2 n 1 a
E i1
i
(a 为计算理论期望频数 Ei 时所采用的参数个数) 所需条件:理论期望频数 Ei ≥ 5
变异系数
名义 率 (定性)
数据 比
速率 比率
相对比
构成比
注意事项
ຫໍສະໝຸດ Baidu
第四章 随机变量、概率和概率分布
常用的概率分布 二项分布、泊松分布、正态分布
常用的抽样分布
c2分布、t分布、F分布
1.条件:互斥、独立、不变 2.性质:X~B(n,)
X的均数: X=n 标准差:
X n (1 ) 样本率p的均数 p
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
图4-2 不同自由度下的t 分布图
χ2分布
f(χ2)
χ2
1.4 f( F)
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0
1
F 分布曲线
1 1,2 5
1 5,2 5
1 10,2 10
2F
3
4
第5章 假设检验
小概率事件(P≤α)
反证法(假定H0成立,然后根据样本 结果推论是否为小概率事件,如果是
误差 同质
统计量:
x, s, p
频率
变量
变异
统计学基本步骤
设计
资料 搜集
整理
分析
调查设计 实验设计
资料来源 质量控制
审核 合理分组
描述性统计 统计推断
应用条件?
描述性统计(第3章) 算术均数
几何均数
中位数
区间
中心趋势 (集中位置)
众数 十、百分位数
(定量) 数据
离散趋势 (变异度)
全距, 四分位数间距 方差,标准差
区间
统计描述 指标的类型?
集中位置
变异度
数据类型?
有序
名义
分类数?
二分类
两个及以上分类
t 检验与 的区间估计
c2 检验与 的区间估计
无
z 检验与 的区间估计
c2 拟合优度 检验
数据类型:区间
统计描述指标:集中位置参数
检验统计量: t x 0 n 1
sn
100(1−)%总体置信区间: x t 2,
的标准差 p (1 ) n
单位面积、体 积、空间、时间 内某事物的发生 数服从Poisson分 布
n 很大, 接近0 成功事件发生数X服从二
项分布
X~P() 性质:
1. 均数=方差
2. 可加性
P(X=k)=
(
n k
)
k
(1
)nk
X=0,1,…,n
P X x x e , X 0,1, 2,...
非第参数15统章计
极度偏离正态
数据类型:区间
统计描述指标:集中位置参数1
试验设计:完全随机设计
总体方差:
2 1
2 2
检验统计量: t (x1 x2 ) (1 2 )
sc2
1 n1
1 n2
n1 n2 2
100(1−)%总体置信区间: (x1 x2 ) t 2,
sc2
1 n1
1 n2
所需条件:总体为正态 (非正态时,采用 Wilcoxon 秩和检验)
数据类型:区间
统计描述指标:集中位置参数1
试验设计:完全随机设计
总体方差:
2 1
2 2
检验统计量: t (x1 x2 ) (1 2 )