统计在考古学中的应用-第八讲-比例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 根据均值区间估计公式可得样本容量n为
n
Z
2
2
2
2
其中: Z 2
n
2. 样本容量n与总体方差2、允许误差、可 靠性系数Z之间的关系为
▪ 与总体方差成正比
▪ 与允许误差成反比
▪ 与可靠性系数成正比
PPT课件
8
置信度、精密度和样本容量
相对误差 RSD 精密度、准确度
PPT课件
9
两个总体比例之差的区间估 计
检验水
PPT课件
21
组别
阳性
阴性
合计
阳性率(%)
铅中毒病人
29
7
36
80.56
对照组
9
28
37
24.32
合计
38
35
73
52.05
理论频数是在H0成立的条件下每个格子理论上 的数据。
若H0成立,则合计的消除率为38/73=52.05%, 则铅中毒病人理论上应有36*38/73=18.74人 呈阳性。
PPT课件
12
比例数一致性的假设检验
墓地甲:100
60
墓地乙:50
35
混合样本:
PPT课件
13
赤峰案例 子弹图
PPT课件
14
某类实体的缺失能否说明某类实体 不存在
样本没有时,推断总体中比例小于1% 总体比例小于1%时,样本没有 P=0.01 N=1,10,100
PPT课件
15
PPT课件
22
理 论 频 数 T11=36*38/73=18.74 T21=19.26 T22=17.74
χ2=23.12 自由度f=(R-1)(C-1)=1
T12=17.26
(3) 确定p值 自由度f=(R-1)(C-1)=1 查χ2界值表得 P<0.005 (4) 推断
按α=0.05拒绝H0,认为两种方法总体阳性率不相同。
一. 二. 三.
四. 五.
通用公式法 专用公式法 四格表χ2值的校正公式 精确概率法 配对四格表资料的χ2检验
PPT课件
19
一. 通用公式法
例1 为了解铅中毒病人是否有尿棕色素增加现 象,分别对病人组和对照组的尿液作尿棕色素定 性检查,结果如下,问铅中毒病人和对照人群的 尿棕色素阳性率有无差别?
两组人群尿棕色素阳性率比较
二. ①n≥40,且T≥5时,用未校正的χ2值 ②1≤T<5,且n≥40时,宜用校正χ2值或用精确概率计算法
χ2检验
介绍了计数资料的U检验,用以推断两个率是否 相等。 χ2检验用以检验多个率(或构成比)之间差异是 否具有显著性,当然也适合于两组比较。
不同容量样本的抽样分布
n=1 n=4 n=10
n=20
PPT课件
c2
16
χ2检验的用途:
推动两个总体构成比是否有差别 推断几组总体构成比之间有无差别 两个变量之间有无关联性 频数分布的拟合优度检验
果进行了比较,它们从两个
城市中分别随机地调查了 1000 个 成 年 人 , 其 中 看 过 广 告 的 比 例 分 别 为 p^1=0.18 和 p^2=0.14 。 试 求 两 城 市 成 年 人 中看过广告的比例之差的95% 的置信区间。
绿色 健康饮品
PPT课件
11
两个总体比例之差的估计
(计算结果)
PPT课件
17
四格表资料的χ2检验
在医学资料中,常常需要比较两个样本率之间的 差异有无显著性,如推断某人群男与女的某种 疾病的患病率是否相等,即该病是否与性别有 关。这类资料由4个数据构成:男与女的患病
人数和未患病人数,统计学称这类资料为四格 表资料。
PPT课件
18
下面介绍四格表资料的χ2检验的几种计算
n 3. 总体比例P 的置信区间为
pˆ Z 2
pˆ(1 pˆ) n
PPT课件
3
置信度
x
/2
1-
/2
X
x
(1 - ) % 区间包含了
% 的区间未包含
PPT课件
4
总体比例的置信区间
(实例)
东下冯墓地
男性11,女性6,11/6=1.83 随机涨落vs.异常? 0.166
元君庙
男性85,女性61,85/61=1.37 偏离
1. 假定条件
▪ 两个总体是独立的 ▪ 两个总体服从二项分布 ▪ 可以用正态分布来近似
2. 两个总体比例之差P1-P2在1-置信水平 下的置信区间为
p ˆ1p ˆ2Z2
p1(1p1)p2(1p2)
n1
n2
PPT课件
10
两个总体比例之差的估计
(实例)
【例】某饮料公司对其所做
的报纸广告在两个城市的效
PPT课件
5
可靠性 样本容量
不能根据观测值进行直接推断,必须统计 推断
PPT课件
6
估计总体比例时样本容量的确定
1. 根据比例区间估计公式可得样本容量n为
n Z2 2p(1 p)
2
其中:Z 2
p(1p) n
2. 若总体比例P未知时,可用样本比例 p^ 来代替
PPT课件
7
估计总体均值时样本容量的确定
PPT课件
23
二. 专用公式法
以上计算χ2统计量的公式对任意行×列表都适合,而 对于四格表资料,可以用其简化公式
χ2=
(adb)c2n
abcdacbd
例1(续)
c2(2 92 879 )27 32.1 32 3 63 73 8 35
PPT课件
24
三. 四格表χ2值的校正
一. 由于χ2界值表是由连续分布:χ2分布计算出来的,但 原始 数据属计数资料是离散的,由此计算出来的χ2值 也是离散的,特 别是四格表,有时若不校正,所求χ2 值偏大,所得概率p值偏低。
统计学在考古中的应用
第八讲
PPT课件
1
性别比例 玉器种类比例 是否有随葬品 二元变量 二项式分布
N>30, 接近正态分布
PPT课件
2
总体比例的置信区间
1. 假定条件
两类结果 总体服从二项分布 可以由正态分布来近似
2. 使用正态分布统计量Z Z pˆ p ~ N(0,1) p(1 p)
解:已知 p^ 1=0.18, p^ 2=0.14,1-=0.95, n1= n2=1000
P1- P2置信度为95%的置信区间为
0.1 80.141.960.1(8 10.1)80.1(4 10.1)4
1000 1000
0.00,70.0 9721
我们有95%的把握估计两城市成年人中看过该广 告的比例之差在0.79% ~ 7.21%之间
组别
阳性数
阴性数
合计
阳性率(%)
铅中毒病人
29
7
36
80.56
对照组
9
28
37
Leabharlann Baidu24.32
合计
38
35
73
52.05
PPT课件
20
(1) 建立检验假设和确定检验水准 H0:两种方法总体阳性率相同,即π1=π2 H1:两种方法总体阳性率不相同,即π1≠π2
准 α=0.05 (2) 计算检验统计量
c2 Ai Ti 2 Ti