统计在考古学中的应用-第八讲-比例
定量考古学2(统计数据的搜集、整理和显示)
• 搜集数据的方法:实验与调查
• 搜集的统计数据有两种:
– 一种是原始资料,又称为初始资料。如考古发 掘中各种资料的数据信息等。
– 另一种是次级资料或第二手资料。如直接利用 或根据考古发掘报告发表的数据等进行统计处 理。
统计调查的方案设计
• 聚落大小等级的研究 • 社会复杂化研究
数值变量
• 今天比昨天冷了;这个聚落比另一个聚落 大;等等
• 昨天和今天的温度的高低、遗址的大小是 有序变量,但如何测出冷多少,大多少可 以用仪器测出具体的数值,这个数值就是 数值变量。
如何提高数据的有效性
• 比如为研究不同时期食物储存问题,可能会测 量不同时期不同地点储存食物的陶器(如罐) 的大小、多少,并研究其与时间的关系问题, 其前提在于假设大罐子会存储更多的粮食。
• 多次重复观测的综合结果一定程度上能反映随机变 量的客观规律性,称为统计性规律。
• 即使是根据多次重复观测的结果所推论的规律或所 进行的预测,不仅是一种可能性预测,而且还可能 预测错误,包括犯弃真或纳伪两类错误。但是对预 测中犯错误的可能性,统计学中称为犯错误的概率, 也是可以估测的,而且一定程度上也是可以控制的。
– 第一,按随机原则抽取样本。 – 第二,根据部分调查的实际资料对调查对象总体的数
量特征作出估计。 – 第三,抽样误差可以事先计算并加以控制。
• B)适用范围:
– 第一,不可能或不必要进行全面调查的现象。 – 第二,对普查资料进行必要的修正。
• C)抽样调查的理论基础
– 概率论和数理统计的有关定理。
墓葬 号
1 2 3 4 5 6 7 ……
墓区
A A B B A B B ……
统计在考古学中的应用-第六讲
a. Ba sed on negative ran ks. b. Wilcoxon S igned Ranks Te st
软件使用说明
利用数据(gs.txt或gs.sav)。该数据
有一列(变量名为m),这是重复零 假设的100g使得m的长度和gsweight一 样 。 然 后 利 用 选 项 Analyze - Nonparametric Tests - Related Samples,再把变量gsweight和m同时 选入Test Pair(s) List之中,再在下面 选Wilcoxon及在Exact中选Exact;再 回到主对话框,OK即可。
Wilcoxon符号秩检验需要一点总体
分布的性质;它要求假定样本点来 自连续对称总体分布;而符号检验 不需要知道任何总体分布的性质。 在对称分布中,总体中位数和总体 均值是相等的;因此,对于总体中 位数的检验,等价于对于总体均值 的检验。
假定 x1,x2,…, xn 为来自连续对称总体。 如果零检验为中位数(均值)m = m0。 把满足 xi-m0<0的|xi-m0|的秩求和,并 用 W- 表 示 ; 同 样 把 满 足 xi-m0>0 的 |xim0|的秩求和,并用表示。如果 m0 的确 是中位数,那么,W- 和W+ 应大体差不 多。 如果W-或者W+过大或过小,则应该怀疑 中位数m = m0的零假设。 令W=min(W-,W+),则当W太小时,应 该拒绝零假设。这个W就是Wilcoxon符 号秩检验统计量。
秩(rank)
非参数检验中秩是最常使用的概
念。什么是一个数据的秩呢?一 般来说,秩就是该数据按照升幂 排列之后,每个观测值的位置。 例如我们有下面数据
060103考古学
060103考古学第一篇:060103 考古学业务培养目标:本专业培养具备考古学基础知识与基本技能,有进一步培养潜能的高层次专门人才和能在考古、文物、博物馆等事业单位及国家机关从事研究、教学、管理等实际工作的考古学高级专门人才。
业务培养要求:本专业学生主要学习考古学的基本理论、方法与技能,了解考古学的多学科交叉发展趋势和世界考古学发展概况,熟悉中国考古学的发展历史、研究现状;在中国历史、世界历史、博物馆学、文物学理论、文化人类学、民族学、古代汉语、史料学、地理学、第四纪环境学、古人类学等方面受到基本训练毕业生应获得以下几方面的知识和能力:1.掌握马克思主义的基本原理和考古学的基本理论、知识、方法与技能;2.能够从事田野考古发掘、整理及编写考古报告;3.掌握博物馆管理技能;4.掌握文献检索、资料查询的基本方法和手段;5.了解国内外考古学界最重要的理论前沿和发展动向;6.具有从事考古学及历史学研究的初步能力。
主干学科:历史学主要课程:中国通史、世界上古史、中国考古学、考古学导论、旧石器时代考古、新石器时代考古、夏商周考古、战国秦汉考古、三国两晋南北朝考古、隋唐考古、宋元考古、博物馆学概论、文物学理论、考古绘图、田野考古学概论等主要实践性教学环节:教学实习安排3~5个月。
修业年限:四年授予学位:历史学学士相近专业:历史学、博物馆学、民族学开设院校:西北大学山西大学郑州大学北京大学吉林大学南京大学厦门大学山东大学武汉大学中山大学四川大学中国科学技术大学等第二篇:中国考古学中国考古学(上-1)(旧石器时代考古)一、基本目的本课程是考古系本科生必修的专业基础课。
通过课堂讲授和教学实习,要求学生掌握旧石器时代考古的基础知识和方法,了解旧石器时代文化的内涵和特征,人类体质特征的发展和演化,能进行一般的旧石器考古田野调查工作,辨别真假石器,为进一步从事旧石器时代考古研究打下基础。
二、内容提要第一章序论和基础知识第一节序论第二节基础知识第二章旧石器时代早期第一节中国境内最早的人类化石和旧石器文化第二节北京直立人及其文化第三节其他重要的直立人类化石和遗址第四节旧石器时代早期自然环境与人类的经济生活第三章旧石器时代中期第一节概述第二节重要的人类化石和遗址第三节过渡时期的文化特征第四章旧石器时代晚期第一节概述第二节重要的人类化石和遗址第三节旧石器时代晚期之末的细石器第四节旧石器时代晚期自然环境的变化和文化的发展三、教学方式课堂授课为主,结合教学参观和实习。
统计学在文化遗产保护与传承中的应用有哪些
统计学在文化遗产保护与传承中的应用有哪些文化遗产是人类文明的瑰宝,承载着历史、艺术、科学和社会价值。
保护和传承文化遗产对于维护人类的文化多样性、促进社会的可持续发展以及增强民族认同感都具有至关重要的意义。
在这一过程中,统计学作为一门研究数据收集、整理、分析和解释的学科,发挥着不可或缺的作用。
首先,统计学在文化遗产的普查与评估中具有重要应用。
通过大规模的普查工作,可以全面了解文化遗产的数量、类型、分布等基本情况。
在普查过程中,运用统计学方法对收集到的数据进行整理和分析,能够为文化遗产的管理和保护提供科学依据。
例如,对于古建筑群的普查,可以统计其建筑数量、建筑年代、建筑风格、保存状况等信息。
通过对这些数据的分析,可以了解不同类型古建筑的分布规律,评估其保护现状和面临的风险,从而有针对性地制定保护策略。
在文化遗产的价值评估方面,统计学也能发挥关键作用。
文化遗产的价值往往是多维度的,包括历史价值、艺术价值、科学价值等。
通过建立评估指标体系,并运用统计学方法对各项指标进行量化分析,可以更客观、准确地评估文化遗产的综合价值。
例如,对于一件文物,可以从其历史年代、制作工艺、稀有程度等方面设定评估指标,并收集相关数据进行统计分析。
这样得出的评估结果能够为文物的保护级别划定、展示利用以及市场交易提供重要参考。
其次,统计学有助于对文化遗产的保护效果进行监测和评估。
随着时间的推移,文化遗产的保护措施是否有效需要进行持续的监测和评估。
统计学可以帮助建立监测指标体系,收集和分析相关数据,以判断保护措施的成效。
例如,对于一处受到风化侵蚀的石窟,在采取保护措施后,可以定期监测石窟表面的温度、湿度、风化速度等指标,并运用统计学方法对监测数据进行分析。
如果数据显示风化速度减缓,温度和湿度得到有效控制,那么可以认为保护措施取得了一定的效果;反之,如果数据没有明显改善,则需要对保护措施进行调整和改进。
此外,统计学在文化遗产的修复工作中也有应用。
文物保护研究中的统计学基础
《文物保护研究中的统计学基础》一、课程名称:文物保护研究中的统计学基础二、课程类型:方向课三、适用对象:文物保护学一年级硕士四、计划课时:36五、学分:2六、任课教师:杨璐七、课程简介:统计学是文物保护与相关研究的重要工具。
从数据采集、试验方法设计到实验数据汇总、结果的解读都离不开统计学,因此该课程是学生进入科学研究领域的基础。
课程从数据的几种常用汇总方法和图形表示方法入手,带领学生进行描述性统计分析,进而将研究方法向探索性分析引导,介绍假设检验、t分布、F 分布、方差分析、回归分析等内容。
最后介绍因子分析和聚类分析两种在行业内最常使用的多元统计分析方法。
通过课程的教学,培养学生基本的统计思想,使学生了解最常用的统计分析手段,进而引导学生将这些方法应用于实际的科学研究工作中。
八、课程的主要内容与考核:(一)课程的主要内容1.数据处理基础1.1茎叶图1.2背靠背茎叶图1.3直方图1.4多峰分布2.数据集的表征指标2.1平均值2.2中位数2.3特异值和耐抗性2.4截尾均值2.5双中心位置数据集3.数据集的离散度3.1极差3.2四分位距或中点分配3.3方差和标准差3.4截尾标准偏差4.数据集的比较4.1箱式图4.2水平位置的移除4.3离散的移除4.4标准化5.数据集的分布或外形5.1对称性5.2变换5.3校正不对称性5.4正态分布6.类别型数据6.1数据的类型6.2列和行比例6.3比例和密度6.4类别和子数据集7.样本和总体7.1抽样7.2抽样的方法7.3样本的代表性7.4不同抽样方法的偏差7.5非随机样本的使用7.6目标总体8.来自一个总体的样本8.1同一总体中样本的变异8.2特殊数据集8.3标准误差9.置信度和总体平均值9.1置信度与精确度9.2学生分布9.3特定置信水平的误差范围9.4有限总体校正10.比较两个样本的均值10.1置信度、显著性和强度10.2通过t检验进行比较10.3单样本t检验10.4零假设10.5统计的结果和解释11.比较多个样本的均值11.1使用平均值和误差范围进行比较11.2基于方差分析的比较11.3差异的强度11.4总体间的差异与变量间的关系11.5实验设计基础12.比例型样本的比较12.1比率和误差范围的比较12.2与卡方的比较12.3强度的测量12.4样本尺寸的作用12.5总体间的差异对变量间的关系13.回归分析13.1两个变量的线性关系13.2最优拟合直线13.3预测13.4相关系数13.5显著性和置信度13.6残差分析14.秩变量14.1斯皮尔曼等级相关系数14.2显著性15.主成分分析15.1相关和变量15.2提取成分15.3执行分析15.4因子旋转16.聚类分析16.1单连接聚类16.2完全连接聚类16.3平均连接聚类16.4聚类方法选择的依据16.5变量聚类(二)考核方式论文考查。
统计在考古学中的应用-第八讲 比例共39页文档
31、园日涉以成趣,门虽设而常关。 32、鼓腹无所思。朝起暮归眠。 33、倾壶绝余沥,窥灶不见烟。
34、春秋满四泽,夏云多奇峰,秋月 扬明辉 ,冬岭 秀孤松 。 35、丈夫志四海,我愿不知老。
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
25、学习是劳动,是充满思想的劳动。——乌申斯基
谢谢!
统计学在文化遗产保护中的应用有哪些
统计学在文化遗产保护中的应用有哪些文化遗产是人类历史和文明的珍贵见证,承载着丰富的文化、历史和社会价值。
在文化遗产保护的领域中,统计学正发挥着日益重要的作用。
它为保护工作提供了科学的方法和依据,有助于更有效地管理、评估和保护文化遗产资源。
首先,统计学在文化遗产普查和调查中具有关键作用。
通过大规模的普查,可以收集到关于文化遗产的数量、类型、分布等基本信息。
统计学方法能够帮助设计合理的抽样方案,确保样本具有代表性,从而以相对较少的工作量获取对整体情况的准确估计。
例如,在对某一地区的古建筑进行普查时,可以运用分层抽样的方法,按照建筑的年代、风格、用途等特征进行分层,然后从各层中抽取样本进行详细调查。
这样既能保证调查的效率,又能提高结果的准确性。
在评估文化遗产的价值和重要性方面,统计学也能提供有力的支持。
可以建立一套综合的评价指标体系,包括文化遗产的历史价值、艺术价值、科学价值、社会价值等多个方面。
然后,运用统计学中的权重分配和综合评价方法,对每一项文化遗产进行量化评估。
这有助于确定哪些文化遗产需要优先保护,以及合理分配有限的保护资源。
例如,对于一组古代文物,可以根据其稀有程度、保存状况、文化影响力等因素赋予不同的权重,通过计算得出每件文物的综合价值得分,从而为保护决策提供依据。
文化遗产的保护需要对其面临的风险和威胁进行评估。
统计学可以帮助分析自然灾害、人为破坏、环境污染等因素对文化遗产造成损害的可能性和程度。
通过对历史数据的统计分析,建立风险模型,预测未来可能发生的风险。
比如,对于容易受到洪水威胁的文化遗址,可以统计过去多年洪水发生的频率、水位高度等数据,结合遗址的地理位置和地形特点,评估其遭受洪水破坏的风险,并制定相应的防范措施。
在监测文化遗产的保存状况方面,统计学同样不可或缺。
定期对文化遗产的物理状况、化学变化等进行监测和记录,运用统计学方法分析这些数据的变化趋势。
这有助于及时发现问题,采取针对性的保护措施。
比例的意义及其在统计学中的应用
比例的意义及其在统计学中的应用比例是统计学中一种重要的测量指标,用于表示两个数量之间的关系。
比例可以帮助我们了解不同组群之间的差异和相似性,以及测量某种特征在整体中的分布情况。
在统计学中,比例经常被用来研究和分析各种数据。
意义比例在统计学中具有重要的意义。
首先,比例可以提供一个简单且直观的指标来评估两个数量之间的关系。
通过比例,我们可以了解不同组群的相对大小,并对其进行比较。
比例还能够提供数据的可比性,使得我们能够更好地理解和解释数据。
其次,比例可以帮助我们发现和分析不同组群之间的差异和相似性。
通过比较不同组群的比例,我们可以揭示和理解某种特征在不同组群中的分布情况,从而帮助我们判断数据的统计显著性和实际意义。
最后,比例还可以用于预测和推断。
通过分析和比较不同组群的比例,我们可以推断出某种特征在整体中的分布情况,并预测未来事件的可能性和趋势。
统计学中的应用比例在统计学中有广泛的应用。
下面是一些常见的应用场景:1. 调查研究:比例可以用来描述和分析调查研究中的各种数据,比如人口普查和民意调查。
比例可以帮助研究人员了解人群的特征和观点。
2. 医学研究:比例可以用于研究和分析医学数据,比如临床试验和流行病学研究。
通过比较不同组群的比例,医学研究人员可以评估治疗效果和疾病的风险因素。
3. 经济分析:比例可以用于经济数据的分析,比如就业率和通货膨胀率。
比例可以帮助经济学家评估经济状况和趋势。
4. 教育研究:比例可以用于教育研究中的数据分析,比如学生的成绩和毕业率。
比例可以帮助教育研究人员了解学生的学业水平和教育质量。
总之,比例在统计学中具有广泛的应用,可以帮助我们理解和解释各种数据。
通过比较和分析不同组群的比例,我们可以得到有关群体特征和趋势的有用信息,从而提供支持决策和推断的依据。
统计在考古学中的应用-第六讲
第六讲
PPT课件
1
两个总体平均值差的估计
PPT课件
2
来自两个总体的独立样本对其总体均值的检验
大样本 计算统计量的标准差 两个样本的个体间是否独立
H 0 :12 H 1 :12
或
H 0 :1 2 0 PP T课件 H 1 :1 2 03
钱币贬值
Emp1 384
PPT课件
16
数据gs.txt
样 本 中 位 数 为 m=98.36 。 因 此 ,
人们怀疑厂家包装的西洋参片份 量不足。由于对于这些重量的总 体分布不清楚,决定对其进行符 号检验。需要检验的是:
H 0:m 1 0 0 H 1:m 1 0 0
PPT课件
17
数据gs.txt
按照零假设,每个观测值(每包西洋
令所有个体减肥前后重量差(减肥前重量减去
减 验为肥后重量)的均值为D;这样所要进行的检
H 0: D 0 PPT课件 H两个样本中配对的观测值逐个 相减,形成一个由独立观测值组成的样本; 然后用单样本检验方法,看其均值是否为 零。
在相减之后公式和单样本均值检验无异。 当然,如果直接选用软件中成对样本均值 的检验,就不用事先逐个相减了。这里也 有单尾和双尾检验。
O bserved
ExactSig. Point
N
Prop. TestProp. (2-tailed) Probability
17
.68
.50
.108
.032
8
.32
25
1.00
PPT课件
18
数据gs.txt
SPSS输出的结果在下面表格中。从 该表格可以看出精确的双边检验的 p-值=0.108(精确地为0.1078);也 就是说,我们的单尾检验的p-值为 其一半。
统计在考古学中的应用-第四讲
已经假定它很可能来源于一个长度平均值为 3.35cm(与样本的长度平均值一样)的总体,但 并不能保证它一定来自这样一个总体。 样本可能来源于一个长度平均值大于或小于 3.35cm、甚至远远大于或小于3.35cm的总体。 可以分别考虑,样本可能取自各种不同的特殊总 体:在多大程度上会是这样的(样本来源于平均 值大于或小于3.35cm的总体)。对于每一个所能 想象到的样本母体,需要考虑到——来自这个总 体的、由任意100件矛头平均值组成的特殊总体。
样本均值抽样分布与中心极限定理
中心极限定理:设从均值为μ,方差为σ2的一个任 意总体中抽取容量为n的样本,当n充分大时,样 本均值的抽样分布近似服从均值为、方差为σ2/n的 正态分布
置信度和总体平均值
一个特殊数列的平均值与总体的平均值是 一样的;其标准差(也即标准误差)是总 体的标准差除以样品数目的平方根。在现 实生活中,我们既不知道样品所取自的总 体平均值,又不知道其标准差。
特殊数列
由所有可能的不同样本(样本大小相等)的平均 值组成
数学上也能够证明,特殊数列的标准差就是给定 总体的标准差再除以样本大小的平方根 。 标准误差就是由从给定总体中能够抽取的给定大 小的所有不同样本的平均值组成的数列的标准差。
SE
n
特殊数列
平均值的抽样分布
第一,特殊数列的平均值和样本抽取总体 的平均值一致;第二,特殊数列的标准差, 就是标准误差,即。第三,特殊数列符合 正态分布,只要样本大小超过30。
比例的意义及其在统计学中的应用
比例的意义及其在统计学中的应用比例是指两个相对量之间的大小关系。
它描述了一种相对的比较情况,通常以百分数、分数或比率表示。
在统计学中,比例有着重要的意义和广泛的应用。
首先,比例在统计学中具有重要的意义。
它可以帮助我们理解和描述事物之间的相对大小关系。
通过比较两个数量的比例,我们可以得到一个相对的了解,从而更好地分析和比较数据。
比例是一个相对的概念,它不受绝对数值的影响,因此可以更好地反映事物之间的差异和变化趋势。
比例还可以帮助我们发现规律和趋势,从而更好地预测和解释现象。
其次,比例在统计学中有着广泛的应用。
比例可以用于描述人口的结构和特征。
例如,我们可以通过比例来描述不同年龄段、性别、教育水平等人口特征的比例分布。
这样可以帮助政府和社会机构制定相应的政策和措施,满足人们的需求和改善社会生活。
比例还可以用于描述社会经济的结构和发展。
例如,我们可以通过比例来描述不同行业、不同地区的经济产出和就业比例,从而了解经济结构的差异和发展水平的差距。
这样可以帮助政府和企业制定经济发展的目标和策略,推动经济的持续增长。
另外,比例在统计学中还可以用于比较和分析不同群体、不同地区之间的差异。
通过比较比例,我们可以了解不同群体之间的差距和相似之处。
例如,我们可以比较不同性别、不同年龄段的人口的教育水平比例,了解教育公平的程度和改善的方向。
我们还可以比较不同地区的就业率、GDP增长率等指标,了解不同地区经济社会发展的差异和变化趋势。
这样可以帮助我们发现问题、解决问题,推动社会的公平和进步。
此外,比例在统计学中还可以用于估计总体和推断总体。
通过从样本中计算得到的比例,我们可以估计总体中具有其中一种特征的比例。
例如,我们可以通过抽样调查得到的就业率比例,估计全国的就业率。
这样可以帮助政府和企业了解社会就业的情况,制定相应的政策和措施。
通过比较不同样本的比例,我们还可以推断总体之间的差异和相似之处。
例如,通过比较不同地区、不同时间点的样本比例,我们可以推断经济和社会发展的差异和趋势。
定量考古学4(根据观测数据对总体平均值的估计)
如需增大估计的置信度,应怎样来 确定估计区间的范围?
• 一定置信度估计区间的一般表达为:
X
Z
s x
或X
Z
2
2
s
n
• 估计区间的中心总是在X=X 处,即Z=0处, 需要寻找的是区间边端的位置,即在给定 置信度 的条件下寻找 Z
2
• 因为估计区间以Z=0为中心并左右对称,当 选择 1- α =0.9,α =0.1 ,则需要找 Z0.05,即 对应累积正态函数(Z) 1 2 0.95 的Z值。
区间估计的置信度
• 估计区间的置信度为68.3 %可以理解成:如 果我们有100个有同样容量的样本,那么在 100个[X ±sX ]估计区间中,大致有68个区间 把总体平均值μ包含其中。
• 用置信度为68.3 %的区间去估计μ,估计不 正确的概率为:1-0.683=31.7%。一般后者 用α来表述,α也称为区间估计的显著性水 平,置信度就是1- α。α是假设检验中犯弃 真错误的概率。
本的方差 s2是总体平均值μ和总体方差σ2的最 佳估计量,即满足对总体参数估计中的无偏、 一致、有效和充分的原则。
总体与样本的关系
• 考古学中对于的总体统计推断具有一定的不确定性, 因为所依靠的样本来自于这一总体的一部分。
• 样本平均值与单次观测结果有相同的数学期望值, 都等于总体的平均值μ。
• 样本平均值的标准差比单次测量的标准差小,等于 后者的1 n ,式中n是样本的容量。
–给定样本来自具有特定参数的总体 的概率是多少?
• 这两个问题即是假设检验所要回答的。 –可以根据概率理论来进行推断。
二、大样本(n ≥30)情况下总体平均值 和标准差的区间估计
• 总体的参数估计包括点估计和区间估计。
统计在考古学中的应用-第五讲
由于一般仅仅抽取一个样本,并且用该样 本的这个估计量的实现来估计对应的参数, 人们并不知道这个估计值和要估计的参数 差多少。 因此,无偏性仅仅是非常多次重复抽样时 的一个渐近概念。 随机样本产生的样本均值、样本标准差和 Bernoulli试验的成功比例分别都是相应的 总体均值、总体标准差和总体比例的无偏 估计。
假设检验的过程和逻辑
也就是说把数据代入检验统计量,看其值是否落入零假设下 的小概率范畴; 如果的确是小概率事件,那么就有可能拒绝零假设,或者 说“该检验显著,” 否则说“没有足够证据拒绝零假设”,或者“该检验不显 著。” 也就是说把数据代入检验统计量,看其值是否落入零假设下 的小概率范畴; 如果的确是小概率事件,那么就有可能拒绝零假设,或者 说“该检验显著,” 否则说“没有足够证据拒绝零假设”,或者“该检验不显 著。”
用估计量估计总体参数
一些常见的总体参数包括总体均值(m)、 总体标准差(s)或方差(s2)和(Bernoulli 试验中)成功概率p等(总体中含有某 种特征的个体之比例)。 正态分布族中的成员被(总体)均值 和标准差完全确定; Bernoulli分布族的成员被概率(或比 例)p完全决定。 因此如果能够对这些参数进行估计, 总体分布也就估计出来了。
用估计量估计总体参数
估计的根据为总体抽取的样本。 样本的(不包含未知总体参数的)函 数称为统计量;而用于估计的统计量 称为估计量(estimator)。 由于一个统计量对于不同的样本取值 不同,所以,估计量也是随机变量, 并有其分布。 如果样本已经得到,把数据带入之后, 估计量就有了一个数值,称为该估计 量的一个实现(realization)或取值,也 称为一个估计值(estimate)。
统计在考古学中的应用-第一讲
小心潜在变量,变异无所不在
样本比较
直方图和茎叶图 位置统计量:集中趋势 尺度统计量 :分散趋势
箱图
中位数 四分位差 异常值 超异常值
异常值应该和方框边界大于一个半方框的 长度。我们可以从纯粹图解的方法来考虑。 我们可以测量如图所示箱图的框的长度。 如果方框是一英尺长,那么我们可以认为 任何一个和方框边界(或上或下)距离大 于1.5英尺的数据就是异常值。 x代表数据聚集的范围(不包括所有的异常 值)。异常值在图中都是空心点来表示, 超异常值都是用实心点表示。
s
2
x x
n 1
2
截尾方差
sT
2 n 1 sW
nT 1
将火石原料制成的刮削器视为一个样本数 列,而将燧石原料制成的刮削器视为另一 个样本数列,绘出刮削器长度的双重茎叶 图(这次忽略了刮削器出土遗址的不同)。如 何比较这两个样本数列?能否看出什么规 律,有助于解释上述所有刮削器长度组成 的茎叶图?
像这样聚集的样本是相当普遍 的,而一个或几个数值远离大 多数值聚集区域的样本也颇为 常见,这些偏离甚大的数值通 常称之为异常值,后面将对它 们作较详细的讨论。这里需强 调的是,对这些异常值,要特 别怀疑并加以验证。该样本中, 直径44.6cm的柱洞显然是不正常 的,应怀疑某人记录此测量数 据时出了差错。迅速核对田野 记录或照片,应能判断该记录 的正确与否,如属记录错误, 则立即将其纠正。如果测量确 实无误,则表明这个样本有这 样一个突出的特征,即有个柱 洞似乎完全不同于其余柱洞。
数字之间有矛盾 用可靠信息来源进行 对比 数据太好了
简单的算术问题
考古调查 区域调整比例
考古调查区域调整比例引言考古调查是研究人类过去文明的一项重要工作,它通过对地表遗址的发掘和研究,揭示出古代文明的面貌和发展历程。
在实际考古工作中,有时候我们需要对区域进行调整,以便更全面地了解古代文明。
本文档主要讨论考古调查中区域调整的比例问题,以帮助考古学家更好地进行研究和工作。
考古调查中的区域调整比例在考古调查的过程中,我们通常会选择一定范围的区域来进行发掘和研究。
然而,由于各种原因,我们有时需要对已选择的区域进行调整。
这种区域调整主要有两种情况:1.扩大区域调整比例1.扩大区域调整比例在某些情况下,我们可能发现原先选择的区域仅仅是整个文明遗址的一小部分,为了更全面地了解整个文明,我们需要进一步扩大区域。
这种情况下,我们可以将原先的考古工作范围适当扩大,以包含更多的遗址和文物。
考古学家可以通过地理信息系统(GIS)等工具来辅助确定扩大区域的比例,以确保更全面的研究成果。
2.缩小区域调整比例2.缩小区域调整比例另一种情况是我们可能发现原先选择的区域过大,导致研究难度增加或无法充分利用有限的资源。
在这种情况下,我们需要对已选区域进行适当的缩小调整。
通过缩小区域,考古学家可以提高工作效率,集中精力进行更深入的研究。
区域调整比例的选择原则在进行区域调整时,我们需要根据具体情况选择合适的比例。
以下是一些选择原则:1.研究目的1.研究目的首先,需要根据研究目的来确定调整比例。
如果我们的研究目的是为了了解整个文明的发展历程和特点,那么我们可能需要选择扩大区域的调整比例。
如果我们的研究目的是为了深入挖掘一个特定的遗址或阶段,那么我们可能需要选择缩小区域的调整比例。
2.资源和时间限制2.资源和时间限制我们的考古工作通常受到资源和时间的限制。
在选择区域调整比例时,需要评估我们可用的资源和所需的时间。
如果我们的资源有限,或者时间紧迫,那么我们可能需要选择缩小区域的调整比例,以确保我们能够充分利用现有资源和时间来取得最大的研究效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
城市中分别随机地调查了 1000 个 成 年 人 , 其 中 看 过 广 告 的 比 例 分 别 为 p^1=0.18 和 p^2=0.14 。 试 求 两 城 市 成 年 人 中看过广告的比例之差的95% 的置信区间。
绿色 健康饮品
PPT课件
11
两个总体比例之差的估计
(计算结果)
组别
阳性数
阴性数
合计
阳性率(%)
铅中毒病人
29
7
36
80.56
对照组
9
28
37
24.32
合计
38
35
73
52.05
PPT课件
20
(1) 建立检验假设和确定检验水准 H0:两种方法总体阳性率相同,即π1=π2 H1:两种方法总体阳性率不相同,即π1≠π2
准 α=0.05 (2) 计算检验统计量
c2 Ai Ti 2 Ti
PPT课件
22
理 论 频 数 T11=36*38/73=18.74 T21=19.26 T22=17.74
χ2=23.12 自由度f=(R-1)(C-1)=1
T12=17.26
(3) 确定p值 自由度f=(R-1)(C-1)=1 查χ2界值表得 P<0.005 (4) 推断
按α=0.05拒绝H0,认为两种方法总体阳性率不相同。
n 3. 总体比例P 的置信区间为
pˆ Z 2
pˆ(1 pˆ) n
PPT课件
3
置信度
x
/2
1-
/2
X
x
(1 - ) % 区间包含了
% 的区间未包含
PPT课件
4
总体比例的置信区间
(实例)
东下冯墓地
男性11,女性6,11/6=1.83 随机涨落vs.异常? 0.166
元君庙
男性85,女性61,85/61=1.37 偏离
PPT课件
5
可靠性 样本容量
不能根据观测值进行直接推断,必须统计 推断
PPT课件
6
估计总体比例时样本容量的确定
1. 根据比例区间估计公式可得样本容量n为
n Z2 2p(1 p)
2
其中:Z 2
p(1p) n
2. 若总体比例P未知时,可用样本比例 p^ 来代替
PPT课件
7
估计总体均值时样本容量的确定
二. ①n≥40,且T≥5时,用未校正的χ2值 ②1≤T<5,且n≥40时,宜用校正χ2值或用精确概率计算法
PPT课件
23
二. 专用公式法
以上计算χ2统计量的公式对任意行×列表都适合,而 对于四格表资料,可以用其简化公式
χ2=
(adb)c2n
abcdacbd
例1(续)
c2(2 92 879 )27 32.1 32 3 63 73 8 35
PPT课件
24
三. 四格表χ2值的校正
一. 由于χ2界值表是由连续分布:χ2分布计算出来的,但 原始 数据属计数资料是离散的,由此计算出来的χ2值 也是离散的,特 别是四格表,有时若不校正,所求χ2 值偏大,所得概率p值偏低。
1. 根据均值区间估计公式可得样本容量n为
n
Z
2
2
2
2
其中: Z 2
n
2. 样本容量n与总体方差2、允许误差、可 靠性系数Z之间的关系为
▪ 与总体方差成正比
▪ 与允许误差成反比
▪ 与可靠性系数成正比
PPT课件
8
置信度、精密度和样本容量
相对误差 RSD 精密度、准确度
PPT课件
9
两个总体比例之差的区间估 计
PPT课件
17
四格表资料的χ2检验
在医学资料中,常常需要比较两个样本率之间的 差异有无显著性,如推断某人群男与女的某种 疾病的患病率是否相等,即该病是否与性别有 关。这类资料由4个数据构成:男与女的患病
人数和未患病人数,统计学称这类资料为四格 表资料。
PPT课件
18
下面介绍四格表资料的χ2检验的几种计算
1. 假定条件
▪ 两个总体是独立的 ▪ 两个总体服从二项分布 ▪ 可以用正态分布来近似
2. 两个总体比例之差P1-P2在1-置信水平 下的置信区间为
p ˆ1p ˆ2Z2
p1(1p1)p2(1p2)
n1
n2
PPT课件
10
两个总体比例之差的估计
(实例)
【例】某饮料公司对其所做
的报纸广告在两个城市的效
统计学在考古中的应用
第八讲
PPT课件
1
性别比例 玉器种类比例 是否有随葬品 二元变量 二项式分布
N>30, 接近正态分布
PPT课件
2
总体比例的置信区间
1. 假定条件
两类结果 总体服从二项分布 可以由正态分布来近似
2. 使用正态分布统计量Z Z pˆ p ~ N(0,1) p(1 p)
一. 二. 三.
四. 五.
通用公式法 专用公式法 四格表χ2值的校正公式 精确概率法 配对四格表资料的χ2检验
PPT课件
19
一. 通用公式法
例1 为了解铅中毒病人是否有尿棕色素增加现 象,分别对病人组和对照组的尿液作尿棕色素定 性检查,结果如下,问铅中毒病人和对照人群的 尿棕色素阳性率有无差别?
两组人群尿棕色素阳性率比较
χ2检验
介绍了计数资料的U检验,用以推断两个率是否 相等。 χ2检验用以检验多个率(或构成比)之间差异是 否具有显著性,当然也适合于两组比较。
不同容量样本的抽样分布
n=1 n=4 n=10
n=20
PPT课件
c2
16
χ2检验的用途:
推动两个总体构成比是否有差别 推断几组总体构成比之间有无差别 两个变量之间有无关联性 频数分布的拟合优度检验
解:已知 p^ 1=0.18, p^ 2=0.14,1-=0.95, n1= n2=1000
P1- P2置信度为95%的置信区间为
0.1 80.141.960.1(8 10.1)80.1(4 10.1)4
1000 1000
0.00,70.0 9721
我们有95%的把握估计两城市成年人中看过该广 告的比例之差在0.79% ~ 7.21%之间
检验水
PPT课件
21
组别
阳性
阴性
合计
阳性率(%)
铅中毒病人
29
7
36
80.56
对照组
9
28
37
24.32
合计
38
35
73
52.05
理论频数是在H0成立的条件下每个格子理论上 的数据。
若H0成立,则合计的消除率为38/73=52.05%, 则铅中毒病人理论上应有36*38/73=18.74人 呈阳性。
PPT课件
12
比例数一致性的假设检验
墓地甲:100
60
墓地乙:50
35
混合样本:
PPT课件
13
赤峰案例 子弹图
PPT课件
14
某类实体的缺失能否说明某类实体 不存在
样本没有时,推断总体中比例小于1% 总体比例小于1%时,样本没有 P=0.01 N=1,10,100
PPT课件
15