统计在考古学中的应用-第一讲
统计在考古学中的应用-第一讲
第一讲
统计学
以归纳为主要思维方式的统计不是以演绎 为主的数学
统计可应用于各个不同学科,在有些学科 已经有其特有的方法和特点;如生物统计 (biostatistics)、经济计量学(econometrics)以及 目前很热门的生物信息(bioinformation)和数 据挖掘(Data Mining)的方法主体都是统计。
数据类型
名称变量
形态:平底、尖底、圜底 纹饰:绳纹、蓖麻纹 性别
有序变量
年龄 分期 地层次序
数值变量
数量 百分比 重量 成分
考古器物的定量描述
陶豆
• • • • • • 通高 口径/通高 柄高/通高 盘深/通高 最大直径/最小直径 纹饰:有无
数字合理性检查
描述性统计
总体——参数 样本——统计量
样品中心的统计量(集中趋势)
平均值:x分别为样本的各个数 值;n为样本数值的个数 1号坑石片重量的平均值是 12.33g (12块石片重量的总和, 除以石片的总数12),而2号坑石 片重量的平均值是11.42g (13块 石片重量的总和,除以石片的 总数13)。 中位数:若样本的个数是奇数, 则中位数即为样本的中间数值, 而若样本的个数是偶数,则为 中间两个数值的平均值。
高三男生身高
170
160
150
140
N= 163 175
地区1
地区2
地区
数列中心的标准化
离散程度的标准化
Z得分
平均值 标准方差
Z (X X ) / s
数列的形状或分布
数据统计图在历史教学中的应用
试论历史数据统计图在教学中的应用冯磊(亳州一中南校,电子信箱:fenglei19860222@)摘要:历史数据统计图不仅有助于师生对教材相关论述文字内容的精确理解,而且还可以代替文字或补助文字内容,使历史知识更加精细的展示出来。
在现实的高中历史教学中,历史数据统计图的应用虽然在增加,但还存在诸多问题。
随着近几年历史数据统计图在安徽省高考历史卷中频繁出现,该类试题在高中历史课堂教学中的应用引起越来越多的历史教师的重视。
关键词:历史数据统计图历史教学史料马克思说:“一种科学只有成功运用数学时,才能达到了真正完善的地步。
”近半个世纪以来,运用自然科学中的数学方法对历史资料进行定量分析的计量史逐渐兴起。
这种研究方法在历史教学中的具体表现就是数据统计图的广泛运用。
所谓历史数据统计图,就是为了实际需要,把经过调查统计得来的原始历史数据资料进行分类、整理、归纳,从而绘制的能够说明社会历史现象及其发展过程规律的各种数学图形,包括数据统计表、条形图、扇形图、折线图、网状图、茎叶统计图、直方图、统计地图等形式。
它具有新颖直观、内涵丰富、信息含量大、形象理解与抽象思维巧妙结合等特点。
从功能上看,历史数据统计图既是一则具有充分说服力的史料,也是一种研究过程,更是一种研究方法,它能够达到充分调动学生“获取与解读信息”、“调动和运用知识”的目标。
这既吻合新课改理念中对学生学习目标“过程与方法”的要求,也符合中学历史课程标准对学生学科能力提出的“在掌握基本历史知识的过程中,进一步提高阅读和通过多种途径获取历史信息的能力;通过对历史事实的分析、综合、比较、归纳、概括等认知活动,培养历史思维和解决问题的能力”的要求。
正是基于此,历史数据统计图才正在与历史教学日益紧密地结合在一起,广泛地运用到历史教学的各个环节,尤其是在历史教学评价体系。
这从高考历史试卷的命题中就可管窥一斑。
近些年来,无论是全国卷,还是各地地方卷,都逐渐加强了对历史数据统计图的考察力度。
统计图表在高中历史教学中的运用
景、意义和目的,以及如何与教材内容联系。
有效使用统计图表辅助高中历史课堂教学
01
利用统计图表激发学生的学习兴趣
通过生动、形象的统计图表,吸引学生的注意力,激发学生的学习兴
趣和热情。
02
利用统计图表帮助学生理解历史事件
通过统计图表中的数据和信息,帮助学生更好地理解历史事件的发展
和演变。
03
利用统计图表培养学生的分析能力
意义
通过运用统计图表,教师可以更加直观、形象地呈现 历史数据和信息,帮助学生更好地理解历史事件和现 象之间的联系和变化。此外,统计图表还可以培养学 生的观察力、思维能力和创新能力,提高学生的历史 学科素养和综合素质。因此,本研究具有重要的实践 意义和理论价值。
研究目的与方法
目的
本研究旨在探讨统计图表在高中历史教学中的运用情况 ,分析其应用效果和存在的问题,并提出相应的对策和 建议,以期为历史教师提供一种新的教学思路和方法, 提高历史教学质量和学生的学习效果。
确保统计图表与教学内容紧密相关
01
选择与课程内容紧密相关的统计图表,避免无关或重复的内容
,确保图表与教材内容的一致性和连贯性。
合理安排统计图表的位置和顺序
02
在教材中合理安排统计图表的位置和顺序,以便学生在学习过
程中能够更好地理解和应用图表。
提供必要的解释和说明
03
对于每个统计图表,应提供必要的解释和说明,包括图表的背
引导学生分析统计图表中的数据和信息,培养学生的分析、比较和判
断能力。
建立完善的统计图表教学评价体系
制定明确的评价标准
制定明确的评价标准,包括统计图表的质量、与教材内容的关联 度、学生的使用情况等。
考古学十八讲题目总结
第一讲考古学概述本讲以名词解释为主。
参见名词解释部分。
第二讲考古学的基本理论方法1,考古地层学的原理?考古地层学是建立在对文化层研究的基础上的。
所谓文化层是指人类在某个区域内生活、居住的过程中,往往会在原来的自然沉积或堆积上面堆积起一层熟土,这层熟土中往往包换有人类有意丢弃或无意遗留的器物或垃圾。
这种包含有人类文化遗存的熟土层就称为文化层。
文化层主要是人力作用形成的,在形成过程中受到人力和自然力的影响。
一般来说,居住于同一地点的人类活动形成的文化层的堆积顺序是按照时间早晚自下而上一次排列的,即年代早的在下,年代晚的在上。
下部文化层中包含的遗迹、遗物的年代应该早于上不文化层中包含的遗迹、遗物。
考古地层学正是依据这一基本原理来判定古文化遗迹中不同时期堆积层次的先后顺序,进而确定包含于其中的各种遗迹、遗物的地层关系和相对年代。
由于不同时期人类活动的内容,生存的环境等有所不同,故不同时期的文化堆积在土色和包含物等就会产生差异。
由于人类文化总是不断发展变化的,不同时期人类文化遗存的内涵和形态会有所差异。
故考古地层学就是主要依据土色的变化并参考包含物的变化及遗迹现行将不同时期的人类文化堆积层级划分开来,并确定他们之间在时间上的先后顺序。
2,考古地层学的目的和作用?考古地层学的目的就是依据文化层土色的变化,参考包含物的变化及遗迹现象来区分不同时期文化堆积的层次,判定遗址中各个时期文化堆积的先后顺序,进而判定包含于文化堆积中的遗迹、遗物的相对年代关系。
考古地层学的重要作用主要体现在三点:①,它使田野考古能够获得有层位关系的资料,为相对年代研究提供了依据。
②,使田野考古能获得有共存关系的资料,为确定遗迹、遗物组合关系提供了必要的前提。
③,使发掘能逐次揭露出遗迹的面貌。
发掘只有按照诸堆积形成的逆层次进行,才能够使遗迹自然显露出来,否则必然会使遗迹面貌遭受破坏。
3,考古地层学的局限性?①,考古底层学判定的是遗迹、遗物埋藏的先后顺序,而非制造和使用的先后顺序。
多元统计分析方法在古陶瓷鉴定中的应用
【学术研究】Academic rescerch046Vol.153李越 龚铭(北京林业大学,北京…100083)摘 要:陶瓷在世界文化发展史中有十分重要的地位,是艺术和科学的结晶。
众所周知,中国陶瓷的发展具有悠长的历史,是中华民族原始文化的代表。
对出土陶瓷的断源、断代是当前考古工作中的重要组成部分。
随着科学技术与考古研究的相互结合,陶瓷鉴赏的技术分析逐渐形成热潮。
当前,国内古陶瓷研究工作主要集中在其成分和元素含量的测定。
文章采用适当的多元统计方法,对古陶瓷化学成分测定数据进行分析,并据此初步判断陶瓷的产地、文化和窑系。
关键词:陶瓷;考古;断源断代;多元统计1 背景作为世界四大文明古国之一,也是世界上最早烧制和使用陶器的国家之一,中国有着丰富的陶瓷文化。
古陶瓷不仅具有实用价值,而且从造型、纹饰、釉色等方面形成了特别的艺术风格,反映了社会环境、民俗民风等时代风貌,是人们研究历史的重要依据,与典籍等资料具有同等重要的价值。
中国陶瓷的发展大致可概括如下:新石器时代早期出现了最早的陶器,商周时期釉陶、印文硬陶和原始瓷烧制成功,汉、晋时期人们发明了青釉瓷,隋唐时期以白釉瓷的出现为突破,宋、元、明、清时期制瓷技术发展成熟。
其中颜色釉瓷、彩绘瓷和雕塑陶瓷是中国科学技术史上的辉煌成就。
陶器,是指用黏土或陶土经捏制成形后烧制而成的器具。
冯先铭先生在《中国陶瓷史》中指出:“特别是随着农业经济和定居生活的发展,谷物的储藏和饮水的搬运,都需要这种新兴的容器——陶器,于是就大量出现,成为新石器时代的突出特征,在人类生活史上开辟了新的纪元。
”[1]陶器在中国考古学研究中占有重要地位,因为它不仅仅是黏土、火及容器的融合,更代表了人类知识和经验两个独立领域的一次复杂交融[2]。
瓷器是由瓷石、高岭土、石英石、莫来石等烧制而成,外表施有玻璃质釉或彩绘。
中国是瓷器的故乡,瓷器是汉族劳动人民的一个重要的创造。
谢肇制在《五杂俎》记载:“今俗语窑器谓之磁器者,盖磁州窑最多,故相延名之,如银称米提,墨称腴糜之类也。
考古学通论常见疑难问题解答
《考古学通论》课程常见问题答疑《考古学通论I》1.考古学的性质和特点是什么?答:从学科总体目标来讲,考古学属于社会科学或人文科学。
但从研究理论、方法来说,则基本属于自然科学范畴。
因此考古学具有边缘科学或交叉科学的性质。
考古学的特点是由它所研究的资料和目标所决定的。
考古学研究的资料是实物遗存,是古代社会遗留下来的残缺不全的、局部的、极少量的遗存,大部分可能已经消失,又大部分被掩埋在地下,存在一个如何寻找和获取的问题。
获取的资料又要根据其自身特点进行研究,以将无序变为有序。
随着自然科学技术的发展,将会有无限多的信息从实物中提取常来,但从大的目标和性质上来讲,它还是属于历史科学。
2.考古学与狭义历史学有怎样的关系?答:考古学和狭义历史学(以文献资料为主研究人类历史)同属历史科学,是历史学科发展到一定阶段的产物,是历史学科的高级阶段。
Childe说,考古学引起了历史科学的变动,扩大了历史科学的空间范围,像用望远镜扩大了空间视野一样,它把历史视野向古代延伸了成百上千倍;像显微镜为生物学揭示了巨大生物躯体内的微小的细胞,又如放射性研究给化学带来的变化一样,改变了历史科学的内容。
史前考古学补充了文献记载所无的绝大部分内容;历史考古可改正文献记载的错误,又大大增加了历史学的内容。
3.考古资料应当怎样进行分类?答:考古资料的文化遗存区别于自然遗存。
经过人工制造、建造或被使用,有着人类活动印记的,都可称为文化遗存(文化是人类特有的)。
反之,未经人类活动参与,与人类本身活动无关的都可称为自然遗存。
考古学研究的对象是文化遗存,但人是生存在自然环境中的,随着自然科学技术的应用,许多自然遗存也成了考古学研究的一部分。
文化遗存通常以遗址的形式存在。
遗址有多种多样:村落、洞穴、矿冶、军事、桥梁、关卡、栈道等交通遗址、宗教遗址。
广义的遗址还可包括墓地,狭义则泛指非墓地的遗址。
遗址中一般包括遗迹、遗物和遗痕。
遗迹指遗址中不可搬动的遗存,有时与土连在一起,如宫殿、住宅、寺庙、作坊、都市、城堡、坟墓、灰坑、窖穴等。
统计在考古学中的应用-第六讲
第六讲
PPT课件
1
两个总体平均值差的估计
PPT课件
2
来自两个总体的独立样本对其总体均值的检验
大样本 计算统计量的标准差 两个样本的个体间是否独立
H 0 :12 H 1 :12
或
H 0 :1 2 0 PP T课件 H 1 :1 2 03
钱币贬值
Emp1 384
PPT课件
16
数据gs.txt
样 本 中 位 数 为 m=98.36 。 因 此 ,
人们怀疑厂家包装的西洋参片份 量不足。由于对于这些重量的总 体分布不清楚,决定对其进行符 号检验。需要检验的是:
H 0:m 1 0 0 H 1:m 1 0 0
PPT课件
17
数据gs.txt
按照零假设,每个观测值(每包西洋
令所有个体减肥前后重量差(减肥前重量减去
减 验为肥后重量)的均值为D;这样所要进行的检
H 0: D 0 PPT课件 H两个样本中配对的观测值逐个 相减,形成一个由独立观测值组成的样本; 然后用单样本检验方法,看其均值是否为 零。
在相减之后公式和单样本均值检验无异。 当然,如果直接选用软件中成对样本均值 的检验,就不用事先逐个相减了。这里也 有单尾和双尾检验。
O bserved
ExactSig. Point
N
Prop. TestProp. (2-tailed) Probability
17
.68
.50
.108
.032
8
.32
25
1.00
PPT课件
18
数据gs.txt
SPSS输出的结果在下面表格中。从 该表格可以看出精确的双边检验的 p-值=0.108(精确地为0.1078);也 就是说,我们的单尾检验的p-值为 其一半。
定量考古学4(根据观测数据对总体平均值的估计)
如需增大估计的置信度,应怎样来 确定估计区间的范围?
• 一定置信度估计区间的一般表达为:
X
Z
s x
或X
Z
2
2
s
n
• 估计区间的中心总是在X=X 处,即Z=0处, 需要寻找的是区间边端的位置,即在给定 置信度 的条件下寻找 Z
2
• 因为估计区间以Z=0为中心并左右对称,当 选择 1- α =0.9,α =0.1 ,则需要找 Z0.05,即 对应累积正态函数(Z) 1 2 0.95 的Z值。
区间估计的置信度
• 估计区间的置信度为68.3 %可以理解成:如 果我们有100个有同样容量的样本,那么在 100个[X ±sX ]估计区间中,大致有68个区间 把总体平均值μ包含其中。
• 用置信度为68.3 %的区间去估计μ,估计不 正确的概率为:1-0.683=31.7%。一般后者 用α来表述,α也称为区间估计的显著性水 平,置信度就是1- α。α是假设检验中犯弃 真错误的概率。
本的方差 s2是总体平均值μ和总体方差σ2的最 佳估计量,即满足对总体参数估计中的无偏、 一致、有效和充分的原则。
总体与样本的关系
• 考古学中对于的总体统计推断具有一定的不确定性, 因为所依靠的样本来自于这一总体的一部分。
• 样本平均值与单次观测结果有相同的数学期望值, 都等于总体的平均值μ。
• 样本平均值的标准差比单次测量的标准差小,等于 后者的1 n ,式中n是样本的容量。
–给定样本来自具有特定参数的总体 的概率是多少?
• 这两个问题即是假设检验所要回答的。 –可以根据概率理论来进行推断。
二、大样本(n ≥30)情况下总体平均值 和标准差的区间估计
• 总体的参数估计包括点估计和区间估计。
统计在考古学中的应用-第五讲
由于一般仅仅抽取一个样本,并且用该样 本的这个估计量的实现来估计对应的参数, 人们并不知道这个估计值和要估计的参数 差多少。 因此,无偏性仅仅是非常多次重复抽样时 的一个渐近概念。 随机样本产生的样本均值、样本标准差和 Bernoulli试验的成功比例分别都是相应的 总体均值、总体标准差和总体比例的无偏 估计。
假设检验的过程和逻辑
也就是说把数据代入检验统计量,看其值是否落入零假设下 的小概率范畴; 如果的确是小概率事件,那么就有可能拒绝零假设,或者 说“该检验显著,” 否则说“没有足够证据拒绝零假设”,或者“该检验不显 著。” 也就是说把数据代入检验统计量,看其值是否落入零假设下 的小概率范畴; 如果的确是小概率事件,那么就有可能拒绝零假设,或者 说“该检验显著,” 否则说“没有足够证据拒绝零假设”,或者“该检验不显 著。”
用估计量估计总体参数
一些常见的总体参数包括总体均值(m)、 总体标准差(s)或方差(s2)和(Bernoulli 试验中)成功概率p等(总体中含有某 种特征的个体之比例)。 正态分布族中的成员被(总体)均值 和标准差完全确定; Bernoulli分布族的成员被概率(或比 例)p完全决定。 因此如果能够对这些参数进行估计, 总体分布也就估计出来了。
用估计量估计总体参数
估计的根据为总体抽取的样本。 样本的(不包含未知总体参数的)函 数称为统计量;而用于估计的统计量 称为估计量(estimator)。 由于一个统计量对于不同的样本取值 不同,所以,估计量也是随机变量, 并有其分布。 如果样本已经得到,把数据带入之后, 估计量就有了一个数值,称为该估计 量的一个实现(realization)或取值,也 称为一个估计值(estimate)。
中国考古学十八讲
目录分析
本书目录还反映了中国考古学的研究重点和最新进展。例如,“中国近代考古学的兴起”和“现 代考古学的发展”两章,详细介绍了中国近代和现代考古学的发展历程和重要发现,反映了中国 考古学不断更新和发展的状态。本书目录也包含了中国考古学的理论和方法,例如考古地层学、 考古类型学和文化因素分析法等,这些都是理解中国考古学的重要工具。 《中国考古学十八讲》这本书的目录既全面又系统地介绍了中国考古学的各个方面,反映了中国 考古学的最新进展和研究重点。通过阅读这本书的目录,读者可以对中国考古学有一个全面而深 入的了解。
作者简介
作者简介
这是《中国考古学十八讲》的读书笔记,暂无该书作者的介绍。
谢谢观看
阅读感受
阅读感受
《中国考古学十八讲》是一本以讲座形式编写的入门级中国考古学教材。这本书通过系统地介绍 考古学的基本概念、方法和现状,以及对中国考古学的历史和分期,田野考古调查和发掘,考古 学研究等方面的基础知识,旨在帮助读者全面了解中国考古学的研究内容和研究方法。 在阅读这本书的过程中,我深深地感受到了中国考古学的博大精深。通过对各个时期的文化、社 会、经济等方面的研究,考古学为我们提供了宝贵的历史资料和文化遗产,揭示了人类历史的发 展脉络和文化多样性。 在书中,作者们通过对考古学的各个方面的系统讲解,使我对中国考古学有了更加全面深入的认 识。通过丰富的案例和实践经验,作者们详细介绍了考古学的基本概念、方法和现状,以及田野 考古调查和发掘的流程和技巧。同时,作者们还通过对不同时期的文化、社会、经济等方面的研 究,深入探讨了考古学对于人类历史发展的作用和意义。
中国考古学十八讲
读书笔记
01 思维导图
03 精彩摘录 05 目录分析
目录
02 内容摘要 04 阅读感受 06 作者简介
使用历史项目的统计数据作为资料
【使用历史项目的统计数据作为资料】一、引言历史项目的统计数据是一种极具价值的资料形式,它能够帮助我们更好地理解历史事件、趋势和发展。
在当今信息爆炸的时代,历史项目的统计数据在学术研究、政策制定和商业决策等领域扮演着重要角色。
本文将围绕着使用历史项目的统计数据作为资料展开讨论,深入探讨其在不同领域中的应用和意义。
二、历史项目的统计数据在学术研究中的应用1.1 提供可靠的证据历史项目的统计数据能够为学术研究提供可靠的证据,帮助学者们支撑其研究观点和结论。
在历史学研究中,通过分析历史项目的统计数据,可以更准确地了解某一时期的社会经济状况、人口分布等信息,从而为历史事件的解读和分析提供客观依据。
1.2 深入解读历史事件历史项目的统计数据还能够帮助学者们更深入地解读历史事件。
通过对数据的分析和比对,可以发现事件背后的规律和趋势,帮助人们更全面、客观地理解历史进程中的重要事件和变迁,从而丰富学术研究的深度和广度。
1.3 数据验证与重建历史历史项目的统计数据还可以用于验证历史事件的真实性,以及重建历史过程中的一些遗漏或模糊的部分。
通过对数据的梳理和分析,可以发现一些历史事件的新线索或解释,促进对历史事件的更加全面和客观的理解与认识。
三、历史项目的统计数据在政策制定中的应用2.1 决策支撑历史项目的统计数据在政策制定中具有重要的决策支撑作用。
政府部门可以通过分析历史项目的统计数据,了解社会经济发展的整体趋势和人民生活的实际状况,从而制定出更加科学合理的政策措施,推动社会的协调发展。
2.2 风险评估历史项目的统计数据还可以帮助政府部门进行风险评估和应急预案的制定。
通过对历史事件和数据的分析,政府部门可以更好地把握一些经济、社会和自然风险的发生规律和可能性,有的放矢地制定出更有效的风险应对措施。
2.3 综合评价政府部门也可以借助历史项目的统计数据进行综合评价和比对,对政策的实施和效果进行评估。
通过对历史数据的分析,可以帮助政府及时了解政策的实施效果,为未来政策的调整和优化提供借鉴和参考。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
210
200
158 96 5
190
248 250 259 323
180
盒子的中间横线是数据的中位数(median),封闭盒子的上下两横线 (边)为上下四分位数(点);按照SPSS的默认选项,如果所有 样本中的数目都在离四分位点1.5倍盒子长度之内,则线的端点为 最大和最小值,否则线长就是1.5倍的盒子长度(盒子长度称为四 分位间距),在其外面的度量单独点出
统计学在考古中的应用
第一讲
统计学
以归纳为主要思维方式的统计不是以演绎 为主的数学
统计可应用于各个不同学科,在有些学科 已经有其特有的方法和特点;如生物统计 (biostatistics)、经济计量学(econometrics)以及 目前很热门的生物信息(bioinformation)和数 据挖掘(Data Mining)的方法主体都是统计。
太密的茎叶图
划分区间要相等 个体数目平方根作为分组数目
双重茎叶图
直方图
旋转90º ,删除图中叶的具体数字,而以方 框高度简单表示叶的个数
多峰
两个数值聚集中心在图上如同两个小峰。 这种多峰的数值聚集方式明显暗示着两者 截然不同的情况,在这里,即为两种不同 类型的遗址,或许可将它们称之为大遗址 和小遗址。茎叶图和直方图上的数值聚集 方式,表明这两种遗址被明确分开。这就 是说,Kiskiminetas河谷中遗址大小的划分, 并非主观臆断,而是其样本数列内在特征 的反映。
计算机无法识别你的统计方面的错误
错误的方法、错误的数据形式都必然输出错 误的结果(虽然看上去可能很漂亮),得到 大量垃圾 另外,统计软件输出的结果太多、很难都理 解
考古学研究中应用统计的化——思维模式的变化 全过程中贯穿定量思想 计算机辅助 定量与传统考古方法的结合 国际交流需要 定量陷阱
分层定量统计
器物特征的定量
考古中的随机发现
男性:69.2% 女性:45.5% χ2分布检验 随葬品与性别有关 18%犯错
有随葬 无随葬 品 品 男 18 8
女
5
6
大信息量的考古资料
化学成分 植硅石测量数据 体质人类学测量数据
数据制图
直观表示 二维图 三维图
高三男生身高
170
160
150
140
N= 163 175
地区1
地区2
地区
数列中心的标准化
离散程度的标准化
Z得分
平均值 标准方差
Z (X X ) / s
数列的形状或分布
对称性 中位数 平均值
变换
用数列中的所有数据减去中位数或平均值, 产生一个标准化水平的新数列,这种操作 是将它的中心调为零的同时,保留了数列 的形状和离散度。接着我们在一个零水平 的数列中将所有数列除以四分位差或标准 差来得到标准化离散度的数列,这是将数 列的离散度调为标准值1
学习内容
描述性统计 随机抽样 概率论 C14测年 统计推断 抽样中的特殊问题 多元统计 上机操作
教材和统计软件
陈铁梅.定量考古学.北京大学出版 社.北京,2005 Excel SPSS Origin WinBASP 其他……
评分标准
考试 40% 课堂交流 20% 课后作业 20% 课题设计 10%
考古学
利有实物遗存资料去复原古代社会的科学
海量数据:测量、描绘。。。 统计描述
抽样过程、随机
“样本”(局部)推断”总体“:发掘的随机性 统计推断
数量关系
认识古代社会
一个器物、墓葬、房址、遗址? 磁山类型 58% 裴李岗类型 57% 动物骨骼百分比
百分比关系
野羚羊绵羊、山羊
s
2
x x
n 1
2
截尾方差
sT
2 n 1 sW
nT 1
将火石原料制成的刮削器视为一个样本数 列,而将燧石原料制成的刮削器视为另一 个样本数列,绘出刮削器长度的双重茎叶 图(这次忽略了刮削器出土遗址的不同)。如 何比较这两个样本数列?能否看出什么规 律,有助于解释上述所有刮削器长度组成 的茎叶图?
数字之间有矛盾 用可靠信息来源进行 对比 数据太好了
简单的算术问题
车祸: 42%的车祸发生在周五、周六和周日 数量变动的百分比:5000->7000->6000
数据统计表
茎叶图
将一组测量值直接罗列出来,人们通常难以获取 其深层次的信息,因此,欲分析一组样本,首先 需将它们重新组织。
车商甲 1985-1991 借通用汽车 60亿美元 1990年12月 4.25亿美元 17000辆厢车进行改 装出口 有问题么?
厢车改装行业一个月17000辆 行业协会报道 1.35%外销
数据虚假
数据是如何产生的 测量的事物?
检查途径
信息不完整:
下雪天车祸28起 高考分数
数据类型
名称变量
形态:平底、尖底、圜底 纹饰:绳纹、蓖麻纹 性别
有序变量
年龄 分期 地层次序
数值变量
数量 百分比 重量 成分
考古器物的定量描述
陶豆
• • • • • • 通高 口径/通高 柄高/通高 盘深/通高 最大直径/最小直径 纹饰:有无
数字合理性检查
Exploratory Data Analysis
茎叶图 箱图 中位数 四分位差
名义变量
统计分析流程
一般来说,统计先从现实世界收集数据 (信息),如观测路口的交通 然后,根据数据作出判断,称为模型 模型是从数据产生的 模型也需要根据新的信息来改进 不存在完美的模型 模型的最终结局都是被更能够说明现实世 界的新模型所取代
数据的产生:数据如何得到? 资料分析:解读数据 统计描述:数据 制图 概率:将事实和无关紧要的信息分离 统计推断:用少量数据,推断大量总体
描述性统计
总体——参数 样本——统计量
样品中心的统计量(集中趋势)
平均值:x分别为样本的各个数 值;n为样本数值的个数 1号坑石片重量的平均值是 12.33g (12块石片重量的总和, 除以石片的总数12),而2号坑石 片重量的平均值是11.42g (13块 石片重量的总和,除以石片的 总数13)。 中位数:若样本的个数是奇数, 则中位数即为样本的中间数值, 而若样本的个数是偶数,则为 中间两个数值的平均值。
双(多)峰
必须拆分
样本的离散趋势
全矩:极差
样本中最大数值和最小数值之差。 完全没有抵抗性。
四分位差:是样本中间一半的全距。在样 本数值中,它不考虑其最大和最小的四分 之一部分。可将其视为一种调整过的全距。
方差和标准差
样本中较高的数值相对于平均值,具有正 偏差(因它们大于平均值),而较低的数值则 具有负偏差(因它们小于平均值) 。 偏差之和必然等于零,故其平均值也为零。
统计、计算机与统计软件
现代生活越来越离不开计算机了,最初的计算机 仅仅是为科学计算而设计和建造的。统计是大型 计算机的最早用户,现在仍然是数值计算的主要 用户 计算机的使用,从计算机语言到 “傻瓜式”地 点击鼠标,输出结果也从数字输出到各种可以想 象得到的形式。输入数据,点鼠标做一些选项, 就可得到漂亮结果,但其中充满了危险的陷阱
小心潜在变量,变异无所不在
样本比较
直方图和茎叶图 位置统计量:集中趋势 尺度统计量 :分散趋势
箱图
中位数 四分位差 异常值 超异常值
异常值应该和方框边界大于一个半方框的 长度。我们可以从纯粹图解的方法来考虑。 我们可以测量如图所示箱图的框的长度。 如果方框是一英尺长,那么我们可以认为 任何一个和方框边界(或上或下)距离大 于1.5英尺的数据就是异常值。 x代表数据聚集的范围(不包括所有的异常 值)。异常值在图中都是空心点来表示, 超异常值都是用实心点表示。
x X
n
异常值的出现,总是显著影响样本的平均 值,而丝毫不会影响其中位数。用统计学 的术语说,中位数具有良好的抵抗性,而 平均值不具任何抵抗性。 异常值剔除:正确?其他类型?直接?
截尾平均值
为1号坑样本调整5%的平均值,等于剩余数 值的和除以nT(10)后所得的商,即11.17g。 欲求2号坑样本调整5%的平均值,同样需先 从样本两端各剔除一个数值(0.05╳13=0.65, 进位为1),再将剩余数值的总和除以nT(11) 得到,其具体的调整平均值为11.48g。 截尾平均值与原初的平均值不同,它可抵 消异常值的影响。
像这样聚集的样本是相当普遍 的,而一个或几个数值远离大 多数值聚集区域的样本也颇为 常见,这些偏离甚大的数值通 常称之为异常值,后面将对它 们作较详细的讨论。这里需强 调的是,对这些异常值,要特 别怀疑并加以验证。该样本中, 直径44.6cm的柱洞显然是不正常 的,应怀疑某人记录此测量数 据时出了差错。迅速核对田野 记录或照片,应能判断该记录 的正确与否,如属记录错误, 则立即将其纠正。如果测量确 实无误,则表明这个样本有这 样一个突出的特征,即有个柱 洞似乎完全不同于其余柱洞。
现实中的随机性和规律性