第一章 统计学的基本知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
What statistics can and can’t do
Can
Can’t
provide objective criteria for evaluating hypotheses
help optimize effort
help you critically evaluate arguments
A.L. Bowley
1.3 几个基本概念
试验(experiment,trial)与事件(event)
– 试验:获取数据资料的过程或研究(在特定 条件下)
掷硬币,饲料对比试验,药物疗效试验
– 事件:试验的结果或现象
必然事件 不可能事件 随机事件
1.2 几个基本概念
变量(variable)与观测值(observation)
1.4 试验资料的性质与分类
(1)数量性状资料 数量性状(quantitative trait):度量有计数与量测两种
方式。 不连续变量(discontinuous or discrete variable): 指用计数方法获得的数据。 连续性变量(continuous variable):指称量、度量或测 量方法得到的数据。
Benjamin Disraeli
“A knowledge of statistics is like a knowledge of foreign languages or of algebra; it may prove of use at any time under any circumstances.”
引自吴仲贤《统计遗传学》(1982,科学出版社)
1.2 统计学的用途
Description
Provide a data summary Help discover trends and patterns. Evaluate magnitude and direction of experimental effects
– 样本:从总体中抽取的部分个体,用于对总 (parameter)与统计量(statistic)
– 参数:描述总体特征的数,通常未知
总体平均数(),总体方差( 2),
– 统计量:描述样本特征的数,是样本观测值 的已知函数
样本平均数(x),样本方差(s 2),
对总体的推断是通过统计量进行的
tell the truth (probabilistic conclusions only!)
compensate for poor design
indicate biological significance: statistical significance does not mean biological significance, nor vice versa!
有限总体(finite population):总体中 包含的个体数目有限,这种总体称为有 限总体。 观察值(observation):每一个体的某一 个性状、特性的测定数值叫做观察值。 变量(variable):观察值集合起来,称 为变数。
1.3 几个基本概念
样本(sample):从总体中抽出的一部分个体的集 合。 统计数(statistic):测定样本中的各个体而得 到的样本特征数,如平均数。 估计值(estimate):统计数是总体相应参数的估 计值。 随机样本(random sample):从总体中随机抽取 的样本。 样本容量(sample size):样本中包含的个体数, 用n表示。
examination; he may be able
to say what the experiment
died of.”
Sir Ronald Fisher
Some opinions of statistics
“There are three types of lies: lies, damn lies, and statistics!”
– 变量:某种特征,其表现随个体而异
身高、体重、体长、产奶量、毛色 随机变量:变量取值的变化是不可预测的
– 观测值:对变量进行测量或观察所获得的数 值
1.3 几个基本概念
总体(population)、个体与样本(sample)
– 总体:一个统计问题所研究对象的全体
– 个体:组成总体的每一基本单元
有限总体 无限总体 假设无限总体
Some opinions of statistics
“If your experiment needs statistics, you should have done a
better experiment.”
Ernest Rutherford
“To call in a statistician after the experiment is done may be no more than asking him to perform a postmortem
Design
Hypothesis-testing
Assist in the design of experiments and field studies
A priori decisions about usefulness of experiments.
Evaluate biological hypotheses by testing to see whether observed patterns are “real” or simply due to chance.
1.3 几个基本概念
准确性(accuracy)与精确性(precision)
– 准确性:观测值或估计值与真值的接近程度
– 精确性:重复观测值或估计值之间的接近程 度
.. .
..
.
.
.
. .
低准确性 低精确性
..........
低准确性 高精确性
..........
高准确性 高精确性
1.3 几个基本概念
第一章 统计学的基本知识
主要内容
统计学基本知识 理论分布于抽样分布 均值比较与T检验 方差分析 聚类与判别分析 因子分析 相关分析 参数估计 非参数检验 不确定分析
1.1 统计学的基本特点
概率性
– 以概率论为理论基础 – 其结果均伴随着某种概率
二元性
– 理论与实际数据
归纳性
– 由现实数据资料中归纳出一般的原理 - 由特殊推导 一般(由样本推导总体)