第五章 样本与统计量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
population/individual/sample/size/observed value
常用的抽样是简单随机抽样, 它满足①代表性: 子样(X1, X2, … , Xn) 的每个分量 Xi与总体X具有相同的概率分布. ②独立 性:各次抽样的结果互不影响. 由简单随机抽样所得子样(X1, X2, … , Xn)称为简单随机子样, 它是来自总体X, 与总体 X具有相同分布的n个相互独立的随 机变量.
1. 内容的数量性
统计总是用数字来表述事实.
2. 目的的总体性, 手段的个体性
目的是找出由大量个体组成的整体的总体特征,但常常从观察个体数量特征入手.
统计的分类
描述统计: 对整体的调查和描述. 常用表和图, 计算特征量(如平均值)等.
统计描述是“社会经济统计学”(属文科)的主要内容. 推断统计: 分析部分资料, 推断出整体情况.
第五章 样本与统计量
第一节 样本与统计量 第二节 数据的简单处理 第三节 统计量的分布
在数理统计中, 研究对象的全体称为总体或母体, 而组成总体的每个单元称为个体. 要了解总体的分布规律, 往往从总体中抽取一部分个体进行观测, 这个过程称为抽样. 在抽样过程中, 每抽取一个个体, 就是对总体X进行一次随机试验, 所抽取的n个个体(X1, X2, … , Xn)称为总体X的 一个样本或子样, 其中所含的个体数量n称为样本容量. 样本(X1, X2, … , Xn) 的观测数据(x1, x2, … , xn)称为样本值或子样观察值.
第五章 样本与统计量
第一节 样本与统计量 第二节 数据的简单处理 第三节 统计量的分布
关于统计的一些说法
“没有统计, 其它科学可以存在, 但是很渺小.”
“Statistics is the science for learning from data.”
统计是“关于收集和分析数据的科学与艺术/art” ——《不列颠百科全书》
总体的数量规 律
统计学探索数量规律性的过程
引言 概率论的问题中, 随机变量的概率分布是已知的或假设是已知的, 而一切计算与推理 都是在这已知的基础上进行的. 但实际中, 一个随机变量所服从的分布可能是完全不知道 的, 或者知道其分布概型, 但是其中的某些参数是未知的. 例如, 某公路上车辆的速度服从的分布是未知的; 电视机的使用寿命服从的分布是未知的; 产品是否合格服从两点分布, 但参数——合格率p是未知的. 数理统计的任务是以概率论为基础, 根据试验所得到的数据, 对研究对象的客观统计规律 做出推断. 数理统计所包含的内容十分丰富, 从第五章开始, 我们学习数理统计的基础知识, 介绍其中 的参数估计, 假设检验, 方差分析, 回归分析等内容. 第五章主要介绍数理统计的一些基本术语, 基本概念, 重要的统计量及其分布, 它们是后面 各章的基础.
(Xi
X
Biblioteka Baidu
)2
sample mean/sample variance
第五章 样本与统计量
第一节 样本与统计量 第二节 数据的简单处理 第三节 统计量的分布
数据的简单处理 抽样调查所得的原始数据往往杂乱无章, 需要以一种直观明了方式对数据进行加工:
数据整理;
计算样本特征数.
数据整理: 将数据分组, 计算各组频数; 作频率分布表, 作频率直方图.
计算样本特征数:
(1)反映趋势的特征数
样本均值 前述.
中位数: 数据按大小顺序排列后, 位置居中的那个数
或居中的两个数的平均数.
众数: 样本中出现最多的那个数.
(2)反映分散程度的特征数: 样本方差, 样本标准差 极差, 四分位数,四分位差数. 极差 样本数据中最大值与最小值之差: R = M m. 四分位数 将样本数据依概率分为四等份的3个数椐, 依次称为第一, 第二, 第三四分位数. 第一四分位数Q1: P{X < Q1} = 0.25, 第二四分位数Q2: P{X < Q1} = 0.50, 第三四分位数Q3: P{X < Q1} = 0.75. 四分位差数 (Q3 Q1)/2.
94
92
96
87
94
92
86
102
88
75
90
U4 X1 X2 2m, ✓
U5 X1X2X3 s .
几个常用的统计量
设(X1, X2, … , Xn)是总体X的一个样本, 样本均值 样本方差 样本均方差或标准差 它们的观测值用相应的小写字母表示.
X
1 n
n i 1
Xi
S 2
1 n1
n i 1
(Xi
X )2
S
1 n
1
n i 1
例1 为对某小麦杂交组合F2代的株高X进行研究, 抽取容量为100的样本, 测试的原始数据记录如下(单位: 厘米), 试根据以上数据,
画出它的频率直方图, 求随机变量X的分布状况.
87
88
111
91
73
70
92
98
105
94
99
91
98
110
98
97
90
83
92
88
86
94
102
99
89
104
94
中心问题是减少误差, 降低出错的可能性. 统计推断是 “数理统计”(属理科)的主要内容.
/descriptive statistics /inferential statistics
描述统计与推断统计的关系
概率论
反映客观 现象的数
据
样本数据 总体数据
描述统计 (数据的搜集, 整理,显示和
分析等)
推断统计 运用概率论分析样本信息, 对总体 的数量特征进行估计和检验等.
•数据有随机性(带偶然误差); •应用时有人的判断和主动性(“艺术”).
统计研究的特点
统计学是一门研究收集数据, 表现数据, 分析数据, 解释数据, 从而认识数量规律的方法论科学. /collect /present /analyze /interprete /methodological
统计研究的特点:
/statistic.
统计量是样本(X1, X2, … , Xn)的不含未知参数的连续函数 f (X1, X2, … , Xn).
2
2
例1 下列哪些是统计量? 其中 X1, X2, X3 是来自总体 N(m, s ) 的一个样本, m 为已知, s 为未知.
U1 X1, ✓ U2 X1 X2e X3 , ✓ U3 max( X1, X 2 , X 3 ), ✓
常用的抽样是简单随机抽样, 它满足①代表性: 子样(X1, X2, … , Xn) 的每个分量 Xi与总体X具有相同的概率分布. ②独立 性:各次抽样的结果互不影响. 由简单随机抽样所得子样(X1, X2, … , Xn)称为简单随机子样, 它是来自总体X, 与总体 X具有相同分布的n个相互独立的随 机变量.
1. 内容的数量性
统计总是用数字来表述事实.
2. 目的的总体性, 手段的个体性
目的是找出由大量个体组成的整体的总体特征,但常常从观察个体数量特征入手.
统计的分类
描述统计: 对整体的调查和描述. 常用表和图, 计算特征量(如平均值)等.
统计描述是“社会经济统计学”(属文科)的主要内容. 推断统计: 分析部分资料, 推断出整体情况.
第五章 样本与统计量
第一节 样本与统计量 第二节 数据的简单处理 第三节 统计量的分布
在数理统计中, 研究对象的全体称为总体或母体, 而组成总体的每个单元称为个体. 要了解总体的分布规律, 往往从总体中抽取一部分个体进行观测, 这个过程称为抽样. 在抽样过程中, 每抽取一个个体, 就是对总体X进行一次随机试验, 所抽取的n个个体(X1, X2, … , Xn)称为总体X的 一个样本或子样, 其中所含的个体数量n称为样本容量. 样本(X1, X2, … , Xn) 的观测数据(x1, x2, … , xn)称为样本值或子样观察值.
第五章 样本与统计量
第一节 样本与统计量 第二节 数据的简单处理 第三节 统计量的分布
关于统计的一些说法
“没有统计, 其它科学可以存在, 但是很渺小.”
“Statistics is the science for learning from data.”
统计是“关于收集和分析数据的科学与艺术/art” ——《不列颠百科全书》
总体的数量规 律
统计学探索数量规律性的过程
引言 概率论的问题中, 随机变量的概率分布是已知的或假设是已知的, 而一切计算与推理 都是在这已知的基础上进行的. 但实际中, 一个随机变量所服从的分布可能是完全不知道 的, 或者知道其分布概型, 但是其中的某些参数是未知的. 例如, 某公路上车辆的速度服从的分布是未知的; 电视机的使用寿命服从的分布是未知的; 产品是否合格服从两点分布, 但参数——合格率p是未知的. 数理统计的任务是以概率论为基础, 根据试验所得到的数据, 对研究对象的客观统计规律 做出推断. 数理统计所包含的内容十分丰富, 从第五章开始, 我们学习数理统计的基础知识, 介绍其中 的参数估计, 假设检验, 方差分析, 回归分析等内容. 第五章主要介绍数理统计的一些基本术语, 基本概念, 重要的统计量及其分布, 它们是后面 各章的基础.
(Xi
X
Biblioteka Baidu
)2
sample mean/sample variance
第五章 样本与统计量
第一节 样本与统计量 第二节 数据的简单处理 第三节 统计量的分布
数据的简单处理 抽样调查所得的原始数据往往杂乱无章, 需要以一种直观明了方式对数据进行加工:
数据整理;
计算样本特征数.
数据整理: 将数据分组, 计算各组频数; 作频率分布表, 作频率直方图.
计算样本特征数:
(1)反映趋势的特征数
样本均值 前述.
中位数: 数据按大小顺序排列后, 位置居中的那个数
或居中的两个数的平均数.
众数: 样本中出现最多的那个数.
(2)反映分散程度的特征数: 样本方差, 样本标准差 极差, 四分位数,四分位差数. 极差 样本数据中最大值与最小值之差: R = M m. 四分位数 将样本数据依概率分为四等份的3个数椐, 依次称为第一, 第二, 第三四分位数. 第一四分位数Q1: P{X < Q1} = 0.25, 第二四分位数Q2: P{X < Q1} = 0.50, 第三四分位数Q3: P{X < Q1} = 0.75. 四分位差数 (Q3 Q1)/2.
94
92
96
87
94
92
86
102
88
75
90
U4 X1 X2 2m, ✓
U5 X1X2X3 s .
几个常用的统计量
设(X1, X2, … , Xn)是总体X的一个样本, 样本均值 样本方差 样本均方差或标准差 它们的观测值用相应的小写字母表示.
X
1 n
n i 1
Xi
S 2
1 n1
n i 1
(Xi
X )2
S
1 n
1
n i 1
例1 为对某小麦杂交组合F2代的株高X进行研究, 抽取容量为100的样本, 测试的原始数据记录如下(单位: 厘米), 试根据以上数据,
画出它的频率直方图, 求随机变量X的分布状况.
87
88
111
91
73
70
92
98
105
94
99
91
98
110
98
97
90
83
92
88
86
94
102
99
89
104
94
中心问题是减少误差, 降低出错的可能性. 统计推断是 “数理统计”(属理科)的主要内容.
/descriptive statistics /inferential statistics
描述统计与推断统计的关系
概率论
反映客观 现象的数
据
样本数据 总体数据
描述统计 (数据的搜集, 整理,显示和
分析等)
推断统计 运用概率论分析样本信息, 对总体 的数量特征进行估计和检验等.
•数据有随机性(带偶然误差); •应用时有人的判断和主动性(“艺术”).
统计研究的特点
统计学是一门研究收集数据, 表现数据, 分析数据, 解释数据, 从而认识数量规律的方法论科学. /collect /present /analyze /interprete /methodological
统计研究的特点:
/statistic.
统计量是样本(X1, X2, … , Xn)的不含未知参数的连续函数 f (X1, X2, … , Xn).
2
2
例1 下列哪些是统计量? 其中 X1, X2, X3 是来自总体 N(m, s ) 的一个样本, m 为已知, s 为未知.
U1 X1, ✓ U2 X1 X2e X3 , ✓ U3 max( X1, X 2 , X 3 ), ✓