数理统计学2(福州大学离散数学中心陈荣斯)资料
数理统计学4( 福州大学离散数学中心 陈荣斯)
![数理统计学4( 福州大学离散数学中心 陈荣斯)](https://img.taocdn.com/s3/m/26cd78735acfa1c7aa00cc8a.png)
一、 置信区间的概念 定义4 设 是总体 X 的待估参数, X1, X2, „, Xn 是取自 对给定值 0 < <1, 若统计量 ( X 1 , X 2 ,, X n) 总体 X 的样本, 和 ( X 1 , X 2 ,, X n ) 满足 P ( ) 1 , 则称随机区间 ( , )为 的置信水平为1- 的双侧置信区间 . 和 置信度 置信概率 分别称为置信下限和置信上限. 作区间估计, 就是要设法找出两个只依赖于样本的界限(构造 统计量) 和 . ( , )是随机区间, 代入样本值所得的普通区间称 为置信区间的实现. 置信水平为 0.95 是指 100 组样本值所得置信区间的实现中, 约有95个能覆盖 , 而不是说一个实现以 0.95 的概率覆盖了 . 要求 以很大的可能被包含在置信区间内, 就是说 , 概率 ─ P( < < )= 1- 要尽可能大. 即要求估计尽量可靠. ─ 估计的精度要尽可能的高. 即要求区间置信的长度尽可能 短, 或能体现该要求的其它准则.
2. 方差 2/ 2 1 2 1 2 (2) 未知均值 ,
1 2
P ( ) 1 ? ^① 我们选取未知参数的某个估计量 , 根据置信水平1- , 可以 ˆ 找到一个正数 , 使得 P ( | | ) 1 , ^ 分布的分位数 ② 只要知道 的概率分布就可以确定 . ˆ ˆ ˆ 由不等式 | | 可以解出 : ③ 这个不等式就是我们所求的置信区间 ( , ) .
─ 2)的样本, N( , X , S 2 分别是其样本 、 2 的置信水平为1- 的置信区间.
求置信区间首先要明确问题: 是求什么参数的置信区间? 置信水平 1- 是多少?
统计学专业福建省考研复习资料统计方法重点内容梳理
![统计学专业福建省考研复习资料统计方法重点内容梳理](https://img.taocdn.com/s3/m/9bf958d7cd22bcd126fff705cc17552707225e3a.png)
统计学专业福建省考研复习资料统计方法重点内容梳理随着社会的不断发展和进步,统计学作为一门重要的学科在各个领域得到越来越广泛的应用。
福建省考研中的统计学科目也有着越来越重要的地位。
为了帮助考生更加系统地复习统计学方法,本文将重点梳理福建省考研统计学专业的复习资料。
一、总体与样本在统计学中,总体和样本是基本的概念。
总体是指研究对象的全体,而样本则是从总体中选取的一部分个体。
统计学的研究对象往往是大规模的,无法对整个总体进行研究,因此需要通过样本来进行推断和研究。
在复习中,考生需要明确总体和样本的概念,并了解常用的抽样方法和抽样误差的计算方法。
二、描述统计描述统计是通过收集、整理和描述数据来总结数据特征的统计方法。
常见的描述统计指标有中心趋势和离散程度两个方面。
其中,中心趋势包括均值、中位数和众数等;离散程度则通过方差和标准差等指标来反映。
此外,箱线图、频率分布表和直方图等图表也是描述统计的重要工具。
考生需要熟悉这些统计指标的计算方法,并能够正确解读图表。
三、概率与概率分布概率是统计学中非常重要的概念,它反映了事件发生的可能性。
在复习中,考生需要掌握基本的概率公式和性质,并了解常见的概率分布。
例如,离散型随机变量的概率分布有二项分布、泊松分布等;连续型随机变量的概率分布有正态分布、指数分布等。
对于不同的概率分布,考生需要了解其特点、参数和应用领域,并能够进行相应的计算和推断。
四、参数估计与假设检验参数估计和假设检验是统计学中常用的推断方法。
参数估计是利用样本信息来估计总体参数,常见的估计方法有点估计和区间估计。
而假设检验则是根据样本数据对总体参数进行推断,判断某一假设是否成立。
在复习中,考生需要了解点估计和区间估计的方法和原理,同时掌握假设检验的步骤和相关的统计量。
五、方差分析与回归分析方差分析和回归分析是统计学中常见的多变量分析方法。
方差分析主要用于比较两个或多个样本的均值差异,常见的方法有单因素方差分析和多因素方差分析。
数理统计的基本概念PPT精品文档40页
![数理统计的基本概念PPT精品文档40页](https://img.taocdn.com/s3/m/a2dcfe6559eef8c75ebfb33c.png)
则样本的联合分布为
n
n
P { X 1 x 1 ,X 2 x 2 , ,X n x n } P { X i x i} p i.
i 1
i 1
§6.2 抽样分布
6.2.1 统计量的概念
由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。
统计量的分布称为抽样分布,下面介绍来自正 态总体的几个重要统计量的分布,称为统计学的三 大分布: 2 分布,t分布和F分布.
6.2.2 χ 2 分布
定义4: 设 X1, X2, …, Xn 是来自总体 N(0, 1), 的样本,则称统计量
与总体X具有相同的概率分布,则称随机变量 X1,X2, ,Xn为来自总体X的容量为n的简单随机 样本,简称样本.
它们的 x1,x观 2, ,x 察 n称值 为,样 又本 称值 为 X的 n个独立 . 的观察值
注意:样本的二重性。
6.1.2 样本的分布 样本 X1,X2,…,Xn 可以被看作n维随机向量,自
定义2:设 X1,X2, ,Xn是来自总体X的样本, g(X 1,X 2, ,X n)是样本 X1,X2, ,Xn的函数,如果 g(X 1,X 2, ,X n)中不包含任何未知参数,则称它
是一个统计量。
定义3:几个常用的统计量
样本均值
X
1 n
n i1
Xi
反映总体 均值的信息
样本方差 S2n11in1(Xi X)2n11(in1 Xi2nX2)
200 20 00 20 00 20 00 20 00 20 000
数理统计-内容归纳(一、二章习题评讲及试卷分析)
![数理统计-内容归纳(一、二章习题评讲及试卷分析)](https://img.taocdn.com/s3/m/5232341e6bd97f192279e944.png)
(1) b=-2, (4) λ=µ=1
a=ห้องสมุดไป่ตู้2/5;
(2) c=8,
d=15;
(3) β=8,γ=15;α=12/5;
第二章
1.点估计量的求解方法 (1)矩法; (2)极大似然法;
2. 无偏估计、有效性、一致性
c(θ ) g '(θ ) I (θ ) = n
DT =
g '(θ ) c(θ )
第二章
2 s12 / s2 Fα / 2 (n − 1)
第二章 习题二:3.(8),4,5,10,12,22,25,27
3.(8) f ( x; θ ) = ( x − 1)θ (1 − θ )
2 x−2
, x = 2, 3, ⋯ , 0 < θ
<1
第二章 习题二:3.(8),4,5,10,12,22,25,27
第二章 习题二:3.(8),4,5,10,12,22,25,27
第二章 典型试题
0.25 2u0.975 ≤ 0.2 ⇒ n ≥ 24.01 ⇒ n ≥ 25 n
第一章
习题一:4,8,11,12, 16,17,21,23
第一章
习题一:4,8,11,12, 16,17,21,23
第一章
习题一:4,8,11,12, 16,17,21,23
第一章 典型试题
0.9
2.147
0.05
~ N (0,1)
~ t (2n − 2)
~ χ 2 (2n − 2)
~ F (n − 1, n − 1)
3. 置信区间
1)设X1,X2,…,Xn来自正态总体,置信度为0.95,则 (1)均值µ的置信区间为 (2)方差σ2的置信区间为
数理统计与多元统计—2
![数理统计与多元统计—2](https://img.taocdn.com/s3/m/1164624469eae009581bec69.png)
p
0
1
xi
i 1
n
1 xi dp nx !n nx ! 1 p i 1 n 1!
n
函数的定义与性质)
p 的后验概率密度 f p x1 , x 2 , , x n
f x1 , x 2 , , x n p p
叶斯估计;
ˆ 3. f x1 , x2 ,, xn 刻画的分布规律, 平均取值的大小 3 作为 按 取
的估计,即取后验密度函数 f x1 , x2 ,, xn 的数学期望作为 的估计,并 称为期望型贝叶斯估计.
不过在贝叶斯统计学的理论研究和实际应用中, 用得最多的是第 3 种,即用后验期望
只用前两种信息的统计学称为经典统计学, 三类信息都用的统计学称为贝叶斯统计学. 贝叶斯估计就是按贝叶斯统计学的观点去构造估计量.
贝叶斯估计的基础是贝叶斯公式。
初等概率论中的贝叶斯公式是用事件的概率形式给出的: 若不相容的事件序列B1 , B2 , , Bn 构成样本空间的一种划分 则
PBk A P Bk P A Bk
接下来讨论如何估计参数 .
经过贝叶斯公式所算得的后验密度函数
f x1 , x2 , , xn
已归纳了与 有关的三种信息.如今我们要估计 只需从后验
密度函数 f x1 , x2 , , xn 叫中提取信息.如何提取呢? 由 于 后 验 密 度 函 数 f x1 , x 2 ,, x n 刻 画 了 在 样 本
f x1 , x2 , , xn .
此种后验分布使人们对 的认识又深入一步.从而可以看出,获
得 样 本 的 净 效 果 , 是 把 我 们 对 的 认 识 由 调 整 到
数理统计的基本概念课件
![数理统计的基本概念课件](https://img.taocdn.com/s3/m/556912986e1aff00bed5b9f3f90f76c661374cef.png)
离散程度
通过方差、标准差等指标 来描述数据的离散程度, 反映数据的变化程度。
数据的中位数、均值和众数
中位数
将数据按照大小顺序排列,处于 中间位置的数值即为中位数。中 位数可以反映数据的集中趋势和
离散程度。
均值
将所有数据相加后除以数据个数 ,得到的数值即为均值。均值可 以反映数据的集中趋势和离散程
度。
拟合优度
决定于所选择的非线性函数形式,常 用的有R²和SSPE(残差平方和)。
显著性检验
一般采用基于参数的假设检验和似然 比检验。
THANKS FOR WATCHING
感谢您的观看
05
假设检验
假设检验的基本思想
统计假设
假设检验的核心是对提出的问题(即假设)进行统计推断,先假设所要考察的 总体参数按某种规律或分布(即统计模型)分布,然后根据样本信息对原假设 进行检验。
假设检验的基本步骤
首先提出假设,然后收集样本数据,接着根据样本数据对原假设进行检验,最 后根据检验结果做出结论。
多元线性回归分析
• β0: 截距 • β1, β2, ...: 斜率
• ε: 误差项
多元线性回归分析
拟合优度
R²,表示模型解释因变量的方差的比例 。
VS
显著性检验
整体显著性检验(F检验)和单个变量的 显著性检验(t检验)。
非线性回归分析
定义
非线性回归分析是研究非线性关系的 统计方法。
模型
Y = f(X) (其中 f 是非线性函数)
• β0: 截距
一元线性回归分析
01
• β1: 斜率
02
• ε: 误差项
03
04
拟合优度:R²,表示模型解 释因变量的方差的比例。
大学数学统计篇之数理统计的基本概念——数理统计的基本概念
![大学数学统计篇之数理统计的基本概念——数理统计的基本概念](https://img.taocdn.com/s3/m/f12a63697e21af45b307a86b.png)
例1 样本及观察值的表示方法: (2) 对363个零售商店调查得其周零售额的结果如下:
零售额(元) 1000 (1000,5000] (5000,10000] (10000,20000] ( 20000,30000] 商店数 61 135 110 42 15
这是一个容量为363的样本的观察值, 对应的总体是
必就一定能清楚地呈现出来, 但实际上人们常常无法 对所研究的对象的全体(或总体) 进行观察,而只能抽 取其中的部分(或样本) 进行观察或试验以获得有限的 整理有 怎样有效地收集、 数据. 数理统计的任务包括:
研 限的数据资料; 怎样对所得的数据资料进行分析、
作出合理的推断, 究, 从而对研究对象的性质、特点,
确定 值的随机性而使分布显得杂乱. 因此, 分组时, 分组数(或组距)应以突出分布的特征并冲淡样本的 随机波动性为原则. 区间所含的样本值个数称为该
区间的组频数.
组频数与总的样本容量之比称为组频数.
2. 频率直方图:频率直方图能直观地表示出组频
率数的分. 其步骤如下: 设 x1 , x2 , , xn 是样本 的 n 个观察值. (1) 求出 x1 , x2 , , xn 中 的最小者 x(1) 和最 大者 x( n ) ; (2) 选取常数 a (略大于 x( n ) ), 并 和b (略小于 x(1) ) 将区间 [a , b] 等分成 m 个小区间 (一般取 m 使 m / n 在 1 / 10 左右, 且小区间不包含右端点):
其概率密度为 (2) 若总体 X 为连续型随机变量,
f ( x ), 则样本的概率密度为
f ( x1 , x2 , xn ) f ( xi )
i 1
n
称其为连续样本密度.
概率论与数理统计2
![概率论与数理统计2](https://img.taocdn.com/s3/m/21c26370aa00b52acfc7cac0.png)
德
第 5页
例4. 设P(A)=p, P(B)=q, P(AB)=r, 用p, q, r表示下列 事件的概率:
(1)P( A B ); (2)P( AB); (3)P( A B); (4)P( AB ).
制作人---张德平
德
第 6页
§4. 等可能概型(古典概型)
等可能概型的两个特点: (1) 样本空间中的元素只有有限个;
加 强 交 通 建 设管理 ,确保 工程建 设质量 。07:48:1507:48:1507:48Friday, October 30, 2020
安 全 在 于 心 细,事 故出在 麻痹。 20.10.3020.10.3007:48:1507:48:15October 30, 2020
踏 实 肯 干 , 努力奋 斗。2020年 10月 30日 上午7时 48分20.10.3020.10.30
德
3制.作频人---率张德的平 特性: 波动性和稳定性.
第 2页
(二)概率 1.定义: 设S是样本空间, E是随机试验. 对于E的 每个事件A对应一个实数P(A), 称为事件 A的概率, 其中集合函数P(.)满足下列条件:
(1) 对任一事件A,有P(A)≥0; (非负性)
(2) P(S)=1;(规范性)
例7. 某接待站在某一周曾接待过12次来访, 且都是 在周二和周四来访. 问是否可以推断接待时间是有 规定的?
注
实际推断原理:“小概率事件在一 次试验中实际上是不可能发生1 页
古典概型概率的间接计算:
一. 加法公式和逆事件概率公式的应用:
练P例(习a(逆加+A1:b.概1法袋(n配公中)A,对式2试有问求a只题至对白)某少A任球n人取)一和一出事bi次一只n1件写只P黑(A了白A球, n球i,)封从P的信(中1概Ai,同)率分j时n.别1P任(在A取Pni(A个nA只j信)).球封上 写个了信这封中n个,人试的求收没信有地一址封.1信如ij的果k信他n P纸任(和A意i信地A封将j A配nk张)对信的纸概装率入. n
2013年年度报告-离散数学-福州大学
![2013年年度报告-离散数学-福州大学](https://img.taocdn.com/s3/m/b56591046bd97f192279e989.png)
离散数学及其应用教育部重点实验室工作总结报告(2014年1月28日)实验室名称:离散数学及其应用教育部重点实验室主管部门:福建省教育厅依托单位:福州大学实验室概况: 在迅速发展的计算机科学技术及信息技术等领域,离散数学是重要的基础学科和支撑学科,它的发展和应用是影响一个国家科学技术发展水平的重要因素。
以福州大学“离散数学与理论计算机科学研究中心”为依托的离散数学及其应用教育部重点实验室于2007年7月获教育部批准立项建设。
目前,实验室共有固定研究人员27人,其中教授16人,副教授4人。
实验室由马志明院士担任学术委员会主任,范更华教授担任实验室主任。
实验室位于福州大学铜盘校区。
2007年11月完成了实验室装修一期工程;2009年3月完成了二期装修工程,达到“环境优美、设备一流”。
按国际研究所标准建设基础设施,为每位研究人员及来访学者提供40平米宽敞办公室及一流科研设备。
为每位研究生提供一个工作位及台式电脑。
已建成无线网覆盖实验室3000平米的科研、办公场所。
重视网络建设,保证网络高速畅通。
订购相关专业的国外数据库及原版图书,已基本建成一流的专业图书资料室。
一、实验室现有三个研究方向:图论与组合数学、大规模集成电路设计中的数学方法、优化理论与算法。
二、本年度实验室在研科研项目国家973计划课题1项,国家自然科学基金13项,其中重点项目1项,面上项目4项,青年项目8项。
教育部重点项目1项,高等学校博士学科点专项科研基金1项。
新增国家自然科学基金4项,均为青年项目,分别是:1.图的完美匹配计数及其相关问题的研究(11301085),林峰根。
2.变密度粘性流体动力学中非线性瑞利-泰勒不稳定性的数学理论研究(11301083),江飞。
3.保持全局形状和视觉舒适度的2D和3D媒体适应方法(61300102),牛玉贞。
4.不相交QoS路径与斯坦纳网络的近似算法研究(61300025),郭龙坤。
实验室成员于元隆博士获福建省“闽江学者奖励计划”项目资助,郭文忠博士获福建省自然科学基金杰青项目资助。
数理统计的基本知识概要课件
![数理统计的基本知识概要课件](https://img.taocdn.com/s3/m/5e4e092549d7c1c708a1284ac850ad02de80073c.png)
目录
• 数理统计的基本概念 • 数据的收集与整理 • 数据的描述性分析 • 概率论基础 • 参数估计与假设检验 • 数理统计的应用领域
01
数理统计的基本概念
统计学的定义与分类
统计学是一门研究如何从数据 中获取有用信息的科学。
02
统计学的分类
01
统计学的定义
描述统计学和推断统计学是统计 学的两大分支。
全概率公式与贝叶斯公式
全概率公式用于计算一个事件的概率,贝叶斯公式则用于在已知一 些事件发生的条件下计算另一个事件的概率。
大数定律与中心极限定理
大数定律
在大量重复试验中,频率稳定地 趋近于概率。
中心极限定理
在满足一定条件下,随机变量的 分布可以近似为正态分布。
05
参数估计与假设检验
参数估计的基本原理与方法
员了解和控制疾病的传播。
生物信息学
生物信息学是数理统计在医学领 域的一个重要应用方向,通过数 据分析和建模,可以揭示基因组 、蛋白质组等生物信息中的规律
和奥秘。
环境领域的应用
环境监测和评估
环境领域的数据分析需要大量的数理统计方法,例如,通 过空气、水质等环境数据的统计分析,可以评估环境污染 的程度和影响。
3
方差分析的步骤
计算平方和、计算自由度、计算均方、计算F值 、判断显著性等。
06
数理统计的应用领域
金融领域的应用
01
投资组合优化
数理统计可以帮助金融分析师进行投资组合的优化,通过数据分析和建
模,确定最佳的投资组合配置,以实现更高的回报和更低的风险。
02 03
风险管理
数理统计在金融领域中也被广泛应用于风险管理,例如,通过历史数据 的统计分析,可以预测和评估潜在的市场风险,从而制定相应的风险应 对策略。
数理统计的基本概念ppt课件
![数理统计的基本概念ppt课件](https://img.taocdn.com/s3/m/df2a0bc870fe910ef12d2af90242a8956becaadc.png)
二、t—分布
1.构造 若X~N(0, 1), Y~2(n), X与Y独立,则
T X ~ t(n). Y /n
t(n)称为自由度为n的t—分布。
t(n) 的概率密度为
h(t)
( n 1) 2
(1
t
2
n1
)2
,
n ( n) n
2
t
2.基本性质:
(1) f(t)关于t=0(纵轴)对称。
2.商品日投放量问题:如草莓的日投放量多少合理? 如何安排银行各营业网点的现金投放量?快餐食品以 什么样的速度生产最为合理等等。
例 制衣厂为了合理的确定服装各种尺码的生产比例,
需要调查人们身长的分布。现从男性成人人群中随
机选取100人,得到他们的身长数据为:
...
(1) 试推断男性成人身长X的概率密度
)(
n2 2
)(n1 / )(1
0,
n ) y n1 / 2
n1 2
1
2
n y) 1 (n1n2 ) / 2 n2
y0
,
y0
2. F—分布的分位点 对于:0<<1,
若存在F(n1, n2)>0, 满足
P{FF(n1, n2)}=, 则 称F(n1, n2)为 F(n1, n2)的 上侧分位点;
F (n1 , n2 )
例子2 证明等腰三角形两底角相等在几何学和统 计学上方法是不一样的。
数理统计方法的特点
2.数理统计方法得到的结果具有不确定性
数理统计所依据的数据在采集的时候具有随机性,虽 然它也可以反映总体的特征,但是有不确定性,这是逻 辑的必然。统计学的作用就是提供归纳推理的方法以及 计算这种不确定性程度的方法。这种带有不确定性的推 断. 称为统计推断,而不确定的程度可以用概率表示
2.2-2.3 数理统计学基本概念
![2.2-2.3 数理统计学基本概念](https://img.taocdn.com/s3/m/8c1cc66faa00b52acec7ca79.png)
10
抽到哪5辆是随机的
样本是随机变量.
容量为n的样本可以看作n维随机变量. 但是,一旦取定一组样本,得到的是
n个具体的数 (X1,X2,…,Xn),称为样本的 一次观察值,简称样本值 .
11
样本具有两重性: 10. 随机性 样本(X1,X2,…,Xn)本身是随机向量。 20. 相对确定性 经过一次抽样后,样本(X1, X2, …, Xn)又 是一组确定的样本值(x1, x2, …, xn)。
7
例如:研究某批灯泡的寿命时,关心的数量指标 就是寿命,那么,此总体就可以用随机变量X表示, 或用其分布函数F(x)表示.
总体
寿命X可用一概 F(x) 率分布来刻划
某批 灯泡的寿命
鉴于此,常用随机变量的记号
或用其分布函数表示总体. 如 说总体X或总体F(x) .
8
类似地,在研究某地区中学生的营养状况时, 若关心的数量指标是身高和体重,我们用X和Y分 别表示身高和体重,那么此总体就可用二维随机变 量(X,Y)或其联合分布函数F(x,y)来表示.
14
2 样本分布
(1)设总体X的分布函数F(x) P(X x)
( X1, X 2 , 的,联X合n )分布函数
F x1, x2 , , xn
P X1 x1, X2 x2 ,
n
F ( xi ) i 1
, Xn xn
15
(2)设总体X连续,具有密度 f(x),则样本 ( X1, X 2 , 的,联X合n )密度为
某批 灯泡的寿命
该批灯泡寿命的 全体就是总体
6
由于每个个体的出现是随机的,所以相应的 数量指标的出现也带有随机性. 从而可以把这种 数量指标看作一个随机变量,因此随机变量的分 布就是该数量指标在总体中的分布.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
T 的密度函数为偶函数;
lim
n
f
(x)
1
e
x2 2
,
即 n充分大时,
t 分布近似 N(0,1).
2 但 n 较小时,t 分布与 N(0,1)分布相差很大
t 分布的尾部比标准正态分布的尾部具有更大的概率
t 分布的上侧
分位数
n 45 时, 查附表求 n > 45 时,t u ,
P(T
> t (n)) =
则可用
1 n
n
i 1
xi
作为EX
的一个估计值, 且 n
越大, 越精确.
一、自由度为 n 的 2 分布 Y ~ 2 (n)
——
随机变量
Y
n
X
2 i
所服从的分布
(诸
Xi
独立且都服从
N(0,1)
)
i 1
40 设 X1, …, Xn 相互独立, 且都服从正态分布 N( , 2), 则
Y
1
2
n
(Xi
i 1
2
1
2
n
(
i 1
Xi
X
)2
n Sn2
2
~ 2(n 1);
(3) X 和 S 2相互独立.
(u )= 1- u
x0
u
x0 u
复习
总体和样本
总体 —— 研究对象的全体, 总体中的每个对象称为个体
总体可用随机变量 X 或其分布来描述, 就是一个概率分布
样本 ——按一定规则从总体中抽取若干个体进行观察试验
所抽取的部分个体称为样本,
样本容量,
样本值,
简单随机样本
独立性; 代表性.
以概率收敛于 X 的期望值 EX = . 这为在不知分布的情形下,
取多次重复观测的算术平均值 X 作为 EX 的较为精确的估计提供 了理论保证.
例如, 有一批产品, 不知其寿命X 的分布, 为评价其质量, 需确
定其平均寿命 X , 随机地从中抽取 n 件产品并测得其寿命分别为
x1 , x2 ,, xn ,
的数 x 为此分布的上侧 分位数 .
2
(n)
3. 2 分布的上侧 分位数
:
O
2 (n)
xn)
)
2 (n)
f
(
x)
d
x
,
2 分布函数的值可通过查表得到
定义4
设 X~N(0, 1), 0 < < 1 , 则称
满足等式 P(X >u ) = 的数 u 为标准正态分布的上侧 分位数;
统计量 ——不含任何未知参数、完全由样本决定的样本函数
样本矩 顺序统计量 将样本值 x1,…, xn 按递增顺序排列 x1 xn
令随机变量
X
k
xk,
(
X
1
,
,
X
n
)
为样本
X1,
…,
Xn
的顺序统计量.
三个常见的统计分布
在同分布条件下大数定律的表现形式: 定理(辛钦大数定律) 伯努利大数律是辛钦大数律的特例
于其抽样分布的性质.
抽样分布
精确抽样分布 ——小样本问题中使用 渐 近 分 布 ——大样本问题中使用
抽样分布就是通常的随机变量函数的分布, 只是强调这一分
布是由一个统计量所产生的. 所以在理论上只要知道总体的分布就
可以求出统计量的分布, 但实际操作一般都很难求.
重点以正态分布为背景, 给出几个常用统计量的抽样分布.
)2
~
2(n) ;
10 可加性——设 Y1 ~ 2 (m), Y2 ~ 2 (n), 且 Y1, Y2 独立,
则 Y1 Y2 ~ 2(m n) ;
20+30 若 Y ~ 2 (n), 则 EY = n , DY = 2n ;
当 n 充分大时, Y n 近似服从 N(0,1). 2n
2 分布的上侧
分位数
n
45
时,
P
(
X
2
(n)
)
n > 45
时,
2
1 2
(
u
2 (n)
2n 1
f ( x) dx
)2 .
,
二、自由度为 n 的 t 分布 T ~ t (n) ——随机变量 T X 所服从的分布,
Y n (其中X~N(0,1), Y ~ 2 (n), X 与 Y 相互独立)
数学期望 E(T )= 0 , 方差 D(T )= n / (n-2) , (n > 2).
三、第一自由度为 m , 第二自由度为 n 的 F 分布 F ~ F(m, n)
—— 统计量 F X m 所服从的分布 Y n ( 随机变量X与Y独立, 且Y ~ 2 (m), Y ~ 2 (n) )
数学期望
E(X)
n n2
,
n 2 .
不依赖于第一自由度
F 分布的性质: 10 若 X ~ F(m, n), 则 1/X ~ F(n, m). 20 若 X ~ t (n), 则 X 2 ~ F(1, n);
称满足等式 P(|X|>u/2 ) = 的数 u/2 为标准正态分布的双侧
分位数; (x)
(x)
/2
/2
O
u
x
-u/2 O
u/2
x
P(X >u )= 1- P(Xu ) = 1-(u ) = , (u )= 1- ,
类似可得 (u/2 )= 1- /2 ,
可查表得值
若 X~N( , 2)时,要求满足 P(X >x0 )= 的 x0 :
查 F 分布附表可求 P( F > F (m,n) )= ,
F 分布上侧
分位数的性质
F1 (m, n)
1 F (n, m)
.
§3 抽样分布
统计量是样本的函数, 是依赖于样本的, 后者是随机变量, 所以统计量也是随机变量, 因而就有它们自己一定的分布, 这个 分布叫做统计量的“抽样分布” .
研究统计量的性质和评价一个统计推断的优良性,完全取决
一、正态总体的抽样分布定理
当总体为正态分布时, 教材上给出了 4 个重要的抽样分布定理.
定理1 ——样本均值、方差的分布
取自正态总体 N( , 2)的样本, 则
设 X1,X2,…,Xn 是
(1)
X
~
N(,
2
n
)
;
正态分布的 线性组合仍服从正态分布 EX= , DX = 2/n
(2)
(n1) S 2
分布的上侧 分位数
1. 正态分布的上侧 分位数 设 X~N(0, 1), 0 < < 1 , 则称
满足等式 P(X >u ) = 的数 u 为标准正态分布的上侧 分位数;
2. 一般定义 设随机变量 X 的密度为 f (x) , 对给定的(0<<1),
称满足等式
P(
X
x
)
x
f
( x)dx
f (x)
设随机变量序列X1, X2, … 独立且同分布, 具有有限
的数学期 EXi =μ, i =1, 2, …, 则对 > 0,
lim
n
P(|
1 n
n
i 1
Xi
|
)
1.
辛钦大数定律为寻找随机变量的期望值, 提供了
辛钦
一条实际可行的途径: 若视 X i 为重复试验中对随机变量 X 的 第 i 次观察, 则当 n → 时, 对X 的 n 次观察结果的算术平均值 X