10-06-数理统计概念-key

合集下载

第六章-数理统计的基本概念

第六章-数理统计的基本概念

而X(k)是将X1, X 2, , X n的取值从小到大排列后第k位的值。
(6)样本中位数
X


X
(
n1) 2

1 2
(
X
(
n 2
)

X ( n 1) ) 2
n为奇数 n为偶数
R软件用函数median(x)计算样本中位数。
(7)样本极差 RnX X (n) X (1) R软件用max(x) min(x)计算样本极差。
x2, … , xn),称为样本观测值。称 ( X1, X2, …, Xn )为
样本,n为样本容量.
概率论与数理统计
第六章 数理统计的基本概念
第9页
个体的二重性:
从总体X中抽取一个个体(但抽取个体的试验未结束,或理解
为试验是形式上的),该个体的值是不确定的,此时抽取的个体
仍用随机变量Xi 表示,它和总体X同分布;
第六章 数理统计的基本概念
第10页
根据随机变量独立性定义及独立随机变量的分布函数 和密度函数的定理,有 命题6.1.1 设总体X~F( ·,θ), (X1 , X2 , … , Xn)为其样本, 则
FX1 ,X2 , , Xn (x1, x2, , xn; θ) FX1 (x1, θ)FX2 (x2, θ) FXn (xn, θ)
概率论与数理统计
第六章 数理统计的基本概念
第3页
用局部推断整体,这就使得数理统计所作 推断的结论不可避免地存在偏差或错误,而刻 画或把握这种偏差的有效方法就是概率论。概 率论通过给出各种各样的统计量所服从的分布 或数字特征,来演绎地评价各种统计方法的优 劣或置信程度。
概率论与数理统计
第六章 数理统计的基本概念

数理统计的基本概念PPT精品文档40页

数理统计的基本概念PPT精品文档40页

则样本的联合分布为
n
n
P { X 1 x 1 ,X 2 x 2 , ,X n x n } P { X i x i} p i.
i 1
i 1
§6.2 抽样分布
6.2.1 统计量的概念
由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。
统计量的分布称为抽样分布,下面介绍来自正 态总体的几个重要统计量的分布,称为统计学的三 大分布: 2 分布,t分布和F分布.
6.2.2 χ 2 分布
定义4: 设 X1, X2, …, Xn 是来自总体 N(0, 1), 的样本,则称统计量
与总体X具有相同的概率分布,则称随机变量 X1,X2, ,Xn为来自总体X的容量为n的简单随机 样本,简称样本.
它们的 x1,x观 2, ,x 察 n称值 为,样 又本 称值 为 X的 n个独立 . 的观察值
注意:样本的二重性。
6.1.2 样本的分布 样本 X1,X2,…,Xn 可以被看作n维随机向量,自
定义2:设 X1,X2, ,Xn是来自总体X的样本, g(X 1,X 2, ,X n)是样本 X1,X2, ,Xn的函数,如果 g(X 1,X 2, ,X n)中不包含任何未知参数,则称它
是一个统计量。
定义3:几个常用的统计量
样本均值
X

1 n
n i1
Xi
反映总体 均值的信息
样本方差 S2n11in1(Xi X)2n11(in1 Xi2nX2)
200 20 00 20 00 20 00 20 00 20 000

数理统计的基本概念课件

数理统计的基本概念课件

离散程度
通过方差、标准差等指标 来描述数据的离散程度, 反映数据的变化程度。
数据的中位数、均值和众数
中位数
将数据按照大小顺序排列,处于 中间位置的数值即为中位数。中 位数可以反映数据的集中趋势和
离散程度。
均值
将所有数据相加后除以数据个数 ,得到的数值即为均值。均值可 以反映数据的集中趋势和离散程
度。
拟合优度
决定于所选择的非线性函数形式,常 用的有R²和SSPE(残差平方和)。
显著性检验
一般采用基于参数的假设检验和似然 比检验。
THANKS FOR WATCHING
感谢您的观看
05
假设检验
假设检验的基本思想
统计假设
假设检验的核心是对提出的问题(即假设)进行统计推断,先假设所要考察的 总体参数按某种规律或分布(即统计模型)分布,然后根据样本信息对原假设 进行检验。
假设检验的基本步骤
首先提出假设,然后收集样本数据,接着根据样本数据对原假设进行检验,最 后根据检验结果做出结论。
多元线性回归分析
• β0: 截距 • β1, β2, ...: 斜率
• ε: 误差项
多元线性回归分析
拟合优度
R²,表示模型解释因变量的方差的比例 。
VS
显著性检验
整体显著性检验(F检验)和单个变量的 显著性检验(t检验)。
非线性回归分析
定义
非线性回归分析是研究非线性关系的 统计方法。
模型
Y = f(X) (其中 f 是非线性函数)
• β0: 截距
一元线性回归分析
01
• β1: 斜率
02
• ε: 误差项
03
04
拟合优度:R²,表示模型解 释因变量的方差的比例。

数理统计的基本概念

数理统计的基本概念

且相互独立
X / n X ~ t ( n 1) ( n 1) S 2 S / n 2 ( n 1)
说明:
X ~ N ( , 2 )
X 已 知 : U ~ N (0,1) / n
1. 未知, X
X 未知: t ~ t (n 1) S/ n
2
估计
EX
1 n 2 估计 ( 2) 样 本 方 差 S : ( Xi X ) n 1 i 1
DX
n 1 : ( X1 X ) ( X 2 X ) ( X n X ) 0
受到1个约束,独立的变量个数为n-1
( 3) 样本标准差 : S
1 n 估计 ( X i X )2 n 1 i 1
Y X X X ~ (n)
2 1 2 2 2 n 2
n
独立的r.v. 的个数
2
(4) 分位点 ( n)
P (n) n
2 2


X 轴上的一个数
P (n) n
2 2


2 (n )
2 ( n) 有表可查(P217附表5)
n1 1 2
n1 1 n2
y

n1 n2 2
,
y0
(2)构造性定理
设 X ~ 2 ( n1 ), Y ~ 2 ( n2 ), 相互独立,则有
X / n1 F ~ F ( n1 , n2 ) Y / n2 1 显然, ~ F ( n1 , n2 ), 则 ~ F ( n2 , n1 ) F F (3) 分位点F ( n1 , n2 )
四. 正态总体统计量的分布Fra bibliotek前提条件:X ~ N ( , 2 ), X1 , X2 ,, Xn ~ N ( , 2 ), 相互独立

数理统计基本概念

数理统计基本概念
1 f (X i , X j ) (X i X j )2 2
S n2
1 C n2

i j
f (X i, X j)
1 ( X i X j )2 n ( n 1) i j
1 [ ( X i2 X 2 j ) 2 X i X j ] n ( n 1) i j i j 1 {( n 1) X i2 [( n X ) 2 X i2 ]} n ( n 1) 1 { X i2 n X 2 } n 1
22
(2) t分布
①定义1.2.3:设X~N(0,1), Y ( n) ,且X与Y独立, 则称随机变量 X T Y n 所服从的分布为t分布,记为T~t(n),称n为自由度.
2
(3)F分布
①定义1.2.4:设 X 2 (n) , Y 2 ( m ) , 且X与Y独立,则称随机变量
m0.25 Q1
第一四分位数 第三四分位数
17
m0.75 Q3
为该样本的 p 分位数(或 p 分位点).
m0.5 称为样本中位数, 显然有
Q1
Q3
18
3
2014-9-29
例2 设 ( X 1 , X 2 ,, X n ) 是 F(x) 的样本,
, 2
j
分别为总体均值与方差, 从中任选两个分量 X i 和 X 令
i 1 n
二、样本 为了推断总体分布及其各种特征,就必须从总体中 按一定法则抽取若干个体进行观测或试验,以获得 有关总体的信息 .这一抽取过程称为抽样 .所抽取的 部分个体称为样本,样本中个体的数目称为样本容量. 例如容量为n的样本可以看作是n维随机变量 ( X , X , , X ), 其观察值为( x1 , x2 , , xn ).

数理统计学的基本概念

数理统计学的基本概念
数理统计学是研究统计工作的一般原理与方法的科学,它主要阐述如何搜集、整理、 分析统计数据,并据此对未知参数给出估计,或做出某种统计推断.如何获取数据的阶 段称为“统计计划”,包括抽样技术、试验设计等分支;有了数据以后,通过分析数据 达到某种结论,作出某种判断的阶段称为“统计推断”,包括参数估计和假设检验两个 主要部分.
但还应注意到,如上文所指出的:因 X 估计接受的准则定为 X ≥ l1 , l1 是某选定的数,可以大于、等于或 小于 l , l1 定得大些,表示我们的检验更严格,这在对元件质量要求很高且供货渠道较 多时可能是适当的.反之, l1 定得小些,表示检验更宽,这在对元件质量要求不很高, 或急需这些元件而供货渠道很少时,也可能采取.从统计上说,无论你怎么定 l1 ,理论 上你都可能犯两种错误之一:一是元件平均寿命达到要求而你拒收,一是元件平均寿命
数理统计学是一门应用性很强的学科,有其方法、应用和理论基础.在西方,“数 理统计学”一词是专指统计方法的数学基础理论那部分而言.在我国则有较广的含义, 即包括方法、应用及理论基础都在内,而这在西方是称为“统计学”.在我国,因为还 有一门被认为是社会科学的统计学存在,这两个名词的区别使用,有时是必要的.
达不到要求而你接受了,这两种错误各有一定的规律,它们在很大程度上决定了接受准
则 X ≥ l1 中的 l1 选择.
153
第二个问题与第一个问题不同:它不是要求对分布中的未知参数作出估计,而是
要在两个决定(就本问题而言就是接受或拒收该批产品)中选择一个.这类问题称为假
设检验问题,也是数理统计的重要内容之一.
本例提出的第一个问题称为参数估计问题,因为 λ 是元件寿命分布中的一个未知
参数,而我们的问题是要估计具有决定性的一个量,即1/ λ .也可以把问题提为要求估

数理统计的基本概念PPT模板

数理统计的基本概念PPT模板
3 次序统计量和样本分布函数
例 4 设总体服从泊松分布,容量为 10 的样本观测值如下: 2,1,4,3,5,6,4,8,4,3.
试构造样本的分布函数 F10 (x) .
解 将样本的观测值由小到大排列为1 2 3 3 4 4 4 5 6 8 ,所以样本的频 率分布如表 5-1 所示.
设 X1 ,X2 , ,Xn 是总体 X 的样本,则可定义以下统计量.
(1)样本均值为
X
1 n
n i 1
Xi

(5-1)
它的观测值记为
x
1 n
n i 1
xi

数理统计的基础知识
数理统计的基本概念
1.2 参数与统计量
(2)样本方差为
S2 1 n n 1 i1
Xi X
2
1 n 1
n i 1
数理统计的基本概念
1.2 参数与统计量
由于样本具有二重性,统计量作为样本的函数也具有二重性,即 对一次具体的观察或试验,它们都是具体的数值,但当脱离具体的某 次观察或试验,样本是随机变量,因此统计量也是随机变量.
统计量是用来对总体分布参数进行估计或检验的,它包含了样本 中有关参数的信息,在数理统计中,根据不同的目的构造了许多不同 的统计量.
设 样 本 X1 ,X2 , ,Xn 的 次 序 统 计 量 为
X (1) X (2)
X(n) ,对应的样本观测值为
x(1) x(2)
x(n) ,令
0 ,x x(1) ,
1 n
,x(1)
x x(2) ,
Fn
(x)
k
n
,x(k )
x x(k 1) ,
1,x x(n) .
(5-6)

数理统计概念

数理统计概念

Example2:吸烟与肺癌的关系 • 吸烟增加患肺癌,其他癌症以及诸如心 脏病等严重疾病的危险. • 1948-1949,英国学者多尔与 希尔从伦敦20家医院中收集了709 名肺癌病人以及对照组-另709名患 肺癌者的吸烟情况的资料,按吸烟斗还 是纸烟,男或女,将烟吞进肺里与否等 指标分类.
统计结论:吸烟与患肺癌呈明显的正相关.
定义 设 ( X 1 , X 2 ,, X n )是总体X 的一个样本,
g (r , r2 , , rn ) 1
为一实值连续函数,且不含有未知参数, 则称随机变量 g ( X 1 , X 2 ,, X n ) 为统计量. 若( x1 , x2 ,, xn ) 是一个样本值, 称
g ( x1 , x2 , , xn )
数参估计(Parametric Estimation)
推断 统计学
假设检验(Hypothesis Testing) 方差分析(Analysis of variance) 回归分析(Regression)
(二) 数理统计的基本概念
总体(population)和样本(Sample)
总体 —— 研究对象全体元素组成的集合
方案1.准备600个完全相同的球,球上依次写上1-
600,放在盒中,并彻底搅乱,然后取6个球
方案2.利用“随机数表,可以从表中任意位置开 始读数(每三个数为一组)如:
537,633,358,643,982, 026,645,850,585,358, 039,624,084,...
方案3. 可利用计算机产生6个1~600间的 不同的随机整数.
(1) X 1 n
( 2) S
2
Xi
i 1
n
为样本均值

10 06 数理统计的基本概念 知识点

10 06 数理统计的基本概念 知识点

10 06 数理统计的基本概念知识网络图正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧ 主要内容一、样本我们把从总体中抽取的部分样品n x x x ,,,21 称为样本。

样本中所含的样品数称为样本容量,一般用n 表示。

在一般情况下,总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。

在泛指任一次抽取的结果时,n x x x ,,,21 表示n 个随机变量(样本);在具体的一次抽取之后,n x x x ,,,21 表示n 个具体的数值(样本值)。

我们称之为样本的两重性。

二、.统计量1.定义:称不含未知参数的样本的函数),,,(21n X X X f 为统计量2.常用统计量样本均值 .11∑==ni i x n x 样本方差∑=--=n i i x x n S 122.)(11 样本标准差 .)(1112∑=--=ni i x x n S 样本k 阶原点矩∑===n i k i k k x n A 1.,2,1,1 样本k 阶中心矩∑==-=ni k i k k x x n B 1.,3,2,)(1 μ=)(X E ,n X D 2)(σ=,22)(σ=S E ,221)(σnn B E -=, 其中∑=-=ni i X X n B 122)(1,为二阶中心矩。

三、抽样分布1.常用统计量分布(1)设n X X X ,,,21 是相互独立的随机变量,且均服从与标准正态分布)1,0(N ,则222212nn X X X X ++=,服从自由度为n 的-2χ分布,记为()n 2~χχ. (2)设()()n Y N X 2~,1,0~χ,且X 与Y 相互独立,则.n YXT =服从自由度为n 的-t 分布,记为()n t T ~.(3)设X 与Y 相互独立,分别服从自由度为1n 和2n 的-2χ分布,则1221n n Y X n Y n XF ⋅==。

数理统计的基本概念

数理统计的基本概念

i 1
若总体X是持续型r.v. ,d.f.为f(x),则样
本的联合d.f.为
n
fn( x1, x2 ,, xn ) f ( xi )
i 1
若总体X是离散型r.v. ,其概率分布为
p(x)=P(X=x),则样本的概率分布为: n
pn (x1, x2, , xn ) P(X1 x1, X2 x2, , Xn xn) p(xi ).
注:在统计研究中,人们关心总体仅仅是关心其每个 个体的一项(或几项)数量指标和该数量指标在总体中 的分布状况.这时,每个个体含有的数量指标的全体就 是总体.
样本 —— 从总体中抽取的部分个体. 用 ( X1, X 2,, X n )表示, n 为样本容量.
称 (x1, x2,为,总xn体) X 的一个容量为n
★K.皮尔森在1990年提出了检验拟合优
度的 2统计量,并证明了其极限分布就是 2分布。
★K.皮尔森的学生英国医生戈塞特1908
年导出了 t统计量的精确分布— t分布,开
创了小样本的先河。
★费希尔系统发展了正态分布总体下多 个统计量的抽样分布理论;建立了以极 大似然预计为中心的点预计理论;创立
了实验设计,并发展了对应的数据分析 办法——方差分析。
k 1
n ik e
sn
e n
k 1 ik !
i1 !i2 ! in !
其中ik (1 k n)取非负整数,sn i1 i2 in.
统计推断:运用总体的样本信息对未知的总
体分布进行推断。
总体、样本及样本值间的关系
总体(理论分布)?
样本值
样本
样本是联系两者的桥梁
总体分布决定了样本取值的概率规律,也就 是样本取到样本值的规律,因而能够由样本 值去推断总体.

数理统计的基本知识概要课件

数理统计的基本知识概要课件
数理统计的基本知识概要课 件
目录
• 数理统计的基本概念 • 数据的收集与整理 • 数据的描述性分析 • 概率论基础 • 参数估计与假设检验 • 数理统计的应用领域
01
数理统计的基本概念
统计学的定义与分类
统计学是一门研究如何从数据 中获取有用信息的科学。
02
统计学的分类
01
统计学的定义
描述统计学和推断统计学是统计 学的两大分支。
全概率公式与贝叶斯公式
全概率公式用于计算一个事件的概率,贝叶斯公式则用于在已知一 些事件发生的条件下计算另一个事件的概率。
大数定律与中心极限定理
大数定律
在大量重复试验中,频率稳定地 趋近于概率。
中心极限定理
在满足一定条件下,随机变量的 分布可以近似为正态分布。
05
参数估计与假设检验
参数估计的基本原理与方法
员了解和控制疾病的传播。
生物信息学
生物信息学是数理统计在医学领 域的一个重要应用方向,通过数 据分析和建模,可以揭示基因组 、蛋白质组等生物信息中的规律
和奥秘。
环境领域的应用
环境监测和评估
环境领域的数据分析需要大量的数理统计方法,例如,通 过空气、水质等环境数据的统计分析,可以评估环境污染 的程度和影响。
3
方差分析的步骤
计算平方和、计算自由度、计算均方、计算F值 、判断显著性等。
06
数理统计的应用领域
金融领域的应用
01
投资组合优化
数理统计可以帮助金融分析师进行投资组合的优化,通过数据分析和建
模,确定最佳的投资组合配置,以实现更高的回报和更低的风险。
02 03
风险管理
数理统计在金融领域中也被广泛应用于风险管理,例如,通过历史数据 的统计分析,可以预测和评估潜在的市场风险,从而制定相应的风险应 对策略。

《数理统计基本概念》课件

《数理统计基本概念》课件

不可能事件
概率等于0的事件,表示一定 不会发生。
独立事件
两个事件的发生相互独立,一 个事件的发生不影响另一个事 件的发生。
随机变量及其分布
01
02
03
04
离散型随机变量
随机变量可以取到有限个或可 数无穷个值。
连续型随机变量
随机变量可以取到任何实数值 。
概率分布函数
描述随机变量取值概率的函数 。
概率密度函数
确定因子、提出假设、构造统计量、 进行统计分析、做出推断结论。
方差分析的应用场景
比较不同组数据的均值差异、分析多 因素对结果的影响等。
方差分析的注意事项
满足正态性和方差齐性的假设、注意 组间和组内的比较等。
04
回归分析
一元线性回归
总结词
一元线性回归是数理统计中常用的回归分析方法,用于研究一个因变量与一个自变量之间 的线性关系。
假设检验的类型
单侧检验、双侧检验、独立样本检验、配对 样本检验等。
假设检验的基本步骤
提出假设、构造检验统计量、确定临界值、 做出推断结论。
假设检验的注意事项
避免两类错误、注意样本量和分布情况等。
方差分析
方差分析的概念
方差分析是用来比较不同组数据的变 异程度和分析变异来源的一种统计方 法。
方差分析的基本步骤
详细描述
一元线性回归分析通过最小二乘法拟合一条直线,使得因变量的观测值与自变量的预测值 之间的残差平方和最小。它可以帮助我们了解自变量和因变量之间的相关性和预测因变量 的未来值。
公式
(y = ax + b) 其中,(a) 是斜率,(b) 是截距。
多元线性回归
01
总结词

数理统计的基本概念

数理统计的基本概念

解 步骤一 在所给数据中找出最小值xmin=119,最大值xmax=184;
步骤二 确定下限 a 和上限 b,并将区间[a,b]分组
选定常数a(略小于xmin)和常数b(略大于xmax)把区间[a,b]等分成m组 ( aj-1,aj], j=1,…,
m,其中a=a0<a1<…<am=b,称 a j
− a j−1
如果总体为连续型随机变量,其概率密度函数为 f(x),则样本的联合概率密度为
n
∏ f (x1, x2 ,L, xn ) = f (xi ) 。 i =1
如果总体为离散型随机变量,其分布律为P{X=ai}=pi (i=1,2,…),则样本的联合分
布律为
n
∏ P{X 1 = x1, X 2 = x2 ,L, X n = xn } = P{X i = xi } , i =1
第六章 数理统计的基本概念
从前五章的学习中我们知道,随机变量及其概率分布全面描述了随机现象的统计规律 性。然而在实际问题中,随机变量所服从的分布未必已知,或者虽然分布已知,但不知道 其中的参数。例如,某条高速公路某一天发生的交通事故数所服从的分布,事先往往并不
知道。又如,一个地区某门课程学生的统考成绩,一般说来服从正态分布 N (μ, σ 2 ) ,但 阅卷尚在进行中,平均成绩 μ 及均方差σ 是不知道的等等。怎样才能掌握随机变量的分布
=
nj n
及频率密度值 y j
=
fj 组距
=
f j (j=1, 11
2,…,6),并列表(见表 6-3);
表 6-3
序号
组(aj-1, aj]
频数nj
频率fj
频率密度yj
1
(118.5, 129.5]

10 06 数理统计概念 key

10 06 数理统计概念 key

常见题型1、 统计量的性质例1. (01,7分)设总体)0)(,(~2>σσμN X ,从该总体中抽取简单随机样本)2(,,,221≥n X X X n ,其样本的均值∑==ni i X n X 21,21求统计量∑=+-+=ni i n i X X X Y 12)2(的数学期望E (Y )。

解:将)(,),(),22211n n n n X X X X X X +++++ (看成是取自总体)2,2(2σμN 的简单随机样本,则其样本均值为=+∑=+n i i n i X X n 1)(1X X n ni i 2121=∑=样本方差为Y n 11-,由于22)11(σ=-Y n E ,所以 22)1(2)2)(1()(σσ-=-=n n Y E例2:设总体X 服从正态分布),(21σμN ,总体Y 服从正态分布),(22σμN ,1,,21n X X X 和 2,,21n Y Y Y 分别是来自总体X 和Y 的简单随机样本, 则=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i . 答案:2σ⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡--+=∑∑==21221221221)()(2σσσn j j n i i Y Y E X X E n n221212)]1()1[(2σσ=-+--+=n n n n⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧-⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡--⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-∑∑==)1(~)(),1(~)(222121221221n Y Y n X X n j j n i i χσχσ注意: ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧-=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡--=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-∑∑==1)(,1)(2212121221n Y Y E n X X E n j j n i i σσ故 例 3. .(2011年,4分)设总体X 服从参数为)0(>λλ的泊松分布,)2(,,1≥n X X n ,来自总体的简单随机样本,则对应的统计量∑==ni i X n T 111,n n i i X n X n T 111112+-=∑-=满足( )2121,)(DT DT ET ET A >>,2121,)(DT DT ET ET B <> 2121,)(DT DT ET ET C ><,2121,)(DT DT ET ET D << 答案:D详解:),,2,1(,n i DX EX i i ===λλ故有λ==∑=n i i EX n ET 111,nEX n EX n ET nn i i λλ+=+-=∑-=111112 n DX n DT ni i λ==∑=1211,n n DX nDX n DT n n i i λλ+-=+-=∑-=11)1(121122 111-<n n,故有2121,DT DT ET ET <<,所以选择D 。

数理统计的概念

数理统计的概念
i =1 i =1 n n
= p i=1 (1 − p )
∑ xi
n
n−
∑ xi
i =1
n
例5.2 设总体X ~ e(λ ),X 1 , X 2 ,L , X n是抽自总体X 的iid 样本,求样本分布。 λe-λx x > 0 解:总体 X ~ e(λ),即有 f X (x)= x≤0 0 设样本任意一组实现为x1, x2 ,L, xn,由于样本为iid λe-λxi xi > 0 所以 f Xi (xi )= i = 1,2,L, n xi ≤ 0 0 于是,样本分布的概率密度为 n -λxi n min{ x1, x2 ,L, xn} > 0 λe 1≤i≤n f (x1, x2 ,L, xn ) = ∏ f Xi (xi ) = ∏ i =1 i =1 0 其他 n −λ ∑xi λne i=1 min{ x , x ,L, x } > 0 = 1 2 n 1≤i≤n 0 其他

i =1
n
f X i ( xi )
推断 样本实现
总体、样本、样本实现的关系 总体 样本
例5.1 设总体X 服从0 -1分布,X 1 , X 2 ,L , X n是抽自总体 X 的iid 样本,求样本分布。
解:总体X 的概率函数为P { X = x} = p x (1 − p )1− x x = 0,1 设样本任意一组实现为x1 , x2 ,L , xn,由于样本为iid 所以P { X i = xi } = p xi (1 − p )1− xi xi = 0,1 i = 1, 2,L , n 于是,样本分布的概率函数为 P {( X 1 , X 2 ,L , X n ) = ( x1 , x2 ,L , xn )} = ∏ P { X i = xi } = ∏ p xi (1 − p )1− xi

数理统计的基本概念

数理统计的基本概念

第六章 数理统计的基本概念前面五章我们讲述了概率论的基本内容,随后的五章将讲述数理统计.数理统计是以概率论为理论基础的一个数学分支.它是从实际观测的数据出发研究随机现象的规律性.在科学研究中,数理统计占据一个十分重要的位置,是多种试验数据处理的理论基础.数理统计的内容很丰富,本书只介绍参数估计、假设检验、方差分析及回归分析的部分内容.本章中首先讨论总体、随机样本及统计量等基本概念,然后着重介绍几个常用的统计量及抽样分布.第一节 随机样本假如我们要研究某厂所生产的一批电视机显像管的平均寿命.由于测试显像管寿命具有破坏性,所以我们只能从这批产品中抽取一部分进行寿命测试,并且根据这部分产品的寿命数据对整批产品的平均寿命作一统计推断.在数理统计中,我们将研究对象的某项数量指标值的全体称为总体(Population ),总体中的每个元素称为个体(Individual).例如上述的一批显像管寿命值的全体就组成一个总体,其中每一只显像管的寿命就是一个个体.要将一个总体的性质了解得十分清楚,初看起来,最理想的办法是对每个个体逐个进行观察,但实际上这样做往往是不现实的.例如,要研究显像管的寿命,由于寿命试验是破坏性的,一旦我们获得实验的所有结果,这批显像管也全烧毁了,我们只能从整批显像管中抽取一部份显像管做寿命试验,并记录其结果,然后根据这部份数据来推断整批显像管的寿命情况.由于显像管的寿命在随机抽样中是随机变量,为了便于数学上处理,我们将总体定义为随机变量.随机变量的分布称为总体分布.一般地,我们都是从总体中抽取一部分个体进行观察,然后根据所得的数据来推断总体的性质.被抽出的部分个体,叫做总体的一个样本.所谓从总体抽取一个个体,就是对总体X 进行一次观察(即进行一次试验),并记录其结果.我们在相同的条件下对总体X 进行n 次重复的、独立的观察,将n 次观察结果按试验的次序记为X 1,X 2,…,X n .由于X 1,X 2,…,X n 是对随机变量X 观察的结果,且各次观察是在相同的条件下独立进行的,于是我们引出以下的样本定义.定义6.1 设总体X 是具有分布函数F 的随机变量,若X 1,X 2,…,X n 是与X 具有同一分布F (x ),且相互独立的随机变量,则称X 1,X 2,…,X n 为从总体X 得到的容量为n 的简单随机样本(Random sample ),简称为样本.当n 次观察一经完成,我们就得到一组实数x 1,x 2,…,x n .它们依次是随机变量X 1,X 2,…,X n 的观察值,称为样本值.对于有限总体,采用放回抽样就能得到简单样本,当总体中个体的总数N 比要得到的样本的容量n 大得多时(一般当nN ≥10时),在实际中可将不放回抽样近似地当作放回抽样来处理.若X 1,X 2,…,X n 为总体X 的一个样本,X 的分布函数为F (x ),则X 1,X 2,…,X n的联合分布函数为F *(x 1,x 2,…,x n )=∏=ni i x F 1)(.又若X 具有概率密度f ,则X 1,X 2,…,X n 的联合概率密度为f *(x 1,x 2,…,x n )=∏=ni i x f 1)(.我们在搜集资料时,如果未经组织和整理,通常是没有什么价值的,为了把这些有差异的资料组织成有用的形式,我们应该编制频数表(即频数分布表).例6.1 某工厂的劳资部门为了研究该厂工人的收入情况,首先收集了工人的工资资料,表6-1记录了该厂30名工人未经整理的工资数值:表6-1资料,这些数据可以记为x 1,x 2,…,x 30,对于这些观测数据,第一步 确定最大值x max 和最小值x min ,根据表6-1,有x max =640,x min =420.第二步 分组,即确定每一收入组的界限和组数,在实际工作中,第一组下限一般取一个小于x min 的数,例如,我们取400,最后一组上限取一个大于x max 的数,例如取650,然后从400元到650元分成相等的若干段,比如分成5段,每一段就对应于一个收入组.表6-1资料的频数分布表如表6-2所示.表6-2图6-1为了研究频数分布,我们可用图示法表示.直方图直方图是垂直条形图,条与条之间无间隔,用横轴上的点表示组限,纵轴上的单位数表示频数.与一个组对应的频数,用以组距为底的矩形(长条)的高度表示,表6-2资料的直方图如图6-1所示.上述方法我们对抽取数据加以整理,编制频数分布表,作直方图,画出频率分布曲线,这就可以直观地看到数据分布的情况,在什么范围,较大较小的各有多少,在哪些地方分布得比较集中,以及分布图形是否对称等等,所以,样本的频率分布是总体概率分布的近似. 样本是总体的反映,但是样本所含的信息不能直接用于解决我们所要研究的问题,而需要把样本所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题.针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.定义6.2 设X 1,X 2,…,X n 是来自总体X 的一个样本,g (X 1,X 2,…,X n )是X 1,X 2…,X n 的函数,若g 中不含任何未知参数,则称g (X 1,X 2,…,X n )是一个统计量(Statistic ). 设x 1,x 2,…,x n 是相应于样本X 1,X 2,…,X n 的样本值,则称g (x 1,x 2,…,x n )是g (X 1,X 2,…,X n )的观察值.下面我们定义一些常用的统计量.设X 1,X 2,…,X n 是来自总体X 的一个样本,x 1,x 2,…,x n 是这一样本的观察值.定义样本平均值∑==ni iX nX 11;样本方差S 2=2221111()11nn i i i i X X X n X n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑; 样本标准差S =∑=--=ni iX X n S122)(11;样本k 阶(原点)矩A k =∑=ni kiX n11,k =1,2,…;样本k 阶中心矩B k =∑=-ni kiX X n1)(1,k =1,2,….它们的观察值分别为∑==ni ix nx 11;s 2=2221111()11nn i i i i x x x n x n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑s =∑=--ni ix x n 12)(11;a k =∑=ni ki x n11, k =1,2,…;b k =11()nkii xx n=-∑, k =1,2,….这些观察值仍分别称为样本均值、样本方差、样本标准差、样本k 阶矩、样本k 阶中心矩.。

数理统计的基本概念

数理统计的基本概念

数理统计的基本概念6 数理统计的基本概念基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。

能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。

2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。

3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。

4 理解样本均值、样本方差及样本矩的概念。

了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。

了解正态总体的某些常用抽样分布。

疑难解答1、采用抽样的方法推断总体,对样本应当有怎样的要求?答:为了对总体X的分布进行研究,逐个研究每个个体是不现实的。

采用抽样推断总体,其出发点是利用局部认识整体,因此抽出的样本要具有代表性。

即要求每个个体被抽取的机会均等,并且抽取一个个体后总体成分不变。

首先要求抽样具有“随机性”,第一次抽取的样品X1的可能取值应与总体的可能取值是完全一样的,且去取个个值的概率相同。

因此,X1是一个随机变量,并且是与X同分布的随机变量。

其次,应具有“独立性”,第一次抽样不改变总体成分,第二次抽取的样品X2可能的值也与X完全一样,且取值的概率也是相同的,因此X2也是与X同分布的一个随机变量且与X1是相互独立的,同样道理,X3,X4,…,X n都是与X同分布的随机变量,并且X1,X2,…,X n是一组相互独立的随机变量,故要求X1,X2,…,X n 是简单随机样本。

2、什么是简单随机样本?在实践中如何获得简单随机样本?答:设X1,X2,…,X n是来自总体X的容量为n的样本,如果它满足以下两个条件,则称它为简单随机样本:(1)X1,X2,…,X n与总体X具有相同的分布(2)X1,X2,…,X n相互独立由简单随机样本的定义知,用简单随机样本研究总体,可以更好地用概率论中独立条件下的一系列结论,正是这些结论为概率统计提供了必要的理论基础。

一般说来,对总体进行独立重复观测,便可以获得简单随机样本。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常见题型
1、 统计量的性质
例1. (01,7分)
设总体)0)(,(~2>σσμN X ,从该总体中抽取简单
随机样本)2(,,,221≥n X X X n ,其样本的均值∑==n
i i X n X 21,21求统计量∑=+-+=n
i i n i X X X Y 12)2(的数学期望E (Y )。

解:将
)(,),(),22211n n n n X X X X X X +++++ (看成是取自总体)2,2(2σμN 的简单随机样本,则其样本均值为=+∑=+n i i n i X X n 1)(1X X n n
i i 2121
=∑=
样本方差为
Y n 11-,由于22)1
1
(σ=-Y n E ,所以 22)1(2)2)(1()(σσ-=-=n n Y E
例2:设总体X 服从正态分布),(21σμN ,总体Y 服从正态分布
),(22σμN ,1,,21n X X X 和 2,,21n Y Y Y 分别是来自总体X 和Y 的简单随机样本,

=⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i . 答案:2σ
⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡--+=∑∑==212212
212
21)()(2σσσn j j n i i Y Y E X X E n n
221212
)]1()1[(2
σσ=-+--+=
n n n n
⎪⎪⎭
⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧-⎥⎥⎥⎥
⎦⎤⎢⎢⎢⎢⎣⎡--⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-∑∑==)1(~)(),1(~)(222
1212212
2
1n Y Y n X X n j j n i i χσχσ注意: ⎪⎪⎭
⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧-=⎥⎥⎥⎥
⎦⎤⎢⎢⎢⎢⎣⎡--=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-∑∑==1)(,1)(2212121
22
1n Y Y E n X X E n j j n i i σσ故 例 3. .(2011年,4分)设总体X 服从参数为)0(>λλ的泊松分布,
)2(,,1≥n X X n ,来自总体的简单随机样本,则对应的统计量∑==n
i i X n T 111,
n n i i X n X n T 11111
2+-=∑-=
满足( )
2121,)(DT DT ET ET A >>,2121,)(DT DT ET ET B <> 2121,)(DT DT ET ET C ><,2121,)(DT DT ET ET D <<
答案:D
详解:),,2,1(,n i DX EX i i ===λλ故有
λ==∑=n i i EX n ET 111,n
EX n EX n ET n
n i i λλ+=+-=∑-=111112 n DX n
DT n
i i
λ
==∑=1
2
11,n n DX n
DX n DT n n i i λ
λ+-=+
-=∑-=11)1(1
2
1
1
22 1
1
1-<n n
,故有2121,DT DT ET ET <<,所以选择D 。

2、 统计量的分布
例4. (03,4分) 设随机变量21
),1)((~X
Y n n t X =
>,则
(A ))(~2b Y χ (B ))1(~2-n Y χ (C ))1,(~n F Y
(D )),1(~n F Y
答案:C 因为相互独立且其中V U n V N U n t n
V U X ,),(~),1,0(~),(~/2χ=
又由)1(~),1,0(~22χU N U 相互独立且V U ,2
)1,(~1
//122n F U n V X Y ==
例6.3:设总体X ~N (0,12),从总体中取一个容量为6的样本),,,(621X X X ,设26542321)()(X X X X X X Y +++++=,试确定常数C ,使随机变量CY 服从2χ分布。

解:因为各i X 相互独立,所以)3,0(~),3,0(~654321N X X X N X X X ++++
),
1,0(~3
3
21N X X X ++),1,0(~3
6
54N X X X ++
26542321)()(X X X X X X Y +++++=
+++=23
21)3
[(
3X X X ])3
(
26
54X X X ++
Y 31+++=2321
)3(X X X 2654)3
(X X X ++)(2~2
χ 故3
1
=
C 例5. (97,3分) 设随机变量X 和Y 相互独立且都服从正态分布)3,0(2N ,,而921921,,,,,Y Y Y X X X 和分别是来自总体X 和Y 的简单随机样本。

则统计量
29
2
1
91X Y
Y X U ++++=
服从 分布,参数为 。

答案:t,9
)1,0(~)9191N X X ++ (,)9(~)9
122
921χY Y ++ (
)(81
1)
X (91
292191Y Y X U ++++= )9(~X 2
9
219
1t Y Y X ++++=。

相关文档
最新文档