数理统计1
《数理统计》测验卷一答案
1 •设随机变量X「X2,…,X10相互独立,且;■ 0,有___________10A. P{P' X i一1 I::: ;} _1 一丫i 410C. P{P X i -10卜:;} _1 -20 ;'i 4EX i =1 , DX i = 2 ( i = 1,2,…,10 ),则对于任意给定的C10P{| a X i -1 卜:;}乞1 一;'i 410D. P{p' X i -1卜:;}乞1 -20;‘i丄B.A岀现的次数, p是事件A在每次试验中出现的概率,则对于任意,广>0,均有lim P j—-p< ®n_jpc n:2 •设」n是n次重复试验中,事件A. = 0B. = 1 3•设X1, X2,…,X n是来自总体1 n nA—、X i2 B. ' (X j」)2 n i 4 i 1C. 02N (•仁)的样本,D.不存在J为未知参数,则是一个统计量。
D. (X r二)2 t 24. X“X2,…,X n是来自总体的样本,记A.样本矩B.二阶原点矩5 •设总体X在区间[-1,1]上服从均匀分布,1 n—X i的方差D(X) = __________n i 11 nX为样本均值,则 -n -1 TC.二阶中心矩D.统计量X1 , X 2^ , X n为其样本,(X i -X)2则样本均值A. 01B.-31C.—3nD. 3166. X i,X2,…,X i6是来自总体X ~A. t(15)B. t(16) 7•设X「X2,…,X n是来自总体XA. 2(n -1)B. 2(n)2--------------------- 1N(2,二)的一个样本,X X i,则16 yD. N(0,1)n __2 、(X i -X) 丫二丄二2Acr 2 D. N(=) n1n2二乙、(X i -)24X -8C. 2 (15)〜N(亠二2)的样本,C. N(Y2)8 •设总体X〜),X1, X2/ ,X n为其样本,则A. 2(n -1)B. 2(n)C. t(n _1),其中X为样本均值,则服从分布9 •设总体X ~ N(」F2),X1,X2,…,X n为其样本,D.t (n)1 nX X in i彳B1n二丄7 (X i _x)2,则n u丫二n - 1(X -)服从的分布是S nA. (n -1)B. N(0,1)C. t(n -1)D.t(n)22 210 •设总体X ~ N(0,匚),匚为已知常数,X i , X 2,…,X n 为其样本,二1^ X i 为样本均值,则服 n i 丄2 从 分布的统计量是 ,(其中 So X - 1 A. SCn C. 1 n 2(X i —X)2 )o n i 41 n 2、(X i -X) CT i 4 11 •若X i ,X 2,…,X n 是来自总体N(0,1)的一个样本,则统计量 n D” i 二 X a 2 (X i -X)2 X ; (n-1)X 12D. F(n,1) X ;A. 2(n -1)B. 2(n) 12 •两种水稻的亩产量分别为 X 与丫,(X 1,X 2,…,X n )、(丫1,丫2,…,Y n )为分别来自总体 X 、丫的样本, 且 E(X)二丄1 , D(X)=G 2, E(Y)^2, D(Y)=/ , CA.叫乞込 13 •矩估计必然是A.无偏估计C. F(n _1,1) 当条件 满足时,品种X 不次于品种Y 。
概率论与数理统计总结1
三Байду номын сангаас 事件间的关系与运算
1. 包含关系: 若事件发生必然导致事件发生 B A或A B 2. 相等关系: A B 且B A 3. 事件的和 ( A B ) :A 与 B 至少有一个发生构成的事件 4. 事件的积 ( A B , 或AB) : A与B 同时发生构成的事件 5.互不相容事件(互斥事件) :A 与 B 不能同时发生,即 AB=
二. 条件概率
在实际问题中, 常常需要计算在某个事件 B 已发生的条件下,, 另一个事件 A 发生的概率 。 在概率论中,称此概率为事件 B 已发生的条件下事件 A 发生的条件概率,记为 P( A | B ) 。 一般地,因为增加了“事件 B 已发生”的条件,所以 P( A | B ) P ( A) 。
下面举例引出条件概率的定义. 例 1 某工厂有职工 500 人,男女各占一半,男女职工中技术优秀的分别为 40 人与 10 人。 现从中人选一名职工,试问: (1) 该职工为技术优秀的概率是多少? (2) 已知选出的是女职工,她为技术优秀的概率是多少? 解 设 A 表示选出的职工为技术优秀的事件, B 表示选出的是女职工的事件。 40 10 1 (1) P( A) 500 10 10 1 (2) P( A | B ) 250 25 显然, P( A) P( A | B) 。这是因为限制在 B 已发生的条件下求 A 的概率的缘故。 10 10 500 P( AB) 另外,可由 P( A | B ) 250 250 P( B ) 500 推得一般情况下条件概率的定义. 设实验的基本事件总数为 n ,事件 B 所包含的基本事件数为 m B , 事件 AB 所包含的基本事件数为 m B ,则有
i 1 i 1 n n
数理统计作业1 张彦
统计学01班 张彦 201121861.举例说明什么是分布的位置参数,尺度参数和形状参数.解:韦伯分布得三个参数分别由位置参数,尺度参数和形状参数决定,其中形状参数最重要,韦伯分布用于研究元件寿命与疲劳程度. 韦伯分布的密度函数和分布函数分别为:c bux t c e b a x b c x f ---⎪⎭⎫⎝⎛-=.)(1c b a x ex F ⎪⎭⎫ ⎝⎛---=1)(其中a,b,c 分别代表位置参数,尺度参数和形状参数。
a 表示X 变量的可能最小值,b 确定其尺寸的大小,c 确定其形状2.查阅资料,列举至少两个厚尾分布。
给出这些分布的密度函数表达或图形,分析分布特征参数对密度曲线的影响,指出应用领域或应用问题。
解:厚尾分布: 从图形上说,较正态分布图的尾部要厚,峰处要尖。
直观些说,就是这些数据出现极端值的概率要比正态分布数据出现极端值的概率大。
(1)股票变化的厚尾性,从网上搜集到上海,深圳的股票数据数据是上海、深圳证券交易所的每日股价指数:上海市选用上证A 股指数每日收盘指数,样本区间为2012年11月至2013年九月;深圳市选用深证A 股指数每日收盘指数,样本区间同上海市一样。
股票收益率民定义为:,其中Pt表示t时期的股价指数,Pt-1表示滞后一期的股价指数样本数均值标准差偏度峰度上海222 2177.068 125.061 -0.01794 -1.0363深圳222 7.100 1.64342 1.30272 0.65979从偏度和峰度数值可以看出,股票收益分布较正态分布有偏且有狭峰,呈厚尾特征。
在R 软件中作图应用于股票市场中:厚尾性越大说明状态持续性越强,在预测股价趋势时历史信息越重要。
对投资者来说,能否以及如何从股票市场上获取最大收益,在一定程度上依赖于投资者对股票市场特性的深刻认识。
如果我们接受收益服从稳态分布的假设,那么就意味着方差将不存在,从而基于方差一协方差的资产选择理论就必须加以修正,这样所要选择的分布就应允许分布具有狭峰特性。
第六章 数理统计的基本概念(1)
XK
1 n
n i 1
X
k i
(4)样本k阶中心矩:
1 n
n i 1
(Xi
X )k
(5)顺序统计量: X(1) X(2) X(n) . 其中 X(k) 为将 X1, X2 , , Xn 从小到大排列第 k 位值.
18 September 2020
概率论与数理统计
理学院数学系
2、离散型 设总体X的分布律为 P{ X x} p( x)
则样本X1, X2 ,的, 联Xn合分布律为 P{ X1 x1, X2 x2 ,, Xn xn } p( x1 ) p{ x2 ) p( xn )
18 September 2020
概率论与数理统计
理学院数学系
样本分布
第六章 数理统计的基本概念
(1)样本均值:
X
1 n
n i 1
Xi
(2)样本方差:
Sn2
1 n
n
(Xi
i 1
X )2
修正样本方差:
Sn*2
1 n1
n i 1
(Xi
X )2
nSn2 (n 1)Sn*2
18 September 2020
概率论与数理统计
理学院数学系
第六章 数理统计的基本概念
第22页
(3)样本k阶原点矩:
第13页
1、样本的联合分布函数 设总体 X 的分布函数为 FX (., ), (X1, X2 ,
则样本的联合分布函数为
, Xn ) 为样本.
FX1,X2 , ,Xn ( x1, x2 , , xn ; ) FX ( x1, )FX ( x2 , ) FX ( xn , )
01第一章 数理统计的基础知识
为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干 个体进行观察,称为抽样。
2
第一章 数理统计的基础知识
第一节 总体与样本
一 . 总体与样本
定义1:研究的对象称为总体,总体往往以某一项数量指标为其特征。实 际上总体就是一个随机变量 X 。
为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干 个体进行观察,称为抽样。 定义2:从总体中抽取的 n 个个体 (X1,X2,…,Xn) 称为样本,实际上样本就 是一个 n 维随机变量(或向量)。
简单随机样本: (X1,X2,…,Xn) 是相互独立的随机变量(独立性);且 Xi ~ X (同分布) 。 样本容量 n:样本中所含个体数目,为已知的一个自然数。 样本观察值: (X1,X2,…,Xn) = (x1,x2,…,xn)
上例中,若某次抽样得: (X1,X2,X3,X4,X5) = (0,0,1,0,1)
P(Y 15) f ( y)dy
15
10 0 15 20 y y 1 3 7 dy dy 10 100 100 2 8 8
例3:设总体 X ~ b(1,p)。现从中抽取容量为 2 的样本,得到样本 (X1, X2),求样本的函数 Y = X12 + X22 的概率分布,并求出事件 P(Y < 15) 的概率。
i 1 n
如上例:总体 X ~ b(1,p),概率分布为:P(X = x) = (1 – p)1 – x p x (x = 0,1) 则样本 (X1,X2,…,Xn) 的联合分布为:
P( X 1 x1 , X n xn ) p x1 (1 p)1 x1 p xn (1 p)1 xn p i1 (1 p)
高等数学 概率论与数理统计课件(一)
高等数学概率论与数理统计课件(一)高等数学概率论与数理统计课件1. 课程简介•高等数学概率论与数理统计是大学数学专业的一门重要课程。
•它是数学学科的基础,也是应用数学的重要工具。
•本课程旨在帮助学生掌握概率论与数理统计的基本概念、理论和方法。
2. 概率论部分2.1 概率的基本概念•概率的定义和性质•随机事件的概率计算方法•条件概率与独立事件2.2 随机变量和概率分布•随机变量的定义和性质•离散型随机变量和连续型随机变量•常见概率分布:离散型和连续型2.3 随机变量的数字特征•期望、方差、标准差的定义和计算•切比雪夫不等式•大数定律和中心极限定理3. 数理统计部分3.1 统计基础•总体和样本的统计特征•参数估计和区间估计•假设检验的基本思想3.2 参数估计•点估计和区间估计的概念•常见的参数估计方法:极大似然估计、矩估计等•置信区间的计算和解释3.3 假设检验•假设检验的基本原理•假设检验的步骤和流程•常见的假设检验方法:单样本、两样本和多样本检验4. 课程学习方法•注重理论和实践相结合,理论指导实践、实践检验理论。
•多做习题,通过刷题巩固知识点。
•参考相关教材和参考书,拓宽知识广度和深度。
•加强课后讨论和交流,与同学共同解决问题。
•关注概率论与数理统计的应用领域,扩展应用实践。
5. 课程考核方式•平时成绩:课堂参与、作业完成情况等。
•期中考试:对课程前半部分的知识进行考核。
•期末考试:对整个课程的知识进行考核。
•课程项目:根据实际情况进行论文、实验等形式进行综合评估。
6. 学习资源推荐•《高等数学》教材,北京大学出版社。
•《概率论与数理统计教程》教材,清华大学出版社。
•《概率论与数理统计习题集》辅导书,高等教育出版社。
•在线学习资源:Coursera、edX、网易云课堂等平台提供的相关课程。
7. 小结•高等数学概率论与数理统计课程是数学专业学生不可或缺的重要课程。
•本课程旨在帮助学生掌握概率论与数理统计的基本概念、理论和方法。
数学的数理统计学
数学的数理统计学数理统计学是一门应用数学的分支学科,旨在研究数据的收集、分析和解释。
它是现代科学、工程和社会科学中必不可少的工具之一。
本文将从数学的角度出发,介绍数理统计学的基本概念、方法和应用。
一、基本概念数理统计学的基本概念包括总体、样本、随机变量和概率分布等。
总体是指研究对象的全体,样本则是从总体中选取的一部分个体。
随机变量是描述随机现象的数值特征,概率分布则描述了随机变量的取值规律。
二、数据的收集与描述在数理统计学中,收集和描述数据是关键的一步。
常见的数据收集方法包括抽样调查、实验和观测等。
而对数据进行描述的手段主要有集中趋势度量和离散程度度量。
集中趋势度量包括均值、中位数和众数等,用于反映数据的中心位置;离散程度度量包括方差、标准差和变异系数等,用于反映数据的离散程度。
三、概率与概率分布概率是数理统计学的重要概念之一,用来描述随机现象发生的可能性。
概率分布则用于描述随机变量的取值规律。
常见的概率分布包括正态分布、二项分布和泊松分布等。
正态分布是一种重要的连续型概率分布,其以钟形曲线为特征,广泛应用于自然科学和社会科学领域。
二项分布和泊松分布则常用于描述离散型随机变量的概率分布。
四、参数估计与假设检验参数估计与假设检验是数理统计学中的核心内容。
参数估计是根据样本数据对总体参数进行估计,常用的方法包括点估计和区间估计。
假设检验则是用于判断总体参数是否满足某个假设,常用的方法包括单样本假设检验、双样本假设检验和方差分析等。
五、回归与相关分析回归分析是研究两个或多个变量之间关系的统计方法。
简单线性回归分析用于描述两个变量之间的线性关系,多元线性回归分析则考虑多个自变量对因变量的影响。
相关分析则用于描述两个变量之间的相关程度,常用的是皮尔逊相关系数。
六、应用领域数理统计学在各个领域都有广泛的应用。
在自然科学方面,数理统计学可以帮助分析实验数据,验证理论模型。
在工程领域,数理统计学可以应用于质量控制、可靠性分析等。
第二章 数理统计的基本概念1
样本极差
它反映了总体取值 悬殊程度的信息
R = X ( n ) − X (1)
样本中位数
n为奇数 X (( n +1) / 2 ) , M c = 1 2 ( X ( n / 2 ) + X ( n / 2+1) ), n为偶数
■样本 为推断总体分布及各种特征, 为推断总体分布及各种特征,随机地从总体 中抽取若干个体进行观察试验, 中抽取若干个体进行观察试验,这一抽取过程称 为 “抽样”,所抽取的部分个体称为样本 样本 抽样” 所抽取的部分个体称为样本. 样本 中所包含的个体数目称为样本容量 样本容量. 中所包含的个体数目称为样本容量 容量为n的样本可以看作 维随机变量 容量为 的样本可以看作n维随机变量 的样本可以看作 (X1,X2,…,Xn) 一旦取定一组样本,得到的是 个数 一旦取定一组样本,得到的是n个数 (x1,x2,…,xn), , 称为样本的一次观察值,简称样本观测值 称为样本的一次观察值,简称样本观测值 .
F= Y n2
服从自由度为n 分布, 服从自由度为 1及 n2 的F分布,n1称为第一自 分布 由度, 称为第二自由度, 由度,n2称为第二自由度, 例6 设 X 1 , X 2 , L, X 15 是总体 X ~ N (0,2 ) 的样本, 试问统计量 10
Max=1572, Min=738, 组数 组数=6 组距=(Max-Min)/6=139 140 组距 取a0=735, 则分组区间及相关数据如下
组序 1 2 3 4 5 6 合计 分区区间 (735,875] (875,1015] (1015,1155] (1155,1295] (1295,1435] (1435,1575] 频数 6 8 9 4 2 1 30 频率 0.2 0.27 0.3 0.13 0.07 0.03 1 累计频率 0.2 0.47 0.77 0.9 0.97 1.0
数理统计1
中国海洋大学本科生课程大纲课程属性:公共基础/通识教育/学科基础/专业知识/工作技能,课程性质:必修、选修一、课程介绍1.课程描述:数理统计是数学的一个重要分支,它研究怎样有效地收集,整理和分析带有随机性的数据,以对所考察的问题做出推断或预测,直至采取一定的决策和行动提供依据和建议。
本课程是低年级数学类专业学生必修的一门重要的专业课,是在概率论基础上对统计基础理论的专门研究,是所有统计课程的理论出发点。
通过本课程的学习,使学生理解数理统计的基本概念,掌握点估计、区间估计及假设检验的思想和方法步骤,了解方差分析、回归分析的思想;能够用一些基本的统计方法处理较简单的实际问题。
同时也为进一步学习高等数理统计理论、统计软件的使用打下扎实基础。
2.设计思路:本课程引导低年级数学类专业学生通过数理统计来探讨和理解由实际问题所驱动的数学在理论和应用两方面的发展途径。
课程内容的选取基于学生“掌握了数学分析、高等代数和概率论等基本内容”。
课程内容包括四个模块:参数估计、假设检验、方差分析和正交试验设计及线性回归分析;这四个方面相互关联,能够体现数理统计学的基本特征。
统计推断是利用样本(子样)提供的信息对总体的某些统计特征进行估计或判断,从而认识总体,参数估计是统计推断的一种基本形式。
课程以参数估计为中心展开,包括点估计的常用方法、评价估计好坏的标准、统计量的充分性与完备性、区间估计、贝叶斯估- 1 -计,每部分均配有具体例题分析。
假设检验是统计推断的另一个重要组成部分,其基本原理是对总体的特征作出某种基本的假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
课程将以实际问题为出发点,强调假设检验的小概率反证法思想,内容分为参数的假设检验和非参数的假设检验两部分,同时给出具体的例题分析。
方差分析着眼于对实验数据进行分析,检验方差相同各正态总体的均值是否相等,以判断各因素对试验指标的影响是否显著。
正交试验设计研究如何合理、有效的安排多因素的试验,以确定各因素对试验指标影响的大小,找出最佳的配方或最佳的工艺条件。
数理统计第一章
n
例1.4 总体X~B(1,p),0<p<1,写出其样本的联合概率函数
总体
样品
X ~ P ( X x ) p ( 1 p ) ( x 0 ,1 )
x 1 x
X ~ P ( X x ) p ( 1 p ) , ( x 0 ,1. i 1,2 , , n )
xi 1 x i i i i
全部信息。 一个好的统计方法,是使由局部推断出的有关整体的信 息尽可能地准确。
第一章
数理统计的基本概念
第一节 随机样本
一.总体与个体
1.总体 在一个统计问题中,把所研究对象的全体称为总体。
构成总体的每个成员称为个体。
如:例一中的一大批灯泡叫总体。而每个灯泡叫做个体。 把含有有限个个体的总体称为有限总体 把含有无限个个体的总体称为无限总体
在数理统计学中,我们总是对随机现象进行有限 次的观察或试验,以获取数据。通过对数据的分析与 推断去寻找隐藏在数据中的统计规律性。 由于是对随机现象进行观察或试验,因此,观察或 试验数据是带有随机性的。为此需要我们从中尽可能地 排除随机性的干扰,以作出合理的推断。 数理统计是研究怎样以有效的方式收集、 整理和分 析带有随机性的数据,在此基础上,对所研究的问题作 出统计推断,直至对可能作出的决策提供依据和建议。
则其简单随机样本的联合分布函数为
F ( x )F ( x )F ( x ) F ( x )
1 2 n
n
(2)若总体X为连续随机变量,概率密度函数为f(x), 样品X i 的概率密度函数为 f ( xi ), (i 1,2,, n)
i 1
i
则样本 ( X1, X 2 , X n ) 的联合概率密度函数为
数理统计与随机过程3-1-数理统计1
记为:Cov ( X , Y ) E [ X E ( X )][Y E (Y )]. 称 XY Cov( X , Y ) D( X ) D(Y ) 为随机变量X 与Y的相关系数.
t2
1 te 2 | 2
因为X Z,故E ( X ) E ( Z ) , D( X ) D( Z ) 2 D(Z ) 2
即正态分布的两个参数 , 2分别是该分布的数学期望和方差。
独立的n个正态变量的线性组合仍服从正态分布:
即二维正态变量( X , Y )的概率密度中的参数 就是X , Y 的相关系数。 从而二维正态变量的分布完全可由X , Y 各自的 均值、方差以及它们的相关系数所确定。
前面已经证明: 若( X , Y )服从二维正态分布,那么X 和Y 相互独立 0 现在知道, XY ,从而知: 对于二维正态变量( X , Y )来说, X 和Y 不相关 X 与Y 相互独立
k!
k 1
(k 1)!
e e
即 E( X )
5
数学期望的特性:
1.设C是常数,则有E(C) C
2.设X 是一个随机变量,C是常数,则有E(CX ) CE( X )
3.设X , Y 是两个随机变量,则有E( X Y ) E( X ) E(Y )
(2) X ~ b(1, 1 2),(即(0 1)分布) P(U 1,V 0) P( X Y 1, X Y 0) 0 P(U 1) P( X Y 1) P( X 1, Y 0) 1 4, P(V 0) P( X Y 0) P( X 0, Y 0) 1 4, 所以P(U 1,V 0) P(U 1) P(V 0) U 与V不独立。
概率论与数理统计1完整(完整版)ppt课件
.
19
定义 当随机试验的样本空间是某个区域,并且任 意一点落在度量 (长度, 面积, 体积) 相同的子区域 是等可能的,则事件 A 的概率可定义为
P(A) m(A)
m()
(其中 m()是样本空间,m 的 (A)度 是量 构成事 A 件 的子区域的 )这度样量借助于几量 何来 上合 的理 度 规定的概率 几称 何为 概 . 率
对偶律: A B A B;
A B AB.
证明 对偶律.
.
13
例.事件 A、B、C两两互不相 则容 有,
ABC 反之 不成 立
例. 甲、乙、丙三人各射击一次,事件A1,A2,A3分别表示 甲、乙、丙射中,试说明下列事件所表示的结果:
A 2,A 2 A 3, A 1A 2, A 1 A 2, A 1A 2A 3, A 1A 2 A 2A 3 A 1A 3.
.
16
例1. 袋中装有4只白球和2只红球. 从袋中摸球两次,每次任取一球.有两种式: (a)放回抽样; (b)不放回抽样.
求: (1)两球颜色相同的概率; (2)两球中至少有一只白球的概率.
例2. 设一袋中有编号为1,2,…,9的球共9只, 现从中任取3 只, 试求: (1)取到1号球的概率,(事件A) (2)最小号码为5的概率.(事件B)
A-BAAB
显然: A-A=, A- =A, A-S=
s
A B
(4)AB
.
10
5.事件的互不相容(互斥):
若 AB,则A 称 与 B 是 互 不 ,或 相 互 容 ,即 斥
A 与 B 不能同 . 时发生
B
A B
A
.
11
6. 对立事件(逆事件): 若ABS且A B,则A称 与B互为逆事件
数理统计-第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
但在实际中,在样本量特别大时 (如 n≥100 ),又常用分组样本来代替完 全样本,这时需要对样本进行分组整理, 它能简明扼要地表示样本,使人们能更 好地认识总体,这是分组样本的优点。
太原理工大学 景英川
第一章 统计量及其分布
则 Fn (x)是一非减右连续函数,且满足 Fn (-∞) =0, Fn (+ ∞)=1 由此可见, Fn (x)是一个分布函数,称 Fn (x)为经验分 布函数。 太原理工大学 景英川
第一章 统计量及其分布
1.6 某食品厂生产听装饮料,现从生产线上随机 抽取 5 听饮料,称得其净重为(单 位:克) 351 347 355 344 351 这是一个容量为 5 的样本,经排序可得有序样本:
而若第一次抽到的是合格品,则第二次抽到不合格品 的概率为
太原理工大学 景英川
第一章 统计量及其分布
显然,如此得到的样本不是简单随 机样本。但是,当 N 很大时,我们可 以看到上述二种情 形的概率都近似等 于 p。所以当 N 很大,而 n不大(一个 经验法则是 )时可以把 该样本近似地 看成简单随机样本。
从总体中抽取样本可以有不同的抽法,为了能 由样本对总体作出较可靠的推断,就希望 样本能很 好的代表总体。这就需要对抽样方法提出一些要 求,最常用的"简单随机抽样”有 如下二个要求: (1)样本具有随机性,即要求总体中每一个个体 都有同等机会被选入样本,这便意味着每一样品xi 与总体X有相同的分布。 (2)样本要有独立性,即要求样本中每一样品的 取值不影响其它样品的取值,这意 味着x1, x2, …,xn 相互独立。
第一章 统计量及其分布
概率论与数理统计01 第一节 随机变量及其分布函数
第二章随机变量及其概率分布在随机试验中,人们除对某些特定事件发生的概率感兴趣外,往往还关心某个与随机试验的结果相联系的变量. 由于这一变量的取值依赖于随机试验结果,因而被称为随机变量. 与普通的变量不同,对于随机变量,人们无法事先预知其确切取值,但可以研究其取值的统计规律性. 本章将介绍两类随机变量及描述随机变量统计规律性的分布.第一节一维随机变量及其分布函数内容分布图示★随机变量概念的引入★随机变量的定义★例1★例2★例3★引入随机变量的意义★课堂练习★习题2-1内容要点:一、随机变量概念的引入为全面研究随机试验的结果, 揭示随机现象的统计规律性, 需将随机试验的结果数量化,即把随机试验的结果与实数对应起来.1. 在有些随机试验中, 试验的结果本身就由数量来表示.2. 在另一些随机试验中, 试验结果看起来与数量无关,但可以指定一个数量来表示之.二、随机变量的定义定义设随机试验的样本空间为S, 称定义在样本空间S上的实值单值函数)XX(e 为随机变量.随机变量与高等数学中函数的比较:(1) 它们都是实值函数,但前者在试验前只知道它可能取值的范围,而不能预先肯定它将取哪个值;(2) 因试验结果的出现具有一定的概率,故前者取每个值和每个确定范围内的值也有一定的概率.三、引入随机变量的意义随机变量的引入,使得随机试验中的各种事件可通过随机变量的关系式表达出来.由此可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内.也可以说,随机事件是从静态的观点来研究随机现象,而随机变量则以动态的观点来研究之.其关系类似高等数学中常量与变量的关系.随机变量概念的产生是概率论发展史上的重大事件. 引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究转化为随机变量及其取值规律的研究,使人们可利用数学分析的方法对随机试验的结果进行广泛而深入的研究.随机变量因其取值方式不同, 通常分为离散型和非离散型两类. 而非非离散型随机变量中最重要的是连续型随机变量. 今后,我们主要讨论离散型随机变量和连续型随机变量.例题选讲:例1 (讲义例1) 在抛掷一枚硬币进行打赌时, 若规定出现正面时抛掷者赢1元钱, 出现反面时输1元钱, 则其样本空间为=S {正面, 反面},记赢钱数为随机变量X , 则X 作为样本空间S 的实值函数定义为⎩⎨⎧=-==.,1,,1)(反面正面ϖϖϖX 例2 (讲义例2) 在将一枚硬币抛掷三次, 观察正面H 、反面T 出现情况的试验中, 其样本空间};,,,,,,,{TTT TTH THT HTT THH HTH HHT HHH S =记每次试验出现正面H 的总次数为随机变量X , 则X 作为样本空间S 上的函数定义为1112223X TTTTTH THT HTT THH HTH HHT HHH ϖ易见, 使X 取值为})2({2=X 的样本点构成的子集为},,,{THH HTH HHT A = 故 ,8/3)(}2{===A P X P 类似地,有.8/4},,,{}1{==≤TTT TTH THT HTT P X P例3 (讲义例3) 在测试灯泡寿命的试验中, 每一个灯泡的实际使用寿命可能是),0[+∞中任何一个实数, 若用X 表示灯泡的寿命(小时),则X 是定义在样本空间}0|{≥=t t S 上的函数,即t t X X ==)(,是随机变量.课堂练习1. 一报童卖报, 每份0.15元,其成本为0.10元. 报馆每天给报童1000份报, 并规定他不得把卖不出的报纸退回. 设X 为报童每天卖出的报纸份数, 试将报童赔钱这一事件用随机变量的表达式表示.四. 随机变量的分布函数定义 设X 是一个随机变量, 称)()()(+∞<<-∞≤=x x X P x F 为X 的分布函数.有时记作)(~x F X 或)(x F X .分布函数的性质1. 单调非减. 若21x x <, 则)()(21x F x F ≤;2. ;1)(lim )(,0)(lim )(==+∞==-∞+∞→-∞→x F F x F F x x3. 右连续性. 即).()(lim 00x F x F x x =+→例4 判别下列函数是否为某随机变量的分布函数?⎪⎩⎪⎨⎧≥<≤+<=⎪⎩⎪⎨⎧≥<≤<=⎪⎩⎪⎨⎧≥<≤--<=.2/1,1,2/10,2/1,0,0)()3(;,1,0,sin ,0,0)()2(;0,1,02,2/1,2,0)()1(x x x x x F x x x x x F x x x x F ππ解 (1)由题设, )(x F 在),(+∞-∞上单调不减, 右连续, 并有,0)(lim )(==-∞-∞→x F F x ,1)(lim )(==+∞+∞→x F F x所以)(x F 是某一随机变量X 的分布函数.(2)因)(x F 在),2/(ππ上单调下降, 所以)(x F 不可能是分布函数. (3)因为)(x F 在),(+∞-∞上单调不减, 右连续, 且有 ,0)(lim )(==-∞-∞→x F F x ,1)(lim )(==+∞+∞→x F F x所以)(x F 是某一随机变量X 的分布函数.离散型随机变量的分布函数例5(讲义例2)设随机变量X 的分布律为 ,2/16/13/121i p X求)(x F .解 }{)(x X P x F ≤=当0<x 时,,}{∅=≤x X 故0)(=x F 当10<≤x 时,31}0{}{)(===≤=X P x X P x F 当21<≤x 时, 216131}1{}0{)(=+==+==X P X P x F 当2≥x 时,1}2{}1{}0{)(==+=+==X P X P X P x F 故 ,2,121,2/110,3/10,0)(⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=x x x x x F )(x F 的图形是阶梯状的图形, 在2,1,0=x 处有跳跃, 其跃度分别等于},0{=X P },1{=X P }.2{=X P例6 X 具有离散均匀分布, 即,,,2,1,/1)(n i n x X P i ===求X 的分布函数.解将X 所取的n 个值按从小到大的顺序排列为)()2()1(n x x x ≤≤≤则)1(x x <时,,0}{)(=≤=x X P x F )2()1(x x x <≤时,,/1}{)(n x X P x F =≤= )3()2(x x x <≤时,,/2}{)(n x X P x F =≤=……)1()(+<≤k k x x x 时,,/}{)(n k x X P x F =≤=)(n x x ≥时,1}{)(=≤=x X P x F故 )(x F ⎪⎪⎩⎪⎪⎨⎧<=≥<),,max(,1),,2,1(),,min(,/),,min(,0111n j n n x x x x k n j x x x x n k x x x 当个不大于中恰好有且当当例7(讲义例3)设随机变量X 的分布函数为⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.3,1,32,19/15,21,19/9,1,0)(x x x x x F求X 的概率分布.解 由于)(x F 是一个阶梯型函数, 故知X 是一个离散型随机变量, )(x F 的跳跃点分别为1, 2, 3, 对应的跳跃高度分别为 9/19, 6/19, 4/19, 如图.故X 的概率分布为 .19/419/619/9321i p X课堂练习设随机变量X 的概率分布为4/12/14/1321i p X -,求X 的的分布函数,并求{},2/1≤X P {},2/52/3≤<X P {}.32≤≤X P。
概率论与数理统计1
第一章事件与概率§1.1 随机事件与样本空间教学目的要求:掌握几个基本概念,为后面的学习打下基础,并对本书内容体系有一个大致的了解.教材分析:1.概括分析:概率论是数理统计的理论基础,本节是概率论中的最基本的与最基础的内容之一.学习本节,要求学生掌握随机事件、样本空间、事件域、布尔代数等基本概念,了解事件之间的关系和事件之间的一些运算.2.教学重点:随机事件、样本空间、事件域、布尔代数等基本概念,事件之间的关系和事件之间的一些运算.3.教学难点:事件之间的关系和事件之间的一些运算的证明.教学过程:我们在引言中已经介绍了随机试验,现在进一步明确它的含意.一、几个基本概念:1.随机试验:一个试验如果满足下述条件:⑪试验可以在相同的情形下重复进行;⑫试验的所有可能结果是明确可知道的,并且不止一个;⑬每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现那一个结果.就称这样的试验是一个随机试验,为方便起见,也简称为试验.2.基本事件:随机试验的每一个可能的结果,称为基本事件.3.样本空间:所有基本事件的全体称为样本空间,通常用字母Ω表示.4.样本点:Ω中的点,即基本事件,有时也称作样本点,通常用字母ω表示.[例]1.1在前述试验中,令ω1={取得白球}, ω2={取得黑球}则Ω={ω1,ω2}[例]1.2 一个盒子中有十个完全相同球,分别标以号码1,2,…,10,从中任取一球,令i ={取得球的号码为i}则Ω={1,2, (10)·3·[例]1.3 讨论某电话交换台在单位时间内收到的呼唤次数,令i={收到的呼唤次数为i}则Ω={1,2,…}[例]1.4 测量某地水温,令 t={测得的水温为t℃}则Ω=[0,100]5.随机事件:无论是基本事件还是复杂事件,它们在试验中发生与否,都带有随机性,所以都叫随机事件或简称为事件.习惯上用大写字母A,B,C等表示事件.在试验中,如果出现A中所包含的某一个基本事件ω,则称作A发生,并记作ω∈A.我们已经知道样本空间Ω包含了全体基本事件,而随机事件不过是有某些特征的基本事件所组成,所以从集合论的观点来看,一个随机事件不过是样本空间Ω的一个子集而已.又因为Ω是所有基本事件所组成,因而在任一次试验中,必然要出现Ω中的某一基本事件ω,即ω∈Ω.也就是在试验中,Ω必然会发生,所以今后又用Ω来代表一个必然事件.相应地,空集Φ可以看作是Ω的子集,在任一次实验中不可能有ω∈Φ,也就是说Φ永远不可能发生,所以Φ是不可能事件.为了方便起见,我们把必然事件和不可能事件看作随机事件的两个极端情形.一个样本空间Ω中,可以有很多的随机事件.概率论的任务之一,是研究随机事件的规律,通过对较简单事件规律的研究去掌握更复杂事件的规律.为此,需要研究事件之间的关系和事件之间的一些运算.二、事件之间的关系和运算:1.如果事件A发生必然导致事件B发生,则称B包含了A,或称A是B的特款,并记作A⊂B或B⊃A.如图1.1.因为不可能事件Φ不含有任何ω,所以对任一事件A,我们约定Φ⊂A.2.如果有A⊂B,B⊂A同时成立,则称事件A与B相等,记作A=B.如图1.2.3.“事件A与B中至少有一个发生”,这样的一个事件称作事件A与B的并(或和)并记作A∪B.如图1.3.4.“事件A与B同时发生”,这样的一个事件称作事件A与B的交(或积),记作A∩B(或AB).如图1.4.5.“事件A发生而B不发生”,这样的一个事件称作事件A与B的差,记作A-B.如图1.5.6.若事件A与B不能同时发生,也就是说AB是一个不可能事件,即AB=Φ,则称事件A与B互不相容.如图1.6.7.若A是一个事件,令A=Ω-A,称A是A的对立事件或逆事件.如图1.7.·4··5·显然有: A A =Φ, A ∪A =Ω, A =A8.若有n 个事件:A 1,A 2,…,A n ,则“A 1,A 2,…,A n 中至少发生其中的一个”这样的事件称作A 1,A 2,…,A n 的并,并记作A 1∪A 2∪…∪A n 或n i i A 1=;若“A 1,A 2,…,A n 同时发生”,这样的事件称作A 1,A 2,…,A n 的交,记作A 1A 2…A n 或 n i iA 1=.大家已经有了一定的集合论知识,一定会发现事件间的关系及运算与布尔(Boole)代数在很多场合,用集合论的表达方式显得简练些,也更容易理解些.但对初学概率论的大家来说,重要的是要学会用概率论的语言来解释集合间的关系及运算,并能运用它们.[例] 1.5 设A 、B 、C 是Ω中的随机事件,则·6·1) 事件“A 与B 发生,C 不发生”可以表示成:C AB 或AB -C 或AB -ABC.2) 事件“A 、B 、C 中至少有二个发生”可以表示成:AB ∪AC ∪BC 或ABC BC A C B A C AB .3) 事件“A 、B 、C 中恰好发生二个”可以表示成: BC A C B A C AB .4) 事件“A 、B 、C 中有不多于一个事件发生”可以表示成:C B A C B A C B A C B A .5) 事件“A 发生而B 与C 都不发生”可以表示成:C B A 或A -B -C 或A -(B ∪C).6) 事件“A 、B 、C 恰好发生一个”可以表示成:C B A C B A C B A .7) 事件“A 、B 、C 中至少发生一个”可以表示成:C B A 或ABC BC A C B A C AB C B A C B A C B A .三、事件的运算规则:1. 交换律:A ∪B=B ∪A AB=BA2. 结合律:(A ∪B)∪C=A ∪(B ∪C) (AB)C=A(BC)3. 分配律:(A ∪B)C=AC ∪BC (AB)∪C=(A ∪C)(B ∪C)4. 德摩根(De Morgan)定理(对偶原则):n i i n i i A A 11=== ni i n i i A A 11=== 四、事件域: 我们已经知道事件是Ω的某些子集,如果把“是事件”的这些子集归在一起,则得到一个类,记作ℱ,称作事件域,即ℱ={A :A ⊂Ω,Ω是事件}在前面已经提到,Ω、Φ是事件,所以Ω∈ℱ,Φ∈ℱ.又讨论了事件间的运算“∪” 、·7·“∩”和“-”,如果A 与B 都是事件,即A ∈ℱ,B ∈ℱ,非常自然地要求A ∪B 、AB 、A -B 也是事件.因此,如果有A ∈ℱ、B ∈ℱ,就要求A ∪B ∈ℱ、AB ∈ℱ、A -B ∈ℱ用集合论的语言来说,就是事件域ℱ关于运算“∪” 、“∩”和“-”是封闭的.经过归纳与整理,事件域ℱ应该满足下述要求:⑪ Ω∈ℱ;⑫ 若A ∈ℱ,则A ∈ℱ;⑬ 若i A ∈ℱ,i=1,2, …,n,则 ni iA 1 ∈ℱ. 在集合论中,满足上述三个条件的集合类,称作布尔代数.所以事件域应该是一个布尔代数.对于样本空间Ω,如果ℱ是Ω的一切子集的全体,那么显然ℱ是一个布尔代数.§1.2 概率和频率教学目的要求:通过本节的学习,使学生掌握频率与概率的概念及其性质,为后面的学习打下基础. 教 材 分 析 :1.概括分析:本节是概率论这一部分的最基本和最基础的重要内容之一.通过对引言中随机试验的分析给出了概率的定义,并通过频率与概率的内在关系的分析得到频率与概率的性质,在此基础上给出了概率的公理化定义.2.教学重点:概率的性质及公理化定义.3.教学难点:概率的公理化定义.教 学 过 程 :回忆引言中的试验二,我们已经知道它是一个随机试验,并且样本空间Ω={ω1,ω2},其中ω1={取得白球},ω2={取得黑球}是其本事件.在一次试验中,虽然不能肯定是ω1还是ω2发生,但是我们可以问在一次试验中发生ω1(或ω2)的可能性有多大?由对称性,很自然地可·8·以断定在一次试验中,出现ω1 (或ω2)的可能性是½,因为我们知道盒子中白球数和黑球数都是5个.现在引入一个定义如下:一、频率和概率的定义:定义1.1 随机事件A 发生可能性大小的度量(数值),称为A 发生的概率,记作P(A). 正如恩格斯所指出的:“在表面上是偶然性在起作用的地方,这种偶然性始终是受内部的隐蔽着的规律支配的,而问题只是在于发现这些规律.”(恩格斯:《路德维希·费尔巴哈和德国古典哲学的终结》,人民出版社,1972年,第38页).人们经过长期的实践发现,虽然个别随机事件在某次试验或观察中可以出现也可以不出现;但在大量试验中它却呈现出明显的规律性——频率稳定性.在掷一次硬币时,既可能出现正面,也可能出现反面,预先作出确定的判断是不可能的,但是假如硬币均匀,直观上出现正面与出现反面的机会应该相等,即在大量试验中出现正面的频率,,其结果如下:又如,在英语中某些字母出现的频率远远高于另外一些字母. 在进行了更深入的研究之后,人们还发现各个字母被使用的频率相当稳定.例如,下面就是英文字母使用频率的一字母使用频率的研究,对于打字机键盘的设计(在方便的地方安排使用频率较高的字母键)、印刷铅字的铸造(使用频率高的应铸得多些)、信息的编码(常用字母用较短的码)、密码的破译等等方面都是十分有用的.对于一个随机事件来说,它发生可能性大小的度量是由它自身决定的,并且是客观存在的.就好比一根木棒有长度,一块土地有面积一样,概率是随机事件发生可能性大小的度量,是随机事件自身的一个属性.一个根本的问题是,对一个给定的随机事件,它发生可能性大小的度量—一概率,究竟是多大呢?在前面的例子中,因为已经知道了盒子中的白球和黑球都是5个,才得以断定)(1 p =1/2.如果不知道盒子中的白球数和黑球数呢?在引言中已经提到,实践告诉我们,如果反复多次地从盒子中取球(取后放回搅匀),随着试验次数n 的增大,比值n n 白会逐渐稳定到1/2(n 白表示出现白球的次数),记·9· nn 白=试验总次数的次数出现1ω=)(1ωn f 称)(1ωn f 为事件ω1在n 次试验中出现的频率.频率当然也在一定程度上反映了发生可能性的大小.尽管每作—串(n 次)试验,所得到的频率)(1ωn f 可以各不相同,但是只要n 相当大,)(1ωn f 与)(1ωp 是会非常“靠近”的.因此概率是可以通过频率来“测量”的,或者说频率是概率的一个近似.在前述摸球的例子中,即使事先并不知道盒子中黑球和白球的比例数(这时概率虽然不知道,但它是客观存在的),经过反复多次的试验后,如果频率)(1ωn f 逐渐稳定到1/2,那么我们就可以判断盒子中的白球数和黑球数是相等的,进一步即可得到)(1ωp =1/2这个结论.这件事情其实质与测量长度和面积—样的平常,给定一根木棒,谁都不怀疑它有自身的“客观”的长度,长度是多少?我们可以用尺或仪器去测量,不论尺或仪器多么精确,测得的数值总是稳定在木棒真实的“长度”值的附近.事实上,人们也是把测量所得的值当作真实的“长度”.这个类比不仅帮助我们去理解概率和频率之间的内在关系,而且还启示了更深刻的事实:概率与长度、面积等变量一样,应该具有“测度”的性质.这个问题请读者先思考一下,然后让我们慢慢地来解释.二、频率和概率的性质:1.频率的性质:现在让我们比较仔细地考察一下频率.如果随机事件A 在n 次反复试验中发生了n 白次,称 )(A f n =n n 白为A 的频率.易知频率具有下述性质.(1).非负性:即)(A f n ≥0; (2).规范性,即若Ω是必然事件,则)(Ωn f =1;(3).有限可加性:即若A 、B 互不相容(即AB=Φ),则)(B A f n =)(A f n 十)(B f n这三条性质的论证是很直观的,因为(1). A n ≥0,所以nn A ≥0;·10·(2). Ω是必然事件,所以n n =Ω,从而nn Ω=1; (3). 若A ∪B 发生,意味着A 、B 中至少发生其中之一,又因为A 与B 互不相容(即不能同时发生),所以A ∪B 发生的次数一定是A 发生次数与B 发生次数之和,即B A B A n n n += ,从而有)(B A f n =)(A f n 十)(B f n成立.频率还具有一些别的性质,但是这三条性质是最基本的,其它的性质可以由它们推出.作为练习,读者不妨自己验证下述几个性质:(1) 不可能事件的频率为零,即)(Φn f =0;(2) 若A ⊂B,则)(A f n ≤)(B f n ,由此还可推得对任一事件A,有)(A f n ≤1;(3) 对有限个两两不相容事件(即任意两个事件互不相容),频率具有可加性.即若A i A j =Φ(1≤i,j≤m,i≠j),则()∑===⎪⎪⎭⎫ ⎝⎛ni i n n i i n A f A f 112. 概率的性质:因为频率的本质就是概率,因而我们有理由要求频率的这些性质也是概率所应该具有的.因为对每一个随机事件A,都有一个概率P(A)与之对应,而在§1中我们已经知道事件域ℱ是一个布尔代数,所以概P 实质上是在布尔代数上有定义的一个(集合)函数(因为ℱ中的元素是集合),它应该具有下述性质:(1).非负性:P(A)≥0,对A ∈ℱ;(2).规范性:P(Ω)=1;(3).有限可加性:若A i ∈ℱ,i =1,2,…,n,且A i A j =Φ(i ≠j),则()∑===⎪⎪⎭⎫ ⎝⎛ni i n n i i A f A P 11由此可知,给定一个随机试验,也就确定了一个样本空间Ω,事件域ℱ和概率P,其中ℱ是一个布尔代数,P 是定义在ℱ上的一个非负的、规范的有限可加集函数,这样一来,对随机试验这样的一个直观对象,我们就可以用“数学化”的语言来描述它们了.§1.3 古典概型教学目的要求:通过本节的学习,使学生在复习巩固排列组合的基础上掌握古典概型的定义和计算公式,并能灵活运用它们解决实际问题.教材分析:1.概括分析:古典概型在概率论中占有相当重要的地位,早在古代就引起了人们的注意.它的内容比较简单,应用却很广泛,深入考察古典概率问题,有助于我们直观地理解概率论的一些基本概念,合理地解决产品质量控制等实际问题.因此,掌握古典概率问题的解法,对于学好概率论具有十分重要的意义.本节首先给出古典概型的定义,然后在复习排列组合的基础上通过实例讲述古典概型问题的解法,达到灵活运用定义与公式的目的.2.教学重点:古典概型的定义与公式及古典概型问题的解法.3.教学难点:古典概型问题的解法及古典概型定义与公式的灵活运用.教学过程:在§2中已经提到,一个随机试验,数学上是用样本空间Ω,事件域ℱ和概率P来描述的.对一个随机事件A,如何寻求它的概率P(A)是概率论的一个基本的课题. 我们先讨论一类最简单的随机试验.一、古典概型的定义与计算公式:1.古典概型的定义:有一类最简单的随机试验,它具有下述特征:(1) 样本空间的元素(即基本事件)只有有限个.不妨设为n个,并记它们为ω1、ω2、…、ωn.(2)每个基本事件出现的可能性是相等的,即有 P(ω1)=P(ω2)=…P(ωn)这种等可能的数学模型曾经是概率论发展初期的主要研究对象,通常就称这种数学模型为古典概型.它在概率论中有很重要的地位,一方面,因为它比较简单,许多概念既直观而又容易理解,另一方面,它又概括了许多实际问题,有很广泛的应用.2.古典概型的计算公式:对上述的古典概型,它的样本空间Ω={ω1、ω2、…、ωn},事件域ℱ为Ω的所有子集的全体.这时,连同Φ、Ω在内,ℱ中含有2n个事件,并且从概率的有限可加性知:1=P(Ω)=P(ω1)+P(ω2)+…+P(ωn)于是 P(ω1)=P(ω2)=…=P(ωn)=1/n·11··12· 对任意一个随机事件A ∈ℱ,如果A 是k 个基本事件的和,即A =k i i i ωωω 21,则基本事件总数的有利事件数基本事件总数中所含的基本事件数A A n k A P ===)( (A 中所含的基本事件数,习惯上常常称为是A 的有利事件数),不难验证,上述的概率P(·)的确具有非负性、规范性和有限可加性.事实上,古典概型的大部分问题都能形象化地用摸球模型来描述.以后我们经常研究摸球模型,意义即在于此.前节例1.1及其有关概率的计算是古典概型的一个例子,但并不是所有古典概型的事件的概率计算都这么容易.事实上,古典概型中许多概率的计算相当困难而富有技巧,计算的要点是给定样本点,并计算它的总数,而后再计算有利场合的数目.在这些计算中,经常要用到一些排列与组合公式.二、基本的组合分析公式1.全部组合分析公式的推导基于下列两条原理:乘法原理与加法原理.为说明这两条原理,请读者和我们一起参加一个智力游戏.王经理从上海去北京参加一个商品展销会,但途中还要到天津去处理一件业务.从上海到天津可以坐飞机,也可以坐火车,还可以坐船;从天津到北京则只有火车与汽车两种交通工具可用.请问王经理从上海到北京一共有几种走法?图 2.1的图(a)是上述问题的忠实描绘.把它重新表示为(b),使我们一目了然地知道,王经理共有6种走法.这样一种表示方法是具有启发性的,它告诉我们,对于同类问题可有一个通用的计算方法.把上海—天津,再从天津—北京看作相继进行的两个过程,分别记为A 1与A 2.一般地,假设完成过程A 1共有n 1种方法(在我们的游戏中n 1=3),完成A 2共有n 2种方法(本例中n 2=2),那末,完成整个过程一共有n 1×n 2种方法(这里3×2=6).这就是所谓的乘法原理.现在把游戏的条件稍微改变一下.假定因时间关系,王经理只能去北京和天津中的一地,而从上海直接去北京可以有铁路与民航两种走法,此时王经理的走法一共有多少种呢?直接采用类似图2.1(b)的表示方法,便知此时共有5种走法,如图2.2所示.现在不同的是,两个过程不是相继的而是并行的.因此在计算中不能用乘法,只能用加法.这样,进行过程A 1或A 2的方法一共有n 1+n 2种.这就是加法原理.容易知道,这两条原理可以推广到多个过程的情况.利用上述原理,可以导出排列与组合的公式.2.排列:所谓排列,是从共有n 个元素的总体中取出r 个来进行有顺序的放置(或者说有顺序地取出r 个元素).这时既要虑到取出的元素也要顾及其取出顺序.这种排列可分为两类:第一种是有放回的选取,这时每次选取都是在全体元素中进行,同一元素可被重复选中;另一种是不放回选取,这时一个元素一旦被取出便立刻从总体中除去,因此每个元素至多被选中一次,在后一种情况,必有r ≤n .(1)在有放回选取中,从n 个元素中取出r 个元素进行排列,这种排列称为有重复的排列,其总数共有n r 种.(2)在不放回选取中,从n 个元素中取出r 个元素进行排列,其总数为rn A =n(n -1)(n -2)…(n -r +1)这种排列称为选排列.特别当r =n 时,称为全排列.(3)n 个元素的全排列数为P n =n(n -1)…3·2·1=n !3.组合:(1)从n 个元素中取出r 个元素而不考虑其顺序,称为组合,其总数为:)!(!!!)1()1(!r n r n r r n n n r A r n C r n r n-=+--==⎪⎪⎭⎫ ⎝⎛= 这里⎪⎪⎭⎫ ⎝⎛r n 是二项展开式的系数,(a+b)n =∑=-⎪⎪⎭⎫ ⎝⎛n r r n r b a r n 0 (2)若r 1+r 2+…+r k =n,把n 个不同的元素分成k 个部分,第一部分r 1个,第二部分r 2个,……,第k 部分r k 个,则不同的分法有:!!!!21k r r r n 种,上式中的数称为多项系数,因为它是(x 1+x 2+…+x k )n 展开式中k rk r r x x x 2121的系数,当k =2时,即为组合数.(3)若n 个元素中有n 1个带足标“1”,n 2个带足标“2”,……,n k 个带足标“k ”,且n 1+n 2+…+n k =n,从这n 个元素中取出r 个,使得带有足标“i ”的元素有r i 个(1≤i ≤k),而r 1+r 2+…+r k =r,这时不同取法的总数为:⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛k k r n r n r n 2211这里当然要求r i ≤n i .4.一些常用等式:把排列公式推广到r 是正整数而n 是任意实数x 的场合,有时是需要的,这时记r x A =x(x-1)(x-2)…(x-r +1)同样定义!)1()2)(1(!r r x x x x r A r x r x +---==⎪⎪⎭⎫ ⎝⎛ 及 0!=1, ⎪⎪⎭⎫ ⎝⎛0x =1. 对于正整数n,若r>n,则⎪⎪⎭⎫ ⎝⎛r n =0.这样一来二项系数有性质: ⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛k n n k n , ⎪⎪⎭⎫ ⎝⎛-+-=⎪⎪⎭⎫ ⎝⎛-k k a k a k 1)1( 由于 ∑=⎪⎪⎭⎫ ⎝⎛=+nr r n x r n x 0)1(故 n n n n n n 2210=⎪⎪⎭⎫ ⎝⎛++⎪⎪⎭⎫⎝⎛+⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛ 利用幂级数乘法又可以证明⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛++⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛n b a b n a n b a n b a 0110 特别地 ⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛++⎪⎪⎭⎫⎝⎛-⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛n n n n n n n n n n n 20110 即 ⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛++⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛n n n n n n 210222 现在举一些求A ∈ℱ的概率P(A)的例子.在下面的讨论中,如无特别需要,常常把事件域ℱ略去.三、概率直接计算的例子:[例1]一部四本头的文集按任意次序放到书架上去,问各册自右向左或自左向右恰成1,2,3,4的顺序的概率是多少?[解] 若以a,b,c,d,分别表示自左向右排列的书的卷号,则上述文集放置的方式可与向量(a,b,c,d)建立一一对应,因为a,b,c,d 取值于1,2,3,4,因此这种向量的总数相当于4个元素的全排列数4!=24,由于文集按“任意的”次序放到书架上去,因此这24种排列中出现任意一种的可能性都相同,这是古典概型概率,其有利场合有2种,即自左向右或自右向左成1,2,3,4顺序,因此所求概率为:2/24=1/12[例2] 有10个电阻,其电阻值分别为1Ω,2Ω,…,10Ω,从中取出三个,要求取出的三个电阻,一个小于5Ω,一个等于5Ω,另一个大于5Ω,问取一次就能达到要求的概率.[解] 把从10个电阻中取出3个的各种可能取法作为样本点全体,这是古典概型,其总数为⎪⎪⎭⎫ ⎝⎛=310310C ,有利场合数为⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛151114. 故所求概率为P=61310151114=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛[例3]某城有N 部卡车,车牌号从1到N,有一个外地人到该城去,把遇到的n 部车子的牌号抄下(可能重复抄到某些车牌号),问抄到的最大号码正好为k 的概率.(1≤k ≤N)[解]这种抄法可以看作是对N 个车牌号进行n 次有放回的抽样.所有可能的抽法共有N n 种,以它为样本点全体.由于每部卡车被遇到的机会可以认为相同,因此这是一个古典概型概率的计算问题,有利场合数可以这样考虑:先考虑最大车牌号不大于k 的取法,这样取法共有k n 种,再考虑最大车牌号不大于k-1的取法,其数目有(k-1)n 种,因此有k n -(k-1)n 种取法其最大车牌号正好为k,这就是有利场合的数目,因而所求概率为 P=n nn Nk k )1(-- [例4]设有n 个球,每个都能以同样的概率1/N 落到N 个格子(N ≥n)的每一个格子中,试求:(1)某指定的n 个格子中各有一个球的概率;(2)任何n 个格子中各有一个球的概率.[解]这是一个古典概型问题,由于每个球可落入N 个格子中的任一个,所以n 个球在N个格子中的分布相当于从N 个元素中选取n 个进行有重复的排列,故共有N n 种可能分布.在第一个问题中,有利场合相当于n 个球在那指定的n 个格子中全排列,总数为n!,因而所求概率为 P 1=n!/N n .在第二个问题中,n 个房间可以任意,即可以从N 个房间中任意选出n 个来,这种选法共有⎪⎪⎭⎫ ⎝⎛n N 种,对于每种选定的n 个房间,有利场合正如第一个问题一样为n!,故所求概率为nN n n N P !2⎪⎪⎭⎫ ⎝⎛= 这个例子是古典概型中一个很典型的问题,不少实际问题可以归结为它.例如,若把球解释为粒子,把格子解释为相空间中的小区域,则这个问题便相应于统计物理学中的马克斯威尔—波尔茨曼(MaxWell-Boltzmann)统计.概率论历史上有一个颇为有名的问题:要求参加某次集会的n 个人中没有两个人生日相同的概率.若把n 个人看作上面问题中的n 个球,而把一年的365天作为格子,则N=365,这时P 2就给出所求的概率.例如当n=40时,P 2=0.109,这个概率是意外的小.[例5] (抽签问题)袋中有a 只黑球,b 只白球,它们除颜色不同外,其他方面没有差别,现在把球随机地一只只摸出来,求第k 次摸出的一只球是黑球的概率(1≤k ≤a+b).[第一种解法] 把a 只黑球及b 只白球都看作是不同的(例如设想把它们进行编号),若把摸出的球依次放在排列成一直线的a+b 位置上,则可能的排列法相当于把a+b 个元素进行全排列,总数为(a+b)!,把它们作为样本点全体.有利场合数为a ×(a+b-1)!,这是因为第k 次摸得黑球有a 种取法,而另外(a+b-1)次摸球相当于a+b-1只球进行全排列,有(a+b-1)!种构成法,故所求概率为ba ab a b a a P k +=+-+⨯=)!()!1( 这个结果与k 无关.回想—下,就会发觉这与我们平常的生活经验是一致的.例如在体育比赛中进行抽签,对各队机会均等,与抽签的先后次序无关.[第二种解法] 把a 只黑球看作是没有区别的,把b 只白球也看作是没有区别的.仍把摸出的球依次放在排列成一直线的a+b 位置上,因若把a 只黑球的位置固定下来则其他位置必然是放白球,而黑球的位置可以有⎪⎪⎭⎫ ⎝⎛+b b a 种放法,以这种放法作为样本点.这时有利场合数为⎪⎪⎭⎫ ⎝⎛--+11a b a ,这是由于第k 次取得黑球,这个位置必须放黑球,剩下的黑球可以在a+b-1个位置上任取a-1个位置,因此共有⎪⎪⎭⎫ ⎝⎛--+11a b a 种放法.所以所求概率为 b a a a b a a b a P k +=⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛--+=11 两种不同的解法答案相同,注意考察一下两种解法的不同,就会发现主要在于选取的样本空间不同.在前—种解法中把球看作是“有个性的”,而在后一种解法中则对同色球不加区别,因此在第一种解法中要顾及各黑球及各白球间的顺序而用排列,第二种解法则不注意顺序而用组合,但最后还是得出了相同的答案.这种情况的产生并不奇怪,这说明对于同一随机现象,可以用不同的模型来描述,只要方法正确,结论总是一致的.在这个例子中,第二种解法中的每一个样本点是由第一种解法中的a!·b!个样本点合并而成的.这个例子告诉我们,在计算样本点总数及有利场合数时,必须对同一个确定的样本空间考虑,因此其中一个考虑顺序,另一个也必须考虑顺序,否则结果一定不正确.既然同一个随机现象可用不同的样本空间来描述,因此对同一个概率也常常有多种不同的求法,我们应逐步训练自己能采用最简便的方法解题,为此熟悉同一问题的多种不同解法是重要的.例如,对例5就存在着多种不同的解法,上面提供的只是比较自然的两种.注意到在这两种解法中,我们对不同的k 用的是同一个样本空间,也就是说:我们构造了一个可以描述a 十b 次摸球的样本空间,并利用它一举解决了“第k(1≤k ≤a+b)次摸得黑球”这一概率的计算.假如允许对不同的k 用不同的样本空间,则我们完全可以构造一个只包含前k 次试验,甚至只包含第k 次试验的样本空间,这时也能求得有关概率.特别是选用最后一种样本空间简直马上可以看出正确答案,不过这种做法对初学者或许不那么容易理解. 四、古典概率的计算方法:求解古典概率问题,一般要做好三方面的工作:一是判明问题性质,分辨所解的问题,是不是古典概率问题.如果问题所及的试验,具有以下两个基本特征:(1)试验的样本空间的元素只有有限个;(2)试验中每个样本点出现豹可能性相同.那么,我们就可断定它是一个古典概率问题.二是掌握古典概率的计算公式.如果样本空间包含的样本点的总数为n,事件A 包含的样本点数(即A 的有利场合的数目)为k,那么事件A 的概率是 P(A)=nk =样本点总数包含的样本点数事件A =样本点总数的有利场合数A 三是根据公式要求,确定n 和k 的数值.这是解题的关键性一步,计算方法灵活多变,没有一个固定的模式.古典概率一种解法,大体都是围绕n 和k 的计算而展开的.五、几类基本问题:抛硬币、掷骰(t óu)子、摸球、取数等随机试验,在概率问题的研究中,有着十分重要的意义.一方面,这些随机试验,是人们从大量的随机现象中筛选出来的理想化的概率模型.它们的内容生动形象,结构清楚明确,富有直观性和典型性,便于深入浅出地反映事物的本质,揭示事物的规律.另一方面,这种模型化的处理方法,思想活泼,应用广泛,具有极大的普遍性,不少复杂问题的解决,常常可以归结为某种简单的模型.因此,有目的地考察并掌握若干常见的概率模型,有助于我们举一反三,触类旁通,丰富解题的技能和技巧,从根本上提高解答概率题的能力.本部分主要讨论古典概率中的四类基本问题(摸球问题、分球入盒问题、随机取数问题和选票问题),给出它们的一般解法,指出它们的典型意义,介绍它们的常见应用.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学与计算科学学院实验报告实验项目名称非参数检验—分布函数的拟合检验所属课程名称数理统计实验类型验证实验日期2013.11.18班级学号姓名成绩一、实验概述: 【实验目的】1.了解非参数检验的基本原理和过程;2.掌握分布函数的拟合检验的步骤以及皮尔逊定理;3.掌握样本的统计方法以及各统计图表的制作方法;4.实现分布函数拟合检验过程程序化。
【实验原理】分布函数的拟合检验 考虑如下假设检验问题:),()(00x F x F H ==).()(01x F x F H ≠=对0H 作显著性检验,通常称之为分布函数的拟合检验。
在此,)(0x F 为需要检验的某个已知的分布函数,);(0θx F 中也可以含有未知参数θ。
对于)(0x F 的函数表达式怎样提较为准确,这可以由样本n ξξξ,...,,21作经验分布函数)(*x F n 。
为此,我们介绍皮尔逊定理,这个定理所建立的统计量的极限分布为2χ-分布,不论总体ξ的分布函数)(x F 是什么类型,定理的结论都适用于作检验判断,这种检验法称之为皮尔逊2χ检验。
皮尔逊定理 不论)(0x F 是什么分布,当0H 正确时,则由n np v mi ii-=∑=12η建立的统计量η以自由度m-1的2χ-分布为极限分布,其中)(0x F 不带有未知参数。
【实验环境】一、硬件环境1.CPU:i5-2410M@2.30GHz 2.内存:2.30GHz,2.00GB 3硬盘:500GB 二、软件环境 MATLAB7.0二、实验内容:【实验方案】问题重述:某工厂生产一种220伏25瓦的白炽灯泡,其光通量(单位:lm )用ξ表示,ξ为一随机变量,假设ξ是服从正态(,)N a σ,试问这个假设是否正确。
考察如下假设检验问题:00:()()H F x F x =, 10:()()H F x F x ≠. 其中()F x 为正态(,)N a σ的分布函数。
【实验步骤】现叙述皮尔逊2χ检验法的五个步骤: (一)抽取样本现在从总体ξ中抽取容量为n=120的样本(对于有限总体,即个体是有限的情形,一定要用有返回抽取方式,随机地独立抽取样本),进行观察得光通量ξ的120个观察值,亦即随机地抽取120个灯泡测得其光通量的数据,列表一。
表一 白炽灯炮测试数据216 203 197 208 206 209 206 208 202 203 206 213 218 207 208 202 194 203 213 211 193 213 208 208 204 206 204 206 208 209 213 203 206 207 196 201 208 207 213 208 210 208 211 211 214 220 211 203 216 224 211 209 218 214 219 211 208 221 211 218 218 190 219 211 208 199 214 207 207 214 206 217 214 201 212 213 211 212 216 206 210 216 204 221 208 209 214 214 199 204 211 201 216 211 209 208 209 202 211 207 202 205 206 216 206 213 206 207 200 198 200202203208216206222213209219(二)作频数分布表对于表一中的120个数据,可取189.5为下界,228.5为上界,将(189.5,228.5)按等间距离为3划分为13个小区间,发现前三个小区间以及后三个小区间的i v 值(即频数值)都太小,应适当并小区间,使得每个小区间的i v 值都不小于5.经适当并小区间后,成为9个小区间,第一个小区间为(189.5,198.5),第9个小区间为[219.5,228.5)。
第2至8这七个小区间的间距为3.这里假定测量精确度为个位1,小区间端点都带0.5是为了计算频数方便。
详见表二。
表二 频数分布表以样本观察值作横坐标,以相应的频数为纵坐标,作出直方图,如下:编号小区间频数累积频数组中值i x1(-∞,198.5) 6 6 194 2 [198.5,201.5) 7 13 200 3 [201.5,204.5) 14 27 203 4 [204.5,207.5) 20 47 206 5 [207.5, 210.5) 23 70 209 6 [210.5,213.5) 22 92 212 7 [213.5,216.5) 14 106 215 8 [216.5,219.5) 8 114 218 9[219.5, ∞)6120224(三)计算理论频数如果0H 成立,由给定的分布函数0()F x ,计算得到: 001()()i i i p F y F y -=- (1,2,...,)i m =我们知道,对于正态分布,a 及2σ的极大似然法估计量为: ,a ξ=现在用表一中的数据i x 求出ξ及2n S 的观察值x 及2s ,作为a 及2σ的估计值,计算得到:209a x =≈,于是0()F x 为正态(209,6.5)N 的分布函数,可算得100(198.5)(){198.5}209{ 1.62}6.5( 1.62)()1(1.62)10.947380.05262p F F P P ξξφφφ=--∞=-∞<<-=-∞<<-=---∞=-=-=200(210.5)(198.5){198.5210.5}209{1.62 1.15}6.5( 1.15)( 1.62)(1.62)(1.15)0.947380..87490.07248p F F P P ξξφφφφ=-=<<-=-<<-=---=-=-=其中()x φ为标准正态(0,1)N 的分布函数,类似于1p 和2p 的算法,可逐一求出3p ,4p ,...,9p 从而得到(1,2,..,9)i np i =各值如下表:表三 频数表编号 1[,)i i y y -i vi np1 (,198.5)-∞6 6.3 2 [198.5,201.5)7 8.7 3[201.5,204.5)1414.54 [204.5,207.5) 20 19.75 [207.5,210.5) 23 21.86 [210.5,213.5) 22 19.7 7 [213.5,216.5) 14 14.58 [216.5,219.5) 8 8.7 9[216.5,219.5)66.3其中01i p <<,11,1,2,...,mi i p i m ===∑,称i np 为样本12,,...,n ξξξ落入第i 个小区间的理论频数。
实测频数i v 依赖于样本12,,...,n ξξξ的观察值。
i v 与i np 的差异越小,0H 假设的接受程度越高。
社会经济统计学中常用加权平均法计算样本平均x 与样本方差2S 。
利用表二中的实测频数i v 与组中值i x ,计算得到:911209.125i i i x v x n ===∑92211()44.175, 6.646i i i S v x x S n ==-==∑其中91120i i n v ===∑(四)建立检验统计量2211()mm i i i i i i iv np v n np np η==-==-∑∑ (1)其中η依赖于i v 及i p ,因而它与0()F x 建立了一定的关系,它可作为判断0H 的检验统计量。
利用表三的数据,计算得到表四。
表四 η值计算表编号 i v2i v2/i i v np1 6 36 5.7012 7 49 5.6323 14 196 13.517 4 20 400 20.305 5 23 529 24.266 6 22 484 24.5687 14 196 13.5178 8 64 7.356 96365.701我们来分析(1)式所建立的统计量η的实际意义。
当0H 成立时,由博雷尔强大数定律知道,以概率为1地使得i ip nv →,即当n 足够大时i i np v ≈,则η以概率为1地取值于零的附近,因而由(1)式所建立的统计量η可以用来判断)(x F 与)(0x F 之间的差异性是否显著。
正因为这样,这个统计量η(它不带有未知参数)可作为判断0H 的检验统计量。
如果0H 中的),...,,;(210l X F θθθ含有l 个未知参数,则首先用这l 个未知参数的极大似然法估计量l θθθ,...,,21来代替l θθθ,...,,21,使),...,,;(210l X F θθθ不含未知参数,然后应用(1)式建立的统计量,再用上面介绍的方法进行显著性检验。
(五)0H 的显著性检验给定了显著性水平α,对于(1)式建立的检验统计量η,怎样选择临界值确定0H 的否定域?由于η的精确分布不知道,我们是用它的极限分布)1(2-m χ近似地选择临界值。
因此,应该这样选择临界值)()1(2αχ-m ,使得:ααχη=>-)}({)1(2m P即否定域由区间)),(()1(2∞-αχm 确定。
就是说(1)式计算得统计量η的观察值,若大于临界值)()1(2αχ-m ,则在显著性水平α下否定0H 。
由(1)式计算得到:.563.0120912≈-=∑=i ii np vη【实验结论】(结果)给定显著性水平05.0=α,由于自由度等于9-1-2=6,查得临界值为592.12)05.0()6(2=χ,由于0.563<12.592,所以不否定0H ,在实际工作中可认为光通量服从正态N (209,6.5). 【实验小结】(收获体会)发布函数的拟合检验,假设检验的问题,通过样本数据的统计。
利用皮尔逊2χ检验对非参数检验,得出皮尔逊定理。
学习了如何用皮尔逊2χ检验去检验是否带参数。
三、指导教师评语及成绩:评 语 评语等级优 良 中及格不及格1.实验报告按时完成,字迹清楚,文字叙述流畅,逻辑性强2.实验方案设计合理3.实验过程(实验步骤详细,记录完整,数据合理,分析透彻) 4实验结论正确.成 绩:指导教师签名: 批阅日期:附录1:源程序clcclearx=[189.5,192.5,195.5,198.5,201.5,204.5,207.5,210.5,213.5,216.5,219.5,222.5,225.5,228.5]; y=[0,1,2,3,7,14,20,23,22,14,8,4,2,0];bar(x,y)title('直方图')xlabel('变量值')ylabel('频数')。