应用数理统计期末复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用数理统计期末复习指导
一、复习重点
第一章 绪 论
数理统计学是一门对客观不确定现象进行数据搜集、整理、表列和分析的科学,其目的是了解客观情况,探索数据内在结构及现象之间的规律性。
对搜集的全部数据加以整理来研究这些数据的特征,这称为描述统计。建立在样本数据的基础上对总体的特征做出估计和推断,这称为推断统计。
数理统计学的发展大致经历了古典统计学、近代统计学和现代统计学三个阶段。
第二章第二章 数据的搜集、整理与描述
统计表最主要的内容是指标名称与指标数值。
数据集中趋势的计量:(1)均值(算术平均数);(2)几何平均数;(3)中位数;(4)众数;(5)切尾均值。
离散趋势的计量:(1)极差,又称为全距。极差是数据中最大值和最小值之差;(2)四分位差;(3)平均差,它是数据值与其均值之差绝对值的平均数;(4)方差和标准差。方差是数据值与其均值离差平方和的平均数。方差不仅可以用来反映值代表性的高低,而且也是数据离散趋势的最主要的统计数量特征;(5)离散系数。
第三章 概率基础
凡是一个行动或过程会导致一毓可能的结果之一,但具体发生哪一个结果是不确定的,这种行动或过程统称为随机试验。随机试验所有可能结果的集合称作样本空间。随机试验的每一个可能的结果称为随机事件。
凡是必然发生的事件称为必然事件。必然不发生的事件称为不可能事件。如果事件A的发生必然导致事件B的发生,则称事件A包含于事件B,记作 。两个事件A、B中至少有一个发生称为两个事件的并,记作 。两个事件A、B中同时发生称为两个事件的交,记作 。事件A发生而事件B不发生称为两个事件的差,记作A-B或 。样本空间与事件A的差称为事件A的逆事件或对立事件,互补事件,记作 。事件A与事件B不可能同时发生称两个事件互不相容或互斥,记 。事件的运算满足: B A ⊂B A B A B A A A -Ω=ϕ
=B A
概率的古典定义:如果某一随时机试验的结果(基本事件)有限;而且各个结果出现的可能性相等,则某一事件A的概率为该事件所包含的基本事件数m 与样本空间中所包含的基本事件个数n 的比值,记为
概率的公理化定义:
(1)对于任何一个事件A,有 ;
(2)对于必然事件 ,有 ;对于不可能事件 ,有 ; (3)对于两两互斥事件 ,有
概率的加法规则: 概率的乘法规则:
事件的独立性与互斥的区别:
(1)互斥事件一定是相互依赖(不独立)的,但相互依赖的事件则不一定是互斥的。
(2)不互斥事件可能是独立的,也可能是不独立的,然而独立的事件不可能是互斥的。
全概率公式:设 为一样本空间,事件 , 为互斥事件,且有 和 ,若样本空间 的另一个事件A与上述几个事件同时出现,则有
贝叶斯公式:条件同全概率公式,有
i
n
i i n i A A 11=== i
n
i i n
i A A 1
1
=== n
m
A P =
)(1)(0≤≤A P Ω1)(=ΩP ϕ0)(=Ω
P ,,2
1
A A
++=++)()()(2121A P A P A A P )()()()(AB P B P A P B A P -+=+)/()()/()()(B A P B P A B P A P AB P ==Ω ,,21B B n B n B B B ++=Ω210)(>i B P Ω)
/()( )/()()/()()(2211n n B A P B P B A P B P B A P B P A P ++⋅+⋅= n
i B A P B P A B P n
i i I ,,2,1 )
/()()/( =⋅=
第四章 随机变量及其分布
随时机变量可以分为离散型随机变量和连续型随机变量两种。离散型随机变量的可能取值为有限可数个或无限可数个。连续型随机变量的可能取值是某一区间的全部数值。
离散型随机变量的概率分布特点。
(1)(1)随机变量的值是可以一一列举的;
(2)(2)
,即随机变量取某一特定值 的概率
为非负。
(3) ,即随机变量Z取各个可能数值 的概率之和为1。
贝努里试验的特点:
(1)(1)每次试验都有两种可能的结果:“成功”或“失败”; (2)(2)第次试验其“成功”的概率(记为 )是一样的,相应地“失
败”
的概率(记为 )也是不变的,显然 ; (3)(3)第一次试验相互独立。
若随机变量X服从二项分布 ,则二项分布的均值为 ,方 差为 。
设总体的单位数为N,其中具有某种特征的单位数为K,不具有某种特征的单位数为N-K,用不重复抽样的方式从中抽取 n 个单位,其中具有某种特征的单位数为X。则X服从超几何分布,即
泊松分布的密度函数为:
其它
∑=≥=n
i i x X P 10)(i x ∑===n i i x X P 11)(i x ρq 1=
+q ρ),(p n b np npq n
N
x n k N x k C C C x X P /)(--==0
,2,1,00!
)(>=⎪⎪⎩
⎪⎪⎨
⎧=-λλλ
x e x x P x
泊松分布的参数是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于单位时间内随机事件发生的次数,如某一服务设施在一定时间内到达人数;电话交换台接到呼唤的次数;公共汽车站的候客人数;机器出现的故障数;自然灾害发生的次数等。
泊松分布具有性质: 。若X服从参数为 和 的正态分布,则其密度函数为:
记为X-N 若X服从标准正态分布,则其密度函数为:
记为X-N(0,1)
第五章 统计推断导论
随机抽样的组织方式有:简单随机抽样、系统抽样、分类抽样和整群抽样。 简单随机抽样的原则是:在抽取样本时,必须保证每一个可能样本被抽到的概率是相等的,在实际抽选过程中是使总体中每个单位被包括在样本中的可能性相等。简单随机抽样有两种抽取单位的方法:重复抽样和不重复抽样。
系统抽样,也称等距抽样或机械抽样,它是从总体中抽取样本时,按照时间或空间的等距间隔抽取。
分类抽样是先把总体按一定标志划分成许多性质相近的类型或组别,然后在每种类型中抽取单位。
整群抽样是把总体分为许多群,然后在这些群中随机抽选若干个群做为样本,把它作为总体的一个代表。
当被抽样总体服从正态分布时,样本均值的抽样分布具有下列性质: (1)样本均值 的分布也是正态分布; (2)样本均值的平均数等于总体平均数;
(3)样本均值的方差等于被抽样总体的方差除以样本容量。
λλ===)()(X D X E μσ∞
<<∞-=--x e x f x 2
22
)
(21)(σμσ
π)
,(2σμ2
2
21)(x e x f -=
π
x