医药数理统计自考复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
一、事件之间的关系及运算:
包含:事件A 发生必然导致事件B 发生,记作B A ⊂或A B ⊃。
相等:若B A ⊂,同时有A B ⊂,记为A=B 并事件:C A B =+={,A B 至少有一个发生} 交事件:AB ={,A B 同时发生}
互斥事件:,A B 不同时发生即Φ=AB ,互斥完备群:即(1)i j A A i j n =Φ≤≠≤且1n
i i A ==Ω∑
对 立事件:在一次试验中A 与B 有且仅有一个发生,即Φ=AB 且A B +=Ω
二、事件的概率
1.频率的定义:进行条件相同的n 次试验,事件A 出现m 次,则称m 为事件A 的频数,比值n/m 称为事件A 发生的频率。
记作()f A m n =
2.概率的古典定义:主要看例题 3.概率的性质: 1)、 ()01P A ≤≤; 2)、1)(=ΩP ; ()0P Φ= 三、概率的运算
1.加法定理:互斥事件()()()P A B P A P B +=+ 一般事件 ()()()()P A B P A P B P AB +=+- 对立事件 ()()()1P A B P A P B +=+=
2.乘法定理:独立事件()()()P AB P A P B =(独立的定义:()(/)P A P A B =或
()(/)P B P B A =)
一般事件()()(/)()(/)P AB P A P B A P B P A B == 注意:独立不互斥,互斥不独立 3.条件概率:()()
/()
P AB P B A P A =
,()/1(/)P B A P B A =-
四、全概公式和逆概公式(重点) 定理1:若事件组12,,
n B B B 是一列互不相容的事件,且有1
n
i i B ==Ω∑,对任何事件A ,有
()1()()/n
i i i P A P B P A B ==∑,即
1211
()()
()
()(|).
n n
i i n i i i P A P AB AB AB P AB P B P A B ===++
+==∑∑
定理2:若12,,
n B B B 是一列互不相容的事件,且
()1
,0,1,2,
n
i
i i B
P B i ==Ω>=
∑
则对任一事件A,P(A)>0有()()()
()()
1
///i i i n
i
i
i P B P A B P B A P B P A B ==
∑,即
()()/()
i i P AB P B A P A =
例题,书后习题。
第二章概率分布与数字特征
离散型变量的概率分布与数字特征 一、概率函数
1、定义:{}k k P X x p ==,写成表格的形式(分布率)
2、 基本性质:0≥i p ;∑=i
i p 1
二、分布函数
1、定义:(){},
F x P X x x R =≤∈
25{}P x X x <≤52{}{}P X x P X x =≤-≤52()()F x F x =-
345()()()P x P x P x =++
2、性质:0()1F x ≤≤;()F x 是x 的不减函数;()()0,1F F -∞=+∞=。
三、常见的离散型随机变量的分布
1、伯努力试验:对立、独立、重复
2、二项分布:~(,)X B n p ,,(1)EX np DX np p ==-
在n 次伯努力试验中,事件A 发生k 次的概率{}(1),k k
n k n
P X k C p p -==- 二项分布的最可能值0k :(1)n p +是整数,0(1),(1)1k n p n p =++- (1)n p +不是整数,0[(1)]k n p =+ 3、泊松分布:~().X P λEX DX λ==
e {},!
k
P X k k λλ-==
四、数字特征
1、均数(期望):1()k k k E X x p ∞
==∑,(加权平均)
均数的性质: E (C )=C ; E (kX )=kE (X );()E kX b kEX b +=+;()E X Y EX EY ±=±; 设X 、Y 独立,则 E (XY )=E (X )E (Y );
2、方差:(波动程度,离散程度)
2()[()]D X E X E X =-22()[()]E X E X =-,22()i i i
E X x p =∑
标准差:)(X D
方差的性质: D (C )= 0;2()().D kX k D X =;
设X 和Y 是两个相互独立的随机变量,则 ()()()D X Y D X D Y +=+ 3
、变异系数:CV =
,不同随机变量之间波动程度的比较
连续型随机变量的概率分布与数字特征 一、密度函数()f x
1、定义:d {}()b
a P a X
b f x x <<=⎰,
2、密度函数的性质:0)(≥x f ,R x ∈; .1d )(=⎰∞
+∞
-x x f
二、分布函数
1、定义:(){}()d x F x P X x f t t -∞
=≤=⎰
,
2、分布函数的性质:(1)0()1,F x x R ≤≤∈
(2)()F x 是单调不减函数;
(3)
()lim ()0,()lim ()1x x F F x F F x →-∞
→+∞
-∞==+∞==
(4)()()f x F x '=
注意:(1) 连续型随机变量取任何一个指定值的概率为0.即{}0P X c == (2){}{}P a X b P a X b <<=≤<{}{}P a X b P a X b =<≤=≤≤()()F b F a =- (3)()1()1()P X x P X x F x >=-≤=- 三、常见的连续型随机变量的分布
1、正态分布
1)、一般正态分布,2(,)X N μσ,2,EX DX μσ==
密度函数: 22
()2()x f x x μσ--
=
-∞<<+∞,
密度函数的性质:0)(≥x f ,R x ∈.
.1d )(=⎰
∞+∞
-x x f
μ确定曲线在坐标系中的位置,σ影响曲线的形状:当σ较大时,曲线较平坦;当σ较小
时,曲线较陡峭.
分布函数是22
()2(),t x F x t x μσ--
-∞
=-∞<<∞⎰
e
d
2)、标准正态分布()0,1X
N
密度函数2
2
(),x x x ϕ-
=
-∞<<∞,
()()x x ϕϕ-=
分布函数e
d 22
()t x Φx t -
-∞
=
⎰
, ()1()Φx Φx -=-,
3)、一般正态分布要化为标准正态分布计算
2(,)X
N μσ,
(0,1)X N μ
σ
-
四、连续型变量的数字特征
1、均数(期望):d ()()E X xf x x +∞-∞
=⎰
,性质同离散型
2、方差:2()[()]D X E X E X =-22()[()]E X E X =-,d 22()()E X x f x x +∞-∞
=⎰
性质同离散型 标准差:)(X D 3、变异系数:CVX =,不同随机变量之间波动程度的比较
第三章 随机抽样和抽样分布
一、统计量的定义: 二、样本的数字特征
1、样本均数:1
1n
i i X X n ==∑,2,EX DX μσ==
2、样本方差:2
211()1n i i S X X n ==--∑22111n i i X nX n =⎛⎫=- ⎪-⎝⎭
∑ 3、样本标准差:S 4、中位数: 5、众数: 6、极差: 三、抽样分布 1、样本均数的分布
n X X X ,,,21 相互独立,且与总体),(~2
σμN X 同分布, 则样本均值),(~2
n
N X σμ
标准化:~(0,1).X U N =
临界值
2、2χ分布
定义:设随机变量n X X X ,,,21 相互独立,且都服从标准正态分布)1,0(N ,称
222
2
12n X X X χ=++
+,为服从自由度为n 的2χ分布,22~().n χχ
2χ分布的性质:
1)、设)(~1221n χχ,)(~2222n χχ,且21χ,2
2χ相互独立,则22212
12~()n n χχχ++ 2)、若)(~22n χχ,则n E =)(2χ,n D 2)(2=χ
3)、
)1(~)1(22
2
--n S n χσ
2
χ分布的密度函数图像、2
χ分布的临界值
2、t 分布
定义:设)1,0(~N X ,)(~2n Y χ,且X 与Y 相互独立,则称随机变量
T =服从自由度
为n 的t 分布,记为T ~t (n ).
t
分布的性质:X t =
~(1)t n -
12~(2)X Y t t n n =+-(),22
2
1212(1)(1)2X Y w n S n S S n n -+-=+-
t 分布的密度函数图像,临界值 3、F 分布
定义:设)(~12n X χ,)(~22
n Y χ,且X 与Y 相互独立,则称随机变量 1
2
//X n F Y n =
服从自由度为12(,)n n 的 F 分布,记作12~(,)F F n n
性质:22
1122
22
~(1,1)X
Y
S F F n n S σσ=-- F 分布的密度函数图像,临界值 练习:55页,5题
第四章 总体的参数估计
一、参数的点估计
1、衡量估计量好坏的标准:无偏性、有效性、一致性。
无偏性:ˆ()E θ
θ=; 有效性:12
ˆˆ()()D D θθ< 样本均数和样本方差是总体均数和总体方差的无偏、有效、一致估计量。
二项分布,样本率ˆX p
n =是总体率的无偏估计量。
ˆˆ,pq
Ep p Dp n
==
泊松分布,ˆX λ
=是总体参数λ的无偏、有效估计量。
二、总体参数的区间估计 1、 置信区间的定义
2、正态分布的总体置信区间的确定(两个样本除外)61页,例1,例2
3、二项分布的总体置信区间的确定 1)、查表法(小样本)
2)、正态近似法(大样本)70页,例2
ˆ~(,)X pq p
N p n n
=ˆ~(0,1)
N ⇒
,n 由于
,
ˆˆˆ1. p q p S =-=
其中若记于是所求总体率p 的置信区间为 //2ˆ2ˆ(,)ˆˆp p p S p u S u αα-+⋅⋅ 或/2ˆ(ˆ)
p p u S α⋅±
练习:72页,4,5,14
第五章 总体参数的假设检验
一、假设检验的基本思想
1、假设检验的基本思想:小概率原理
2、假设检验中的两类错误以及两类错误之间的关系 第一类错误:α(弃真),0H 为真,拒绝0H 第二类错误:β(取伪),0H 为假,接受0H
关系:样本容量一定时,减小犯一类错误的概率,就会增加犯另一类错误的概率。
二、正态总体参数的假设检验。
注意检验的步骤,对方差的检验不要求掌握,成组比较中,反差未知且不相等,不考。
84页,例4
1、单个正态总体均数的检验
2σ已知 0010
00
:,
:H H μμμμμμμμ=≠><
(0,1)X U N =
拒绝域 :2
||U u U u U u αα
α
≥≥≤-
2σ未知 0010
00
:,
:H H μμμμμμμμ=≠><
(1)X T t n =
- 拒绝域 :2
||T t T t T t αα
α
≥≥≤-
2、单个正态总体方差的检验
22
22
0010
22022
0:,:H H σσσσσσσσ=≠>< 2
2220
(1)(1)n S
n χχσ
-=- 拒绝域:2222
12
2
22
22
1,ααααχχ
χχχχχχ-
-≤≥≥≤或
3、两个正态总体均数差的检验
三、离散型变量总体率的检验
1、列联表独立性的检验:四格表、列联表,例题4,5,99页,18题
2、参照单位法(不要求)
第八章 相关与回归
一、相关
1、 总体相关系数的性质 (1)1ρ≤;
(2)X 和Y 线性相关1ρ⇔=;
(3)如果X 和Y 独立,则0ρ=;若0ρ=,则X 和Y 非线性相关。
2、样本相关系数
定义:1()()xy i i i i i i l x x y y x y x y n ⎛⎫⎛⎫=--=-
⎪⎪⎝⎭⎝⎭
∑∑∑∑, 2
221()xx
i i i l x x x x n ⎛⎫=-=- ⎪⎝⎭∑∑∑,2
221()yy i i i l y y y y n ⎛
⎫=-=- ⎪⎝⎭
∑∑∑
l r =
性质:(1)1r ≤;
-1≤r <0,为负线性相关;0<r ≤1,为正线性相关;
(2)|r |越趋于1表示x 与y 线性关系越密切;|r |越趋于0表示x 与y 线性关系越不密切 3、相关系数的检验(了解) 1.R 检验,01:0,
:0H H ρρ=≠
2
l
r f n
==-,拒绝域:{||}
W r r
α
=≥
2.T检验,
01
:0,:0
H H
ρρ
=≠
~(2)
t t n
=-,拒绝域:
2
{||(2)}
W t t n
α
=≥-
二、回归方程
1、建立回归方程
,
xy
xx
l
b a y bx
l
==-,ˆy a bx
=+
2、回归方程的显著性检验
01
:0,:0
H b H b
=≠
2,
xx yy
U b l Q l U
==-
()
1,2
/(2)
U
F F n
Q nα
=-
-
F F
α
>,拒绝
第九章正交试验设计
一、正交表符号的含义
二、正交表的性质:158页
三、试验结果的直观分析:。