万变不离其宗:2017高中数学课本典例改编之选修:专题六 随机变量及其分布列、统计案例 含解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题六 随机变量及其分布列、统计案例
一、题之源:课本基础知识
1.离散型随机变量
随着试验结果变化而变化的变量称为随机变量,常用字母X ,Y ,ξ,η,…表示.所有取值可以一一列出的随机变量,称为离散型随机变量. 2.离散型随机变量的分布列及其性质
[1)一般地,若离散型随机变量X 可能取的不同值为x 1,x 2,…,x i ,…,x n ,X 取每一个值
x i [i =1,2,…,n )的概率P [X =x i )=p i ,则表
称为离散型随机变量X 的概率分布列,简称为X 的分布列,有时为了表达简单,也用等式P [X =x i )=p i ,i =1,2,…,n 表示X 的分布列. [2)离散型随机变量的分布列的性质 ①p i ≥0[i =1,2,…,n );
②∑n
i =1
p i =1. 3.常见离散型随机变量的分布列 [1)两点分布:
若随机变量X 服从两点分布,则其分布列为
其中p =P [X =1)称为成功概率. [2)超几何分布
在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{X =k }发生的概率为P [X =k )=C k M C n -k
N -M
C n N ,k =0,1,2,…,m ,其中m =min{M ,n },且n ≤N ,M ≤N ,n ,M ,N ∈N *,
称分布列为超几何分布列.
4.条件概率
5.事件的相互独立性
[1)定义:设A ,B 为两个事件,如果P [AB )=P [A )P [B ),则称事件A 与事件B 相互独立. [2)性质:
①若事件A 与B 相互独立,则P [B |A )=P [B ),
P [A |B )=P [A ),P [AB )=P [A )P [B ).
②如果事件A 与B 相互独立,那么A 与B -,A -与B ,A -与B -
也相互独立. 6.独立重复试验与二项分布
7.离散型随机变量的均值与方差 若离散型随机变量X 的分布列为
[1)均值:称E [X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量X 的均值或数学期望,它反映
了离散型随机变量取值的平均水平.
[2)D [X )=∑n
i =1 [x i -E [X ))2
p i 为随机变量X 的方差,它刻画了随机变量X 与其均值E [X )的平均偏离程度,其算术平方根D (X )为随机变量X 的标准差. 8.均值与方差的性质
(1)E (aX +b )=aE (X )+b
(2)D (aX +b )=a 2
D (X )
[a ,b 为常数). 9.两点分布与二项分布的均值、方差
10.正态曲线的特点
[1)曲线位于x 轴上方,与x 轴不相交; [2)曲线是单峰的,它关于直线x =μ对称; [3)曲线在x =μ处达到峰值



[4)曲线与x 轴之间的面积为1;
[5)当σ一定时,曲线随着μ的变化而沿x 轴平移;
[6)当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散. 11.变量间的相关关系
[1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
[2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 12.两个变量的线性相关
[1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
[2)回归方程为y ^=b ^x +a ^,其中b ^
=错误!,错误!=错误!-错误!错误!.
[3)通过求Q =i =1
∑n
[y i -bx i -a )2
的最小值而得出回归直线的方法,即求回归直线,使得样本
数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.
[4)相关系数:
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.
13.独立性检验
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表[称为2×2列联表)为:
K2=n(ad-bc)
(a+b)(a+c)(b+d)(c+d)
[其中n=a+b+c+d为样本容量).
二、题之本:思想方法技巧
1.求离散型随机变量的分布列的步骤
[1)明确随机变量的所有可能取值,以及每个值所表示的意义,判断一个变量是否为离散型随机变量,主要看变量的值能否按一定的顺序一一列出.
[2)利用概率的有关知识,求出随机变量取每个值的概率.对于古典概率、互斥事件的概率、相互独立事件同时发生的概率、n次独立重复试验恰有k次发生的概率等,都要能熟练计算.
[3)按规范形式写出分布列,并用分布列的性质验证.
2.分布列的结构为两行,第一行为随机变量X所有可能的取值,第二行是对应于随机变量X 的值的事件发生的概率.在每一列中,上为“事件”,下为事件发生的概率,只不过“事件”是用一个反映其结果的实数表示的.每完成一列,就相当于求一个随机事件发生的概率.
3.可用超几何分布解决的题目涉及的背景多数是生活、生产实践中的问题,且往往由明显的两部分组成,如产品中的正品和次品,盒中的白球和黑球,同学中的男生和女生等.注意弄清楚超几何分布与二项分布的区别与联系.
4.“独立”与“互斥”的区别
两事件互斥是指两个事件不可能同时发生,两事件相互独立是指一个事件发生与否对另一事
件发生的概率没有影响[如有放回的抽取模型).两事件相互独立通常不互斥,两事件互斥通常不独立. 5.条件概率的求法
[1)利用定义,分别求出P [A ),P [AB ),得P [B |A )=
P (AB )
P (A )

[2)借助古典概型概率公式,先求事件A 包含的基本事件数n [A ),再在事件A 发生的条件下求事件B 包含的基本事件数n [AB ),即P [B |A )=
n (AB )
n (A )
.
[3)为了求一些复杂事件的条件概率,往往可以先把它分解为两个[或若干个)互斥事件的和,利用公式P [B ∪C |A )=P [B |A )+P [C |A )进行计算,其中B ,C 互斥. 6.对n 次独立重复试验的理解
[1)在n 次独立重复试验中,事件A 恰好发生k 次的概率为P [X =k )=C k n p k
[1-p )n -k
,k =0,1,
2,…,n ,其中p 是一次试验中该事件发生的概率.实际上,C k n p k
[1-p )
n -k 正好是二项式[1-
p )+p ]n 的展开式中的第k +1项.这也是二项分布名称的由来.
[2)要弄清n 次独立重复试验中恰好发生k 次的概率与第k 次才发生的概率计算公式P n [k )=
C k n p k [1-p )
n -k 与P k =[1-p )k -1p 的区别. 7.相互独立事件同时发生的概率的求法
[1)利用相互独立事件的概率乘法公式直接求解;
[2)正面计算较繁或难于入手时,可以从其对立事件入手进行计算. 8.正确理解独立重复试验与独立事件间的关系
独立重复试验是指在同样条件下可重复进行的,各次之间相互独立的一种试验,每次试验都只有两种结果[即某事件要么发生,要么不发生),并且在每次试验中,事件发生的概率均相等.独立重复试验是相互独立事件的特例[概率公式也是如此),就像对立事件是互斥事件的特例一样.一般地,有“恰好”等字眼的用独立重复试验的概率公式计算更简单,就像有“至少”或“至多”等字眼的题目用对立事件的概率公式计算更简单一样. 9.均值与方差的常用性质
掌握下述有关性质,会给解题带来方便: [1)E [aX +b )=aE [X )+b ;
E [X +Y )=E [X )+E [Y ); D [aX +b )=a 2D [X ).
[2)若X ~B [n ,p ),则E [X )=np ,D [X )=np [1-p ). 10.计算均值与方差的基本方法
[1)已知随机变量的概率分布求它的均值、方差和标准差,可直接用定义或公式求; [2)已知随机变量X 的均值、方差,求X 的线性函数Y =aX +b 的均值、方差和标准差,可直接用均值及方差的性质求;
[3)如能分析所给随机变量服从常用的分布[如两点分布、二项分布等),则可直接利用它们的均值、方差公式来求.
11.[1)在实际中经常用均值来比较平均水平,当平均水平相近时,再用方差比较稳定程度;[2)注意离散型随机变量的均值、方差与样本数据的平均数、方差的区别与联系.
12.正态曲线的性质特点可用来求其数学期望μ和标准差σ:正态曲线是单峰的,它关于直线x =μ对称,据此结合图象可求μ;正态曲线在x =μ处达到峰值12πσ
,据此结合图象
可求σ.
13.能熟练应用正态曲线的对称性解题,并注意以下几点: [1)正态曲线与x 轴之间的面积为1;
[2)正态曲线关于直线x =μ对称,从而在关于x =μ对称的区间上概率相等; [3)几个常用公式:
P [X <a )=1-P [X ≥a );
P [X <μ-a )=P [X ≥μ+a )[即第[2)条);
若b >0,则
P [X <μ-b )=
1-P (μ-b <X ≤μ+b )
2
.
14.无论是正态分布的正向或逆向的应用问题,关键都是先确定μ,σ,然后利用对称性,将所求概率转化到三个特殊区间.
15.在研究两个变量之间是否存在某种关系时,必须从散点图入手.对于散点图,可以做出如下判断:
[1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.
[2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系. [3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 16.分析两个变量相关关系的常用方法: [1)利用散点图进行判断; [2)利用相关系数r 进行判断. 17.
[1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义.
[2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值.
[3)用最小二乘法求回归方程,关键在于正确求出系数,,由于,的计算量较大,计算时应仔细小心.
18.线性回归分析的方法、步骤 [1)画出两个变量的散点图;
[2)求相关系数r ,并确定两个变量的相关程度的高低;
[3)用最小二乘法求回归直线方程y
ˆ=x +, ⎪⎪
⎪⎩⎪⎪⎪
⎨⎧
-=--=---=∑∑∑∑====.ˆˆ,)())((ˆ1
2
21
1
21x b y a
x
n x
n y
x x x y x b n
i i
n
i i
i n
i i n
i i i
[4)利用回归直线方程进行预报.
注:①对于非线性[可线性化)的回归分析,一般是利用条件及我们熟识的函数模型,将题目
中的非线性关系转化为线性关系进行分析,最后还原.②利用相关指数R 2
=1-
∑∑==--n i i
n
i i i
y y
y y
1
2
12)()ˆ(刻画回归效果时,R 2
越大,意味着残差平方和∑=-n
i i i
y
y
1
2)ˆ(越小,模型的拟合效果越好. 19.独立性检验的一般步骤
[1)假设两个分类变量x 与y 没有关系; [2)计算出K 2
的观测值,其中
K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )

[3)把K 2
的值与临界值比较,作出合理的判断. 20.独立性检验的注意事项
[1)在列联表中注意事件的对应及相关值的确定,不可混淆.
[2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.
[3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.
三、题之变:课本典例改编
1.原题(选修2-3第八十六页例2)一只红铃虫的产卵数 y 和温度 有关,现收集了 7 组观测数据列于表中,试建立 y 与 之间的回归方程。

改编 为了对2006年佛山市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学[已折算为百分制)、物理、化学分数对应如下表,
[1) 若规定85分[包括85分)以上为优秀,求这8位同学中数学和物理分数均为优秀的概率; [2) 用变量y 与x 、z 与x 的相关系数说明物理与数学、化学与数学的相关程度;
[3) 求y 与x 、z 与x 的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.
参考数据:5.77=x ,85=y ,81=z ,
1050)(8
1
2
≈-∑=i i
x x

456)(8
1
2≈-∑=i i
y y

550
)(8
1
2
≈-∑=i i
z z

688
))((8
1
≈--∑=i i i
y y x x

755
))((8
1
≈--∑=i i i
z z x x

7)ˆ(8
1
2
≈-∑=i i i
y
y
,94)ˆ(8
1
2≈-∑=i i i z z ,5.23550,4.21456,4.321050≈≈≈.
[3) 设y 与x 、z 与x 的线性回归方程分别是a bx y
+=ˆ、a x b z '+'=ˆ. 根据所给的数据,可以计算出63.345.77*65.085,65.01050
688
=-===
a b , 20.255.77*72.081,72.01050
755
=-='==
'a b . 所以y 与x 和z 与x 的回归方程分别是63.3465.0ˆ+=x y
、20.2572.0ˆ+=x z . 又y 与x 、z 与x 的相关指数是98.0456712≈-
=R 、83.0550
94
12≈-='R .
故回归模型63.3465.0ˆ+=x y
比回归模型20.2572.0ˆ+=x z 的拟合的效果好. 2.原题(选修2-3第九十五页例1)改编 甲乙两个学校高三年级分别有1100人,1000人,为了了解两个学校全体高三年级学生在该地区二模考试的数学成绩情况,采用分层抽样方法从两个学校一共抽取了 105名学生的数学成绩,并作出了如下的频数分布统计表,规定考试成绩在120,150]内为优秀,甲校:
乙校:
[I )计算,x y 的值;
[II)由以上统计数据填写右面22⨯列联表,若按是否优秀来判断,是否有97.5% 的把握认为两个学校的数学成绩有差异.
[III)根据抽样结果分别估计甲校和乙校的优秀率;若把频率作为概率,现从乙校学生中任
附:
2(3,)5
B 032)(1)5-=
分布列:
期望:
26 ()3.
55 Eξ=⨯=。

相关文档
最新文档