随机变量及其分布简介

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、编写中考虑的几个问题
由于在《数学3(必修)》中已经介绍了线性回归方程相关知识与应用,教材在这些知识的基础上增加了有关模型诊断的思想介绍,使学生使学生知到解决实际问题不仅仅是建立经验方程,还需要对样本数据、模型的拟合效果等方面进行考察,以求尽可能准确描述数据间的关系。
事实上,数据本身不能直接告诉我们它来自什么模型,我们所能做的仅是在一定的规则下努力寻找效果更好的模型来刻画这些数据。
3.具体内容的变化
4.
知识载体的变化:以取限值离散型随机变量为知识载体。
•使学生的注意力更集中在有关随机变量的均值、方差概念的理解;

•不影响二点分布、超几何分布、二项分布的知识理解,他们都是取有限值的随机变量。

增加了超几何分布。
•贴近学生们的生活。如在模球和扑克牌游戏中,都会出现超几何分布。而同学们又很熟悉这些游戏,由此可提升他们学习概率知识的兴趣。
1.函数模型与“回归模型”的关系。
2.
Байду номын сангаас3.
函数模型:
样本点在函数曲线 上
因变量y完全由自变量x确定
回归模型:
样本点不全在函数曲线 上
预报变量y完全由解释变量x和模型误差e确定
4.引进残差变量的作用:虽然无法得到残差变量 的值,但却可以估计它,对它进行分析,从而可以发现异常数据,可以做模型诊断。
5.
6.散点图与模型的选择:若散点分布在函数曲线族 中的某条曲线附近,则可以用
四、
1.在教学过程中要交待引入随机变量的原因(章引言中);
2.
3.通过与函数的比较加深对随机变量的理解;
4.
5.在介绍有关随机变量的概念过程中,重点在在于概念的理解及应用,不宜引入过于复杂的计算,以免喧宾夺主;
6.
7.注意产生超几何分布与二项分布的背景差别,以帮助学生更好地理解两个模型以及两个事件间独立性的概念。
横轴为编号,可以考察残差与编号次序之间的关系,常用于调查数据错误。
横轴为解释变量,可以考察残差与解释变量的关系,常用于研究模型是否有改进的余地。
若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域。
e)在残差图中寻找异常点(可能由错误数据引起,也可能由我们没有注意到的因素所引起),即远离坐标横轴的点。
在独立性检验内容的编写过程中,遇到的问题主要是知识背景的问题。传统上,都是以假设检验思想为基础来介绍独立性检验,这样就可以把独立性检验处理成一种特殊的假设检验。在没有假设检验知识为基础的情况下,我们采用类比于反正法的思路,对于典型案例进行分析,使得独立性检验的思想得以体现。
四、
在第一节的教学过程中需要注意如下问题。
7.
拟合数据。如在“红铃虫的产卵数与温度”的案例中,散点图如下
这说明两个变量很有可能近似呈现二次和数关系或指数函数关系,所以此时直接用线性回归模型不能达到最好效果。
8.残差变量与模型选择
9.
a)残差图的作用:残差图帮助确定异常点,以及模型的改进方向。
b)
c)残差图的制作及特点:
d)
坐标纵轴为残差变量,横轴可以有不同的选择。
(6)
三、
1.知识的引入的变化
2.
注重利用学生熟悉的实例和具体情景引入知识,以促发学生们的兴趣;
通过思考或探究栏目提出问题,以调动学生解决问题的积极性。
例如,我们通过学生们熟悉的掷骰子为背景提出问题,引导学生思考,以得到随机变量的概念。又如,我们以抽奖券为背景,设计了一套问题,引导学生体会概率和条件概率的区别。再如,我们通过混合糖果定价的问题,引入数学离散型随机变量均值的定义。
(2)
(3)介绍超几何分布模型及其应用,其目的是
(4)
i.让学生了解它的广泛应用背景,并使学生能够应用该分布设计一些能够丰富学生课外活动的摸奖游戏,引发学习兴趣;
ii.
iii.另外该模型还可以帮助理解二项分布模型的背景;
iv.
v.在产品的质量控制方面有广泛的应用。
vi.
(5)介绍条件概率和独立性的概念,主要是为引入二项分布模型打基础,另外这些概念在实际中也有广泛应用。
对研究对象的背景分析;
利用散点图判断模型类别;
估计模型参数;
残差分析,模型诊断。
案例2蕴含如下的思想:
对于同样的数据,有不同的统计分析方法可供选择,要用最有效的方法分析数据。
在讲完例2通过引导学生们讨论“是不是还有其它的效果更好的模型来拟合例2中的数据?”,获得上述结论。
在第二节的教学过程中应该注意如下问题
第二章
李勇,北京师范大学数学科学院
随机变量是研究随机现象的重要工具之一,他建立了连接随机现象和实数空间的一座桥梁,使得我们可以借助于有关实数的数学工具来研究随机现象的本质,从而可以建立起应用到不同领域的概率模型,如二项分布模型、超几何分布模型、正态分布模型等。
在本章中将通过具体实例,帮助学生理解取有限值的离散型随机变量及其分布列、均值、方差的概念,理解超几何分布和二项分布的模型并能解决简单的实际问题,使学生认识分布列对于刻画随机现象的重要性,认识正态分布曲线的特点及曲线所表示的意义。
一、内容与要求
1.随机变量及其分布的概念。
2.
通过具体实例使学生理解随机变量及其分布列的概念,认识随机变量及其分布对于刻画随机现象的重要性。要求学生会用随机变量表达简单的随机事件,并会用分布列来计算这类事件的概率。
3.超几何分布模型及其应用。
4.
通过实例,理解超几何分布及其导出过程,并能进行简单的应用。
12.
13.
第三章
李勇,北京师范大学数学科学院
回归分析和独立性检验都是常用的统计方法,在统计学中也占有很重要的地位。本章是在《数学3(必修)》的统计知识的基础上,通过对典型案例的讨论,进一步学习线性回归分析模型及其应用,并初步了解独立性检验的基本思想,认识统计思想的应用价值。
一、内容与要求
1.通过典型案例进一步介绍线性回归模型的有关知识,包括残差变量的来源,模型诊断的初步知识,以及应用线性回归模型解决非线性相关关系问题等,使学生进一步了解回归分析的基本思想、方法及其初步应用。
(10)
(11)关于正态分布模型,仅需要学生们了解正态分布密度曲线的特征,密度曲线与相应的随机变量落在某个区间的概率之间的关系,参数 和 的含义,以及 准则。
(12)
8.本章的重点和难点
9.
(1)离散型随机变量的分布列、均知和方差概念的理解;
(2)
(3)条件概率、两事件相互独立的概念;
(4)
(5)二项分布、超几何分布模型及其应用.
8.
超几何分布:从 个红球和 个黑球中,不放回模出m个球中的红球个数,结果导致“第 次摸出红球”与“第 次摸出红球”不相互独立( );
二项分布:从 个红球和 个黑球中,有放回模出m个球中的红球个数,结果导致“第 次摸出红球”与“第 次摸出红球”相互独立( )。
9.注意解释随机变量与样本均值(方差)的关系:
5.二项分布模型及其应用。
6.
通过具体实例使学生了解条件概率和两个事件相互独立的概念,理解n次独立重复试验和二项分布模型,并能解决一些简单的实际问题。
7.离散随机变量的均值与方差。
8.
通过实例使学生理解离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
9.正态分布模型。
5.
6.对内容安排的说明。
7.
研究一个随机现象,可以借助于随机变量,而分布描述了随机变量取值的概率分布规律。二项分布和超几何分布是两个应用广泛的概率模型.为了使学生能够更好地理解它们,并能用来解决一些实际问题,教科书在内容安排上作了如下考虑:
(1)为学生把注意力集中在随机变量的基本概念和方法的理解上,通过取有限个不同值的随机变量为载体介绍这些概念,以便他们能更好的应用这些概念解决实际问题。例如,如何定义随机变量来描述所感兴趣的随机事件;一个具体的随机变量都能表达什么样的事件,如何表达这些事件;如何用分布列来表达随机事件发生的概率等。

•应用广泛。如抽样中。

•可以帮助正确理解二项分布产生的背景。

5.更注重知识的应用
6.
体现概率统计的应用价值。
利用思考、探究等栏目提高学生解决实际问题能力。
如,例1.3演示了超几何分布在设计抽奖游戏中的应用,该例后的思考引导学生动手设计抽奖游戏;例2.2体现了条件概率在破译密码中的应用;例2.3给出了独立性在抽奖活动中的应用;例2.4给出了二项分布在射击中的应用;例3.3给出了离散型随机变量在制定减灾方案中的应用。
小结约1课时
3.本章知识框图
4.
本章介绍两种不同的统计方法,每种方法涉及的知识范围不同,下面分别列出这两种方法的知识框图。
回归分析知识框图
独立性检验知识框图
3.对内容安排的说明。
4.
回归分析的部分内容在《数学3(必修)》中已出现过,比如画散点图,最小二乘估计的计算公式,建立回归方程并进行预报等。在此基础上,本章通过典型案例进一步讨论一元线性回归模型,分析产生模型中随机误差项的原因;从残差分析的角度探讨异常数据的识别方法,以及所选用的回归模型是否可以改进的问题;介绍一个刻画模型拟合效果的指标,即相关指数,引导学生体会模型诊断的思想。作为线性回归模型的一个应用,教科书给出了一个讨论非线性相关关系的实例。
f)
g)
h)解释残差变量的来源
i)
其它因素的影响。如影响身高y的因素不只是体重x,可能还包括遗传基因、饮食习惯、生长环境等因素。
选用的回归模型近似真实模型所引起的误差。
预报变量的观测误差。身高y的测量有误差。
j)正确理解相关指数的含义
k)
相关指数是度量模型拟合效果的一种指标,它越小,模型拟合效果越好。
10.
两者都表示各自的平均位置(变化剧烈程度);
样本均值(方差)是随机变量,具有随机性,而随机变量的均值(方差)是实数,没有随机性;
样本均值(方差)的极限是总体均值(方差)。
11.在高尔顿钉板试验中,课文中说“随着试验次数的增加,这个频率直方图的形状会越来越像一条钟形曲线”的含义为:随着试验次数的增加,这个频率直方图的形状会越来越接近于钟形曲线的离散化。
第二节的独立性检验内容对于老师和同学来讲都是新的内容,因此教科书通过典型案例的研究过程,介绍了独立性检验的基本思想、方法和初步应用。
独立性检验的步骤是固定的,仿照教科书的例题,学生不难完成习题,但独立性检验的思想对学生来说是比较难理解的,它来源于统计上的假设检验思想.考虑到对高中生而言,假设检验的思想难于理解,所以在教科书上仅从反正法的角度介绍独立性检验思想。
(6)
(7)为了使学生更容易理解二项分布的产生背景,教材通过简单实例的讨论,向学生们展示从独立重复实验到二项分布的推导过程。
(8)
(9)对于离散型随机变量的均值与方差的含义及其计算公式,重点是概念的理解,而不是均值与方差的计算。因此教材中借助于很简单的离散型随机变量来介绍均值与方差的概念,以避免复杂的计算冲淡概念的理解。
2.
3.通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生能够应用独立性检验的方法解决一些最简单分类变量的独立性检验问题。
4.
二、
1.本章共10课时,具体内容和课时分配如下(仅供参考):
2.
3.1回归分析的基本思想及其初步应用约4课时
3.2独立性检验的基本思想及其初步应用约3课时
实习作业约2课时
在线性模型中,它代表解释变量刻画预报变量的能力。
l)注意提炼案例所蕴含的统计思想
m)
如在例1结尾提到“用身高预报体重时,需要注意下列问题:……”,这些论述适用于所有的回归模型。
模型适用的总体;
模型的时间性;
样本的取值范围对模型的影响;
模型预报结果的正确理解。
又如教科书上所列“建立回归模型的基本步骤”,不仅适用于线性回归模型,也适用于所有的回归模型。
1.反证法原理与假设检验原理比较。
反证法原理:
假设检验原理:
在假设一个论述不成立的前提下,如果推出一个矛盾,就证明了这个论述成立。
在假设一个论述不成立的前提下,如果一个与该假设矛盾的小概率事件发生,就推断这个论述成立。
2.独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。
3.
4.通过图形直观判断,只能定性地判断两个分类变量是否有关系,无法知道所得结论的可信程度,因此需要用列联表检验。
10.
借助直观使学生认识正态分布曲线的特点及含义。
二、
1.全章共安排了4个小节,教学约需12课时,具体内容和课时分配如下(仅供参考):
2.
2.1离散型随机变量及其分布列约3课时
2.2二项分布及其应用约4课时
2.3离散型随机变量的均值与方差约3课时
2.4正态分布约1课时
小结约1课时
3.本章知识框图
4.
相关文档
最新文档