选修2 第二章 正态分布和线性回归讲义

合集下载

高二数学正态分布、线性回归人教版知识精讲

高二数学正态分布、线性回归人教版知识精讲

高二数学正态分布、线性回归人教版[同步教育信息]一. 本周教学内容正态分布、线性回归二. 重点、难点 〔一〕抽样方法1. 简单随机抽样⎩⎨⎧随机数表法抽签法2. 系统抽样3. 分层抽样关键:三种抽样均使每个个体被抽到的概率相等〔二〕总体分布总体分布曲条形图线总体密度频率分布直方图频率分布条⎪⎩⎪⎨⎧---累积频率分布,曲线上一点),(b a P 即:)(a P b <=ξ〔三〕正态分布1. 正态分布),(2σμN ,其总体密度曲线近似为函数。

R x x f x ∈=--222)(21)(σμσσπ 〔σμ,为参数,0>σ〕〔1〕曲线在x 轴上方,与x 轴不相交。

〔2〕曲线关于直线μ=x 对称。

〔3〕μ=x 时,)(x f 取得最大值。

〔4〕↑-∞),(μ↓∞+),(μ〔6〕σ越大,曲线越“矮胖〞,σ越小曲线越“高瘦〞。

2. 标准正态分布)1,0(N 2221)(x ex f -=πR x ∈〔1〕偶函数 〔2〕π21)(max =x f〔3〕↑-∞)0,( ),0(∞+↓3. 标准正态分布)(1)()(000x x x P x --=<=φφ )()()(a b b x a P φφ-=<<4. 一般正态分布与标准正态分布的转化),(2σμN 中,)()()(σμφξ-=<=x x P x F〔四〕线性回归相关关系、回归分析、散点图)(21n x x x n x +++=)(121n y y y ny +++=2222121nix x x xni +++=∑= 2222121ni y y y yni +++=∑= n n iiy x y x y x yx ni +++=∑= 22111∴ 2211xn xyx n y x b ni ni ii i --=∑∑== x b y a -=回归直线方程a bx y+=ˆ 样本相关系数))((2222111y n y x n x yx n yx r ni ni ii i i ni ---=∑∑∑===1≤r 且r 越接近于1,相关程度越大r 越接近0,相关程度越小05.0r r > 回归直线方程有意义 05.0r r ≤ 回归直线方程无意义[典型例题][例1] 某政府机关在职人员100人,其中副处级干部10人,一般干部70人,职员20人,上级机关为了解政府机构改革的意见,要从中抽一个容量为10人的样本应选择〔 D 〕A. 抽签法B. 随机数表法C. 系统抽样D. 分层抽系[例2] 某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取一个容量为45的样本,那么高一、高二、高三各年级抽取人数分别为〔 D 〕A. 15,5,25B. 15,15,15C. 10,5,30D. 15,10,20[例3] 一个容量为n 的样本分成假设干组,某组的频数和频率分别为30和0.25那么=n 〔 B 〕A. 750B. 120C. 240D. 150[例4] ξ~)05.0,4.1(N ,=<<)45.135.1(ξP 〔 C 〕A. 8413.0B. 4406.0C. 6826.0D. 5671.0[例5] 一个容量为20的样本数据,分组后组距与频数如下:]20,10(2个,]30,20(3个,]40,30(4个,]50,40(5个,]60,50(4个,]70,60(2个,那么样本在区间〔∞-,50〕上的频率为〔 D 〕A. 5%B. 25%C. 50%D. 70%[例6] 线性回归方程a bx y+=ˆ过定点),(y x 。

正态分布与线性回归

正态分布与线性回归
独立重复试验时事件 A 第一次发生,且 P(ξ=k)=_q_k_-_1_p_(其中 P 是在
一次试题中事件 A 发生的概率;p+q=1,k=1,2,3,…),则称 ξ 服从 几何分布,记作 g(k,p)=qk-1p.
第74讲 │ 要点探究
要点探究
► 探究点1 离散型随机变量的分布列及其应用
例 1 已知某离散型随机变量 ξ 的分布列如下:
A=A1 B 1+ A 1B1+A1B1+A2B2,故所求的概率为
P(A)=P(A1 B 1)+P( A 1B1)+P(A1B1)+P(A2B2)
第74讲 │ 要点探究
=P(A1)P( B 1)+P( A 1)P(B1)+P(A1)P(B1)+P(A2)P(B2) =0.1×0.9+0.9×0.1+0.1×0.1+0.3×0.3=0.28.
[点评] (1)二项分布是一类重要的分布,要熟练掌握.在写分布列时, 首先要判断随机变量是否满足二项分布的条件.(2)在进行概率计算时, 要注意排列、组合等知识在等可能事件中的应用,要注意互斥事件、相 互独立事件、独立重复试验的概率的应用.
第74讲 │ 要点探究
某厂生产电子元件,其产品的次品率为 5%,现从 一批产品中任意连续取出 2 件.
3.课时安排:本单元共安排了4讲及一个单元能力训练卷, 每讲建议1课时完成,单元能力训练卷建议1课时完成,大约共 需5课时.
第74讲 │ 离散型随机变量的分布列
第74讲 离散型随机变量的分布 列
第74讲 │ 编读互动
编读互动
离散型随机变量及其分布列是高考必考的一个知识点,常常作为 解答题的一问出现.本讲主要复习离散型随机变量及其分布列的计算, 复习时,要抓住离散型随机变量的概率分布的两个本质特征:pi≥0(i =1,2,…,n),p1+p2+…+pn=1,这是确定分布列中参数值的依据.求 离散型随机变量的分布列时,首先要根据具体情况确定随机变量 ξ 的 取值情况,然后利用排列、组合与概率知识求出 ξ 取各个值的概率.掌 握几个典型的分布列:几何分布、二项分布等.

第二章简单线性回归模型

第二章简单线性回归模型
2586
4000
2037 2210 2325 2419 2522 2665 2799 2887 2913 3038 3167 3310 3510
2754
4500
2277 2388 2526 2681 2887 3050 3189 3353 3534 3710 3834
3039
5000 5500
2469 2924 2889 3338 3090 3650 3156 3802 3300 4087 3321 4298 3654 4312 3842 4413 4074 4165
Yi 与 E(Yi Xi )不应有偏差。若偏
差u i 存在,说明还有其他影响因素。
Xi
X
u i实际代表了排除在模型以外的所有因素对 Y 的影
响。 u i
◆性质 是其期望为 0 有一定分布的随机变量
重要性:随机扰动项的性质决定着计量经济分析结19
果的性质和计量经济方法的选择
引入随机扰动项 u i 的原因
特点:
●总体相关系数只反映总体两个变量 X 和 Y 的线性相关程度 ●对于特定的总体来说,X 和 Y 的数值是既定的,总体相关系
数 是客观存在的特定数值。
●总体的两个变量 X 和 Y的全部数值通常不可能直接观测,所
以总体相关系数一般是未知的。
7
X和Y的样本线性相关系数:
如果只知道 X 和 Y 的样本观测值,则X和Y的样本线性
计量经济学
第二章 一元线性回归模型
1
未来我国旅游需求将快速增长,根据中国政府所制定的 远景目标,到2020年,中国入境旅游人数将达到2.1亿人 次;国际旅游外汇收入580亿美元,国内旅游收入2500亿 美元。到2020年,中国旅游业总收入将超过3000亿美元, 相当于国内生产总值的8%至11%。

高二数学正态分布、线性回归知识精讲 人教版

高二数学正态分布、线性回归知识精讲 人教版

高二数学正态分布、线性回归知识精讲 人教版一. 本周教学内容:高三新课:抽样方法、总体分布的估计、正态分布、线性回归二. 本周教学重、难点:1. 抽样方法:简单随机抽样,系统抽样,分层抽样。

2. 正态分布:(1)正态分布的密度函数:222)(21)(σμσπ--=x ex f (R x ∈>,0σ)(2)正态曲线(3)标准正态分布的密度函数:2221)(x ex f -=π(R x ∈)(4)标准正态曲线 (5)正态曲线的性质[例1] 为了了解参加某次数学竞赛的1000名学生的成绩,打算抽取一个容量为50的样本,说明抽样方法。

解:用系统抽样法:假定这1000名学生的编号为1,2,…,1000,由于20:11000:50=,将总体均分成50个部分,其中每一部分包含20个个体,假设第一部分的编号为1,2,…,20,然后在第一部分随机抽取一个号码(比如它是第18号),那么从该号码开始,每隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998即为系统抽样样本。

[例2] 某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出抽样过程。

解:因为机构改革关系到各种人的不同利益,故采用分层抽样方法较为妥当。

∵820160=,∴ 2816=,148112=,4832=。

因行政人员和后勤人员较少,可将他们分别按1~16编号与1~32编号,然后采取抽签法分别抽取2人和4人。

对教师112人采用000,001,…,111编号,然后用随机数表法抽取14人。

[例3] 某批零件共160个,其中,一级品有48个,二级品有64个,三级品32个,等外品16个,从中抽取一个容量为20的样本。

请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同。

解: (1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作了1~160个号签,从中随机抽20个,显然每个个体被抽到的概率为8116020=。

正态分布-线性回归

正态分布-线性回归

正态分布、线性回归一、 知识梳理1.正态分布的重要性正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。

一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。

2.正态曲线及其性质正态分布函数:22()2()x f x μσ--=,x ∈(-∞,+∞)3.标准正态曲线标准正态曲线N (0,1)是一种特殊的正态分布曲线,00()1()x x Φ-=-Φ,以及标准正态总体在任一区间(a ,b)内取值概率)()(a b P Φ-Φ=。

4.一般正态分布与标准正态分布的转化由于一般的正态总体),(2σμN 其图像不一定关于y 轴对称,对于任一正态总体),(2σμN ,其取值小于x 的概率)()(σμ-Φ=x x F 。

只要会用它求正态总体),(2σμN 在某个特定区间的概率即可。

5.“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。

这种认识便是进行推断的出发点。

关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。

课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。

进行假设检验一般分三步:第一步,提出统计假设。

课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布),(2σμN ; 第二步,确定一次试验中的取值a 是否落入范围(μ-3σ,μ+3σ); 第三步,作出推断。

如果a ∈(μ-3σ,μ+3σ),接受统计假设;如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设。

6.相关关系研究两个变量间的相关关系是学习本节的目的。

高考数学理一轮复习 X1-4正态分布、线性回归精品课件

高考数学理一轮复习 X1-4正态分布、线性回归精品课件

备选例题1 设随机变量ξ服从正态分布:ξ~ N(1,4),试求:
(1)P(0<ξ≤2); (2)求常数C,使P(ξ≤C)=32·P(ξ>C).
参考数据:Φ(0)=0.5,Φ(1)=0.8413,Φ(2) =0.9772,Φ(0.5)=0.6915,Φ(1.88)= 0.9697,Φ(3)=0.9987.
2.小概率事件是指事件发生的概率很小的事, 通常认为这些情况在一次试验中几乎是不可 能发生的.
3.统计中假设检验的基本思想:根据小概率 事件在一次试验中几乎不可能发生的原理和 从总体中抽测的个体的数值,对事先所作的 统计假设作出判断,是拒绝假设,还是接受 假设.
4.利用线性回归方程,可由一个变量的值预 测或控制另一个变量的值.借助计算器,特 别是含统计的计算器,能简化手工的计算, 迅速得出正确结果.
(函数Φ(x0)实际上是正态总体N(0,1)的累积分
布函数),即Φ(x0)=

(5)两个重要公式:ⅰ.Φ(-x)=1Φ(x)


Φ(a)
ⅱ.P(a<ξ<b)=Φ(b)-
. 小于
(6)对于任一正态分布总体N(μ,σ2)来说,取
值 x的概率为F(x)=Φ(
).
(7)假设检验的基本思想
ⅰ.提出统计假设,如假设随机变量服从正态 分布等;
5.“回归”和“相关”含义是不同的:如果 两个变量中的一个变量是人为可以控制、非 随机的,另一变量的变化是随机的且随着控 制变量的变化而变化,则这两变量间的关系 就称为回归关系;若两个变量都是随机的, 则称它们之间的关系为相关关系,在本教材 中,两者不加区别.
方法规律·归纳
题型 一
正态分布的基本运算
思维 提示
①P(x<x0)=Φ(x0); ②Φ(x0)=1-Φ(-x0);

第二章 经典线性回归模型

第二章 经典线性回归模型

它表明,对于n个时期t =1,2,…,n,该模型成立。
6
更一般的形式为:
Yi xi ui
i 1,2,...,n
(2.4)
即模型对X和Y的n对观测值(i=1,2,…,n)成立。 (2.3)式一般用于观测值为时间序列的情形,在横 截面数据的情形,通常采用(2.4) 式。
7
例2.1 城镇居民家庭人均消费方程 根据凯恩斯的绝对收入消费理论,在其它 条件不变的情况下,消费与可支配收入同方向变 动,即消费曲线的斜率为正。根据中国2006年31 个省市的城镇居民家庭平均每人全年可支配收入 income(单位:元)和城镇居民家庭平均每人全年 消费性支出consume的数据(单位:元),画出散 点图如下:
(6)各解释变量之间不存在严格的线性关系。
上述假设条件可用矩阵表示为以下四个条件:
18
A1. E(u)=0 A2. E (uu) 2 I n
由于
u1 u2 uu u1 u2 ... u n
2
u12 u1u2 ...... u1un 2 u2u1 u2 ...... u2un ... un ................................. 2 unu1 unu2 ...... un
8
15,000 14,000 13,000 12,000
CONSUME
11,000 10,000 9,000 8,000 7,000 6,000 8,000
12,000
16,000 INCOME
20,000
24,000
从图中看出,两变量之间呈线性关系,可建立城镇居 民家庭人均消费方程如下:
C o n su m e * In c o m e u

选修2 第二章 正态分布和线性回归讲义

选修2 第二章 正态分布和线性回归讲义

1
2
e

x 2 2 x 1 4

1

( x 1) 2 2( 2 )2
2 1 2 1 ( ) ( 2 2 (1) (1) 2(1) 1 2 0.8413 1 0.6826 。 又 P(1 2 x 1 2 2 ) F (1 2 2 ) F (1 2 ) F ( 1 2 )F (1 2 ) 2 2 1 2 1 ( ) ( ) (2) (1) 2 2 (2) (1) 1 0.9772 0.8413 1
王新敞
奎屯 新疆
新疆
源头学子 小屋
/wxc/
特级教师 王新敞
wxckt@
新疆
源头学子 小屋
/wxc/
特级教师 王新敞
wxckt@
0( x 0) f ( x) kx 1(0 x 2) ,且 f(x) ≥0,求常数 k 的值,并计算概率 P(1.5≤ <2.5)。 0( x 2) 分析:凡是计算连续型随机变量 的密度函数 f(x)中的参数、概率 P(a≤ ≤b)都需要通过求面积来转化而求 得。若 f(x) ≥0 且在[a,b]上为线性,那么 P(a≤ ≤b)的值等于以 b-a 为高,f(a)与 f(b)为上、下底的直角梯形 1 的面积,即 P(a b) [ f (a) f (b)](b a) 。 2 解: ∵ 1 P( ) P( 0) P(0 2) P(2 ) 1 0 P(0 2) 0 [ f (0) f (2)](2 0) f (0) f (2) 2 2k 2 1 ∴k ; 2 1 ∴ P(1.5 2.5) P(1.5 2) P(2 2.5) P(1.5 2) 。 16 2 例 2 设 X ~ N ( , ) ,且总体密度曲线的函数表达式为:

人教版高中选修2-3《正态分布》教案

人教版高中选修2-3《正态分布》教案

人教版高中选修2-3《正态分布》教案一、教学目标1.知识与技能:–能够通过计算、观察与分析进行正态分布的基本参数估计与计算;–能够根据数据特征确定正态分布的使用条件,并运用正态分布解决实际问题。

2.过程与方法:–提高学生数理思维能力及运用计算机软件进行数据统计和分析的能力;–提高学生观察、归纳、分析问题及解决问题的能力。

3.情感态度与价值观:–培养学生科学态度,认识正态分布的重要性和应用价值,拓宽学生科学视野。

二、教学重、难点1.教学重点:–正态分布的基本概念与相关参数的计算;–正态分布的性质及模型的应用;–正态分布与假设检验。

2.教学难点:–正态分布在实际中的广泛应用。

三、教学内容1. 正态分布的基本概念与参数1.正态分布的定义–介绍正态分布的基本特征和概念。

2.正态分布的概率密度函数和分布函数–掌握正态分布的概率密度函数和分布函数的定义;–画出正态分布的概率密度函数和分布函数的图像。

3.正态分布的标准化–掌握正态分布的标准化转化法,以及标准正态分布表的使用方法。

2. 正态分布的参数估计与计算1.正态分布的基本形式–介绍正态分布的基本形式,以及参数的含义;–学习如何通过样本来估计总体的参数。

2.样本均值和样本标准差–掌握样本均值和样本标准差的定义和计算方法;–从样本中估计总体的均值和标准差。

3.抽样分布–掌握样本均值和样本标准差的概率分布,以及如何计算抽样分布。

3. 正态分布的应用1.正态分布的性质及模型的应用–描述正态分布的各种统计特征;–掌握利用正态分布进行概率估计的方法;–了解正态分布在实际问题中的应用,如质量控制、投资、风险评估等。

2.正态分布与假设检验–了解假设检验的基本内容及步骤;–学习如何从正态分布的角度来诠释假设检验。

四、教学方法1.授课讲解:对正态分布相关概念和公式进行讲解,以期解决学生对于正态分布不熟悉的情况。

2.讲解示范法:用实例向学生呈现正态分布的应用场景及应用方法,以期加深学生对于正态分布在实践中的应用认识。

正态分布知识点总结2u

正态分布知识点总结2u

正态分布知识点总结2u一、正态分布的基本概念1. 概率密度函数正态分布的概率密度函数是一个钟形曲线,其数学表达式为:\[f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]其中,$x$是随机变量的取值,$\mu$是分布的均值,$\sigma$是分布的标准差。

这个函数在$x=\mu$处取得最大值,然后随着$x$的偏离而逐渐减小。

换句话说,正态分布的大部分数据集中在均值附近,并且随着偏离均值越远,密度越低。

2. 均值和标准差正态分布的均值$\mu$决定了分布的位置,而标准差$\sigma$决定了分布的扁平程度。

当$\sigma$较小时,数据集中在均值附近,曲线变得更加陡峭;当$\sigma$较大时,数据分布更广,曲线变得更加平缓。

3. 性质正态分布有许多重要的性质。

其中最著名的是“三西格玛定理”,它指出约有68%的数据在均值的一个标准差范围内,约有95%的数据在均值的两个标准差范围内,约有99.7%的数据在均值的三个标准差范围内。

这个性质使得正态分布在统计推断中非常有用,因为我们可以通过均值和标准差来判断数据的集中程度。

二、正态分布的应用1. 统计推断正态分布在统计推断中有着广泛的应用。

例如,我们可以利用正态分布的性质来进行假设检验,构建置信区间等等。

此外,许多统计模型的假设都是基于正态分布的形式,比如线性回归模型、方差分析模型等等。

2. 财务领域在财务领域,正态分布被广泛应用于风险管理、资产定价、投资组合优化等领域。

例如,资本资产定价模型(CAPM)假设资产的收益率服从正态分布,这使得我们可以通过对分布的均值和标准差进行估计,来评估投资组合的预期收益和风险。

3. 自然科学在自然科学中,许多自然现象都可以用正态分布来描述。

例如,地震的震级、雨量的分布、气温的变化等等都具有正态分布的特性。

这使得我们可以利用正态分布的概念来解释自然现象,并且进行相关的预测和分析。

人教版高中数学(文科)选修正态分布与线性回归教案

人教版高中数学(文科)选修正态分布与线性回归教案

正态分布与线性回归一、教学目标:1.了解正态分布的意义,能借助正态曲线的图像理解正态曲线的性质。

2.了解标准正态分布的意义和性质,掌握正态总体),(2σμN 转化为标准正态总体N (0,1)的公式)()(σμ-Φ=x x F 及其应用;通过生产过程的质量控制图,了解假设检验的基本思想。

3.了解相关关系、回归分析、散点图等概念,会求回归直线方程。

4.了解相关系数的计算公式及其意义,会用相关系数公式进行计算;了解相关性检验的方法与步骤,会用相关性检验方法进行检验。

二、教学重点:正态分布的意义及主要性质,线性回归的方法和简单应用。

三、教学过程:(一)主要知识:1.正态分布: ;2.正态分布的概率密度函数: ;3.标准正态总体: ;4.正态曲线的性质: ;5.标准正态总体()0,1N 及一般正态总体()2,N μσ在区间()12,x x 内取值的概率: ;6.相关关系与函数关系: ;7.回归直线方程 。

(二)知识点详析1.正态分布的重要性正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。

一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。

例如,产品尺寸是一类典型的总体,对于成批生产的产品,如果生产条件正常并稳定,即工艺、设备、技术、操作、原料、环境等可以控制的条件都相对稳定,而且不存在产生系统误差的明显因素,那么,产品尺寸的总体分布就服从正态分布。

又如测量的误差;炮弹落点的分布;人的生理特征的量:身高、体重等;农作物的收获量等等,都服从或近似服从正态分布。

另一方面,正态分布具有许多良好的性质,很多分布可以用正态分布来近似描述,另外,一些分布又可以通过正态分布来导出,因此在理论研究中正态分布也十分重要。

2.正态曲线及其性质对于正态分布函数:22)(21)(σμπσ--=x e x f ,x ∈(-∞,+∞)由于中学知识范围的限制,不必去深究它的来龙去脉,但对其函数图像即正态曲线可通过描点(或计算机中的绘图工具)画出课本图1-4中的图(1)、(2)、(3),由此,我们不难自己总结出正态曲线的性质。

第二章回归分析中的几个基本概念

第二章回归分析中的几个基本概念

第⼆章回归分析中的⼏个基本概念第四章⼀、练习题(⼀)简答题1、多元线性回归模型的基本假设是什么?试说明在证明最⼩⼆乘估计量的⽆偏性和有效性的过程中,哪些基本假设起了作⽤?2、多元线性回归模型与⼀元线性回归模型有哪些区别?3、某地区通过⼀个样本容量为722的调查数据得到劳动⼒受教育的⼀个回归⽅程为fedu medu sibs edu 210.0131.0094.036.10++-=R 2=0.214式中,edu 为劳动⼒受教育年数,sibs 为该劳动⼒家庭中兄弟姐妹的个数,medu 与fedu 分别为母亲与⽗亲受到教育的年数。

问(1)若medu 与fedu 保持不变,为了使预测的受教育⽔平减少⼀年,需要sibs 增加多少?(2)请对medu 的系数给予适当的解释。

(3)如果两个劳动⼒都没有兄弟姐妹,但其中⼀个的⽗母受教育的年数为12年,另⼀个的⽗母受教育的年数为16年,则两⼈受教育的年数预期相差多少? 4、以企业研发⽀出(R&D )占销售额的⽐重为被解释变量(Y ),以企业销售额(X1)与利润占销售额的⽐重(X2)为解释变量,⼀个有32容量的样本企业的估计结果如下:099.0)046.0()22.0()37.1(05.0)log(32.0472.0221=++=R X X Y其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。

如果X1增加10%,估计Y 会变化多少个百分点?这在经济上是⼀个很⼤的影响吗?(2)针对R&D 强度随销售额的增加⽽提⾼这⼀备择假设,检验它不虽X1⽽变化的假设。

分别在5%和10%的显著性⽔平上进⾏这个检验。

(3)利润占销售额的⽐重X2对R&D 强度Y 是否在统计上有显著的影响? 5、什么是正规⽅程组?分别⽤⾮矩阵形式和矩阵形式写出模型:i ki k i i i u x x x y +++++=ββββΛ22110,n i ,,2,1Λ=的正规⽅程组,及其推导过程。

第二章 一元线性回归分析基础

第二章 一元线性回归分析基础

加,消费增加,但消费的增长低于收入的增长,即消
费对收入的弹性小于1。它的数学表述为
Y X
0
Y X
1,
Y X
Y X
其中Y为消费额,X为收入。
该线性方程描述了消费与收入之间的确定关系,即给定 一个收入值,可以根据方程得到一个唯一确定的消费值。 但实际上消费与收入间的关系不是准确实现的。
原因:入随机误差项,将变量之间的关系用一个线性 随机方程来描述,用随机数学的方法来估计方程中的 参数,这就是线性回归模型的特征,也就是线性计量 经济学模型的特征。
二、一元线性回归模型
单方程线性回归模型的一般形式为
Yi 1 2 X2i 3 X3i k Xki ui ,i 1,2, ,n 其中Y为被解释变量,X 2 ,X 3 , ,X n 为解释变量。
化。
如果误差项的方差不同,那么与其对应的观测值Yi的可 靠程度也不相同。这会使参数的检验和利用模型进行预 测复杂化。而满足同方差假设,将使检验和预测简化。
假设3 表示不同的误差项之间互相独立,同时,不同的 被解释变量在统计上也是互相独立的。即
Cov(Yi, Yj)= E(Yi-E(Yi)) (Yj-E(Yj))= E(uiuj)=0, i≠j 假假设设4,自通动常满X足i为,确即定性变量,即非随机变量,此时,该
也可以用显函数形式表示为 Y f ( X1,X 2 , ,X n )
其中最简单的形式为一元线性函数关系。
例如 当某种商品单价P固定不变,其销售收入y与销售 的商品数量x之间的关系为一元线性关系,即y = Px
如果用x,y构成的直角坐标图来表示,上式所表示的 函数关系为一条经过坐标原点的直线,所有可能的点 都在这条直线上。
Cov(ui, Xi)= E(ui-E(ui)) (Xi-E(Xi))=0,i=1,2, ……,n 假设5 随机误差项服从零均值,同方差的正态分布。即

高中数学第2章2.4正态分布精品课件新人教A选修23.ppt

高中数学第2章2.4正态分布精品课件新人教A选修23.ppt
提示:因σ1=0.5<σ2=1<σ3=2,那么,X1 的分布最集中,X3的分布最分散.
∴P(-1≤X1≤1)>P(-1≤X2≤1)>P(- 1≤X3≤1).
课堂互动讲练
考点突破
考点一 求正态分布密度函数
正态曲线方程中含有两个参数μ和σ,其中μ 可取任意实数,表示平均水平的特征数, E(X)=μ;σ>0表示标准差,D(X)=σ2.一个正 态曲线方程由μ,σ惟一确定,π和e为常数, x为自变量,x∈R.
失误防范
1.对于X~N(μ,σ2):在利用对称性转化区 间时,要注意正态曲线的对称轴是x=μ,而 不是x=0(μ≠0).
2.注意区分是X~N(μ,σ2)还是X~N(μ,σ) 的形式,二者的方差不同(σ≠1).
知能优化训练
本部分内容讲解结束
按ESC键退出全屏播放 点此进入课件目录 谢谢使用
考点三 正态分布的实际应用
正态分布是自然界中最常见的一种分布,许 多现象都近似地服从正态分布,如长度测量 的误差,正常生产条件下各种产品的质量指 标等,由此可确定一些决策性的指标. 例3 一次数学考试中,某班学生的分数X~ N(110,202),且知满分150分,这个班共有54 人,求这个班在这次数学考试中及格(不小 于90分)的人数和130分以上的人数.
学习目标 1.利用实际问题的直方图,了解正态分布曲 线的特点及曲线所表示的意义. 2.了解变量落在区间(μ-σ,μ+σ],(μ-2σ, μ+2σ],(μ-3σ,μ+3σ]的概率大小. 3.会用正态分布去解决实际问题.
2.4Leabharlann 课前自主学案 课堂互动讲练 知能优化训练
课前自主学案
温故夯基
1.在频率分布直方图中,纵坐标的含义是 频率 _组__距__,用小矩形的_面__积_表示数据落在该组中
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、【内容讲解】1.正态分布密度函数:22()21()2x f x e μσπσ--=,(σ>0,-∞<x <∞)其中π是圆周率;e 是自然对数的底;x 是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2σμN2.正态分布),(2σμN )是由均值μ和标准差σ唯一决定的分布3.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量ξ~N(μ,σ2),根据定义有:μ=E ξ,σ=D ξ。

正态曲线具有以下性质:(1)曲线在x 轴的上方,与x 轴不相交。

(2)曲线关于直线x =μ对称。

(3)曲线在x =μ时位于最高点。

(4)当x <μ时,曲线上升;当x >μ时,曲线下降。

并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近。

(5)当μ一定时,曲线的形状由σ确定。

σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。

五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x ex f -=π,(-∞<x <+∞)其相应的曲线称为标准正态曲线标准正态总体N (0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题5.标准正态总体的概率问题:x标准正态分布曲线f x () =12⋅π()⋅e -x 22()xy对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.56.标准正态分布表标准正态总体)1,0(N 在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”.在这个表中,对应于0x 的值)(0x Φ是指总体取值小于0x 的概率,即 )()(00x x P x <=Φ,)0(0≥x . 若00<x ,则)(1)(00x x -Φ-=Φ.利用标准正态分布表,可以求出标准正态总体在任意区间),(21x x 内取值的概率,即直线1x x =,2x x =与正态曲线、x 轴所围成的曲边梯形的面积1221()()()P x x x x x <<=Φ-Φ.7.非标准正态总体在某区间内取值的概率:可以通过)()(σμ-Φ=x x F 转化成标准正态总体,然后查标准正态分布表即可 在这里重点掌握如何转化 首先要掌握正态总体的均值和标准差,然后进行相应的转化8.小概率事件的含义:发生概率一般不超过5%的事件,即事件在一次试验中几乎不可能发生假设检验方法的基本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析 假设检验方法的操作程序,即“三步曲”一是提出统计假设,教科书中的统计假设总体是正态总体;二是确定一次试验中的a 值是否落入(μ-3σ,μ+3σ); 三是作出判断9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.10.回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析 通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性 对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。

两个变量具有相关关系是回归分析的前提。

(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。

(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。

11.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 粗略地看,散点分布具有一定的规律12. 回归直线设所求的直线方程为,^a bx y +=,其中a 、b 是待定系数.1122211()()()n ni i i i i i n n i ii i x x y y x y nxy b x x x nx a y bx====⎧---⎪⎪==⎨--⎪⎪=-⎩∑∑∑∑, ∑==ni i x n x 11,∑==n i i y n y 11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y 与x 的一组观测值,把∑∑∑===----=ni ni i ini i iy y x xy y x xr 11221)()())((=∑∑∑===---n i n i i i ni ii y n y x n x yx n yx 1122221))((叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.14.相关系数的性质: r ≤1,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.15.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值 它必须在每一次统计检验之前确定16. 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数 在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n 为观测值组数)相应的相关数临界值r 0 05或r 0 01;例如n=7时,r0.05=0.754,r0.01=0.874 求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当r ≤r 005或r 0 01,认为线性关系不显著讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到 题型讲解例1 已知连续型随机变量ζ的概率密度函数⎪⎩⎪⎨⎧>≤≤+<=)2(0)20(1)0(0)(x x kx x x f ,且f(x) ≥0,求常数k 的值,并计算概率P(1.5≤ξ<2.5)。

分析:凡是计算连续型随机变量ξ的密度函数f(x)中的参数、概率P(a ≤ξ≤b)都需要通过求面积来转化而求得。

若f(x) ≥0且在[a ,b]上为线性,那么P(a ≤ξ≤b)的值等于以b-a 为高,f(a)与f(b)为上、下底的直角梯形的面积,即1()[()()]()2P a b f a f b b a ξ≤≤=+-。

解: ∵1()(0)(02)(2)P P P P εξξξ=-∞<<+∞=-∞<<+≤≤+<<+∞0(02)0P ξ=+≤≤+1[(0)(2)](20)(0)(2)222f f f f k =+-=+=+∴21-=k ;∴1(1.5 2.5)(1.52)(2 2.5)(1.52)16P P P P ξξξξ≤<=≤≤+<<=≤≤=。

例2 设),(~2σμN X ,且总体密度曲线的函数表达式为:412221)(+--=x x ex f π,x ∈R 。

(1)求μ,σ;(2)求)2|1(|<-x P 及)22121(+<<-x P 的值。

分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。

利用一般正态总体),(2σμN 与标准正态总体N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。

解:(1)由于222)2(2)1(41222121)(--+--⋅==x x x eex f ππ,根据一般正态分布的函数表达形式,可知μ=1,2=σ,故X ~N (1,2)。

(2))2121()2|1(|+<<-=<-x P x P2121(12)(12)()()22(1)(1)2(1)120.84131F F 1+-1--=+--=Φ-Φ=Φ-Φ-=Φ-=⨯- 6826.0=。

又)21()221()22121(--+=+<<-F F x P 22121()()(2)(1)22(2)(1)10.97720.84131φφ1+-1--=Φ-Φ=Φ-Φ-=+-=+-8185.0=。

点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。

通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。

例3 某中学有1000人参加并且高考数学成绩近似地服从正态分布()210,100N ,求此校数学成绩在120分以上的考生人数。

(ф(2)≈0.977)解:用ξ表示此中学数学高考成绩,则)10,100(~2N ξ()()120100*********.02310P P ξξ-⎛⎫∴>=-≤=-Φ≈ ⎪⎝⎭∴120分以上的考生人数为1000×0.023=23点评:通过公式)()(σμ-Φ=x x F 转化成标准正态总体,然后查标准正态分布表即可 例4 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52).(1)若d =90°,求ξ<89的概率;(2)若要保持液体的温度至少为80 ℃的概率不低于0.99,问d 至少是多少? (其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01). 分析:(1)要求P (ξ<89)=F (89),∵ξ~N (d ,0.5)不是标准正态分布,而给出的是Φ(2),Φ(-2.327),故需转化为标准正态分布的数值.(2)转化为标准正态分布下的数值求概率p ,再利用p ≥0.99,解d .解:(1)P (ξ<89)=F (89)=Φ(5.09089-) =Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01. ∴Φ(5.080d-)≤0.01=Φ(-2.327). ∴5.080d-≤-2.327. ∴d ≤81.1635.故d 至少为81.1635.点评:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x <0时,f (x )为增函数,x >0时,f (x )为减函数.例5 在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是: (1)提出统计假设:某种指标服从正态分布N (μ,σ2); (2)确定一次试验中的取值a ;(3)作出统计推断:若a ∈(μ-3σ,μ+3σ),则接受假设,若a ∈(μ-3σ,μ+3σ),则拒绝假设. 某砖瓦厂生产的砖的“抗断强度”ξ服从正态分布N (30,0.8),质检人员从该厂某一天生产的1000块砖中随机抽查一块,测得它的抗断强度为27.5 kg/cm 2,你认为该厂这天生产的这批砖是否合格?为什么?解:由于在一次试验中ξ落在区间(μ-3σ,μ+3σ)内的概率为0.997,故ξ几乎必然落在上述区间内. 于是把μ=30,σ=0.8代入,算出区间(μ-3σ,μ+3σ)=(27.6,32.4), 而27.5∉(27.6,32.4) .∴据此认为这批砖不合格.例 6 已知测量误差ξ~N (2,100)(cm ),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm 的频率大于0.9?解:设η表示n 次测量中绝对误差不超过8 cm 的次数,则η~B (n ,p ).其中P =P (|ξ|<8)=Φ(1028-)-Φ(1028--)=Φ(0.6)-1+Φ(1)=0.7258-1+0.8413=0.5671. 由题意,∵P (η≥1)>0.9,n 应满足P (η≥1)=1-P (η=0)=1-(1-p )n >0.9,∴n >)5671.01lg()9.01lg(--=4329.0lg 1-=2.75.因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8 cm 的概率大于0.9.例7 已知某地每单位面积菜地年平均使用氮肥量xkg 与每单位面积蔬菜年平均产量yt 之间的关系有如下数据:年份1985 1986 1987 1988 1989 1990 1991 1992 x(kg) 70 74 80 78 85 92 90 95 y(t) 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0年份1993 1994 1995 1996 1997 1998 1999 x(kg) 92 108 115 123 130 138 145 y(t) 11.5 11.0 11.8 12.2 12.5 12.8 13.0(1)求x 与y 之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y 与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg 时,每单位面积蔬菜的年平均产量。

相关文档
最新文档