概率统计补充案例
补充案例:概率部分:
案例1、“三人行必有我师焉”
案例2、抓阄问题
案例3、贝叶斯方法运用案例介绍
案例4、化验呈阳性者是否患病
案例5、敏感性问题的调查
案例6、泊松分布在企业评先进中的应用
案例7、碰运气能否通过英语四级考试
案例8、检验方案的确定问题
案例9、风险型决策模型
案例10、一种很迷惑游客的赌博游戏
案例11、标准分及其应用
案例12、正态分布在人才招聘中的应用
案例13、预测录取分数线和考生考试名
统计部分:
案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理
案例16、如何估计湖中黑、白鱼的比例
案例17、预测水稻总产量
案例18、工程师的建议是否应采纳
案例19、母亲嗜酒是否影响下—代的健康
案例20、银行经理的方案是否有效
案例21、一元线性回归分析的Excel实现
案例22、方差分析的Excel实现
案例23、预测高考分数
案例24、两次地震间的间隔时间服从指数分布
案例1、“三人行必有我师焉”
我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题,即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行,行行出状元”,我们不妨把一个人的才能分成360个方面。孔子是个大圣人,我们假设他在一个方面超过某个人的概率为99%,那么孔子在这方面超过与他“同行”的两个人的概率为
99% ×99% =98.0l %,在360个方面孔子总比这两人强的概率为(98.01%)360
=0.07% ,即这两个人在某一方面可以做孔子老师的概率为99.93%.从数学角度分析,孔子的话是很有道理的.
案例2、抓阄问题
一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会,组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄,10张阄中只有一张写“有”. 每个人都想争取到这次机会,你希望自己是第几个抓阄者呢? 有人说要先抓,否则写有“有”的阄被别人抓到,自己就没有机会了;有人说不急于先抓,如果前面的人没有抓到写有“有”的阄,这时再抓抓到“有”的机会会大一些. 为了统一认识,用概率的方法构造一个摸球模型来说明问题.
摸球模型:袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回),求红球被第 k 个人摸到的概率( k = 1, 2, ?, 10).
解决问题 :设
k A = “ {第 k 个人摸到红球 }, k = 1, 2, ?, 10. 显然,红球被
第一个人摸到的概率为
101
)(1=
A P . 因为 12A A ?,于是红球被第二个人摸到的概率为 101
91109)()()()(121212=
?===A A P A P A A P A P .
同样,由 213A A A ?知红球被第三个人摸到的概率为
1018198109)()()()()(2131213213=
??=
==A A A P A A P A P A A A P A P .
如此继续,类似可得 )(4A P =
== )(5A P 101
)(10=
A P . 由此可见,其结果与 k 无关,表明10 个人无论摸球顺序如何,每个人摸到红球的机会相等. 这也说明10 个人抓阄,只要每个人在抓之前不知道他前边那些已经抓完的结果,无论先后, 抓到的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等,人们常常乐于用抓阄的办法来解决,其合理性保证当然得归功于“概率”. 通过上面的摸球模型,我们总结出分配中的“抓阄”问题,无论先抓后抓, 结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后,我们要发扬风格让他人先抓.
案例3、贝叶斯方法运用案例介绍 什么是贝叶斯过滤器?
垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。
正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。 2002年,Paul Graham 提出使用"贝叶斯推断"过滤垃圾邮件。他说,这样做的效果,好得不可思议。1000封垃圾邮件可以过滤掉995封,且没有一个误判。
另外,这种过滤器还具有自我学习的功能,会根据新收到的邮件,不断调整。收到的垃圾邮件越多,它的准确率就越高。 建立历史资料库
贝叶斯过滤器是一种统计学过滤器,建立在已有的统计结果之上。所以,我们必须预先提供两组已经识别好的邮件,一组是正常邮件,另一组是垃圾邮件。
我们用这两组邮件,对过滤器进行"训练"。这两组邮件的规模越大,训练效果就越好。Paul Graham使用的邮件规模,是正常邮件和垃圾邮件各4000封。
"训练"过程很简单。首先,解析所有邮件,提取每一个词。然后,计算每个词语在正常邮件和垃圾邮件中的出现频率。比如,我们假定"sex"这个词,在4000封垃圾邮件中,有200
封包含这个词,那么它的出现频率就是5%;而在4000封正常邮件中,只有2封包含这个词,那么出现频率就是0.05%。(【注释】如果某个词只出现在垃圾邮件中,Paul Graham就假定,它在正常邮件的出现频率是1%,反之亦然。随着邮件数量的增加,计算结果会自动调整。)
有了这个初步的统计结果,过滤器就可以投入使用了。
贝叶斯过滤器的使用过程
现在,我们收到了一封新邮件。在未经统计分析之前,我们假定它是垃圾邮件的概率为50%。(【注释】有研究表明,用户收到的电子邮件中,80%是垃圾邮件。但是,这里仍然假定垃圾邮件的"先验概率"为50%。)
我们用S表示垃圾邮件(spam),H表示正常邮件(healthy)。因此,P(S)和P(H)的先验概率,都是50%。
然后,对这封邮件进行解析,发现其中包含了sex这个词,请问这封邮件属于垃圾邮件的概率有多高?
我们用W表示"sex"这个词,那么问题就变成了如何计算P(S|W)的值,即在某个词语(W)已经存在的条件下,垃圾邮件(S)的概率有多大。
根据条件概率公式,马上可以写出
公式中,P(W|S)和P(W|H)的含义是,这个词语在垃圾邮件和正常邮件中,分别出现的概率。这两个值可以从历史资料库中得到,对sex这个词来说,上文假定它们分别等于5%和0.05%。另外,P(S)和P(H)的值,前面说过都等于50%。所以,马上可以计算P(S|W)的值:
因此,这封新邮件是垃圾邮件的概率等于99%。这说明,sex这个词的推断能力很强,将50%的"先验概率"一下子提高到了99%的"后验概率"。
联合概率的计算
做完上面一步,请问我们能否得出结论,这封新邮件就是垃圾邮件?
回答是不能。因为一封邮件包含很多词语,一些词语(比如sex)说这是垃圾邮件,另一些说这不是。你怎么知道以哪个词为准?
Paul Graham的做法是,选出这封信中P(S|W)最高的15个词,计算它们的联合概率。(【注释】如果有的词是第一次出现,无法计算P(S|W),Paul Graham就假定这个值等于0.4。因为垃圾邮件用的往往都是某些固定的词语,所以如果你从来没见过某个词,它多半是一个正常的词。)
所谓联合概率,就是指在多个事件发生的情况下,另一个事件发生概率有多大。比如,已知W1和W2是两个不同的词语,它们都出现在某封电子邮件之中,那么这封邮件是垃圾邮件的概率,就是联合概率。
在已知W1和W2的情况下,无非就是两种结果:垃圾邮件(事件E1)或正常邮件(事件E2)。
其中,W1、W2和垃圾邮件的概率分别如下:
如果假定所有事件都是独立事件(【注释】严格地说,这个假定不成立,但是这里可以忽略),那么就可以计算P(E1)和P(E2):
又由于在W1和W2已经发生的情况下,垃圾邮件的概率等于下面的式子:
即
将P(S)等于0.5代入,得到
将P(S|W1)记为P1,P(S|W2)记为P2,公式就变成
这就是联合概率的计算公式。 最终的计算公式
将上面的公式扩展到15个词的情况,就得到了最终的概率计算公式:
一封邮件是不是垃圾邮件,就用这个式子进行计算。这时我们还需要一个用于比较的门槛值。Paul Graham 的门槛值是0.9,概率大于0.9,表示15个词联合认定,这封邮件有90%以上的可能属于垃圾邮件;概率小于0.9,就表示是正常邮件。 有了这个公式以后,一封正常的信件即使出现sex 这个词,也不会被认定为垃圾邮件了。 案例4、化验呈阳性者是否患病
在医疗中经常通过化验来诊断。当某人做癌症检查结果呈阳性时,他就患癌症了?其实不然。假设某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?
设C={抽查的人患有癌症},A={试验结果是阳性},则C 表示“抽查的人不患癌症”。已知()0.005P C =, ()0.995P C =,
()0.95
P A C =,
()0.04
P A C =。
由贝叶斯公式,可得
)
()()()()
()()(C A P C P C A P C P C A P C P A C P +=
代入数据计算得: P (C |A )= 0.1066 。在以上假设下,做癌症检查结果呈阳性的人确患癌症的概率为仅为0.1066,平均来说,1000个人中大约只有107人确患癌症。
这是不是意味着这种试验对于诊断一个人是否患有癌症没有意义呢?不是!如果不做试验,一人是患者的概率为0.005。若试验后得阳性反应,则此人是患者的概率为0.1066, 从0.005增加到0.1066,将近增加约21倍,说明这种试验对于诊断一个人是否患有癌症有意义。
案例5、敏感性问题的调查
学生阅读不健康书刊或录像会严重影响学生的身心健康. 但这些都是避着家长和教师进行的,属个人隐私行为. 我们如何设计一种调查方案,能够估计出大学生中看过不健康书刊或录像的人数的比率呢?
对这种敏感性问题的调查,被调查者会有一种顾虑,害怕调查者不能很好的保守秘密. 如果被调查者不愿意真实回答问题,将使调查数据失真,这样的统计结果将没有意义. 因此巧妙设计调查方案是获得真实数据的关键. 经过多年的研究和实践,一些统计学家和心理学家发明了一种能消除人们抵触情绪的“随机化应答”方法. 被调查者只需回答两个问题之一,而且只需回答“是”或“否”,设计的问题如下:
问题A :你的生日是否在 7月1日 之前? 问题B :你是否看过不健康书刊?
被调查者在没有外人的情况下,从一个装有黑球和白球的箱子中随机抽取一个球,看过颜色后又放回.若抽出白球则回答问题A ;若抽出黑球则回答问题B. 箱中黑球所占比率 α是已知的,即
{}P α=任意抽取一个是黑球, {}1P α
=-任意抽取一个是白球.
被调查者无论回答A 或B ,都只需在一张只有“是”、“否”两个选项的答案上做出选择,然后投入密封的投票箱内. 上述抽球和答卷都在无人的情况下进行,这样就可以消除被调查者的顾虑,从而可以保证答卷的真实可靠性.
打开投票箱进行统计,设共有 n 张有效答卷,其中 k 张选择“是”,那么可用频率 n k
估计回答“是”的概率 ?为:
{}/P k n
?==答“是”.
回答“是”有两种情况:一种是摸到白球后对问题A 回答“是”,也就是被调查者 “生日在7月1日之前”的概率,一般认为这个概率是0.5,即 }{
0.5
P =答“是”抽白球;另一种是摸到黑球后对问题B 回答“是”,这个条件概率就是看不健康书刊的学生在参加调查的学生中的比率 p ,即
}{
P p
=答“是”抽黑球.
利用全概率公式得
{}{}}{{}}
{
P P P P P =?+?答“是”抽白球答“是”抽白球抽黑球答“是”抽黑球,
即 αα?p +-=)(
15.0. 由此可获得
/0.5(1)
k n p αα
--==
.
假设在一次实际调查中,箱子中共有50个球,其中30个是黑球,20个白球,则 6.0=α. 调查结束时共收到1583张有效答卷,其中有389张回答“是”,据此可估算出
0762
.06.04
.021
1583389=?-=p .
这表明1583名学生中,约 62.7%的学生看过不健康书刊.
案例6、泊松分布在企业评先进中的应用
某工业系统在进行安全管理评选时,有两家企业在其它方面得分相等,难分高下。只剩下千人事故率这个指标,甲企业有2000人,发生事故率为0.005,即发生事故10起。乙企业有1000人,发生事故率也为0.005,即发生事故5起。那么,应该评选谁为先进企业呢? 显然,按事故数来评,则应评乙企业为先进。但甲企业不服。因为甲企业的事故数虽然是乙企业的2倍。但甲企业的人数正好是乙企业的2倍。按事故率来评,两企业应榜上有名。由于指标限制,只能评出一家企业,究竟评谁好呢? 可用泊松(Poisson )分布来解决这个问题。
统计资料表明:安全管理中的事故次数、负伤人数是服从泊松分布的。服从泊松分布的随机变量 X 取 k 值的概率为:
{}!
k
P X k e k λ
λ-==
其中 np λ=( n 为人数, p 为平均事故概率)
事件发生了至少
x 次的概率为
{}!
k
k x
P X x e k λ
λ∞
-=≥=∑
若 0x =,上式 {0}1P X ≥=成为必然事件。
假设两厂均不发生事故得满分10分。两厂的均值分别为10与5,则两厂发生事故的概率为
105
105(),()!!k k P X k e P X k e k k --==
==乙甲
两厂的得分为
评选乙企业为先进。
案例7、碰运气能否通过英语四级考试
大学英语四级考试是全面检验大学生英语水平的一种综合考试,具有一定难度.这种考试包括听力、语法结构、阅读理解、写作等.除写作占15分外,其余85道为单项选择题,每道题附有A 、B 、C 、D 四个选项.这种考试方法使个别学生产生碰运气和侥幸心理. 那么,靠运气能通过英语四级考试吗?
答案是否定的. 下面我们计算靠运气通过英语四级考试的概率有多大. 假定不考虑写作所占的15分,若按及格为60分计算,则85道选择题必须要答对51道题以上才行,这可以看成是85重伯努利试验.
设随机变量X 表示答对的题数,则)25.0,85(~B X ,其分布律为:
()
8585()(0.25)0.75,0,1,2,,85
k
k k P X k C k -===
若要及格,必须51≥X ,其概率为
()
85
8512
8551(51)(0.25)0.758.7410k
k
k k P X C --=≥=≈?∑
此概率非常之小,故可认为靠运气通过英语四级考试几乎是不可能发生的事件,它相当于在1000亿个碰运气的考生中,只有0.874个人可以通过考试. 然而,我们地球上只有60多亿人口.
案例8、检验方案的确定问题
在某地区为了进行某种疾病普查,需要检验N 个人的血液,可用两种方法进行,方法(一):对每个人的血液逐个检验,这时需要检验N 次;方法(二):将N 个检验者分组,每组k 个人,把一组的k 个人抽出的血液混合在一起进行一次检验,如果检验结果为阴性,则说明这k 个人的血液均为阴性,这时这k 个人总共检验了一次;如果检验结果为阳性,为了明确这k 个人中哪些人为阳性,就要对这k 个人再逐个进行检验,这时这k 个人总共进行了 1 + k 次检验. 假设每个人的检验结果是否为阳性是独立的,且每个人为阴性的概率为q. 问哪种检验方法检验次数少些?
对方法(二),设每个人所需检验次数是一个随机变量X ,则X 的分布律为
????? ?
?-+
k k q q k k 1111
k q q k q k EX k k k 1
1)1)(11(1+-=-++=
那么,N 个人平均需要检验的次数为
)
1
1(k q N k +- 由此可知,适当选择k ,使得 1 k k q 1>时,则N 个人的平均需要检验的次数小于N ,这时方法(二)比方法(一)检验次数少. 如果q 已知,还可以根据 k q EX k 1 1+ -=选出使其最小的整数 0k ,从而使得检验次 数最少. 比如, 若需检验 1000人,且 9.0=q ,则 40=k ,按方法(二)平均只需进行检 验 594 )41 9.01(10004=+-?次,这样可以减少约 40%的工作量,为检验工作节约大量的 人力、物力、财力. 案例9、风险型决策模型 决策是人们在政治、经济、军事和日常生活等多方面普遍存在的一种选择方案的行为.风险型决策是指在作出决策时,由于某些随机性的因素影响,决策因存在一定的风险,称为风险型决策. 某渔船要对下个月是否出海打鱼作出决策. 如果出海后是好天,可获收益 5000元,若出海后天气变坏,将损失 2000元;若不出海,无论天气好坏都要承担 1000元损失费. 据预测下月好天的概率为 0.6,天气变坏的概率为0.4,应如何选择最佳方案? 我们将出海的收益作为随机变量 X ,其概率分布如下: 故 X 的数学期望为 22004.0)2000 (6.05000=?-+?=EX (元) 显然出海的收益比不出海的收益好. 案例10、一种很迷惑游客的赌博游戏 在一个游客很多的旅游圣地,发现一类赌博游戏。形式是这样的:摊主(以下称赌主)拿着一个装有20个同样大小的玻璃球的小袋,玻璃球共有红、黄、蓝、白、黑5种颜色,每种颜色均为4个球。让游客(以下称赌客)从袋中任意摸出10个球。如摸到红球4个,黄球4个,白球2个,则数字排列为442(数字大者排前,小者排后),以摸到各种球组成的数字 面上看12中可能只有2中可能赌客输钱,似乎赌客赢钱的可能性大。也正是如此,很能吸引过往的旅客参赌。最后结果如何?若每天有100人参赌,则赌主每天能赢100来元。下面具体计算。 用 ()i P x 表示摸到某球色数字排列 i x 的概率。 由古典概率公式可得如下概率分布表(可 10 20184756C = 由上表可得 赌客赢钱概率 1 ()0.3765 i i p x ==∑ 赌客输钱概率 1112()()0.6235 p x p x += 当摸的次数很多时,赌主赢钱几乎是必然的。 设随机变量 X 为赌客每赌一次输赢的金额,则其数学期望为: ()100.001520.00262(0.023420.0277)1(0.04210.0624)0.520.093520.2494 2.50.3741 1.04E X =?+??+?+?+?++??-?-?=- 从整体上看赌客每赌一次平均输1.04元。如果每天有100人参赌,则赌主每天平均进 帐104元。 案例11、标准分及其应用 原始分数不利于各科水平的横向比较和考试的评价分析. 一是其位置含义不明确. 原始分数是75分,这个分数是高还是低?该考生在全体考生中的位置靠前还是靠后?单从这个分数看不出来,因为没有一个稳定的参照点. 二是不可比. 原始分数往往受试题难度和区分度大小的影响,具有不稳定性. 题目难,原始分数就偏低;试题容易,分数就偏高,从而导致了原始分数之间的不可比性. 三是不可加. 各科原始分数、位置标准不一致,不可直接累加后比较,就像我们不能将甲乙两人口袋里的美元与港币数直接相加来比较哪个钱多一样.所以,在评价学生学业水平时,为了可比性,比较一学生几门课的情况、两个学生多科的总成绩等,可将卷面分转化为标准分来比较. 对一门课,比较标准分的大小;对多门课,比较标准分总和. 标准分就是分数这个随机变量 X 的标准化: DX EX X -. 由于标准分数分值小,并带有小数和负值,在许多情形下直接使用不大合乎人们的习惯,故通常根据具体情况,把标准分数通过线性变换化为各种导出分数. 常见的有: ①教育与心理测验中的分数:T=50+10Z ②韦氏智力量表中各分测验的量表分:T=10+3Z ③韦氏智力量表智商(离差智商):IQ=100+15Z ④美国大学入学考试委员会使用的标准分数:CEEB=500+100Z ⑤美国教育测验中心举办“托福”考试:TOEFL=500+70Z ⑥我国出国人员英语水平考试即EPT 所使用的分数:EPT=90+20Z ⑦五等级分数:由标准分的值按表4来分段确定等级。按此方式,40人的班,每次考试,不管原始分数如何,大约有3人(占7%)不及格。美国不少大学采用这种“竞争”的评分方式。 案例12某公司准备通过考试招工 300 名。其中 280 名正式工,20 名临时工. 实际报考人数为 1657名. 考试满分400 分。考试不久后,通过当地新闻媒体得到如下消息:考试平均成绩是166 分, 360 分以上的高分考生31 名. 某考生A 的成绩为 256分. 问他能否被录取?若被录取,能否是正式工? 我们用正态分布来解决这个问题. 先预测最低录取分数线,记最低录取分数为 0x 。设考生成绩为 X ,对一次成功的考试来说,X 应服从正态分布,即 ),166(~2 σN X ,从而 )1,0(~166 N X Y σ-= 由题设知 165731 )166 360()360(≈ -> =>σ Y P X P 于是 981.01657311)166 360( =- ≈-Φσ 。查正态分布表,得 08.2166 360≈-σ, 从而 93=σ。因此 )93,166(~2N X . 因为最低录取分数线 0x 的确定,应使高于此线的考生的频率等于 1657300,即 1657300 )93166()(00≈ ->=>x Y P x X P 819 .016573001)93166(0=-≈-Φx 于是 251 ,91.093166 00≈≈-x x .即最低录取分数线是251 分. 下面预测考生 A 的名次,其考分 256 = x . 831.0)93166 256()93166256()256(≈-Φ=-< = 故 169.0831.01)256(=-≈>X P ,此表示成绩高于考生A 的人数约占总人数的 16.9%. 由 282169.01657≈?知考生A 大约排在 283名. 因为该考生的成绩是 256 分,大于录取分数限 251 分,因此该考生 A 能被录取. 但他的排名是283,排在280 名之后,所以他不能被录取为正式工,只能是临时工。 案例13、预测录取分数线和考生考试名次 当今社会,考试作为一种选拔人才的有效途径,正被广泛采用.每次考试过后,考生最关心的两个问题是:自己能否达到最低录取分数线?自己的考试名次如何?其实,学了概率之后我们可以通过二项分布来解决这些问题. 招工问题: 某公司通过招聘考试,准备招工300名(其中 280名正式工,20名临时工),而报考的人数是 1657名,考试满分为400分.考试后不久,通过当地新闻媒介得到如下信息:考试总评成绩是166分,360分以上的高分考生31名.某考生A 的成绩是256分,问他能否被录取?如被录取能否是正式工? 解决问题: 先来预测一下最低录取分数线,记该最低分数线为 0x . 设考生考试成绩为 ξ,则 ξ是随机变量,对于一次成功的考试来说, ξ应服从正态分 布.本题中, ),166 (~2 σξN ,则 )1,0(~166 N σξη-= . 因为考试成绩高于360分的频率是 165731 ,所以 165731 )166360()360(≈ ->=>σηξP P . 于是 981 .0165731 1)1663600()3600(=-≈-≤≤=≤≤σηξP P , 查正态分布表知, 08.2166 360≈-σ,即 93≈σ. 所以 )93,166(~2 N ξ. 因为最低录取分数线 0x 有确定应使高于此线的考生的频率等于 1657 300 ,即 1657300 )93166()(00≈-> =>x P x P ηξ, 所以 819 .01657300 1)931660()0(00=-≈-≤≤=≤≤x P x P ηξ. 查正态分布表,得 0166 0.9115 93x -≈,求得 0 250.77x ≈. 即最低录取分数线是251. 下面预测考生A 的考试名次.他的考分x=256,查正态分布表知, 166.0834.01)968.0(1)93166 256()256(=-≈Φ-=-> =>ηξP P . 这说明,考试成绩高于256分的频率是0.166,也就是说成绩高于考生A 的人数大约占总人 数的16.6%.所以,考试名次排在A 之前的人大约有 165716.6%275.06?=(名), 即考生A 大约排在第276名. 从以上分析得出:最低录取分数线为251分,低于考生A 的分数,所以,考生A 能被录取.但因其考试名次大约是276名,排在280名之前,所以,有可能被录取为正式工. 案例14、随机变量函数的均值和标准差的近似计算方法 在工程上,已知随机变量的均值和标准差,求随机变量函数的均值和标准差的近似方法主要有泰勒展开式、变异系数法、基本函数法. 例1 设 X 、 Y 的均值、标准差分别为 Y Y X X σμσμ,;,.找出函数 2 )(X X f =均值、 标准差的近似计算公式. 对 2 )(X X f Z ==在 X X μ=附近进行线性逼近: )(2))(()()(2 X X X X X X X X f f X f μμμμμμ-+=-'+≈ 所以 X X X X X X X X X D X D σμσσμμμμ2,4)](2[)(22 222==-+=, 而 222)(2 X X X EX DX μσμ+=+= . 例2 设 X 、 Y 的均值、标准差分别为 Y Y X X σμσμ,;,。找出函数 Y X Y X g = ),(均 值、标准差的近似计算公式. 对 Y X Y X g = ),(在 X X μ=附近进行线性逼近: ))(,())(,(),(),(Y Y X Y X Y X X Y X Y g X g g Y X g μμμμμμμμ-'+-'+≈ )()(12 Y Y X X Y Y X Y X μμμμμμμ---+= 所以 Y X Y X E μμ=)(, 242 22)(Y Y X Y X Y X D σμμμσ+=,即 2 1 22222)(1X Y Y X Y Y X σμσμμσ+=. 案例15、如何表示考试成绩比较合理 ——TOEFEL 成绩是如何计算出来的 考试成绩是考生水平的反映,考试成绩的合理表示不但能反映考生的实际水平,而且还应该尽量减少因题目难易程度对考试成绩的影响。 目前,我国普遍采用百分制记分法、即满分设计为100分,考生在这 100分中所得分数即为他们的成绩。 这种记分法的主要缺点是分数受题目难易程度的影响很大,若考题容易,很可能大部分考生成绩都在80分以上,这样80分未必是好成绩。从这个角度看,百分制不能完全反映考生实际水平的高低. 采用排名次的方法,或者称为秩方法,对于评定考生间的相对成绩不失为一个好办法。 该方法将考生的成绩由低到高排列,考生所排位置成为该考生的秩,成绩越好的考生秩越大 (注意这与我们通常的考生的排名正好相反),而相同成绩的考生的秩规定为这几个考生在他们应排位置上的平均数.例如,某6位考生的考试成绩的百分制和秩方法有如下关系: 百分制 90 80 70 70 65 60 秩 6 5 3.5 3.5 2 1 其中两位考生的成绩相同,他们应排在3,4的位置上,从而他们的秩同为(3+4)/2=3.5。 秩方法也有其不足之处,由于秩的大小与考生人数有关,1000人中的第三和10人中的第三是难以比较的. 为了克服百分制和秩方法的不足,可以将百分制分数或秩改换为百分位.某考生的百分位是假定有l 00人参加考试时,成绩等于或小于该考生成绩的人数.若有4人参考,考生成绩的百分制及百分位有如下关系: 百分制 67 78 90 95 秩 l 2 3 4 百分位 25 50 75 100 又如,若有50人参考,某位考生的成绩是第11名,倒数是第40名,则他的百分位为80,也就是说,有80%同学的成绩不如他或和他持平。 百分制是将满分定位100,而百分位是将考生中的最好成绩定位100.具体算法为: 百分位也有其不足之处,就是不能根据百分位确定原来的考试得分。 一种比较合理因而也是国际上较通用的记分方法就是标准分方法;一个考生的标准分等于一个考生的考试得分见减去全体考生得分的平均值再除以所有考生的得分的标准查(样本方差开方), 即 i i X X Y S -= 正的标准分表示该考生的成绩高于平均分,负的标准分表示该考生的成绩低于平均分,且在一般情况下,根据中心极限定理,标准分可认为服从正态分布 (0,1)N ,这样标准分不仅与考试的原始得分相对应,而且可有标准正态分布表。确定出某标准分下的相应的百分位 (即标准分小于或等于所给定标准分的概率乘100),由标准正态分布表可得百分位与标准 分的对应关系如下表: 例如,百分位-50,则标准分一0;百分位=95,则标准分—1.64.反之若标准分为0.5,则百分位—69,等等. TOEFEL 自考试成绩采用标准分记分法.只是为了消除标准分中的两位小数,给标准分乘上100,另外又为了消除负号,再加上500,即 TOEFEL :-h=1 00×标准分+500 由TOEFEL 分结台上表可以看出,考TOKFEL 得500分并不难。因为它只相当于所有考生的平均分,考600分以上的人(此时标准分≥1)占全体考生人数的l5%,而得664分以上得人数只占全体考生得5%.因此能考664分自然是很不容易的。 案例16、如何估计湖中黑、白鱼的比例 某水产养殖场两年前在人工湖混养了黑白两种鱼. 现在需要对黑白鱼数目的比例进行估计. 设湖中有黑鱼 a 条,则白鱼数为 b ka =,其中 k 为待估计参数. 从湖中任捕一条鱼,记 1,0,X ?=? ?若是黑鱼若是白鱼 则, 1(1),(0)1(1)11a k P X P X P X a ka k k == ===-==+++. 为了使抽取的样本为简单随机样本,我们从湖中有放回的捕鱼 n 条.(即任捕一条,记下其颜色后放回湖中.任其自由游动,稍后再捕第二条,重复前一过程) 得样本 12,, ,n X X X . 显然诸 i X 相互独立,且均与 X 同分布. 设在这 n 次抽样中,捕得 m 条 黑鱼.下面用用矩法和极大似然估计法估计 k . (1)矩估计法.令 1()1X E X k == + 可求得 1?1M k X =-.由具体抽样结果知, X 的观测值 m X n =,故 k 的矩估计值为 ?1M n k m =-. (2)极大似然估计. 由于每个 i X 的分布为: 11{}()(),0,1 11i i x x i i i k P X x x k k -===++ 设 1,2,,n x x x 为相应抽样结果(样本观测值),则似然函数为: 11121 (;,,,)()()11n n i i i i n x x n k L k x x x k k ==- ∑∑=++ (1)n m n k k -= + 12ln (;,,,)()ln ln(1)n L k x x x n m k n k =--+ 令 12ln (;,,,)0 1n d L k x x x n m n dk k k -=-=+ 可求得 R 的极大似然估计值为 ?1MLE n k m =- 对本题而言,两种方法所得估计结果相同. 本题是一个十分广泛的估计比例的统计模型. 案例17、预测水稻总产量 某县多年来一直种植水稻,并沿用传统的耕作方法, 平均亩产600千克.今年换了新的稻种,耕作方法也作了改进. 收获前,为了预测产量高低,先抽查了具有一定代表性的30亩水稻的产量,平均亩产642.5千克,标准差为160千克. 如何预测总产量? 要预测总产量,只要预测平均亩产量. 只要算出平均亩产量的置信区间,则下限与种植面积的乘积就是对总产量的最保守估计,上限与种植面积的乘积就是对总产量最乐观估计. 设水稻亩产量 X 为一随机变量,由于它受众多随机因素的影响,故可设 ),(~2 σμN X . 根据正态分布关于均值的区间估计,在方差 2 σ已知时, μ的置信度为95%的置信区间为: ] 96 .1,96 .1[n X n X σ σ +- 用 2S 代替 2 σ,将 160,5.642,30===S X n 代入,有 25.575.64296 .1±=±n S X 故得 μ的置信度为95%的置信区间为:[585.25,699.75]. 所以,最保守的估计为亩产585.25千克,比往年略低;最乐观的估计为亩产可能达到700千克,比往年高出100千克. 因上下差距太大,影响预测的准确. 要解决这个问题,可再抽查70亩,即前后共抽样 100亩. 若设 160,5.642,100 ===S X n ,则 μ的95%的置信区间为: 4.315.64296 .1±=±n S X 即[611.1,673.9].置信下限比以往年亩产多11.1千克.这就可以预测:在很大程度上,今 年水稻平均亩产至少比往年高出11千克, 当然这是最保守的估计. 案例18、工程师的建议是否应采纳 某机械厂工程师建议厂长采用新工艺加工齿轮可节省开销。他用新工艺做了9个星期的试验。在保证齿轮质量和数量的同时,使每台机器平均每周开支由原来的100元降到了75元。 假定每台机器采用新、老工艺每周运转开支都服从正态分布 2 (,25)N u 。在 0.01α=的水平下。检验新工艺能否节省开支。 我们把开支不能节省与开支能节省分别作为零假设与备则假设,即 01:100;:100H u H u =< 在 0H 为真时,检验统计量 ~(0,1) X U N = 拒绝域为 0.01 2.33U Z Z α<-=-=- 将 00100,75,9,25u x n σ====代入 U 的观察值 00.01 3 2.33U Z ==-<-=- 落在拒绝域内。故应拒绝 0H 。即认为新工艺能显著节省开支。所以工程师的建议应该被采 纳。 〔注〕为什么要把“开支不节省”即 100u =作为零假设而不把 100u <作为零假设? 这是因为工程师建议采用新工艺是一件大事。如果没有较可靠的证据表明这样做有益,则不宜采纳。把“开支不节省”作为零假设便能体现这一点。因为检验水平为0.01,当零假设正确开支不节省,因而不宜采纳工程师建议时,犯错误(即采纳工程师建议)的可能性只有0.01,这个概率很小。 案例19、母亲嗜酒是否影响下—代的健康 美国的jones 医生于1974年观察了母亲在妊娠时曾患慢性酒精中毒的6名七岁儿童(称为甲组)以母亲的年龄,文化程度及婚姻状况与前6名儿童的母亲相同或相近,但不饮酒的46 智商一般受诸多因素的影响从而可以假定两组儿童的智商服从正态分布 211(,)N u σ和 211(,)N u σ 本问题实际是检验甲组总体的均值 1u 是否比乙组总体的均值 2u 偏小?若是,这个差异范围有多大?前一问题属假设检验,后一问题属区间估计。 由于两个总体的方差未知,而甲组的样本容量较小。因此采用大样本下两总体均值比较的U -检验法似乎不妥.故采用方差相等(但未知)时。两正态总体均值比较的t -检验法对第一个问题作出回答。为此,利用样本先检验两总体方差是否相等,即检验假设 2222 012112 :;:H H σσσσ=≠ 当 0H 为真时,统计统计量 2 122 ~(5,45) S F F S = 拒绝域为 1/2(5,45)F F α-≤或 /2(5,45)F F α≥,取 0.1α= /20.051/20.950.05(5,45)(5,45) 2.43 1 (5,45)(5,45)0.22 (45,5)F F F F F αα-==== = F 的观察值 2 0219 1.41 16F ==,得 0.9500.05(5,45)(5,45)F F F << 未落在拒绝域内,故接受 0H ,即认为两总体方差相等 下面用t -检验法检验 1u 是否比 2u 显著偏小?即检验假设 012112:;:H u u H u u =< 当 0H 为真时,检验统计量 12~(2) X X T t n n = +- 其中 22 2 1122 12(1)(1)2w n S n S S n n -+-= +-,取 0.01α= 将 221212119,16,6,46,99S S n n x =====代入得 T 的观察值 00.012.96 2.54(50)T t =-<-=- 落在拒绝域内,故拒绝 0H .即认为母亲嗜酒会对儿童智力发育产生不良影响. 下面继续考察这种不良影响的程度。为此要对两总体均值差进行区间估计. 21u u -的置信度为 1α-的置信区间为 21122)X X S n n -±+- 取 0.01α=,并代入相应数据可得 0.005 (50) 2.67,16.32w t S == 于是置信度为99%的置信区间为。 99-78±16. 32×2.67× 土18 91=(2 .09, 3 9.91) 由此可断言:在99%的置信度下。嗜酒母亲所生孩子在七岁时自己智商比不饮酒的母亲所生孩子在七岁时的智商平均低2.09到39.91 〔注〕读者可能已注意到。在解决问题过程中。两次假设检验所取的显著性水平不同.在检验方差相等时,取 0.1α=;在检验均值是否相等时取 0.01α=。前者远比后者大。为什 么要这样取呢?因为检验的结果与检验的显著性水平 α有关。 α取得小。则拒绝域也会小。产生的后果使零假设 0H 难以被拒绝。因此,限制显著性水平的原则体现了“保护零假设” 的原则 在 α较大时,若能接受 0H ,说明 0H 为真的依据很充足:同理,在 α很小时.我们仍 然拒绝 0H 说明 0H 不真的理由就更充足。在本例中,对 0.1α=,仍得出 22 12σσ=可被接 受及对 0.01α=, 12u u =可被拒绝的结论,说明在所给数据下,得出相应的结论有很充足 的理由。 另外在区间估计中,取较小的置信水平 0.01α=(即较大的置信度),从而使得区间估计的范围较大。若反之,取较大的置信水平.则可减少估计区间的长度,使区间估计分精确。但相应地区间估计的可靠度要是降低了,则要冒更大的风险 案例20、银行经理的方案是否有效 某银行经理认为现在的储蓄机制有点片面的强调顾客的存款数而对顾客取款缺乏一些 激励措施。为此,他设计了一种将存款数与存款期限相乘的指数,然后在不太影响银行效益的前提下设计了一些有吸引力的存款有奖措施已尽量减少顾客的取款数。为了比较此方案的有效性,随机地选择了该银行的15位储户,得到他们在新方案实施前后的指数,结果见下表 对α检验该经理的方案是否有效。 对本检验问题,采用成对数据的比较方法较好。这是因为初看起来,这是两总体均值的比较问题,即将新方案实施前后的指数分别看作两个总体,将1 5位储户在新方案实施前后的指数看作来自这两个总体的样本,若进一步假设这两个总体服从正态分布,便可利用t-检验法检验二者的均值是否有显著差异.但仔细想想,发现这样有点欠妥,因为每位储户的家庭经济状况、消费水平、理财策略等等会有很大的差异,从而储户的存款存在较大差异,这使得各户之间的存款指数缺乏一致性,因而看成来自同一总体的样本是不妥当的.如果我们将同一储户在新方案实施前后的存款指数相减,由于各储户在新方案实施前后的经济状况、消费水平、理财策略等方面不会有太大的变化,则该差值不是由于各储户的家 庭状况的差异而来,而是反映了新方案的实施对存款指数的影响,因而将这些差值看成来自 某一总体的样本就比较合理了.若进一步假定这些差值服从 2 (,)N u σ,则 u 的大小反映了新方案实施前后对存款指数的平均影响程度.检验方案是否有效,等价于检验假设 01:0;:0H u H u ≤> 该假设便可有正态总体均值的t -检验法来检验 以 12,(1,2, ,15)i i x x i =分别表示新方案实施前后各储户的存款指数,令 21,1,2, ,15i i i y x x i =-= 则 12 15,,,y y y 可看做来自正态总体 2(,)N u σ的一个容量为15的样本观测值。由此可求 得: 15 1 0.011300.47 15190.96 (1)(14) 2.624 i i n y y S t n t α=====-==∑ 由正态总体均值的t -检验统计量 n T = 及上述假设可得其拒绝域为(注意此处( 00u =) ) 0) (1)n Y u T t n S α-= >- 即 0(1) Y u t n α=+ - 0.010.01,(14) 2.624t α== (1) Y n c α≥ - 代入具体数据可求得 2.624129.38c = =。由于 300.47y c =>, 故拒绝 0H ,所给数据结果显著地支持新方案有效。 本例关于原假设 0H 的选择体现了数理统计数材中指出的如何选择零假设和备择假设 的精神.即我们“希望”证实某方法有效果时,“有意”将“该方法无效"作为零假设.因为如果这时还能拒绝零假设(特别时在显著性水平 α较小时),则“有效果”的断言就得到更有 力的支持.反之,若把“新方法有效果”作为零假设,则当它被接受时,只是说明有效果的断言“能与观察数据相容”,并不能说明它受到观察数据的有力支持. 本例中所介绍的方法称为成对数据比较的参数性检验方法.能用此方法检验的问题在现实世界中大量存在.例如,为了比较两个玉米品种的平均亩产量,如果利用正态总体均值此较的检验方法,我们应设计如下试验:选择( m n +)块形状面积相同的地块,其中 m 块种植品种 A ,得亩产量 A μ, n 块种植品种 B ,得亩产量 B μ ,然后将这两组数据看成来自两个正态总体的样本,利用正态总体均值比较的检验方法检验 A , B 两品种的平均亩产是否有显著差异.但仔细想想,若用该方法检验,必须要求这( m n +)个地块的土质肥沃程度和地质、气候等条件相同,不然得话,假如种植A 品种的那m 块田地比较肥沃,或其它条 件较好,则即使A 品种不恍于B 品种,但试验结果也可能有利于A 品种.而选择( m n +)块各种条件一致的田块在实际中(尤其当 m , n 较大时)是很难做到的.但如果我们取 n 块田地,将其一分为二,其中一小块种植品种A ,另一小块种植品种B(哪一小块种植品种A ,可随机决定),这样,即使 n 块田地的土质,气候等条件不一致,哪一个品种也不会占地利之便,每块田地上A ,B 两品种的亩产量之差 A B μμ-,正好反映了两个品种对产量的影响 程度,将 A B μμ -看成来自某总体的样本,检验其均值是否为零就比较合理了。 又如,为了比较一种新的降血压药品A 与以往使用的降血压药品B 的疗效(以一定时间内血压降低量作为比较标准),可以取( m n +)个患者,其中 m 个服用药品A ,另 n 个服用药品B .若将服用药品A 的疗效和服用药品B 的疗效看作来自两个总体的样本作比较,以检验新药品的疗效是否优于原药品,这样又产生与上述类似的问题:病人的情况不一,有的病情较重,身体条件较差,用药难以见效,有的患者则相反。为避免这种误差,我们可选取 n 对患者,使每对在各种条件上尽可能一致,各队中人选一名服用A ,另一名服用B ,而不同对患者的条件可以有很大差异。这样设计不但此要求( m n +)个患者的条件一致更容易实现,而且各对内两患者的疗效之差较确切地反映了这两种药品的疗效差异,从而可利用成对数据的比较方法较好地解决这两种药品疗效的比较问题.进一步,如果这种药品的降压效果可在一定地时间内消失,则可只选择 n 个人,在充分长的时间间隔下分别服用药品A 和B ,测定其疗效,用其差值检验两种药品的疗效差异,这可使得各对数据之间更具有可比性,但它要求药品的疗效无后效性,否则,这种方法是不可取的。 再如,在双胞胎中先出生与后出生者在某个时期的一些指标(如智商,身高)的比较中,假如我们抽取了 n 对双胞胎,由于各对双胞胎所处的家庭环境及社会环境不同,将先出生的 n 个双胞胎与后出生的 n 个双胞胎分别看成来自两个总体的样本,对所关心的指标作比较是不妥的,而将每对双胞胎的该项指标值之差看作来自某总体的样本,便可很好的解决其比较问题。 总结上述诸例的思想,我们可以提出成对数据比较的一般模型如下: 设要比较两种处理方法的效果,这里“处理方法”的含义可以很广泛,如银行经理的新的储蓄方案和原方案,两种玉米品种,两种药品,先后出生的双胞胎等等;选择 n 对试验对象。每对中两个试验对象的条件尽可能的一致,而不同对之间不要求一致;在每对试验对象中,随机地指定其中之一给处理方法A ,另一个给处理方法B ,经试验可观测得到对每个 这里 i Y 是在第 i 对式样对象中,所观测到的处理方法B 的处理效果优于A 的量(为了确定起见,我们假定观测值越大,处理效果越大).这个量不受试验对象的条件差别影响,因为每对内两个试验对象的条件已尽量一致了.我们假定 i Y 为来自某个总体(通常假定为正 态总体 2 (,)N u σ的样本,则该总体的均值 u 就表示处理方法B 的处理效果平均优于处理方 法A 的量。这样一来,两处理方法的效果比较就归结为 u 的检验问题。例如:要检验两处 理方法的效果是否一样,等价于检验 u 是否为零;要检验处理方法A 不优于B ,等价于检验 u ≥O 是否可被接受:要检验处理方法B 的效果平均优于A 的量不小于 0u ,等价于检验是 否有 0u u ≥,等等。 案例21、一元线性回归分析的Excel 实现 某班级60名同学的数学(x )和物理成绩(y )如下表, 求数学成绩(x )预测物理 (1)输入数据 将要分析的数据输入Excel 文本中。 (2)选择方法 点击Excel 文本上方的 “工具”,点对话框中的“数据分析(D )”,出现数据分析对话框时,向下拖动数据分析对话框的滑块,点选 “回归”后,点数据分析对话框的 “确定”,出现左图所示的回归对话框. (2)输入变量区域 分别在“Y 值输入区 域”、 “X 值输入区域”的矩形框内输入物理成绩、数学成绩的起止位,并勾选“线性拟合图”选项,如左图所示. (4)输出结果 点回归对话框中的“确定”,出现下面回归分析的分析表及线性拟合图、回归分析的显著性方差分析表. 回归分析的分析表 回归分析的显著性方差分析表 由回归分析的分析表可得,数学成绩预测物理成绩的线性回归方程是: 14.972520.499637Y X =+. 由回归分析的显著性方差分析表知,回归显著性概率为: 9 4.0910-?. 线性拟合图 案例22、方差分析的Excel实现 用Excel程序可以进行单因素方差分析、可重复的双因素方差分析、无重复的双因素方差分析,由于操作过程相差不多,为方便起见我们以单因素方差分析问题为例来说明方差分析的操作过程. 为了研究速度训练,弹跳能力训练,力量训练对运动员跳远成绩的影响,把一批跳远成绩大体相当的年轻运动员随机分为三组,分别加强100米跑(5名),三级跳(6名),力量(4名)的训练,半年后进行跳远成绩测量。问这三种不同的体质训练对提高跳远运动员跳远成绩的影响是否有显著差异? (1)输入数据 将要分析的输入数据 Excel文本中,如左图所 示. (2)选择方法 点击Excel文本上方的 “工具”,点对话框中的 “数据分析(D)”,出现数 据分析对话框时,如左图 所示. 向下拖动数据分析 对话框的滑块,点选“方 差分析:单因素方差分析” 后,点数据分析对话框的 “确定”,出现下图所示的 方差分析:单因素方差分析对话框. (3)输入变量区域 在方差分析:单因素方 差分析的对话框中的 “输入区域(I)”的条 形框内输入分析数据的 所在区域;“分组方式:” 选择“行(R)”. (4)输出结果 点方差分析:单因 素方差分析的对话框中 实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.解:设每张彩票中奖的数额为随机变量X , 则X 10000 5000 1000 100 10 0p 51/1052/10510/105100/1051000/100p 每张彩票平均能得到奖金 05512()10000500001010E X p =? +?++? 0.5(),=元每张彩票平均可赚20.50.3 1.2(), --=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则 X 8 -2p 0.3 0.7()80.320.71(),E X =?-?=万元存入银行的利息:故应选择投资.1050.5(),%?=万元实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500; 3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术、电气课校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料、电气设备调试高中中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并 第四章作业题解 4.1 甲、乙两台机床生产同一种零件, 在一天内生产的次品数分别记为 X 和 Y . 已知 ,X Y 的概率分布如下表所示: 如果两台机床的产量相同, 问哪台机床生产的零件的质量较好? 解: 11.032.023.014.00)(=?+?+?+?=X E 9.0032.025.013.00)(=?+?+?+?=Y E 因为 )()(Y E X E >,即乙机床的平均次品数比甲机床少,所以乙机床生产的零件质量较好。 4.2 袋中有 5 个球, 编号为1,2,3,4,5, 现从中任意抽取3 个球, 用X 表示取出的3 个球中的 最大编号,求E (X ). 解:X 的可能取值为3,4,5. 因为1.01011)3(35 == = =C X P ;3.010 3)4(35 2 3== = =C C X P ; 6.010 6)5(3 5 24=== =C C X P 所以 5.46.053.041.03)(=?+?+?=X E 4.3 设随机变量X 的概率分布1 {}(0,1,2,),(1) k k a P X k k a +===+ 其中0a >是个常 数,求()E X 解: 1 1 2 1 1 1 ()(1) (1) (1) k k k k k k a a a E X k k a a a -∞ ∞ +-=== = +++∑∑ ,下面求幂级数11 k k k x ∞ -=∑的和函数, 易知幂级数的收敛半径为1=R ,于是有 1 2 1 1 1()( ),1,1(1) k k k k x k x x x x x ∞ ∞ -==''=== <--∑ ∑ 第1章 随机变量及其概率 1,写出下列试验的样本空间: (1) 连续投掷一颗骰子直至6个结果中有一个结果出现两次,记录投 掷的次数。 (2) 连续投掷一颗骰子直至6个结果中有一个结果接连出现两次, 记录投掷的次数。 (3) 连续投掷一枚硬币直至正面出现,观察正反面出现的情况。 (4) 抛一枚硬币,若出现H 则再抛一次;若出现T,则再抛一颗骰子,观 察出现的各种结果。 解:(1)}7,6,5,4,3,2{=S ;(2)},4,3,2{Λ=S ;(3)},,,,{ΛTTTH TTH TH H S =;(4)}6,5,4,3,2,1,,{T T T T T T HT HH S =。 2,设B A ,就是两个事件,已知,125.0)(,5.0)(,25.0)(===AB P B P A P ,求)])([(),(),(),(___ ___AB B A P AB P B A P B A P ??。 解:625.0)()()()(=-+=?AB P B P A P B A P , 375.0)()(])[()(=-=-=AB P B P B A S P B A P , 875.0)(1)(___ --=AB P AB P , 5.0)(625.0)])([()()])([()])([(___=-=?-?=-?=?AB P AB B A P B A P AB S B A P AB B A P 3,在100,101,…,999这900个3位数中,任取一个3位数,求不包含数字1个概率。 解:在100,101,…,999这900个3位数中不包含数字1的3位数的个数为648998=??,所以所求得概率为 关于“概率论与数理统计”课程中案例教学的研究“概率论与数理统计”是理工院校绝大部分理工科专业重要的基础课程,它是 从数量化的角度来研究现实世界中的一类不确定现象及其规律性的一门应用数学学科。在当前现代化的教学改革之中,加强案例的应用,对提高学生在应用数学方面的兴趣和创新能力具有重要意义。本文将结合相关案例探讨案例法在“概率论与数理统计”课程教学中的应用与研究。 标签:概率论与数理统计;课程案例;教学改革 以往的教学内容、教学方法、教学手段已不能满足新形势下的教学要求,应改变“重理论,轻应用”的思想。案例教学是以培养学生的能力为目标,以相关案例为媒介,以分析案例为切入点,以与学生共同探究为主的一种教学手段和方法。案例教学法是一种创新的教学理念,有利于调动教师与学生教和学的积极性,实现师生之间、学生与学生之间的多方面的互动,能够促进理论与实践有效地结合,实现理论向实践的转化,能够培养学生的创造性思维和分析处理实际问题的能力。 1.案例教学引入到“概率论与数理统计”课程的实践 下面我们通过两个案例来说明案例教学在“概率论与数理统计”课程中的作用。 全概率公式和贝叶斯公式是概率论的重点和难点,它们都反映了“因果”的概率规律,然而区别在于:全概率公式做出的是“由因溯果”的推断,而贝叶斯公式则是“由果溯因”。 案例1:某市统计局三名统计员登录一批工业经济调查表,王宁登录了38%,李红登录了40%,张建登录了22%。根据以往的经验,王宁的出错率为1%,李红的出错率为2%,张建的出错率为0.8%。局长从三人登录的调查表中随机抽取一张,试问该表有误的概率是多少?另外,若发现这张表有误,试问是王宁登录的可能性是多少? 让学生从问题出发,体会“由因溯果”和“由果溯因”,思考如何正确地使用全概率公式和贝叶斯公式来解决上述两个概率问题。另外,注意贝叶斯公式归根结底是个条件概率问题。 另外,一个随机变量如果受到许多随机因素的影响,而其中每个因素都起不到主导作用(作用微小),则它近似服从正态分布。这就是中心极限定理所要表明的结论。这个定理也是结合案例讲解更加清楚明了。 案例2:一盒同型号的螺丝钉共100个,已知该型号的螺丝钉的重量是一随机变量,期望值是100克,标准差是10克,求一盒螺丝钉的重量超过10.2千克 第一章测试题 一、选择题 1.设A, B, C 为任意三个事件,则与A 一定互不相容的事件为 (A )C B A ?? (B )C A B A ? (C ) ABC (D ))(C B A ? 2.对于任意二事件A 和B ,与B B A =?不等价的是 (A )B A ? (B )A ?B (C )φ=B A (D )φ=B A 3.设A 、B 是任意两个事件,A B ?,()0P B >,则下列不等式中成立的是( ) .A ()()P A P A B < .B ()()P A P A B ≤ .C ()()P A P A B > .D ()()P A P A B ≥ 4.设()01P A <<,()01P B <<,()()1P A B P A B +=,则( ) .A 事件A 与B 互不相容 .B 事件A 与B 相互独立 .C 事件A 与B 相互对立 .D 事件A 与B 互不独立 5.对于任意两事件A 与B ,()P A B -=( ) .A ()()P A P B - .B ()()()P A P B P AB -+ .C ()()P A P AB - .D ()()() P A P A P AB +- 6.若A 、B 互斥,且()()0,0P A P B >>,则下列式子成立的是( ) .A ()()P A B P A = .B ()0P B A > .C ()()()P AB P A P B = .D ()0P B A = 7.设A 、B 、C 为三个事件,已知()()0.6,0.4P B A P C AB ==,则()P BC A =( ) .A 0.3 .B 0.24 .C 0.5 .D 0.21 8.设A ,B 是两个随机事件,且0 0,)|()|(A B P A B P =,则必有 ( ) 概率论与数理统计课后习题答案 第七章参数估计 1.[一] 随机地取8只活塞环,测得它们的直径为(以mm 计) 74.001 74.005 74.003 74.001 74.000 73.998 74.006 74.002 求总体均值μ及方差σ2的矩估计,并求样本方差S 2。 解:μ,σ2 的矩估计是 61 22 106)(1?,002.74?-=?=-===∑n i i x X n X σμ 621086.6-?=S 。 2.[二]设X 1,X 1,…,X n 为准总体的一个样本。求下列各总体的密度函数或分布律中的未知参数的矩估计量。 (1)? ??>=+-其它,0,)()1(c x x c θx f θθ 其中c >0为已知,θ>1,θ为未知参数。 (2)?? ???≤≤=-.,01 0,)(1其它x x θx f θ 其中θ>0,θ为未知参数。 (5)()p p m x p p x X P x m x m x ,10,,,2,1,0,)1()(<<=-==- 为未知参数。 解:(1)X c θc θc c θdx x c θdx x xf X E θθc θ θ =--=-== =+-∞+-∞+∞ -? ? 1 ,11)()(1令, 得c X X θ-= (2),1)()(10 += = = ? ? ∞+∞ -θθdx x θdx x xf X E θ 2 )1(,1 X X θX θθ-==+得令 (5)E (X ) = mp 令mp = X , 解得m X p =? 3.[三]求上题中各未知参数的极大似然估计值和估计量。 解:(1)似然函数 1211 )()()(+-=== ∏θn θ n n n i i x x x c θ x f θL 0ln ln )(ln ,ln )1(ln )ln()(ln 1 1 =- +=-++=∑∑ ==n i i n i i x c n n θθ d θL d x θc θn θn θL 概率论与数理统计在生活中的应用 单位:兴隆场初级中学姓名:姜宏琼 摘要:随机现象无处不在,渗透于日常生活的方方面面和科学技术的各个领域,概率论就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。生活中买彩票显示了小概率事件发生的几率之小,抽签与体育比赛赛制的选择用概率体现了公平与不公平,用概率来指导决策,减少错误与失败等等,显示了概率在人们日常生活中越来越重要。数理统计在人们的生活中也不断的发挥重要的作用,如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。 关键字:概率、保险、彩票、统计、数据、应用 由赌徒的问题引起,概率逐渐演变成一门严谨的科学。1654年,有一个法国赌徒梅勒遇到了一个难解的问题:梅勒和他的一个朋友每人出30个金币,两人谁先赢满3局谁就得到全部赌注。在游戏进行了一会儿后,梅勒赢了2局,他的朋友赢了1局。这时候,梅勒由于一个紧急事情必须离开,游戏不得不停止。他们该如何分配赌桌上的60个金币的赌注呢?梅勒的朋友认为,既然他接下来赢的机会是梅勒的一半,那么他该拿到梅勒所得的一半,即他拿20个金币,梅勒拿40个金币。然而梅勒争执道:再掷一次骰子,即使他输了,游戏是平局,他最少也能得到全部赌注的一半——30个金币;但如果他赢了,并可拿走全部的60个金币。在下一次掷骰子之前,他实际上已经拥有了30个金币,他还有50%的机会赢得另外30个金币,所以,他应分得45个金币。 赌本究竟如何分配才合理呢?后来梅勒把这个问题告诉了当时法国著名的数学家帕斯卡,这居然也难住了帕斯卡,因为当时并没有相关知识来解决此类问题,而且两人说的似乎都有道理。帕斯卡又写信告诉了另一个著名的数学家费马,于是在这两位伟大的法国数学家之间开始了具有划时代意义的通信,在通信中,他们最终正确地解决了这个问题。他们设想:如果继续赌下去,梅勒(设为甲)和他朋友(设为乙)最终获胜的机会如何呢?他们俩至多再赌2局即可分出胜负,这2局有4种可能结果:甲甲、甲乙、乙甲、乙乙。前3种情况都是甲最后取胜,只有最后一种情况才是乙取胜,所以赌注应按3:1的比例分配,即甲得 补充案例:概率部分: 案例1、“三人行必有我师焉” 案例2、抓阄问题 案例3、贝叶斯方法运用案例介绍 案例4、化验呈阳性者是否患病 案例5、敏感性问题的调查 案例6、泊松分布在企业评先进中的应用 案例7、碰运气能否通过英语四级考试 案例8、检验方案的确定问题 案例9、风险型决策模型 案例10、一种很迷惑游客的赌博游戏 案例11、标准分及其应用 案例12、正态分布在人才招聘中的应用 案例13、预测录取分数线和考生考试名 统计部分: 案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理 案例16、如何估计湖中黑、白鱼的比例 案例17、预测水稻总产量 案例18、工程师的建议是否应采纳 案例19、母亲嗜酒是否影响下—代的健康 案例20、银行经理的方案是否有效 案例21、一元线性回归分析的Excel实现 案例22、方差分析的Excel实现 案例23、预测高考分数 案例24、两次地震间的间隔时间服从指数分布 案例1、“三人行必有我师焉” 我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题,即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行,行行出状元”,我们不妨把一个人的才能分成360个方面。孔子是个大圣人,我们假设他在一个方面超过某个人的概率为99%,那么孔子在这方面超过与他“同行”的两个人的概率为99% ×99% =98.0l %,在360个方面孔子总比这两人强的概率为 (98.01%)360=0.07% ,即这两个人在某一方面可以做孔子老师的概率为99.93%.从数学角度分析,孔子的话是很有道理的. 案例2、抓阄问题 一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会,组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄,10张阄中只有一张写“有”. 每个人都想争取到这次机会,你希望自己是第几个抓阄者呢? 有人说要先抓,否则写有“有”的阄被别人抓到,自己就没有机会了;有人说不急于先抓,如果前面的人没有抓到写有“有”的阄,这时再抓抓到“有”的机会会大一些. 为了统一认识,用概率的方法构造一个摸球模型来说明问题. 摸球模型:袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回),求红球被第 k 个人摸到的概率( k = 1, 2, ?, 10). 解决问题 :设 k A = “ { 第 k 个人摸到红球 }, k = 1, 2, ? , 10. 显然,红球被 第一个人摸到的概率为 101 )(1= A P . 因为 12A A ?,于是红球被第二个人摸到的概率为 101 91109)()()()(121212= ?===A A P A P A A P A P . 同样,由 213A A A ?知红球被第三个人摸到的概率为 1018198109)()()()()(2131213213= ??= ==A A A P A A P A P A A A P A P . 如此继续,类似可得 )(4A P = ==ΛΛ)(5A P 101 )(10=A P . 由此可见,其结果与 k 无关,表明10 个人无论摸球顺序如何,每个人摸到红球的机 会相等. 这也说明10 个人抓阄,只要每个人在抓之前不知道他前边那些已经抓完的结果,无论先后, 抓到的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等,人们常常乐于用抓阄的办法来解决,其合理性保证当然得归功于“概率”. 通过上面的摸球模型,我们总结出分配中的“抓阄”问题,无论先抓后抓, 结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后,我们要发扬风格让他人先抓. 案例3、贝叶斯方法运用案例介绍 什么是贝叶斯过滤器? 垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。 正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。 概率论与数理统计MOOC课程中的案例设计 发表时间:2018-07-06T10:44:29.247Z 来源:《防护工程》2018年第5期作者:郭珂琪 [导读] 概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。 北京计算机技术及应用研究所北京 100854 摘要:概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。在西方,这门课是几乎所有大学生都要学习的必修课程,在我国,概率论与数理统计也是理工,农林,经管,医药卫生等各领域学生的必修课程,如何让学生学好这门课程一直是很多教师关注的热点。这门课程成为MOOC 课程,可以面向更多的学生,整合并充分利用优质教育资源,方便不同专业的交流;但同时也面临了学生专业跨度大,数学基础差别大的困难。针对这样的学生群体,该课程的MOOC 课程制作面临更大的挑战,必须深入浅出,形象生动,难度层次递进,且有连贯性,才能达到更好的教学效果,并有效降低学生辍学率。 关键词:MOOC 课程;概率论与数理统计;案例教学;概率统计 随着各种MOOC资源平台的涌现和推广,新的在线教学模式—MOOC已经成为大学教育中不可忽视的一种教育模式。MOOC对学校而言,能更好地整合教育资源;对学生而言,能更好地锻炼自学、思考和反思的能力。但MOOC也存在一些较难克服的障碍,对于内容抽象、学习难度大的课程,基础有欠缺、自制力缺乏的学生的辍学率始终居高不下,故可以预见,在较长时期内,部分学生还是会选择以传统课堂教学课程为主的学习方式。对于这门内容抽象、学习难度大的课程,如何保证学生课下自学的效果,不影响课程内容的进度,成为翻转课堂实施的一个关键问题,MOOC相关课程的资源便成为学生课下自学中最好的辅助;同时在课上讨论中,为了更好地提高学生的兴趣,锻炼学生的思考能力,也可以适当结合和借鉴MOOC灵活开放的教学方式。 一、案例教学对概率论与数理统计课堂教学的意义 在概率论与数理统计课堂教学中积极提倡案例教学是十分必要的,并具有其独特的意义。 1、概率论与数理统计的教学目标,既有学习理论方面的目标,又有实践层面的目标,既培养学生具有扎实的概率统计基础理论,又能将该理论和实践结合起来。而案例教学能将理论和实践很好地结合起来,可以使两个目标得以同时实现,且在两者结合方面拉近了距离,使得理论不再是空中楼阁,而是活生生的理论,实践也不是盲目的实践,而是有指导、有方向、有目的的实践。概率论与数理统计是一门应用性很强的学科,很适合用案例教学方法来组织课堂教学。 2、概率论与数理统计是一门研究随机现象的学科,在学习中有许多难点,需辅以案例教学才能理解概率论与数理统计的思想方法、基本原理和统计工具。概率论与数理统计这门课程不同于以往学习的确定性数学,其中随机变量、分布函数、大数定理、中心极限定理、极大似然估计方法以及假设检验的思想方法等都是该课程中难以理解的内容,如果教师在课堂教学上照本宣科,只强调教学过程的理论性、严谨性和逻辑性而脱离实际应用,学生要真正掌握和理解概率统计思想方法和概率统计模型是很困难的,必须从案例出发,才能清晰地阐明其概念和统计思想,必须通过案例的描述、假设、建模与求解,演示理论与方法的应用过程。 3、在概率论与数理统计课堂教学中实施案例教学也是教学改革的必然要求。案例教学法是把案例作为一种教学工具,把学生引导到实际问题中去,通过分析与相互讨论,调动学生的主动性和积极性,并提出解决问题的基本方法和途径的一种教学方法,它是连接理论和实践的桥梁。将理论教学与实际案例有机地结合起来,使得课堂讲解生动而清晰,可收到良好的教学效果。同时案例教学可以促进学生全面地看问题,从数量的角度分析事物的变化规律,使概率与数理统计的思想和方法在现实生活中得到更好的应用,从而提高学生分析问题和解决问题的能力。 二、案例教学在概率论与数理统计课堂教学中的运用 案例教学一般适合于既要注重理论教学,又注重实际操作的课程,而概率论与数理统计作为一门应用性很强的随机学科,在课堂上很适合采用案例教学方法,根据该学科的特点,在案例教学时应按照以下步骤组织实施: 1、案例的选择。选择合适的案例是整个案例教学的核心,同时也是一项十分复杂的工作,这主要是由于大学各理工科的专业性质不同,对案例的选择也不同,一般来说,所选择的案例要与相应专业比较接近,这样才能调动学生学习的积极性,以达到好的教学效果。因而在选择案例时需把握以下几点:一要考虑案例的实用性;二要考虑案例的典型性;三要考虑案例的针对性。根据案例的选择原则,这就要求我们在选择案例时要深入各个相关专业进行调研,与专业教师交流探讨,对专业教材阅读分析,收集专业课程中使用概率论与数理统计知识的案例和学生感兴趣的案例,安排教研活动组织专题讨论,进行分类汇总,编写《概率论与数理统计案例选编》,对于来自各个学科专业的数学应用案例,要有问题的提出和分析,有模型的建立与求解,有应用的讨论和评注。 2、明确案例教学思路,做好案例教学设计。根据教学内容,结合学生的专业特点,从概率论与数理统计案例选编中选取合适案例,选取好案例后,要合理分配好课堂上案例讨论与分析的时间,选择好教学方法和教学手段,并以多媒体的形式在课堂上呈现。概率论与数理统计从内容到方法与以往的数学课程有本质的不同,因此其基本概念的引入就显得更为重要。在教学中,应首先从案例出发引入概率统计的相关概念、概率统计的基本原理、统计方法,然后再选择合适案例来说明概率统计原理与方法的应用。当然,在课堂上不是要一味地讲解案例,也不是案例越多越好,而是要把握好案例与课堂知识点的结合,不能公式化,在教学过程中要充分体现“实践—理论—实践”的认识过程,做到理论与实际的有机结合。 3、有效组织案例教学,做好案例的讨论、分析。案例的讨论与分析是案例教学的中心环节,对案例进行讨论的目的是提出解决问题的途径与方法,可以从自身角度出发来剖析案例,说明自己的观点和看法,教师要掌握讨论的进程,让学生成为案例讨论的主体,同时把握好案例讨论的重点和方向,进行必要的引导。同时在组织案例教学时要辅以各种有效的教学方法,如启发式教学、讨论式教学,让学生积极参与,大胆发表意见,提出观点,深入思考,激发学生的学习热情及科研兴趣,使案例教学效果达到最佳,培养学生运用概率统计原理解决实际问题的能力。 4、案例的总结。案例总结是保证和提高案例教学质量的必备环节。对案例的总结一般要包括以下内容:一是对讨论过程进行总结,对于一个案例,让学生提出各种观点及其案例所包含的概率统计原理,让学生通过分析和评价案例,掌握正确处理和解决复杂多变的现实 第1章 随机变量及其概率 1,写出下列试验的样本空间: (1) 连续投掷一颗骰子直至6个结果中有一个结果出现两次,记录 投掷的次数。 (2) 连续投掷一颗骰子直至6个结果中有一个结果接连出现两次, 记录投掷的次数。 (3) 连续投掷一枚硬币直至正面出现,观察正反面出现的情况。 (4) 抛一枚硬币,若出现H 则再抛一次;若出现T ,则再抛一颗骰 子,观察出现的各种结果。 解:(1)}7,6,5,4,3,2{=S ;(2)},4,3,2{ =S ;(3)},,,,{ TTTH TTH TH H S =;(4)}6,5,4,3,2,1,,{T T T T T T HT HH S =。 2,设B A ,是两个事件,已知,125.0)(,5.0)(,25.0)(===AB P B P A P ,求 )])([(),(),(),(___ ___ AB B A P AB P B A P B A P ??。 解:625.0)()()()(=-+=?AB P B P A P B A P , 375.0)()(])[()(=-=-=AB P B P B A S P B A P , 875.0)(1)(___ --=AB P AB P , 5 .0)(625.0)])([()()])([()])([(___ =-=?-?=-?=?AB P AB B A P B A P AB S B A P AB B A P 3,在100,101,…,999这900个3位数中,任取一个3位数,求不包含数字1个概率。 解:在100,101,…,999这900个3位数中不包含数字1的3位数的个数为648998=??,所以所求得概率为 72.0900 648 = 4,在仅由数字0,1,2,3,4,5组成且每个数字之多出现一次的全体三位数中,任取一个三位数。(1)求该数是奇数的概率;(2)求该数大于330的概率。 解:仅由数字0,1,2,3,4,5组成且每个数字之多出现一次的全体三位数的个数有100455=??个。(1)该数是奇数的可能个数为 48344=??个,所以出现奇数的概率为 48.0100 48 = (2)该数大于330的可能个数为48454542=?+?+?,所以该数大于330的概率为 48.0100 48 = 5,袋中有5只白球,4只红球,3只黑球,在其中任取4只,求下列事件的概率。 (1)4只中恰有2只白球,1只红球,1只黑球。 (2)4只中至少有2只红球。 (3)4只中没有白球。 解: (1)所求概率为338 4 12 1 31425=C C C C ; 《概率论与数理统计》 姓名:黄淑芹 学号:1543201000276 班级:数学与应用数学E 时间:2017年6月 概率论与数理统计 摘要:随机现象无处不在,渗透于日常生活的方方面面和科学技术的各个领域,概率论就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。生活中买彩票显示了小概率事件发生的几率之小,抽签与体育比赛赛制的选择用概率体现了公平与不公平,用概率来指导决策,减少错误与失败等等,显示了概率在人们日常生活中越来越重要。数理统计在人们的生活中也不断的发挥重要的作用,如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。 关键词:概率、统计、数学期望、方差、实际问题、应用 概率论与数理统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规律进行演绎和归纳的科学。随着社会的不断发展,概率论与数理统计的知识越来越重要,运用抽样数据进行推断已经成为现代社会一种普遍适用并且强有力的思考方式。目前,概率论与数理统计的很多原理方法已被越来越多地应用到交通、经济、医学、气象等各种与人们生活息息相关的领域。本文将就概率论与数理统计的方法与思想,在日常生活中的应用展开一些讨论,,推导出某些表面上并非直观的结论,从中可以看出概率方法与数理统计的思想在解决问题中的高效性、简捷性和实用性。 (一)、概率 要学习与概率有关的知识,首先要知道事件的定义与分类及与它们有关的运算性质: 随机事件 在抛掷一枚均匀硬币的试验中,“正面向上”是一个随机事件,可用A={正面向上}表示。 【1】随机试验中的每一个可能出现的试验结果称为这个试验的一个样本点,记作ωi。全体样本点组成的集合称为这个试验的样本空间,记作Ω.即Ω={ω1,ω2,…,ωn,…}。仅含一个样本点的随机事件称为基本事件,含有多个样本点的随机事件称为复合事件。 在随机试验中,随机事件一般是由若干个基本事件组成的。样本空间Ω的任一子集A称为随机事件。属于事件A的样本点出现,则称事件A发生。例如,在试验E中,令A表示“出现奇数点”,A就是一个随机事件,A还可以用样本点的集合形式表示,即A={1,3,5},它是样本空间Ω的一个子集,在试验中W中,令B表示“灯泡的寿命大于1000小时”,B也是一个随机事件,B也可用样本点的集合形式表示,即B={t|t>1000},B也是样本空间的一个子集。 统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较. 8.相关性 (1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的______ (2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为____________ (3)在两个变量x 和y 的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是______,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是______的.如果所有的点在散点图中没有关系,则称变量间是______的. 9.线性回归方程 (1)最小二乘法 如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+ [y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是所要求的直线,这种方法称为最小二乘法. (2)线性回归方程 方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数. 概率论与数理统计在生活中的应用 材料学院 1211900133 缪克松 摘要:数学在生活中的应用越来越广,而概率也发挥着重要的作用。它不仅在科学技术、工 农业生产和经济管理中发挥着重要作用。而且它常常就发生在我们身边, 出现在我们每一 个人的生里, 只要我们善于利用概率的知识去解决问题, 概率论就会对我们的生活产生积极 的影响。 关键字:概率论;数理统计;生活 概率论与数理统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规 律进行演绎和归纳的科学。随着社会的不断发展,概率论与数理统计的知识越来越重要, 运用抽样数据进行推断已经成为现代社会一种普遍适用并且强有力的思考方式。目前,概率论与数理统计的很多原理方法已被越来越多地应用到交通、经济、医学、气象等各种与 人们生活息息相关的领域。本文将就概率论与数理统计的方法与思想,在日常生活中的应 用展开一些讨论,从中可以看出概率方法与数理统计的思想在解决问题中的高效性、简捷 性和实用性。 一.随机现象与概率 在自然界和现实生活中, 一些事物都是相互联系和不断发展的。在它们彼此间的联系 和发展中, 根据它们是否有必然的因果联系, 可以分成两大类: 一类是确定性的现象, 指 在一定条件下, 必定会导致某种确定的结果。如, 在标准大气压下, 水加热到 100 ℃, 就 必然会沸腾。事物间的这种联系是属于必然性的。另一类是不确定性的现象。这类现象在 一定条件下的结果是不确定的。例如, 同一个工人在同一台机床上加工同一种零件若干个, 它们的尺寸总会有一点差异。又如, 在同样条件下, 进行小麦品种的人工催芽试验, 各颗 种子的发芽情况也不尽相同有强弱和早晚之别等。为什么在相同的情况下, 会出现这种不 确定的结果呢? 这是因为, 人们说的“相同条件”是指一些主要条件来说的, 除了这些主 要条件外, 还会有许多次要条件和偶然因素是人们无法事先预料的。这类现象, 人们无法 用必然性的因果关系, 对现象的结果事先做出确定的答案。事物间的这种关系是属于偶然 性的, 这种现象叫做偶然现象,或者叫做随机现象。概率, 简单地说, 就是一件事发生的可能性的大小。比如: 太阳每天都会东升西落, 这件事发生的概率就是 100% 或者说是 1, 因为它肯定会发生; 而太阳西升东落的概率就是 0, 因为它肯定不会发生。但生活中的很 多现象是既有可能发生, 也有可能不发生的, 比如某天会不会下雨、买东西买到次品等等, 这类事件的概率就介于 0 和 100% 之间, 或者说 0 和 1 之间。在日常生活中无论是股市涨跌, 还是发生某类事故, 但凡捉摸不定、需要用运气来解释的事件, 都可用概率模型进行定量分析。不确定性既给人们带来许多麻烦, 同时又常常是解决问题的一种有效手段甚 至唯一手段。 二. 社会热点与概率论诠释 社会热点 1 进入 21 世纪后,各种特大自然灾害不断出现,日本发生里氏 9. 0 级强震、冰岛南部冰川火山喷发、印尼地震引发海啸等,“ 2012 地球毁灭之说”是否是真的。 社会热点 2 中国福利彩票巨奖频现,继 2009 年河南彩民独中 3. 6 亿元之后, 2010 年一河南彩民博得 2. 58 亿元,近日浙江一彩民狂揽 5. 65 亿元。这几把接力“火炬”,无 疑让中国福彩业沸腾了,但并非人人都有这样的好运气。 概率论知识———小概率事件必然发生 以上热点 1 和热点 2 都是概率论里提及的小概率事件,意指发生可能性很小的事件。小概率事件的原理又称为似然推理,即如果一个事件发生的概率很小,那么在一次 试验中,可以把它看成是不可能事件。如考虑福彩双色球每一注中 500 万大奖的概率为p,则 p=1C633* C116=11 107 568* 16≈5. 64*10^-8,是典型的小概率事件,在一次 “统计与概率”教学案例 南昌市洪都小学谭琴 教材内容:人教版义务教育课程标准实验教科书数学三年级下册第38页内容及练习十第1题。 教材分析 统计最基础的知识是比较、排列和分类。对现实生活中一类物体根据其不同的标准进行比较,从中分辨出异同,并按一定的顺序进行排列,这些都是统计的萌芽思想,而分类则是在比较、排列的基础上,进一步划分不同标准的结果。 本课在学生认识了一格代表2个单位、5个单位的纵向条形统计图的基础上,通过两个例题继续介绍一些常见的条形统计图:一种是横向条形统计图,另一种是起始格与其他格表示不同单位量的条形统计图。让学生根据统计图表进行初步的数据分析,通过分析寻找信息,并根据这些信息作出进一步的判断和决策。学生通过这一阶段的学习,对条形统计图的结构、数据的表示方式,以及条形统计图的作用,都有了一个基本的了解,为下一阶段学习折线统计图打下坚实的基础。练习十中的习题除了让学生根据统计图进行简单的数据分析以外,还注意加强对学生进行提出问题、解决问题能力的培养,让学生根据统计图寻找信息,提出问题并加以解决的要求。 设计思路 1. 数学生活化,让学生学习现实的数学。围绕新课标的这一具体要求,力图让学生在熟悉、亲切的生活背景素材中提出数学问题,让学生感到生活中处处有统计,处处有数学。 2.数学活动化,让学生学习动态的数学。为了让学生真正投入到统计的过程中,为此创设了画一画、议一议的活动氛围,从活动中初步感受数据收集、整理、分析的全过程,从而形成统计观念。 3.数学问题化,让学生学习思考的数学。注意在课中引导学生用精确的数学语言描述数据,根据数据提出问题并解决问题,充分拓展思维,深化对统计意义的理解。 学情分析 在前几册的教材中,学生已经学会了收集和整理数据的方法,会用统计表(包括单式统计表和复式统计表)和条形统计图(一格表示一个或多个单位)来表示统计的结果,并能根据统计图表提出问题加以解决。学生已经掌握基本的统计方法,建立了初步的统计观念。这是本节课的基础和起点。这节课进一步学习统计知识,通过有限样本的数据分析来推断总体样本的大致情况,有些学生在课前已经试着进行了分析,有一定基础,但有一些学生动手能力较弱,推理能力不强,对学生这部分内容会产生一定的困难。主要的难点是在“分析数据”和“合理推断上。 教学目标 1、引导学生自主探索、合作交流,学会看横向条形统计图和起始格与其他格代表的单位量不一致的条形统计图,并能根据统计表中的数据完成统计图。 2、初步学会简单的数据分析,进一步感受到统计对于决策的作用,体会统计在现实生活中的作用,理解数学与生活的紧密联系。 3、加强学生提出问题、解决问题能力的培养。 概率论与数理统计习题答案 第四版 盛骤 (浙江大学) 浙大第四版(高等教育出版社) 第一章 概率论的基本概念 1.[一] 写出下列随机试验的样本空间 (1)记录一个小班一次数学考试的平均分数(充以百分制记分)([一] 1) ??? ????=n n n n o S 1001, ,n 表小班人数 (3)生产产品直到得到10件正品,记录生产产品的总件数。([一] 2) S={10,11,12,………,n ,………} (4)对某工厂出厂的产品进行检查,合格的盖上“正品”,不合格的盖上“次品”,如连续查出二个次品就停止检查,或检查4个产品就停止检查,记录检查的结果。 查出合格品记为“1”,查出次品记为“0”,连续出现两个“0”就停止检查,或查满4次才停止检查。 ([一] (3)) S={00,100,0100,0101,1010,0110,1100,0111,1011,1101,1110,1111,} 2.[二] 设A ,B ,C 为三事件,用A ,B ,C 的运算关系表示下列事件。 (1)A 发生,B 与C 不发生。 表示为: C B A 或A - (AB+AC )或A - (B ∪C ) (2)A ,B 都发生,而C 不发生。 表示为: C AB 或AB -ABC 或AB -C (3)A ,B ,C 中至少有一个发生 表示为:A+B+C (4)A ,B ,C 都发生, 表示为:ABC (5)A ,B ,C 都不发生, 表示为:C B A 或S - (A+B+C)或C B A ?? (6)A ,B ,C 中不多于一个发生,即A ,B ,C 中至少有两个同时不发生 相当于C A C B B A ,,中至少有一个发生。故 表示为:C A C B B A ++。 (7)A ,B ,C 中不多于二个发生。 相当于:C B A ,,中至少有一个发生。故 表示为:ABC C B A 或++ (8)A ,B ,C 中至少有二个发生。 相当于:AB ,BC ,AC 中至少有一个发生。故 表示为:AB +BC +AC 6.[三] 设A ,B 是两事件且P (A )=0.6,P (B )=0. 7. 问(1)在什么条件下P (AB )取到最大值,最大值是多少?(2)在什么条件下P (AB )取到最小值,最小值是多少? 解:由P (A ) = 0.6,P (B ) = 0.7即知AB ≠φ,(否则AB = φ依互斥事件加法定理, P (A ∪B )=P (A )+P (B )=0.6+0.7=1.3>1与P (A ∪B )≤1矛盾). 从而由加法定理得 P (AB )=P (A )+P (B )-P (A ∪B ) (*) (1)从0≤P (AB )≤P (A )知,当AB =A ,即A ∩B 时P (AB )取到最大值,最大值为 P (AB )=P (A )=0.6, (2)从(*)式知,当A ∪B=S 时,P (AB )取最小值,最小值为 P (AB )=0.6+0.7-1=0.3 。 7.[四] 设A ,B ,C 是三事件,且0)()(,4 1 )()()(=== ==BC P AB P C P B P A P ,8 1 )(= AC P . 求A ,B ,C 至少有一个发生的概率。 解:P (A ,B ,C 至少有一个发生)=P (A +B +C )= P (A )+ P (B )+ P (C )-P (AB )-P (BC )【免费下载】概率论与数理统计案例
概率论与数理统计第4章作业题解
概率论与数理统计及其应用第二版课后答案浙江大学
关于“概率论与数理统计”课程中案例教学的研究
(精选)概率论与数理统计第一章
概率论与数理统计第四版课后习题答案
概率论与数理统计在生活中的应用
概率统计补充案例
概率论与数理统计MOOC课程中的案例设计
概率论与数理统计及其应用第二版课后答案
概率论与数理统计
(完整word版)高中数学统计与统计案例概率知识点,推荐文档
【概率论】概率论与数理统计在生活中的应用
《概率与统计》教学案例
《概率论与数理统计》浙江大学第四版课后习题答案