概率论与数理统计在大数据分析中的应用3篇 概率论与数理统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论与数理统计在大数据分析中的应用3篇概率论与
数理统计
精品文档,仅供参考
概率论与数理统计在大数据分析中的应用3篇概率
论与数理统计
在大数据时代,利用概率论与数理统计方法来对繁杂数据进行分析与挖掘不失为是一种简单高效的方法。下面是本站为大家带来的,希望能帮助到大家!
概率论与数理统计在大数据分析中的应用1
概率论与数理统计知识是数学知识体系中的重要分支,对日常生活有着广泛的理论指导。基于此,本文首先介绍了概率论与数理统计的主要学科知识,其次对于概率论与数理统计知识在日常生活中的应用,从等概率问题、序列概率问题、几何概率模型问题、统计模型、常识性统计几个方面,进行具体的研究与分析,最后对概率与数理统计的应用做出展望。
概率论和数理统计是高等数学中的重要组成部分。在自然界和人们的日常生活中,随机现象与随机事件非常普遍,概率论和数理统计是对某一事件可能结果的客观分析和理性判断。只要我们细心研究就会发现,概率论和数理统计在日常生活中有着多方面的应用。
一、概率论与数理统计知识
概率论(Probability Theory)是研究随机现象数量规律的数学分支,数理统计(Mathematics Statistics)是以概率论为基础,研究人类社会和自然界中的随机现象变化规律的
一种数学模型[1]。概率论与数理统计知识主要包含事件间关系的确定、概率的计算、概率计算模型、概率计算公式、相关性分析、参数估计、假设检验与回归分析、随机变量知识、中心极限定理等等[2]。概率论与数理统计来源与生活,是对生活中的多种随机现象的逻辑分析与抽象总结。在日常生活中,也能找到多种应用概率论与数理统计知识的具体体现。
二、概率论与数理统计在日常生活中的具体应用体现
(一)概率论与数理统计在等概率事件中的应用
等概率事件是指每一个随机事件发生的概率都是相同的,等概率问题是生活中常见的问题,小到我们玩狼人杀时的身份抽取、值日生分组中的抓阄分组,大到工厂的货物质检、食品安全部门的卫生抽检,都能应用到概率论与数理统计的相关知识。
例1:一个罐头生产厂将密封不严、颜色不达标、微生物超標的罐头列为次品。该工厂每月生产十五批货。一批货的次品率是1/20,数量很大,有几万个,现在随机取9个。问9个里面次品数量大于2个(包括2个)的概率有多少?
解:P(B1)代表9个产品中次品数量大于2的概率
P(B2)代表9个里面次品数量小于1个(包括1个)的概率,也相当于只有一个次品的概率+没有次品的概率
P(B2)=9*(1/20)*(19/20)8 +(19/20)9
=10*(19/20)9
=0.9288
P(B1)=1-P(B2)=1-0.9288=0.0712
在这次检验中,每个罐头是次品的概率都是相同的,我们从相识生活的经验可知,整批次上万个罐头逐一检验确定产品的次品率,在时间上、成本上都是不现实的。这样的等概率计算可以保障工厂,在只抽检9个罐头产品的情况下,对该批次上万个罐头的产品质量进行估计,大大节省了质量检验的时间,同时,一定程度上保障了质量检验的科学性。
(二)概率论与数理统计在密码问题中的应用
密码问题也是我们生活中的常见问题,当下,每个人都拥有多种电子设备芯片存储卡,为了保障电子设备和卡片的安全性,我们常常设置不同的密码,但往往会在使用中忘记完整的密码,以及具体的密码和设备与卡片之间的搭配。应用概率论与数理统计的知识,我们可以将琐碎的密码信息进行随机排列组合,有计划的进行密码尝试,破解被我们忘记的密码。
例2:丹丹为母亲李女士购买了一台新型智能手机,李女士岁手机进行密码设置之后,不慎将密码遗忘,只记得密码的四个数字是5,8,6,3,丹丹进行解锁尝试,有多大的可能一次就将密码解开?(正确密码为3,5,6,8) 解:事件A为丹丹一次尝试解锁就可以将设备解开
3,5,6,8出现在设备锁中的第1,2,3,4位置为事件A1A2A3A4,
P(A)=P(A1A2A3A4)
=P(A1)P(A2/A1)P(A3/A1A2)P(A4/A1A2A3)
=1/4*1/3*1/2*1
=1/24
所以,丹丹一次尝试就能成功解开手机的概率为1/24。丹丹在经过概率计算之后再进行设备解锁,可以在解锁中平心静气,认真记录每次解锁的数值,坚定解锁过程的信心,按照不同的数字组合顺序依次解锁,避免解锁中的重复尝试造成的时间精力的浪费,更快找到正确的密码。
(三)概率论与数理统计在时效性问题中的应用
时效性问题是生产生活中常见的问题,例如我们与朋友相约见面、生产中多种原料的综合投产、多种药品同时服用的相互影响作用、护肤产品的保质期限与使用间隔时间等问题,都属于时效性问题。应用几何概率模型,能够有效的帮助我们解决生活中遇到的时效性问题,帮助我们更加科学合理的安排与计划时间,增加对物料使用的利用效率。
例3:同学甲和同学乙约定上午9时到11时在南湖公园一起玩耍,不论谁先到都在公园门口等对方30分钟,如果30分钟后对方仍没有来,就先进入公园,按照公园的游览路线独自游览,在这样的情况下,二人在南湖公园门口见面的
几率有多大?
解:假设甲同学到达南湖公园的时间为x,乙同学到达公园的时间为y,两人在南湖公园门口见面为事件A,那么事件A实现的条件为|x-y|≤30
P(A)=(120*120-90*90)/120*120
=0.4375
由计算分析可知,两个同学在南湖公园门口碰面的概率为0.4375,两个同学在知晓概率结果之后,可以更好的安排自己的时间,由于见面的几率较小,所以二人应该在见面前加强联系,尽量缩短约定的时间间隔,并且尽可能的为见面安排预备方案,例如,十点整在公园内摩天轮处汇合等。在不破坏各自的路线规划的情况下,增加见面的几率,提升游玩过程的愉悦程度。
(四)假设检验在日常生活中的应用
假设检验是根据假设条件的状态,从样本推断整体的一种数理统计方法。根据事件成立或满足条件的显著性水平,对一只样本数据进行检验。假设检验主要包含u检验法、t 检验法、χ2检验法(卡方检验)、F检验法,秩和检验等[3]。实际生活中的人口结构估算、工厂生产设备状态判断、医疗药品的临床应用效果检验等,都经常用到假设检验的数理统计方法。
例4:A市第六中学人口结构研究一小组,在项目报告