概率与统计随机抽样用样本估计总体变量间的相互
统计学重点
第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。
第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。
每个单位被抽中的概率是已知的,或是可以计算出来的。
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。
(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。
考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例
温馨提示:此题库为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,关闭Word文档返回原板块。
考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2013·四川高考文科·T7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示。
以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()【解析】选A.由[0,5),[5,10)内的频数均为1,可知频率分布直方图中的高度相等,可以排除选项B;由于分组时按照组距为5分的,而选项C,D的组距为10,故错误;所以选A.2.(2013·重庆高考理科·T4)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x 、y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8 【解题指南】直接利用中位数和平均数的定义进行求解.【解析】选C. 因为甲组数据的中位数为15,所以易知5=x ,又乙组数据的平均数为16.8,所以8.165241018159=+++++y ,解得8=y .故选C.3. (2013·重庆高考文科·T6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为( )A.0.2B.0.4C.0.5D.0.6【解题指南】直接根据数据的总个数和落在区间[22,30)内的个数求解即可. 【解析】选B. 落在区间[20,30)内的个数为4个,总的数据有10个,故概率为0.4.选B.4.(2013·湖南高考理科·T2)某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法 【解题指南】 本题要弄懂三种抽样方法之间的区别和联系。
概率与统计
平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角 度和适用的范围又不尽相同。
三.变量间的相关关系及回归分析
1.相关关系:
当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的 关系叫做相关关系。与函数关系不同,相关关系是一种不确定关系。
2.散点图
3.回归分析:
对具有相关关系的两个变量进行统计分析的方法叫做回归分析。
ˆx a <1>回归直线方程: y ˆ b
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为 样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这 种抽样方法叫做简单随机抽样。(抽签法,随机数表法)
3.系统抽样
当总体中的个体比较多时,首先把总体分成均衡的若干部分,然后按照 事先确定的规则,从每一部分中抽取一个个体,得到所需要的样本,这种抽 样方法叫做系统抽样。
(2)特点:
①无限性:试验中所有可能出现的结果(基本事件)有无限多个; ②等可能性:试验结果在每一个区域内均匀分布。
构成事件A的区域长度(面积或体 积) (3)计算公式: P( A) 试验的全部结果所构成 的区域长度(面积或体 积)
7.条件概率 (1)定义:
对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率 叫做条件概率,用符号P(B|A)来表示。
概率与统计【题集】-讲义(教师版)
概率与统计【题集】1. 条件概率与相互独立事件1.盒子中有个白球和个红球,现从盒子中依次不放回地抽取个球,那么在第一次抽出白球的条件下,第二次抽出红球的概率是 .【答案】【解析】设事件为第一次抽取的为白球;设事件为第二次抽到红球,∴;∴第一次抽到白球条件下,第二次抽到红球的概率为.故答案为:.【标注】【知识点】超几何分布;条件概率A.B.C.D.2.甲、乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛.若赛完局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为,乙获胜的概率为,各局比赛结果相互独立.则甲在局以内(含局)赢得比赛的概率为( ).【答案】A【解析】用表示“甲在局以内(含局)赢得比赛”,表示“第局甲胜”,表示“第局乙胜”,则,,,,,,,∴.故选项.【标注】【知识点】相互独立事件的概率乘法公式;互斥事件的概率加法公式2. 离散型随机变量的分布列、期望与方差A.B.C.D.3.设是一个服从两点分布的离散型随机变量,其分布列为:则的值为().【答案】A 【解析】,∴,∴.故选.【标注】【知识点】离散型随机变量的数学期望;离散型随机变量的分布列A.B.C.D.4.已知随机变量的分布列如表(其中为常数)则等于( ).【答案】C【解析】由概率之和等于可知,∴.故选.【标注】【知识点】离散型随机变量的分布列;概率的基本性质5.若随机变量的概率分布如表,则表中的值为 .【答案】【解析】由随机变量的概率分布表得:,解得.故答案为:.【标注】【知识点】概率的基本性质;互斥事件的概率加法公式A. B.C.D.6.设离散型随机变量的分布列为().若离散型随机变量满足,则下列结果正确的有( ).【答案】AC【解析】由离散型随机变量的分布列的性质得︰,则,,即,离散型随机变量满足,∴,故结果正确的有.故选.【标注】【知识点】期望与方差的性质3. 两点分布7.已知随机变量服从两点分布,且,设,那么.【答案】【解析】∵随机变量服从两点分布,且,∴,∴,设,则.【标注】【知识点】离散型随机变量的数学期望;两点分布A. B. C. D.8.设某项试验的成功率是失败率的倍,用随机变量去描述次试验的成功次数,则().【答案】C【解析】设失败率为,则成功率为.∴的分布列为:则“”表示试验失败,“”表示试验成功,∴由,得,即.故选.【标注】【知识点】离散型随机变量的分布列9.若的分布列为:其中,则,.【答案】 ;【解析】,,故答案为:,.【标注】【知识点】离散型随机变量的分布列A.和 B.和 C.和 D.和10.若随机变量服从两点分布,其中,则和的值分别是().【答案】D【解析】∵随机变量服从两点分布,且,∴,∴,,∴,.故选.【标注】【知识点】离散型随机变量的数学期望;离散型随机变量的方差A. B. C. D.11.某电视台夏日水上闯关节目中的前三关的过关率分别为,,,只有通过前一关才能进入下一关,且通过每关相互独立.一选手参加该节目,则该选手只闯过前两关的概率为().【答案】D【解析】某电视台夏日水上闯关节目中的前三关的过关率分别为,,,只有通过前一关才能进入下一关,且通过每关相互独立.一选手参加该节目,则该选手只闯过前两关的概率为:.故选:.【标注】【知识点】两点分布;离散型随机变量的分布列;相互独立事件的概率乘法公式4. 次独立重复实验与二项分布A.,B.,C.,D.,12.已知随机变量服从二项分布,即,且,,则二项分布的参数,的值为().【答案】D【解析】由二项分布的期望和方差公式,,则,∴,,∴,∴.故选.【标注】【知识点】n次独立重复试验与二项分布A. B. C. D.13.已知服从二项分布的随机变量满足,则()的值为().【答案】B【解析】.故选.【标注】【知识点】n次独立重复试验与二项分布14.一批产品的次品率为,从这批产品中每次随机取一件,有放回地抽取次,表示抽到的次品件数,则.【答案】【解析】∵一批产品的次品率为,从这批产品中每次随机取一件,有放回地抽取次,表示抽到的次品件数,∴,∴,故答案为:.【标注】【知识点】n次独立重复试验与二项分布15.某大厦的一部电梯从底层出发后只能在第,,层停靠,若该电梯在底层载有位乘客,且每位乘客在这三层的每一层下电梯的概率均为,用表示这位乘客在第层下电梯的人数,则.【答案】【解析】服从二项分布,即,∴.【标注】【知识点】n次独立重复试验与二项分布A. B. C. D.16.新冠肺炎病毒可以通过飞沫传染,佩戴口罩可以预防新冠肺炎病毒传染,已知,,三人与新冠肺炎病人甲近距离接触,由于,,三人都佩戴了某种类型的口罩,若佩戴了该种类型的口罩,近距离接触病人被感染的概率为,记,,三人中被感染的人数为,则的数学期望().【答案】B【解析】,,,,故.故选.【标注】【知识点】n 次独立重复试验与二项分布;离散型随机变量的数学期望(1)(2)17.在天猫进行大促期间,某店铺统计了当日所有消费者的消费金额(单位:元),如图所示:人数消费金额元将当日的消费金额超过元的消费者称为“消费达人”,现从所有“消费达人”中随机抽取人,求至少有位消费者,当日的消费金额超过元的概率.该店铺针对这些消费者举办消费返利活动,预设有如下两种方案:方案:按分层抽样从消费金额在不超过元,超过元且不超过元,元以上的消费者中总共抽取位“幸运之星”给予奖励金,每人分别为元、元和元.方案:每位会员均可参加线上翻牌游戏,每轮游戏规则如下:有张牌,背面都是相同的喜羊羊头像,正面有张笑脸、张哭脸,将张牌洗匀后背面朝上摆放,每次只能翻一张且每翻一次均重新洗牌,共翻三次.每翻到一次笑脸可得元奖励金.如果消费金额不超过元的消费者均可参加轮翻牌游戏;超过元且不超过元的消费者均可参加轮翻牌游戏;元以上的消费者均可参加轮翻牌游戏(每次、每轮翻牌的结果相互独立).以方案的奖励金的数学期望为依据,请你预测哪一种方案投资较少?并说明理由.【答案】(1)(2).方案投资较少;证明见解析.【解析】(1)记“在抽取的人中至少有位消费者消费超过元”为事件,由图可知,去年消费金额在内的有人,在内的有人,消费金额超过元的“消费达人”共有(人),从这人中抽取人,共有种不同方法,其中抽取的人中没有位消费者消费超过元,(2)共有种不同方法,所以.方案按分层抽样从消费金额在不超过元,超过元且不超过元,元以上的消费者中总共抽取位“幸运之星”,则“幸运之星”中的人数分别为:,,,按照方案奖励的总金额为:(元),方案设表示参加一轮翻牌游戏所获得的奖励金,则的可能取值为,,,,由题意,每翻牌次,翻到笑脸的概率为:,所以,,,,所以的分布列为:数学期望为:(元),按照方案奖励的总金额为:(元),因为由,所以施行方案投资较少.【标注】【知识点】组合;离散型随机变量的分布列;n次独立重复试验与二项分布;古典概型18.(1)(2)(3)年月,我国武汉地区爆发了新冠肺炎疫情,为了预防疫情蔓延,全国各地的学校都推迟年的春季线下开学,并采取了“停课不停学”的线上授课措施,某校为了解学生对线上课程的满意程度,随机抽取了学校中的名学生对线上课程进行评价打分,其得分情况的频率分布直方图如下:若根据频率分布直方图得到的评分不低于分的概率估计值为.频率组距评分求直方图中的,值,若评分的平均值不低于分视为满意,判断该校学生对线上课程是否满意?并说明理由.若采用分层抽样的方法,从评分在和内的学生中共抽取人,再从这人中随机抽取人检验他们的网课学习效果,求抽取到的人中至少一人评分在内的概率.若从该校学生中随机抽取人,记评分标准在的人数为,用频率估计概率,求随机变量的分布列与数学期望.【答案】(1)(2)(3)满意,证明见解析..的分布列为:.【解析】(1)(2)由已知得,解得,又,∴,评分的平均值为:,因此该校学生对线上课程满意.由题知评分在和内的频率分别为和,则抽取的人中,评分在内的为人,评分在的有人,记评分在的位学生为 , , ,(3)评分在内的位学生为,,则从人中任选人的所有可能结果为:,,,,,,,,,,共种,其中,评分在内的可能结果为,,,共种,∴这人中至少一人评分在的概率为.学生在分的频率为,用频率估计概率,则每个学生评分在分的概率为,据题意知,的可能取值为,,,,所以,,,,,那么的分布列为:则数学期望,或知.【标注】【知识点】离散型随机变量的分布列;n次独立重复试验与二项分布;离散型随机变量的数学期望;古典概型;用样本的数字特征估计总体的数字特征问题;众数、中位数、平均数;频率分布直方图;分层随机抽样19.改革开放年来,体育产业蓬勃发展反映了“健康中国”理念的普及.下图是我国年至年体育产业年增加值及年增速图.其中条形图为体育产业年增加值(单位:亿元),折线图为体育产业年增长率().(1)(2)(3)体育产业增加值体育产业年增长率从年至年随机选择年,求该年体育产业年增加值比前一年的体育产业年增加值多亿元以上的概率.从年至年随机选择年,设是选出的三年中体育产业年增长率超过的年数,求的分布列与数学期望.由图判断,从哪年开始连续三年的体育产业年增长率方差最大?从哪年开始连续三年的体育产业年增加值方差最大?(结论不要求证明)【答案】(1)(2)(3).分布列为:期望值.从年或年开始连续三年的体育产业年增长率方差最大.从年开始连续三年的体育产业增加值方差最大.【解析】(1)(2)设表示事件“从年至年随机选出年,该年体育产业年增加值比前一年的体育产业年增加值多亿元以上”.由题意可知,年,年,年,年满足要求,故.由题意可知,的所有可能取值为,,,,且;;;.(3)所以的分布列为:故的期望值.从年或年开始连续三年的体育产业年增长率方差最大.从年开始连续三年的体育产业增加值方差最大.【标注】【知识点】离散型随机变量的数学期望;离散型随机变量的分布列(1)(2)20.已知某同学每次投篮的命中率为,且每次投篮是否命中相互独立,该同学投篮次.求至少有次投篮命中的概率.设投篮命中的次数为,求的分布列和期望.【答案】(1)(2).的分布列为:.【解析】(1)(2)设次投篮至少有次投篮命中为事件,则,∴至少有次投篮命中的概率为.由题意知的可能取值为,,,,,,,,,,,,∴的分布列为:∵,∴.【标注】【知识点】离散型随机变量的分布列;n次独立重复试验与二项分布;离散型随机变量的数学期望5. 超几何分布A. B. C. D.21.某小组有名男生,名女生,从中任选名同学参加活动,若表示选出女生的人数,则().【答案】C【解析】名男生,名女生中任选名参加活动,则女生人数为人时,女生人数为人时,,∴,∴故答案选.【标注】【素养】数学运算;逻辑推理【知识点】超几何分布(1)(2)22.已知箱中装有个白球和个黑球,且规定:取出一个白球得分,取出一个黑球得分.现从该箱中任取(无放回,且每球取到的机会均等)个球,记随机变量为取出球所得分数之和.求的分布列;求的数学期望.【答案】(1)(2)分布列为.【解析】(1)(2)的可能取值有:45.,故所求的分布列为所求的数学期望为.【标注】【知识点】超几何分布,,,(1)(2)23.某学校组织一项益智游戏,要求参加该益智游戏的同学从道题目中随机抽取道回答,至少答对道可以晋级.已知甲同学能答对其中的道题.设甲同学答对题目的数量为,求的分布列及数学期望.求甲同学能晋级的概率.【答案】(1)(2)的分布列为数学期望..【解析】(1)(2)可取,,,,则,,,,的分布列为.甲同学能晋级的概率.【标注】【知识点】离散型随机变量的数学期望;离散型随机变量的分布列(1)(2)24.在某年级的联欢会上设计一根摸奖游戏,在一个口袋中装有个红球和个白球,这些球除颜色外完全相同,一次从中摸出个球,表示摸出红球的个数.求的分布列.(用数字作答)至少摸到个红球就中奖,求中奖的概率.(用数字作答)【答案】(1)(2).【解析】(1)(2)的取值为,,,,设摸出个红球的概率为,,,,.中奖的概率为.【标注】【知识点】超几何分布;离散型随机变量的数学期望;离散型随机变量的分布列25.年突如其来的新冠疫情,不仅是一场危机,更是一场考验,给人民的生命财产,身体健康和经济社会发展都带来了巨大的挑战.在党中央的坚强领导下,国内疫情防控取得了阶段性的成果.某企业在此期间积极应对疫情带来的影响,拓展线上经营业务,创造就业机会.该企业招聘员工,其中、、、、五种岗位的应聘人数、录用人数和录用比例(精确到)如下:岗位男性应聘人数男性录用人数男性录用比例女性应聘人数女性录用人数女性录用比例(1)(2)(3)总计从表中所有应聘人员中随机选择人,试估计此人被录用的概率.从应聘岗位的人中随机选择人.记为这人中被录用的人数,求的分布列和数学期望.表中、、、、各岗位的男性、女性录用比例都接近(二者之差的绝对值不大于),但男性的总录用比例却明显高于女性的总录用比例.研究发现,若只考虑其中某四种岗位,则男性、女性的总录用比例也接近,请写出这四种岗位.(只需写出结论)【答案】(1)(2)(3).的分布列为:.,,,【解析】(1)(2)(3)由表可得:应聘人员总数为:,被录用的人数为:,所以从表中所有应聘人员中随机选择人,此人被录用的概率为:.可能的取值为,,,∵岗位的人中,被录用的有人,未被录用的有人,∴,,,∴的分布列为:∴.取掉岗位,男性录用比例为:,女性录用比例为:,∴去掉岗位后,男女比例接近,∴这四种岗位是:,,,.【标注】【知识点】离散型随机变量的分布列;古典概型;分层随机抽样频率组距重量克(1)(2)(3)26.某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的件产品作为样本并称出它们的重量(单位:克),重量的分组区间为,,,,,由此得到样本的频率分布直方图,如图所示.求的值.在上述抽取的件产品中任取件,设为重量超过克的产品数量,求的分布列.用这件产品组成的样本中各组产品出现的频率估计概率,现在从流水线上任取件产品,求恰有件产品的重量超过克的概率.【答案】(1)(2)(3)..【解析】(1)(2)频率分布直方图中每个矩形面积之和为,可得,解得.件产品中任取件重量超过克的产品数量为:,的所有取值为,,;,(3),,从流水线上任取件产品,重量超过克的概率为,重量不超过克的概率为,恰有件产品的重量超过克的概率.【标注】【知识点】离散型随机变量的分布列;n 次独立重复试验与二项分布;频率分布直方图(1)(2)27.从名演员中选人参加表演.求甲在乙前表演的概率.若甲参加表演,门票收入会增长万元,若乙参加表演,门票收入会增长万元,若甲乙都参加演出,门票收入会增加万元,记门票增长为(万元),求的分布列和数学期望.【答案】(1)(2)..【解析】(1)(2)记“甲在乙前表演”为事件,∴,∴甲在乙前表演的概率是.可能取值有,,,,∴,,,,∴的分布列为:∴.【标注】【知识点】离散型随机变量的数学期望;古典概型(1)(2)(3)28.新生婴儿性别比是指在某段时间内新生儿中男婴人数与女婴人数的比值的倍.下表是通过抽样调查得到的某地区年到年的年新生婴儿性别比.年份新生婴儿性别比根据样本数据,估计从该地区年的新生儿中随机选取人为女婴的概率(精确到).从年到年这五年中,随机选取两年,用表示该地区的新生婴儿性别比高于的年数,求的分布列和数学期望.根据样本数据,你认为能否否定“生男孩和生女孩是等可能的”这个判断?并说明理由.【答案】(1)(2)(3).的分布列为的数学期望.可以否定,证明见解析;不能否定,证明见解析;无法判断,证明见解析.【解析】(1)(2)设“从该地区年的新生儿中随机选取人为女婴”为事件,则.的可能取值为,,,,,,所以的分布列为(3)所以的数学期望.答案一:可以否定;从样本数据看这五年的男婴在新生儿中的比例都高于,由样本估计总体,所以可以否定“生男孩和生女孩是等可能的”这个判断;答案二:不能否定;尽管从样本数据看这五年的男婴在新生儿中的比例都高于,但由于抽样调查本身存在一定的随机性,且从数据上看,男女婴在新生儿中的比例都近似于,所以不能否定“生男孩和生女孩是等可能的”这个判断;答案三:无法判断;由于样本容量未知,如果样本容量较小,那么通过样本数据不能“否定生男孩和生女孩是等可能的”这个判断,如果样本容量足够大,那么根据样本数据,可以否定“生男孩和生女孩是等可能的”这个判断.【标注】【知识点】古典概型;离散型随机变量的数学期望;超几何分布;离散型随机变量的分布列(1)(2)(3)29.年月份,我国湖北武汉出现了新型冠状病毒,人感染后会出现发热、咳嗽、气促和呼吸困难等,严重的可导致肺炎甚至危及生命.为了增强居民防护意识,增加居民防护知识,某居委会利用网络举办社区线上预防新冠肺炎知识答题比赛,所有居民都参与了防护知识网上答卷,最终甲、乙两人得分最高进入决赛,该社区设计了一个决赛方案:①甲、乙两人各自从个问题中随机抽个.已知这个问题中,甲能正确回答其中的个,而乙能正确回答每个问题的概率均为,甲、乙两人对每个问题的回答相互独立、互不影响;②答对题目个数多的人获胜,若两人答对题目个数相同,则由乙再从剩下的道题中选一道作答,答对则判乙胜,答错则判甲胜.求甲、乙两人共答对个问题的概率.试判断甲、乙谁更有可能获胜?并说明理由.求乙答对题目数的分布列和期望.【答案】(1)(2)(3).乙胜出的可能性更大,证明见解析.分布列为:期望.【解析】(1)(2)(3)推出两人共答题,甲答对个,乙答对个,两人共答题,甲答对个,乙答对个.然后求解甲、乙两名学生共答对个问题的概率.甲、乙共答对个问题分别为:两人共答题,甲答对个,乙答对个,两人共答题,甲答对个,乙答对个,所以甲、乙两名学生共答对个问题的概率﹔.故答案为:.设甲获胜为事件,则事件包含“两人共答题甲获胜”和“两人共答题甲获胜”两类情况,其中第一类包括甲乙答对题个数比为,,,,,六种情况,第二类包括前三题甲乙答对题个数比为,,三种情况,然后求解概率;设乙获胜为事件,则,为对立事件,求出的概率,得到结论.设甲获胜为事件,则事件包含“两人共答题甲获胜”和“两人共答题甲获胜”两类情况,其中第一类包括甲乙答对题个数比为,,,,,六种情况,第二类包括前三题甲乙答对题个数比为,,三种情况,所以甲胜的概率,设乙获胜为事件,则,为对立事件,所以,,所以乙胜出的可能性更大.设学生乙答对的题数为,则的所有可能取值为,,,,,求出概率,得到随机变量的分布列,然后求解期望.设学生乙答对的题数为,则的所有可能取值为,,,,,,,,,,所以随机变量的分布列为:所以期望.【标注】【知识点】离散型随机变量的分布列;离散型随机变量的数学期望;古典概型的概率计算(涉及计数原理)6. 正态分布A. B. C. D.30.已知随机变量,若,,则=().【答案】D【解析】根据题意,,∵随机变量,∴,故选:.【标注】【知识点】正态分布31.已知随机变量服从正态分布,若,则.【答案】【解析】因为,所以.【标注】【知识点】正态分布A.B.C.D.32.下列有关说法正确的是( ).的展开式中含项的二项式系数为的展开式中含项的系数为已知随机变量 服从正态分布,,则已知随机变量 服从正态分布,,则【答案】ACD【解析】、选项:对于二项式的展开式中项为,∴系数为,二次项系数为,故正确,错误;、选项:对于随机变量服从正态分布,∵,∴,∴,又∵对于随机变量服从正态分布且正态分布为∴,故正确、正确.故选.【标注】【知识点】求二项式展开式的特定项;求项的系数或二项式系数;正态分布33.在某市年月份的高三质量检测考试中,所有学生的数学成绩服从正态分布,现任取一名学生,则他的数学成绩在区间内的概率为 .(附:若,则,.)【答案】【解析】∵学生的数学成绩服从正态分布,∴,.故答案为.【标注】【知识点】正态分布A.B.C.D.34.在一次数学测验中,学生的成绩服从正态分布,其中分为及格线,分为优秀线.下面说法正确的是( ).附:;;.学生数学成绩的期望为学生数学成绩的标准差为学生数学成绩及格率超过学生数学成绩不及格的人数和优秀的人数大致相等【答案】AC 【解析】,,∴,显然正确,错误;.,故正确;.,故错误.故选.【标注】【知识点】正态分布35.已知随机变量,,其正态分布的密度曲线如图所示,则下列说法错误的是( ).A.B.C.D.的取值比的取值更集中于平均值左右两支密度曲线与轴之间的面积均为【答案】B【解析】A 选项:B 选项:C 选项:D 选项:因为,,故正确;由图可知,故错误;因为正态分布曲线越瘦高,数据越集中,故正确;根据正态分布曲线的性质可知,故正确.故选 B .【标注】【知识点】正态分布(1)(2)(3)36.某市需对某环城快速道路进行限速,为了调查该道路的车速情况,于某个时段随机对辆车的速度进行取样,根据测量的车速制成下表:车速频数经计算,样本的平均值,标准差,以频率作为概率的估计值.已知车速过慢与过快都被认为是需矫正速度,现规定车速小于或车速大于需矫正速度.从该快速车道上的所有车辆中任取辆,求该车辆需矫正速度的概率.从样本中任取辆车,求这辆车均需矫正速度的概率.从该快速车道上的所有车辆中任取辆,记其中需矫正速度的车辆数为.求的分布列和数学期望.【答案】(1).(2)(3).分布列:,.【解析】(1)(2)(3),,∴小于有辆,大于有辆,∴所求概率..,,,∴,,,∴分布列:,∴.【标注】【知识点】正态分布;离散型随机变量的数学期望;古典概型(1)1(2)37.为了解某市高三数学复习备考情况,该市教研机构组织了一次检测考试,并随机抽取了部分高三理科学生数学成绩绘制如图所示的频率分布直方图:分数频率组距根据频率分布直方图,估计该市此次检测理科数学的平均成绩.精确到个位)研究发现,本次检测的理科数学成绩近似服从正态分布(,约为),按以往的统计数据,理科数学成绩能达到自主招生分数要求的同学约占.2估计本次检测成绩达到自主招生分数要求的理科数学成绩大约是多少分?(精确到个位)从该市高三理科学生中随机抽取人,记理科数学成绩能达到自主招生分数要求的人数为,求的分布列及数学期望.(说明:表示的概率.参考数据(,)【答案】(1)12(2)..分布列为:∴.【解析】(1)12(2).设本次检测成绩达到自主招生分数要求的理科数学成绩为,则,∴,∴,解得.由题意可知,∴,,,,,,∴的分布列为:∴.【标注】【知识点】n 次独立重复试验与二项分布;离散型随机变量的数学期望38.《山东省高考改革试点方案》规定:从年秋季高中入学的新生开始,不分文理科;年高考总成绩由语数外三门统考科目和物理,化学等六门选考科目组成,将每门选考科目的考生原始成绩从高到低划分为、,,,、、、共个等级,参照正态分布原则,确定各等级人。
高二数学--概率与统计-(1)
高二数学 概率与统计考试要求1.统计(1)随机抽样① 理解随机抽样的必要性和重要性.② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. (2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.② 理解样本数据标准差的意义和作用,会计算数据标准差. ③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. ④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. (3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. ② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 不要求记忆线性回归方程系数公式()()()1122211,nniiiii i nniii i x ynx y xxyyb a y bxxnxxx-------===---∑∑∑∑用最小二乘法求线性回归方程系数公式:7.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.② 了解两个互斥事件的概率加法公式. (2)古典概型①理解古典概型及其概率计算公式.②会计算一些随机事件所含的基本事件数及事件发生的概率. (3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率. ②了解几何概型的意义.1.课本概念与定理详解(1)随机抽样①简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体数较少. ②系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.③分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.(2)众数、中位数、平均数①众数:在样本数据中,出现次数最多的那个数据.②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.在直方图中取频率为0.5处的频数。
概率论与数理统计基础知识
进行统计分析,通常是从母体中随机地选择一部分样品,称为子样(又称样本)。用它来代 表母体进行观察、研究、检验、分析,取得数据后加以整理,得出结论
例如,我们可将一个编号水泥看成是母体,每一包水泥看成是个体,通过随机取样(连续取 样或从20个以上不同部位取样),所取出的12kg检验样品可称为子样,通过检验分析,即可 判断该编号水泥(母体)的质量状况。
实例2 随机变量 X 为“测量某零件尺寸时的测量 误差”.
则 X 的取值范围为 (a, b) .
定义
设 E 是随机试验, 它的样本空间是 S {e}. 如 果对于每一个 e S , 有一个实数 X (e) 与之对应, 这样就得到一个定义在 S 上的单值实值函数 X (e), 称 X (e) 为随机变量.
如果事件A发生必然导致事件B发生,即A的每个样本点都是B的样本点,则称 B包含A,记作 A B .从事件的集合表示看,事件B包含事件A就是样本空间的 子集B包含子集A 等对,任记何为事A件=AB,,总即有,AA与 B含有如相果同A 的 B样本,点同时B A ,则称事件A和事件B相
事件的互斥
如果事件A和B不可能同时发生,即A与B没有公共样本点,则称A与B是互斥 的(Mutually Exclusive)或互不相容的,换句话说,两个事件A与B互斥就是 样本空间两个子集A与B不相交
四、数据统计特征数
算术平均值 我们从总体抽了一个样本(子样),得到一批数据X1、X2、X3……Xn在处理这批数据时,经常
用算术平均值X来代表这个总体的平均水平。统计中称这个算术平均值为“样平均值”。 中位数 把数据按大小顺序排列,排在正中间的一个数即为中位数。当数据的个数n为奇数时,中位数就
统计学
名解01.医学统计学:运用概率论和数理统计等数学的原理、方法,研究医学资料的搜集、整理、分析和推断的一门学科。
02.总体(population):根据研究目的所确定的同质研究对象某项观察指标的全体。
03.样本(sample):根据随机化的原则从总体中抽出具有代表性的一部分观察单位。
04.参数(parameter):总体的统计指标。
05.统计量(statistic):样本的统计指标。
06.频率(f)(frequence):f=m/n=A发生的试验数/试验的总次数07.概率(P):描述随机事件发生可能性大小的数值。
08.小概率事件:P≤0.05或P≤0.01的随机事件,称作小概率事件。
09.定量资料:以定量值表达每个观察单位的某项观察指标。
10.定性资料:以定性方式表达每个观察单位的某项观察指标。
11.等级资料:以等级方式表达每个观察单位的某项观察指标。
12.变异:是指某项观察指标在其同质性观察单位之间显示的差别。
13.正偏态:指分布尾部偏向数轴正侧,又称右偏态,反之为负偏态。
14.中位数M:是指将全部观察值从小到大排列,位置居中的观察值水平。
15.百分位数Px:将全部观察值从小到大排列,将样本例数一百等分,其x等分处的变量值即第x百分位数记为Px。
16.全距R:是一组变量值中最大值与最小值之差。
17.四分位数间距:四分位数是两个特定的百分位数,第25%分位数P25,和第75% 分位数P75,分别记为Ql与Qu, 四分位数间距定义为Ql-Qu,其间包括了全部观察值的一半。
18.变异系数CV:是标准差与均数之比,其同时排除了平均水平和量纲的影响。
19.标准化目的:采用统一的标准,以消除某方面的构成不同对总率比较的影响,使标准化的数据具有可比性。
20.参考值:正常人的各种生理、生化数据,组织或排泄物中各种成分的含量。
21.参考值范围(reference interval):绝大多数正常人的测定值应该所在的范围。
统计学(第四版)期末复习资料
第一章统计和统计数据名词解释1.统计学:收集处理分析解释数据并从数据中得出结论的科学。
2.描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。
3.推断统计:研究如何利用样本数据来推断总体特征的统计方法。
4.分类数据:只能归于某一类别的非数字型数据。
5.顺序数据:只能归于某一有序类别的非数字型数据。
6.数值型数据:按数字尺度测量的观察值。
7.总体:包含所研究的全部个体(数据)的集合。
8.样本:从总体中抽取的一部分元素的集合。
9.参数:用来描述总体特征的概括性数字度量。
10.变量:说明现象某种特征的概念。
11.分类变量:说明事物类别的一个名称。
12.顺序变量:说明事物有序类别的一个名称。
13.数值型变量:说明事物数字特征的一个名称。
14.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
15.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
16.简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。
17.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。
18.整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
19.系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则确定其它样本单位。
20. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差简答题。
1.概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。
操作简便,时效快,成本低,专业要求不很高。
概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。
提出精度要求。
2.数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求3.误差的控制:抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。
普通高中数学课程标准(2017年版)概率与统计 几何与代数内容的比较
概率与统计内容的比较一、概率与统计内容体系编排比较我们可以从纵向和横向两个角度对《修订》与《大纲》中"概率与统计"内容结构的设置做个比较:纵向比较:①《修订》必修课程中"概率与统计"相关内容主要有统计(数据与基本概念、抽样、统计图表、用样本估计总体)、概率(随机事件与概率、随机事件的独立性)組成。
选修课程由限定选修课程和任意选修课程组成。
其中限定选修课程有计数原理、概率(随机事件的条件概率、离散型随机变量及其分布列、正态分布)、统计(成对数据间的相关性、一元线性回归模型)。
其中任意选修课程由A课程统计与概率(连续型隨机变量及其分布、二维随机变量及其联合分布、参数估计、假设检验、二元线性回归模型)、B课程应用统计(连续型随机变量及其分布、二维随机变量及其联合分布、参数估计、假设检验、聚类分析、正交设计)、C课程社会调查与数据分析(社会调查概论、社会调查方案设计、抽样设计、社会调查数据分析、社会调查数据报告、社会调査案例选讲)组成。
②《实验》必修课程中概率与统计相关内容主要由必修课程组成和选修课程组成。
其中必修课程有数学3统计(随机抽样、用样本估计总体、变量的相关性)、概率(随机事件与概率、古典概型及概率计算公式、几何概型)。
选修课程由限定选修课程和任意选修课程组成。
其中限定选修课程有选修1-2统计案例(14课时)和选修2-3计数原理(基本计数原理、排列与姐合、二项式证明)、概率(离散型随机变量、二项分布、直方图)、统计案例组成。
任意选修课程主要有风险与决策、优选法与试验设计初步组成。
经过比较可知,《实验》与《修订》在"概率与统计"必修课程内容中均含有统计和概率相关内容,而选修课程中概率内容只有《修订》和《实验》理科选修课程中才有。
此次《修订》取消文理分科后,文理科在必修课程和选修课程均要学习概率等相关内容,说明概率内容得到了进一步的重视。
同时,《修订》在任意选修课程新増加了统计与概率的相关选修课程。
概率与统计1
返回
解析:只有命题①正确.看似分层抽样,实际上哪种方 法都可能出现这个结果. 答案:B
返回
[例2]
(2012· 豫南九校)下图甲是某市有关部门根据对当
答案:B
返回
1 9.某人抛掷一枚硬币,出现正反面的概率都是2,构造数列 {an},使得
1当第n次出现正面时, an= -1当第n次出现反面时,
记 Sn=a1+
a2+a3+„+an(n∈N*). (1)若抛掷 4 次,求 S4=2 的概率; (2)已知抛掷 6 次的基本事件总数是 N=64,求前两次均 出现正面且 2≤S6≤4 的概率 .
返回
(2)6 次中前两次均出现正面,且要使 2≤S6≤4,则后 4 次 中有 2 次正面,2 次反面或 3 次正面 1 次反面,设其概率为 P2,N=64,由(1),知前两次均出现正面且 2≤S6≤4 的情 10 5 况有 10 种,所以 P2=64=32.
返回
[例5] (2012· 洛阳模拟)某学校共有高一、高二、高三学 生2 000名,各年级男、女人数如下图:
个点Q,则点Q取自正方形ABCD内部的概率等于
________.
返回
2 解析:设正方形的边长为 1,则圆的半径为 2 , 1 ∴正方形的面积为 1,圆的面积为2π. 1 2 ∴点 Q 取自正方形 ABCD 内部的概率等于1 =π. 2π 2 答案:π
返回
x2 y 2 8. m- n =1(其中 m, 从 n∈{-1,2,3})所表示的圆锥曲线(椭 圆、双曲线、抛物线)方程中任取一个,则此方程是焦点 在 x 轴上的双曲线方程的概率为 1 A.2 2 C.3 4 B.7 3 D.4 ( )
高中二年级数学概率与统计初步
高中二年级数学概率与统计初步概率与统计是高中数学中的一门重要课程,它涵盖了概率和统计两个方面。
概率是用来描述事件发生的可能性,而统计则是通过对数据进行收集、分析和解释,来给出结论。
本文将从概率和统计两个角度来介绍高中二年级数学中的初步内容。
一、概率1.1 概率的基本概念概率是描述随机事件发生可能性的数值。
在实际生活中,我们经常会遇到概率的问题,比如投掷一枚硬币正面朝上的概率是多少,抽一张扑克牌时抽到黑桃的概率是多少等等。
1.2 事件与样本空间在概率问题中,事件是指某个具体结果的集合,样本空间是指所有可能结果的集合。
例如,投掷一枚硬币,事件可以是正面朝上,样本空间可以是{正面,反面}。
1.3 概率的计算方法在概率的计算中,有两种主要的方法:频率法和古典概型法。
频率法是通过做大量的实验来计算概率,古典概型法是通过确定每个结果出现的可能性来计算概率。
二、统计2.1 数据的收集与整理统计的第一步是收集数据,并对数据进行整理和分类。
我们可以使用表格、图表等形式来展示数据,以便更好地进行分析。
2.2 数据的描述性统计描述性统计是用来对收集到的数据进行概括和描述的方法。
常用的描述性统计方法包括平均数、中位数、众数、标准差等。
2.3 样本与总体在统计学中,我们通常会采集一部分数据作为样本,用来对整个总体进行推断。
样本的选择要具有代表性,以确保结果的可靠性。
2.4 统计推断统计推断是通过对样本数据进行分析,来推断总体的特征和性质。
常用的统计推断方法包括假设检验、置信区间等。
结论概率与统计是高中数学中的一门重要课程,它们在实际生活和各个领域中都有广泛的应用。
通过学习概率与统计,学生可以培养逻辑思维能力,提高数据分析和决策能力,为将来的学习和工作打下坚实的基础。
希望本文对读者对高中二年级数学概率与统计初步有所帮助。
山东高中数学高一教学大纲(精选)
山东高中数学高一教学大纲(精选)山东高中数学高一教学大纲抱歉,我无法找到关于山东高中数学高一教学大纲的具体内容,但是我可以提供一些关于高中数学必修一的教学内容。
高中数学必修一的主要内容是人教A版数学必修第一册的内容,主要包括八个主题:集合与函数、数列、三角函数、不等式、空间几何体、点、直线、平面之间的位置关系、概率与统计和算法初步等。
具体来说,集合与函数包括集合的含义、符号和表示方法、集合的分类、集合间的基本关系、集合的化简等;数列包括数列的分类、数列的表示法、数列的函数特性、数列的通项公式等;三角函数包括角的概念的推广、终边相同的角的表示、弧度制等;不等式包括不等式的性质、不等式的解法、含有绝对值不等式的解法等;空间几何体包括空间几何体的结构、空间几何体的三视图和直观图、空间几何体的表面积和体积等;点、直线、平面之间的位置关系包括点、直线、平面的基本位置关系、直线与直线、直线与平面、平面与平面的位置关系等;概率与统计包括计数原理、排列组合、随机事件的概率、二项分布等;算法初步包括算法的含义、基本逻辑结构等。
需要注意的是,不同版本教材的教学内容可能存在差异,请以实际教材内容为准。
数学高中教学大纲高中数学课程分为必修课程和选修课程。
必修课程为____5学分____,选修课程包括四类课程,共计____14学分____。
必修课程为:1.必修课程分为4个模块,每个模块2学分,共计8学分。
2.必修课程包括:-集合与函数-三角函数-数列与数学归纳法-圆锥曲线、直线和圆的方程-空间向量与立体几何-概率与统计-导数及其应用-算法初步选修课程包括:1.选修课程分为4个系列,每个系列2学分,共计8学分。
2.选修课程包括:-系列1:几何证明选讲、数列与差分、不等式选讲、概率与统计的进一步研究、数系的扩展、向量代数与空间解析几何、参数方程、极坐标系、柱坐标系、数学实验等。
-系列2:数学史选讲、数学中思想方法选讲、微积分初步、离散数学初步、复数及其应用、数学建模、数学探究、数学文化等。
高中数学知识点第十二章-概率与统计
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布. ②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm=,则k 的范围可以写为k=0,1,…,n.〕 ⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系. 设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n =+-+=+==--,即η~)(b a a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样.二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为n n 2211.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p +q = 1)⑷二项分布:∑=⋅-⋅=-np q pk n k n k E k n k)!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =(如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).S 阴=0.5S a =0.5+S。
概率论与数理统计复习资料(改)
一、 基础理论1. 在个别试验中呈现出不确定性 ,而在大量重复试验或观察中又具有 统计规律性 的现象,称为随机现象 。
2. 随机现象的每一种结果称为随机事件 ,它的取值称为随机变量 。
3. 根据试验或观测得到的有限信息,对整体做出一定概率的推断,称为统计推断。
4. 在数理统计中常把研究对象的全体称为 总体 。
5. 从母体中抽取若干数量个体来观测母体某种数量指标的取样过程称为 抽样 。
6. 精密度 一在相同条件下,几次测定结果彼此相符合的程度,即平行测定结果相互接近程度。
7. 抽样调查是按照 随机原则 ,从总体中抽取部分单位进行观察用以推算总体数量特征的一种统计调查方式。
8. 集中趋势 是指一组数据向其中心值靠扰的倾向。
9. 总体方差是各个数据与其算术平均数 的高差平方的平均数,通常以σ2表示。
10. 按随机变量取值的特点不同,通常把随机变量分为两类,即离散型随机变量 和连续型随机变量 。
11. 设样本X1,X2,……Xn 来自N(m ,1.69),则对检验H0:m =35,采用的检验量是12. 客观现象之间的数量联系可以归纳为两种不同的类型,一种是 函数关系 ,另一种是 相关关系 。
13. 按变量之间关系的 密切程度 不同,可分为完全相关、不完全相关和不相关。
14. 相关分析 是研究一个变量一个变量与另一个变量式另一组变量之间相关方向和相关密切程度的统计分析方法。
15. 回归分析 是指根据相关关系的具体形态,选择一个适合的数学模型来近似地表达变量间平均变化关系的统计分析方法。
16. 最小二乘法 就是寻找参数β0和β1的估计值β-0和β-1。
使因变量实际值与估计值的残差平方和达到最小。
17. 略18. 略19. 根据抽取样本的方法不同,有 重复抽样 和 不重复抽样 两种具体抽样方法。
20. 以样本指标去估计总体指标有 点估计 和 区间估计 两种方法。
21. 点估计就是用样本指标去直接估计总体指标,它没有考虑抽样误差 ;而区间估计就是根据样本指标和抽样误差去推断总体指标的 可能范围 ,并能够说明估计的 可靠性 ,所以 区间估计 是样本指标推断总体指标的主要方法。
新课标对概率统计的要求
新课标对概率统计的要求
《普通高中数学课程标准(2017 年版 2020 年修订)》对概率统计的要求主要包括以下几个方面:
1. 在必修课程中,学生将在义务教育阶段学习统计与概率的基础上,通过实际问题情境,学习随机事件与概率、古典概型、随机抽样、用样本估计总体、变量间的相关关系等内容,了解概率的基本性质,理解古典概型,初步了解随机事件的概率模型,理解用样本估计总体的思想,理解变量间的相关关系。
2. 在选择性必修课程中,学生将通过具体实例,学习离散型随机变量及其分布列、二项分布及其应用、离散型随机变量的均值与方差、正态分布、成对数据的统计分析等内容,了解离散型随机变量的概念,理解离散型随机变量及其分布列、二项分布及其应用、离散型随机变量的均值与方差、正态分布的概念和性质,会用正态分布解决一些简单的实际问题,理解独立性检验的基本思想,会用独立性检验分析两个分类变量是否有关,了解回归分析的基本思想、方法及其简单应用。
3. 学生能通过对概率统计内容的学习,了解随机现象,掌握概率统计的基本知识和基本技能,体会概率统计思想,感受其在实际生活中的广泛应用,提高运用概率统计知识和方法解决实际问题的能力。
4. 教师在教学中要引导学生结合具体实例,理解概率统计的概念和方法,避免单纯的形式化训练;要引导学生经历数据收集、整理、分析和推断的过程,提高数据分析和处理能力;要鼓励学生运用概率统计知识和方法解决实际问题,体会概率统计的应用价值。
总之,新课标对概率统计的要求注重培养学生的数学素养和解决实际问题的能力,强调概率统计在现实生活中的应用。
高三数学第十二章-概率与统计知识点归纳
高中数学知识点第十二章-概率与统计考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样.(2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果. 它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为:ΛΛ,,,,21i x x xξ取每一个值),2,1(1Λ=i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的分布列.有性质①Λ,2,1,01=≥i p ; ②121=++++ΛΛi p p p .注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0Λ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B (n ·p ),其中n ,p 为参数,并记p)n b(k;qp C kn kkn⋅=-.⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布.②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列.4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A AP(k)P(ξk 1k 21-==Λ.根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-==Λ),3,2,1(1Λ==-k p q k 于是得到随机变量ξ的概率分布列.我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中Λ3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0C C C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C r m =,则k 的范围可以写为k=0,1,…,n.〕⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a Λ=⋅==+-.⑶超几何分布与二项分布的关系.设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n ,0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n Λ=+-+=+==--,即η~)(b a a n B +⋅.[我们先为k个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样. 二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为则称ΛΛ++++=n n p x p x p x E 2211ξ为ξ的数学期望或平均数、均值.数学期望又简称期望.数学期望反映了离散型随机变量取值的平均水平. 2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身. ②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p + q = 1) ⑷二项分布:∑=⋅-⋅=-np q p k n k n k E k n k )!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率)3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()(Λ===k p x P k k ξ时,则称ΛΛ+-++-+-=n n p E x pE x p E x D 2222121)()()(ξξξξ为ξ的方差.显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:=ξD 其分布列为p P ==)1(ξ⑶两点分布:pq D =ξ 其分布列为:(+ q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)( ⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =所围成的曲边梯形的面积图像的函数)(x f 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f . (σμ,,R x ∈为常数,且0φσ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E .⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近. ⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-ππx ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤π.注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)(φx Φ.比如5.00793.0)5.0(π=-Φσμ则σμ-5.0S 阴=0.5S a =0.5+S如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).。
概率论与数理统计-第五章
【数理统计简史】
1. 近代统计学时期
18 世纪末到 19 世纪,是近代统计学时期.这一 时期的重大成就是大数定律和概率论被引入统计 学.之后最小二乘法、误差理论和正态分布理论 等相继成为统计学的重要内容.这一时期有两大 学派:数理统计学派和社会统计学派.
【数理统计简史】 数理统计学派始于19世纪中叶,代表人物是比 利时的凯特莱( A.Quetelet , 1796-1874 ),著有 《概率论书简》《社会物理学》等,他主张用研 究自然科学的方法研究社会现象,正式把概率论 引入统计学,并最先用大数定律证明了社会生活 中随机现象的规律性,提出了误差理论.凯特莱 的贡献,使统计学的发展进入个了一个新的阶 段.
i =1 36
1 2 2 3 2 2 2 2 D( X ) = E ( X ) − E ( X ) = ( 0 + 1 + 2 + 3 ) − 4 2 5 = 4
2
二、样本与抽样 由于X1,X2,...,X36均与总体X同分布,且相互独 立,所以,Y的均值和方差分别为
E (Y ) = E ( ∑ X i ) = 36 E ( X ) = 54,
【数理统计简史】 18世纪到 19世纪初期,高斯从描述天文观测的 误差而引进正态分布,并使用最小二乘法作为估 计方法,是近代数理统计学发展初期的重大事件, 对社会发展有很大的影响.
【数理统计简史】 用正态分布描述观测数据的应用是如此普遍,以 至 在 19 世 纪 相 当 长 的 时 期 内 , 包 括 高 尔 顿 ( Galton )在内的一些学者,认为这个分布可用 于描述几乎是一切常见的数据.直到现在,有关 正态分布的统计方法,仍占据着常用统计方法中 很重要的一部分.最小二乘法方面的工作,在 20 世纪初以来,经过一些学者的发展,如今成了数 理统计学中的主要方法.
2013届高考数学考点回归总复习《第十模块 概率与统计 随机抽样 用样本估计 总体 变量间的相互关》课件
1 [( x1 x ) 2 ( x2 x ) 2 ( xn x ) 2 ], 其中s 2 表示样本 n 方差, s表示样本标准差.
5.两个变量的相关关系
(1)当自变量的取值一定时,因变量的取值带有随机性,这两个
变量乊间的关系叫做相关关系.
如果一个变量的值由小变大时,另一个变量的值也在由小到大 ,这种相关称为正相关;反乊,如果一个变量的值由小变大时, 另一个变量的值在由大到小,这种关系称为负相关.变量间 的这种关系不函数关系丌同,它是一种非确定关系.
×n=7,n=15,选B.
2.(2010·湖北)将参加夏令营的600名学生编号为
:001,002,…,600.采用系统抽样方法抽取一个容量为50的样
本,且随机抽得的号码为003.这600名学生分住在三个营区,
从001到300的第Ⅰ营区,从301到495在第Ⅱ营区,从496到 600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A.26,16,8 C.25,16,9 B.25,17,8 D.24,17,9
第三种方式抽样的步骤如下:第一步,分层.因为若按成绩分,其
中优秀生共150人,良好生共600人,普通生共250人,所以在
抽取样本时,应该把全体学生分成三个层次;第二步,确定各
150 600 250 , , , 10 10 10
个层次抽取的人数.因为样本容量不总体的个数乊比为 100:1000=1:10,所以在每个层次中抽取的个体数依次为 即15,60,25;第三步,按层次分别抽取.在优秀生中 用简单随机抽样法抽15人;在良好生中用简单随机抽样法 抽取60人;在普通生中用简单随机抽样法抽取25人.
法,若有某些层面应抽取的个体数目丌是整数时,可作适当
的绅微调整.
《概率与统计》的认识及教学建议
对新教材第三册(选修)第一章《概率与统计》的认识及教学建议一、增加本章内容的背景与作用在全日制普通高级中学《教学大纲》中,增加概率与统计的初步知识是高中数学教学内容改革的重要组成部分。
《高中数学课程标准》的框架设想中指出,中学的概率与统计的教学,是中国数学教学的弱点,现在正在大力弥补。
由于概率、总体、样本等的概念很复杂,对高中学生来说难以严格地说清楚,所以新教材中采用描述方法来说明。
由于概率统计知识与日常生活、自然知识、社会生产实践的联系紧密,而日常生活中许多事件的发生往往是随机发生的,这与中学数学中长期占统治地位的确定性数学研究的对象有很大的不同,但它在数学众多分支中别具一格,与众不同。
教材中按排概率与统计的教学内容主要是培养学生的随机观念,弄清随机变量的取值规律是用概率和分布刻划的,会用随机观点处理随机现象,知道统计结果是概率地呈现的,可以有误差。
这样可使学生感觉到确定性和随机性数学思维方法的本质区别。
高中概率与统计内容教学的线索应该是:提出问题、收集资料、整理资料、解释资料、研究资料特征,做出统计判断,要使学生经历这样的全过程。
数据处理需要学生参与。
数据处理和概率的教学,主要依靠编制事例,提出课题,进行实际问题的处理。
在本章的第二部分“统计”中,教材选择了数理统计中最基本的问题来介绍这门学科的思想和方法。
第一个问题,就是采集样本。
有样本才能作统计推断。
抽样方法就是介绍怎样科学、合理公正地采集样本,教材介绍了简单随机抽样是最基本的抽样方法。
第二个问题,就是从样本中分布估计总体的分布。
教材首先介绍了总体分布的意义,并且实际例子介绍了用样本的频率分布估计总体分布。
第三个问题,就是假设检验。
教材利用线性回归的内容,介绍了相关系数的假设检验,通过具体的操作方法,介绍了假设检验的基本思想。
首先作出一个统计假设,在此假设下某些随机事件是否发生,从此来判断事先所作的统计假设:拒绝这个假设,还是接受这个假设。
医学统计学名词解释
1.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示3.同质:是指事物的性质、影响条件或背景相同或相近。
4.变异:是指同质的个体之间的差异5.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
6.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
7.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
8.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
9.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
10.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
11.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
12.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.用样本的数字特征估计总体的数字特征 (1)众数,中位数,平均数 在一组数据中,出现次数最多的数据叫做这组数据的众数. 将一组数据按大小依次排列,把处在中间位置的一个数据(或
中间两个数据的平均数)叫做这组数据的中位数.
如果n个数,x1,x2,…,xn,那么 的平均数.
x (x1n1+x2+…+xn)叫做这n个数
(2)系统抽样:系统抽样被称为等距抽样或机械抽样.它按照时 间或空间的等距间隔抽取样本,即将总体分成几个部分,然 后按照预先定出的规则,从每一部分抽取一个个体,得到所 需要的样本,这种抽样称为系统抽样.系统抽样与简单随机 抽样的联系在于:将总体均分后的每一部分进行抽样时,采 用的是简单随机抽样.
(3)分层抽样:当总体中一部分个体与另一部分个体有明显的 差异且易于区别时,常将相近的个体归成一组,然后按照各 部分所占的比例进行抽样,这种抽样称为分层抽样.其中所 分成的各部分称为层.分层抽样时,每一个个体被抽到的概 率都是相等的.
4
的人数是25;令300<3+12(k-1)≤495得 <k≤42,因此第Ⅱ营区被 抽中的人数是42-25=17.结合各选项知,选B.
答案:B
3.(2010·山东)在某项体育比赛中,七位裁判为一选手打出的 分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分 别为( )
③把学生按成绩分成优秀、良好、普通三个级别,从其中共抽 取100名学生进行考察(已知该校高三学生共1000人,若按成 绩分,其中优秀生共150人,良好生共600人,普通生共250人). 根据上面的叙述,试回答下列问题:(1)上面三种抽取方式的 总体、个体、样本分别是什么?每一种抽取方式抽取的样 本中,样本容量分别是多少?(2)上面三种抽取方式各自采用 的是何种抽取样本的方法?(3)试分别写出上面三种抽取方 式各自抽取样本的步骤.
解题准备:1.简单随机抽样:抽签法:搅拌均匀后逐一抽取.
随机数表法:注意编号的灵活性,如对100个个体可用 00,01,01,02,…,99来编号.
2.系统抽样:对多余个体的剔除不影响总体中每个个体被抽到 的等可能性,仍然能保证抽样的2公0 平性1.0例. 如从1002个体中
1002 501
利用系统抽样抽取容量为20的样本,剔除2个个体后,每个个 体被抽到的可能性仍为
第十模块 概率与统计 第四十八讲 随机抽样、用样本估计 总体、变量间的相互关系、统计案例
回归课本
1.样本及抽样的定义
(1)在数理统计中称研究对象的全体为总体,组成总体的每一个 基本单元为个体,从总体中抽取若干个个体x1,x2,…,xn,这样 的n个个体x1,x2,…,xn称为大小为n(容量为n)的一个样本.
,这种相关称为正相关;反之,如果一个变量的值由小变大时, 另一个变量的值在由大到小,这种关系称为负相关.变量间 的这种关系与函数关系不同,它是一种非确定关系.
(2)散点图:表示具有相关关系的两个变量的一组数据的图形 叫做散点图.
6.回归直线方程
(1)一般地,设x和y是具有相关关系的两个变量,且对应于n个观 测值的n个yˆ 点 a大致b分x,布则在一条直线的附近,若所求的直线方 程为
3.频率分布表、频率分布直方图与茎叶图 (1)频率分布 样本中所有数据(或者数据组)的频数和样本容量的比,就是该
数据的频率.所有数据(或者数据组)的频率的分布变化规律 叫做频率分布,可以用频率分布表、频率分布直方图、频率分 布折线图、茎叶图等来表示. (2)频率分布折线图:连接频率分布直方图中各小长方形上端 的中点,就得到频率分布折线图.
我们将这个方程叫做回归直线方程,a,b叫做回归系数,相应的 直线叫做回归直线.
(2)最小二乘法 使离差平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2为最小的
方法,叫做最小二乘法.
7.回归分析
y
(1)回归直线方程 =bx+a中,
n
xi yi n xy
b
(2)抽样:抽样是为了获取总体的信息,特别在客观实际中对总 体的全部个体逐一进行研究,有的是不适宜、不可能或不必 要的.因此,抽样调查是获取总体信息的重要方法.
2.随机抽样
(1)简单随机抽样:从一个总体中通过逐个抽取的方法从中抽 取一个样本,且每次抽取时各个个体被抽到的概率相等,这 样的抽样称为简单随机抽样.这样抽出的样本称为简单随机 样本.简单随机抽样的基本方法有抽签法和随机数表法.
答案:A
5.(2010·湖南)某商品销售量y(件)与销售价格x(元/件)负相关,
则其yˆ 回归方程可能是( ) yˆ
A. =yˆ-10x+200
B. =10x+yˆ200
C. =-10x-200
D. =10x-200
解析:由图象知选项B、D为正相关,选项C不符合实际意义,故选
A.
答案:A
类型一抽样方法的综合应用
3.分层抽样:当总体中个体差异较大时,往往采用分层抽样的方 法,若有某些层面应抽取的个体数目不是整数时,可作适当 的细微调整.
【典例1】 为了考察某校的教学水平,将抽查这个学校高三年 级的部分学生本年度的考试成绩.为了全面反映实际情况, 采取以下三种方式进行抽查(已知该校高三年级共有20个 班,并且每个班内的学生已经按随机方式编好了学号,假定 该校每班学生的人数相同):①从高三年级20个班中任意抽 取一个班,再从该班中任意抽取20名学生,考察他们的学习 成绩;②每个班抽取1人,共计20人,考察这20名学生的成绩;
5
5
故选B. 答案:B
4.(2010·福建)若某校高一年级8个班参加合唱比赛的得分如 茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 C.91和91.5
B.91.5和92 D.92和92
1
1
解析:中位数为 (291+92)=91.5;平均数为 8
(87+89+90+91+92+93+94+96)=91.5.
A.92,2
B.92,2.8
C.93,2
D.93,2.8
解析:去掉一个最高分95分与一个最低分89分后,所得的5个数
分别为90、90、93、94、93,
所以
x 90 90 93 94 93 460 92,
5
5
s2 2 (90 92)2 2 (93 92)2 (94 92)2 14 2.8,
第二种方式抽样的步骤如下:第一步,用简单随机抽样法从第 一个班中任意抽取一名学生,记其学号为a;第二步,在其余
第三种方式抽样的步骤如下:第一步,分层.因为若按成绩分,其 中优秀生共150人,良好生共600人,普通生共250人,所以在 抽取样本时,应该把全体学生分成三个层次;第二步,确定各 个层次抽取的人数.因为样本容量与总体的个数之比为
(3)总体密度曲线
如果样本容量不断增大,分组的组距不断缩小,则频率分布直 方图实际上越来越接近于总体在各小组内所取值的个数与 总数比值的大小,它可以用一光滑曲线来描绘,这条光滑曲 线就叫做总体密度曲线.
(4)茎叶图表示数据有两个突出的优点,其一是统计图上没有原 始数据的损失,所有信息都可以从这个茎叶图中得到,其二 是在比赛时随时记录,方便记录与表示.
答案:B
2.(2010·湖北)将参加夏令营的600名学生编号为 :001,002,…,600.采用系统抽样方法抽取一个容量为50的样 本,且随机抽得的号码为003.这600名学生分住在三个营区, 从001到300的第Ⅰ营区,从301到495在第Ⅱ营区,从496到 600在第Ⅲ营区,三个营区被抽中的人数依次为( )
总体中所有个体的平均数叫做总体平均数.
样本中所有个体的平均数叫做样本平均数,如果在n个数据中 ,x1出现了f1次,x2出现f2x次,…1n ,xk出现fk次(这里f1+f2+…+fk=n),
那么
(x1f1+x2f2+…+xkfk),叫做这n个数的加权平均数.
2 样本方差, 标准差设样本的元素为x1, x2 ,, x n , 样本的
(2)2×2列联表
一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和 {y1,y2},其样本频数列联表(称为2×2列联表)为
n(ad bc)2
K2= (a b)(c d )(a c)(b用它d )的大小可以决定是否拒绝原来的
统计假设H0,如果K2值较大,就拒绝H0,即拒绝事件A与B无关.
平均数为x , 定义s2
1 n [( x1
x )2
( x2
x )2
( xn x )2 ],
s
1 n
[( x1
x )2
( x2
x )2
方差, s表示样本标准差.
( xn x )2 ], 其中s2表示样本
5.两个变量的相关关系 (1)当自变量的取值一定时,因变量的取值带有随机性,这两个
变量之间的关系叫做相关关系. 如果一个变量的值由小变大时,另一个变量的值也在由小到大
的分布规律能较清楚的呈现出来.这时应注意:①一般样本 容量越大,所分组数越多;②为方便起见,组距的选择应力求 “取整”;③当样本容量不超过100时,按照数据的多少,通 常分成5~12组.
150 , 600 , 250 ,
11000:1100001=01:10,所以在每个层次中抽取的个体数依次为
即15,60,25;第三步,按层次分别抽取.在优秀生中 用简单随机抽样法抽15人;在良好生中用简单随机抽样法 抽取60人;在普通生中用简单随机抽样法抽取25人.
类型二频率分布直方图和茎叶图 解题准备:1.作频率分布直方图的步骤: (1)求极差,即一组数据中最大值和最小值的差. (2)决定组距与组数.将数据分组时,组数应力求合适,以使数据