频率分布直方图与茎叶图
高考数学易错题10.2 统计图表的应用-2019届高三数学提分精品讲义
专题十概率、统计问题二:统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.学科-网2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
2023年高考数学一轮复习(新高考地区专用)6-6 分布列基础(精练)(解析版)
6.6 分布列基础(精练)(基础版)1.(2022·云南·昆明市第一中学西山学校)国家“双减”政策落实之后,某市教育部门为了配合“双减”工作,做好校园课后延时服务,特向本市小学生家长发放调查问卷了解本市课后延时服务情况,现从中抽取100份问卷,统计了其中学生一周课后延时服务总时间(单位:分钟),并将数据分成以下五组:[)[)[)[)[]100,120,120,140,140,160,160,180,180,200,得到如图所示的频率分布直方图.(1)根据如图估计该市小学生一周课后延时服务时间的众数、平均数、中位数(保留小数点后一位);(2)通过调查分析发现,若服务总时间超过160分钟,则学生有不满情绪,现利用分层随机抽样的方法从样本问卷中随机抽取8份,再从抽取的8份问卷中抽取3份,记其中有不满情绪的问卷份数为X ,求X 的分布列及均值.【答案】(1)150,151,150.9;(2)分布列见解析,34.【解析】(1)众数:150;第1到5组频率分别为:0.05,0.15,0.55,0.2,0.05,平均数:1100.051300.151500.551700.21900.05151x =⨯+⨯+⨯+⨯+⨯=, 设中位数为x ,则中位数在第3组,则()0.21400.02750.5x +-⨯=,150.9x ≈; (2)用分层随机抽样抽取8份问卷,其中学生有不满情绪的有8×(0.2+0.05)=2份,∴X 的可能取值为0,1,2,∴()306238C C 5C 140P X ===,()216238C C 15C 281P X ===,()126238C C 3C 282P X ===,∴X 的分布列为:题组一 超几何分布∴()515330121428284E X =⨯+⨯+⨯=. 2.(2022·北京·高三专题练习)为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记X 表示学生的考核成绩,并规定85X >为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:.(1)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核为优秀的概率;(2)从图中考核成绩满足[]70,79X ∈的学生中任取3人,设Y 表示这3人中成绩满足8510X -≤的人数,求Y 的分布列和数学期望;(3)根据以往培训数据,规定当8510.510X P ⎛-⎫≤≥⎪⎝⎭时培训有效.请你根据图中数据,判断此次冰雪培训活动是否有效,并说明理由.【答案】(1)15(2)分布列见解析,()158E Y = (3)有效,理由见解析 【解析】(1)解:设该名学生的考核成绩优秀为事件A ,由茎叶图中的数据可知,30名同学中,有6名同学的考核成绩为优秀,故()15P A =. (2)解:由8510X -≤可得7595X ≤≤,所以,考核成绩满足[]70,79X ∈的学生中满足8510X -≤的人数为5,故随机变量Y 的可能取值有0、1、2、3,()3338C 10C 56P Y ===,()213538C C 151C 56P Y ===,()123538C C 152C 28P Y ===,()3538C 53C 28P Y ===,所以,随机变量Y 的分布列如下表所示:因此,()115155150123565628288E Y =⨯+⨯+⨯+⨯=. (3)解:由85110X -≤可得7595X ≤≤,由茎叶图可知,满足7595X ≤≤的成绩有16个, 所以851610.51030X P ⎛-⎫≤=≥⎪⎝⎭,因此,可认为此次冰雪培训活动有效. 3.(2022·宁夏中卫·三模(理))共享电动车(sharedev )是一种新的交通工具,通过扫码开锁,实现循环共享.某记者来到中国传媒大学探访,在校园喷泉旁停放了10辆共享电动车,这些电动车分为荧光绿和橙色两种颜色,已知从这些共享电动车中任取1辆,取到的是橙色的概率为0.4P =,若从这些共享电动车中任意抽取3辆.(1)求取出的3辆共享电动车中恰好有一辆是橙色的概率;(2)求取出的3辆共享电动车中橙色的电动车的辆数X 的分布列与数学期望. 【答案】(1)12;(2)分布列见解析,数学期望为65.【解析】(1)因为从10辆共享电动车中任取一辆,取到橙色的概率为0.4,所以橙色的电动车有4辆,荧光绿的电动车有6辆.记A 为“从中任取3辆共享单车中恰好有一辆是橙色”,则()2164310C C 1C 2P A ⨯==. (2)随机变量X 的所有可能取值为0,1,2,3.所以()3064310C C 10C 6P X ⨯===,()2164310C C 11C 2P X ⨯===, ()()1264310C C 32C 10P X P A ⨯====,()0364310C C 13C 30P X ⨯===.所以分布列为数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=.4.(2022·广东·华南师大附中三模)“双减”政策实施后,为了解某地中小学生周末体育锻炼的时间,某研究人员随机调查了600名学生,得到的数据统计如下表所示:(1)估计这600名学生周末体育锻炼时间的平均数t ;(同一组中的数据用该组区间的中点值作代表) (2)在这600人中,用分层抽样的方法,从周末体育锻炼时间在[)40,60内的学生中抽取15人,再从这15人中随机抽取3人,记这3人中周末体育锻炼时间在[)50,60内的人数为X ,求X 的分布列以及数学期望()E X . 【答案】(1)58.5;(2)分布列答案见解析,数学期望:95.【解析】(1)估计这600名学生周末体育锻炼时间的平均数 350.1450.2550.3650.15750.15850.158.5t =⨯+⨯+⨯+⨯+⨯+⨯=.(2)依题意,周末体育锻炼时间在[)40,50内的学生抽6人,在[)50,60内的学生抽9人,则()363154091C P X C ===,()216931527191C C P X C ===,()12693152162455C C P X C ===,()3931512365C P X C ===,故X 的分布列为: 则()42721612901239191455655E X =⨯+⨯+⨯+⨯=. 5.(2022·云南保山·模拟预测(理))某高中学校为了解学生的课外体育锻炼时间情况,在全校学生中随机抽取了200名学生进行调查,并将数据分成六组,得到如图所示的频率分布直方图.将平均每天课外体育锻炼时间在[40,60)上的学生评价为锻炼达标,将平均每天课外体育锻炼时间在[0,40)上的学生评价为锻炼不达标(1)根据频率分布直方图估计这200名学生每天课外体育锻炼时间的众数、中位数;(2)为了了解学生课外体育锻炼时间不达标的原因,从上述锻炼不达标的学生中按分层抽样的方法抽取10人,再从这10人中随机抽取3人,记这三人中每天课外体育锻炼时间在[0,20)的人数为ξ,求ξ的分布列和数学期望.【答案】(1)中位数为28.125,众数等于25(2)分布列见解析,0.9【解析】(1)众数就是直方图中最高矩形底边中点的横坐标,则样本众数等于25.由频率分布直方图可得,在[0,10)上的频率为0.08,在[10,20)上的频率为0.16,在[20,30)上的频率为0.32,0.080.160.50.080.160.32<<+++,则中位数在区间[20,30)上.设中位数为0x ,则()00.24200.0320.5+-⨯=x ,028.125x =,即样本中位数为28.125.(2)根据题意,在[0,10),[10,20),[20,30),[30,40)上抽取的人数分别为1,2,4,3,其中在[0,20)上抽取的人数为3,则0ξ=,1,2,3.3127373310103576321(0),(1),1202412040ξξ⨯========C C C P P C C , 2133733310102171(2),(3)12040120C C C P P C C ξξ=====⨯==. 从而得到随机变量ξ的分布列如下表:随机变量ξ的期望72171()01230.9244040120E ξ=⨯+⨯+⨯+⨯=6.(2022·北京市朝阳区人大附中朝阳分校模拟预测)自“新型冠状肺炎”疫情爆发以来,科研团队一直在积极地研发“新冠疫苗”.在科研人员不懈努力下,我国公民率先在2020年年末开始使用安全的新冠疫苗,使我国的“防疫”工作获得更大的主动权.研发疫苗之初,为了测试疫苗的效果,科研人员以白兔为实验对象,进行了一些实验:(1)实验一:选取10只健康白兔,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒的环境中,实验结果发现:除2号、3号、7号和10号四只白兔仍然感染了新冠病毒,其他白兔未被感染.现从这10只白兔中随机抽取3只进行研究,将仍被感染的白兔只数记作X ,求X 的分布列和数学期望.(2)实验二:疫苗可以再次注射第二针、加强针,但两次疫苗注射时间间隔需大于三个月.科研人员对白兔多次注射疫苗后,每次注射的疫苗对白兔是否有效互相不影响.试问:若将实验一中未被感染新冠病毒的白兔的频率当做疫苗的有效率,那么一只白兔注射两次疫苗后的有效率能否保证达到90%?如若可以,请说明理由;若不可以,请你参考上述实验给出注射疫苗后有效率在90%以上的建议. 【答案】(1)分布列见解析;数学期望()65E X =; (2)无法保证;建议:需要将注射一次疫苗的有效率提高到90%以上. 【解析】(1)由题意得:X 所有可能的取值为0,1,2,3,()3631020101206C P X C ∴====;216431060111202C C P XC ; 1264310363212010C C P X C ;3431041312030C P XC ; X ∴的分布列为:∴数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=; (2)由已知数据知:实验一中未被感染新冠病毒的白兔的频率为0.6,则注射一次疫苗的有效率为0.6, ∴一只白兔注射两次疫苗的有效率为:()2110.60.8484%90%--==<, ∴无法保证一只白兔注射两次疫苗后的有效率达到90%;设每支疫苗有效率至少达到x 才能满足要求,()21190%x ∴--≥,解得:0.990%x ≥=,∴需要将注射一次疫苗的有效率提高到90%以上才能保证一只白兔注射两次疫苗后的有效率达到90%.7.(2022·全国·高三专题练习(理))高二年级某班学生在数学校本课程选课过程中,已知第一小组与第二小组各有六位同学.每位同学都只选了一个科目,第一小组选《数学运算》的有1人,选《数学解题思想与方法》的有5人,第二小组选《数学运算》的有2人,选《数学解题思想与方法》的有4人,现从第一、第二两小组各任选2人分析选课情况.(1)求选出的4 人均选《数学解题思想与方法》的概率;(2)设ξ为选出的4个人中选《数学运算》的人数,求ξ的分布列和数学期望. 【答案】(1)415(2)分布列见解析,期望为1 【解析】(1)解:设“从第一小组选出的2人选《数学解题思想与方法》”为事件A ,“从第二小组选出的2人选《数学解题思想与方法》”为事件B ,由于事 件A 、B 相互独立,且22542266C C 22(),()C 3C 5P A P B ====, 所以选出的4人均选《数学解题思想与方法》的概率为224()()()3515P A B P A P B ⋅=⋅=⨯=.(2)解:由题意,随机变量ξ可能的取值为0,1,2,3,可得4(0)15P ξ==,211125524422226666C C C C C 22(1)C C C C 45P ξ==⋅+⋅=,152266C 11(3)C C 45P ξ==⋅=,2(2)1(0)(1)(3)9P P P P ξξξξ==-=-=-==, 所以随机变量ξ的分布列为:ξ0 1 23 P415224529145所以随机变量ξ的数学期望 42221012311545945E ξ=⨯+⨯+⨯+⨯=. 1.(2022·北京·人大附中三模)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图: 组号分组频数1[)0,262 [)2,48题组二 二项分布每周课外阅读时间小于6小时的学生我们称之为“阅读小白”,大于等于6小时且小于12小时的学生称之为“阅读新手”,阅读时间大于等于12小时的学生称之为“阅读达人”.(1)从样本中随机选取一名学生,已知这名学生的阅读时间大于等于6小时,问这名学生是“阅读达人”概率; (2)从该校学生中选取3人,用样本的频率估计概率,记这3人中“阅读新手和阅读小白”的人数和为X ,求X 的分布列和数学期望;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论) 【答案】(1)1069(2)分布列答案见解析,()2710E X =(3)第4组【解析】(1)解:从样本中随机选取一名学生,其中阅读时间大于等于6小时的学生人数为1003169-=, “阅读达人”的学生人数为10,故所求概率为1069. (2)解:从该校学生中任选一人,该学生是“阅读小白”或“阅读新人”的概率为90910010=, 所以,9~3,10X B ⎛⎫ ⎪⎝⎭,则()3110101000P X ⎛⎫=== ⎪⎝⎭,()397293101000P X ⎛⎫=== ⎪⎝⎭,()21391271C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭,()223912432C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:()927310100E X =⨯=. (3)解:样本中的100名学生该周课外阅读时间的平均数为10.0630.0850.1770.2290.25110.12130.06150.02170.02⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=7.68.因此,样本中的100名学生该周课外阅读时间的平均数在第4组.2.(2022·安徽·合肥一六八中学模拟预测(理))《关于加快推进生态文明建设的意见》,正式把“坚持绿水青山就是金山银山”的理念写进中央文件,成为指导中国加快推进生态文明建设的重要指导思想.为响应国家号召,某市2020年植树节期间种植了一批树苗,2022年市园林部门从这批树苗中随机抽取100棵进行跟踪检测,得到树高的频率分布直方图如图所示:(1)求树高在225-235cm 之间树苗的棵数,并求这100棵树苗树高的平均值;(2)若将树高以等级呈现,规定:树高在185-205cm 为合格,在205-235为良好,在235-265cm 为优秀.视该样本的频率分布为总体的频率分布,若从这批树苗中机抽取3棵,求树高等级为优秀的棵数ξ的分布列和数学期望.【答案】(1)15;220.5(2)分布列见解析;期望为0.6【解析】(1)树高在225-235cm 之间的棵数为:()10010.00530.0150.02000250.011015⎡⎤⨯-⨯++++⨯=⎣⎦..树高的平均值为:0.051900.152000.22100.252200.152300.12400.052500.05260220.5⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)由(1)可知,树高为优秀的概率为:0.10.050.050.2++=, 由题意可知()~3,0.2B ξ,则ξ的所有可能取值为0,1,2,3,()0330C 0.80.512P ξ===, ()1231C 0.80.20.384P ξ==⨯=, ()2232C 0.80.20.096P ξ==⨯=,()3333C 0.20.008P ξ===,故ξ的分布列为:因为()~3,0.2B ξ,所以()30.20.6E ξ=⨯=3.(2022·新疆克拉玛依·三模(理))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中的a 值,并根据直方图估计该市全体中学生的测试分数的中位数和平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)将频率作为概率,若从该市全体中学生中抽取4人,记这4人中测试分数不低于90分的人数为X ,求X 的分布列及数学期望.【答案】(1)0.02a =,中位数为74.3,平均数为74.5;(2)分布列见解析,25.【解析】(1)由频率分布直方图和茎叶图知,测试分数在[50,60),[60,70),[70,80),[90,100]的频率依次为:0.1,0.25,0.35,0.1,因此,测试分数位于[)80,90的频率为10.10.250.350.10.2----=,则0.20.0210a ==, 显然测试分数的中位数t 在区间[70,80)内,则有:()700.0350.50.10.25t -⨯=--,解得:74.3t ≈, 测试分数的平均数为:550.1650.25750.35850.2950.174.5⨯+⨯+⨯+⨯+⨯=. (2)测试分数不低于90分的频率为110,X 的所有可能值是:0,1,2,3,4, 显然1(4,)10XB ,()4419C ()(),N,41010k k k P X k k k -==∈≤, 所以X 的分布列为:数学期望()124105E X =⨯=. 4.(2022·全国·模拟预测)为了中国经济的持续发展制定了从2021年2025年发展纲要,简称“十四五”规划,为了普及“十四五”的知识,某党政机关举行“十四五”的知识问答考试,从参加考试的机关人员中,随机抽取100名人员的考试成绩的部分频率分布直方图,其中考试成绩在[)70,80上的人数没有统计出来.(1)估算这次考试成绩的平均分数;(2)把上述的频率看作概率,把考试成绩的分数在[]80,100的学员选为“十四五”优秀宣传员,若从党政机关所有工作人员中,任选3名工作人员,其中可以作为优秀宣传员的人数为ξ,求ξ的分布列与数学期望.【答案】(1)70.5(2)分布列见解析,数学期望为0.9【解析】(1)设分数在[)70,80内的频率为x ,根据频率分布直方图得,()0.010.0150.020.0250.005101x ++++⨯+=,解得0.25x =,可知分数在[)70,80内的频率为0.25,则考试成绩的平均分数为450.10550.15650.2750.25850.25950.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.(2)根据频率分布直方图可知考试成绩在[]80,100的频率为()0.0250.005100.3+⨯=,则0,1,2,3ξ=.()003334300.30.71000P C ξ==⨯=,()12344110.30.71000P C ξ==⨯=()22318920.30.71000P C ξ==⨯=,()3332730.31000P C ξ===,故随机变量ξ的分布列为因为该分布为二项分布,所以该随机变量的数学期望为()30.30.9E ξ=⨯=.5.(2022·江苏苏州·模拟预测)如图,在数轴上,一个质点在外力的作用下,从原点O 出发,每次等可能地向左或向右移动一个单位,质点到达位置的数字记为X .(1)若该质点共移动2次,位于原点O 的概率;(2)若该质点共移动6次,求该质点到达数字X 的分布列和数学期望. 【答案】(1)12;(2)分布列见解析,0.【解析】(1)质点移动2次,可能结果共有224⨯=种,若质点位于原点O ,则质点需要向左、右各移动一次,共有12C 2=种,故质点位于原点O 的概率2142P ==. (2)质点每次移动向左或向右,设事件A 为“向右”,则A 为“向左”,故1()()2P A P A ==, 设Y 表示6次移动中向左移动的次数,则1(6,)2Y B ,质点到达的数字62X Y =-,所以06611(6)(0)C ()264P X P Y =====,16613(4)(1)C ()232P X P Y =====,266115(2)(2)C ()264P X P Y =====, 36615(0)(3)C ()216P X P Y =====,466115(2)(4)C ()264P X P Y =-====, 56613(4)(5)C ()232P X P Y =-====,66611(6)(6)C ()264P X P Y =-====, 所以X 的分布列为:1()(62)2()626602E X E Y E Y =-=-+=-⨯⨯+=.6.(2022·北京通州·模拟预测)第24届冬季奥林匹克运动会,于2022年2月在北京市和张家口市联合举行.某校寒假期间组织部分滑雪爱好者参加冬令营集训.训练期间,冬令营的同学们都参加了“单板滑雪”这个项目相同次数的训练测试,成绩分别为A 、B 、C 、D 、E 五个等级,分别对应的分数为5、4、3、2、1.甲、乙两位同学在这个项目的测试成绩统计结果如图所示.(1)根据上图判断,甲、乙两位同学哪位同学的单板滑雪成绩更稳定?(结论不需要证明) (2)求甲单板滑雪项目各次测试分数的众数和平均数;(3)若甲、乙再同时参加两次测试,设甲的成绩为4分并且乙的成绩为3分或4分的次数为X ,求X 的分布列(频率当作概率使用).【答案】(1)乙比甲的单板滑雪成绩更稳定 (2)众数为3分,平均数为2.9分 (3)分布列答案见解析【解析】(1)解:由图可知,乙比甲的单板滑雪成绩更稳定.(2)解:因为甲单板滑雪项目测试中4分和5分成绩的频率之和为0.325, 3分成绩的频率为0.375,所以,甲单板滑雪项目各次测试分数的众数为3分,测试成绩2分的频率为10.20.3750.250.0750.1----=,所以,甲单板滑雪项目各次测试分数的平均数为10.220.130.37540.2550.075 2.9⨯+⨯+⨯+⨯+⨯=. (3)解:由题意可知,在每次测试中,甲的成绩为4分,并且乙的成绩为3分或4分的概率为30.250.375216⨯⨯=, 依题意,3~2,16X B ⎛⎫ ⎪⎝⎭,所以,()2131********P X ⎛⎫=== ⎪⎝⎭,()12313391C 1616128P X ==⋅⋅=,()239216256P X ⎛⎫=== ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:X0 1 2 P1692563912892561.(2022·全国·高三专题练习(理))冰壶是2022年2月4日至2月20日在中国举行的第24届冬季奥运会的比赛项目之一.冰壶比赛的场地如图所示,其中左端(投掷线MN 的左侧)有一个发球区,运动员在发球区边沿的投掷线MN 将冰壶掷出,使冰壶沿冰道滑行,冰道的右端有一圆形的营垒,以场上冰壶最终静止时距离营垒区圆心O 的远近决定胜负,甲、乙两人进行投掷冰壶比赛,规定冰壶的重心落在圆O 中,得3分,冰壶的重心落在圆环A 中,得2分,冰壶的重心落在圆环B 中,得1分,其余情况均得0分.已知甲、乙投掷冰壶的结果互不影响,甲、乙得3分的概率分别为13,14;甲、乙得2分的概率分别为25,12;甲、乙得1分的概率分别为15,16.(1)求甲所得分数大于乙所得分数的概率;(2)设甲、乙两人所得的分数之差的绝对值为X ,求X 的分布列和期望.题组三 独立重复实验【答案】(1)1130(2)分布列见解析,期望为:169180【解析】(1)由题意知甲得0分的概率为1211135515---=,乙得0分的概率为1111142612---=,甲所得分数大于乙所得分数分为:甲得3分乙得2或1或0分,甲得2分乙得1或0分,甲得1分乙得0分所以所求概率为1121111(1)()3456125123011⨯-+⨯++⨯=.(2)X 可能取值为0,1,2,3,()11211111290345256151290P X ==⨯+⨯+⨯+⨯=()112111111111++35565251283246121805P X ==⨯+⨯+⨯+⨯⨯⨯=()11111121231215180P X ==⨯+⨯+⨯+⨯=()11211121545334P X ==⨯+⨯=所以,随机变量X 的分布列为:所以()298331216918001239018018405E X =⨯+⨯+⨯+⨯= 2.(2022·全国·高三专题练习(理))为弘扬奥运精神,某校开展了“冬奥”相关知识趣味竞赛活动.现有甲、乙两名同学进行比赛,共有两道题目,一次回答一道题目.规则如下:∴抛一次质地均匀的硬币,若正面向上,则由甲回答一个问题,若反面向上,则由乙回答一个问题.∴回答正确者得10分,另一人得0分;回答错误者得0分,另一人得5分.∴若两道题目全部回答完,则比赛结束,计算两人的最终得分.已知甲答对每道题目的概率为45,乙答对每道题目的概率为35,且两人每道题目是否回答正确相互独立.(1)求乙同学最终得10分的概率;(2)记X 为甲同学的最终得分,求X 的分布列和数学期望. 【答案】(1)37100(2)分布列见解析,X 的数学期望为10【解析】(1)记“乙同学最终得10分”为事件A ,则可能情况为甲回答两题且错两题;甲、乙各答一题且各对一题;乙回答两题且对一题错一题, 则()1111141313123722252525252525100P A =⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=,所以乙同学得10分的概率是37100. (2)甲同学的最终得分X 的所有可能取值是0,5,10,15,20. ()1111111313131640225252525252510025P X ==⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()111213121645222525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯==,()141114*********102225252525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()1412164152252510025P X ==⨯⨯⨯⨯==,()141416420252510025P X ==⨯⨯⨯==.X 的分布列为()4191105101520102525252525E X =⨯+⨯+⨯+⨯+⨯=,所以X 的数学期望为10. 3.(2022·青海·海东市第一中学模拟预测(理))“民族要复兴,乡村必振兴”,为了加强乡村振兴宣传工作,让更多的人关注乡村发展,某校举办了有关城乡融合发展、人与自然和谐共生的知识竞赛.比赛分为初赛和复赛两部分,初赛采用选手从备选题中选一题答一题的方式进行,每位选手最多有5次答题机会,选手累计答对3题或答错3题即终止比赛,答对3题者直接进入复赛,答错3题者则被淘汰.已知选手甲答对每个题的概率均为35,且相互间没有影响.(1)求选手甲被淘汰的概率;(2)设选手甲在初赛中答题的个数为X ,试求X 的分布列和数学期望. 【答案】(1)9923125(2)分布列见解析,2541625【解析】(1)设“选手甲被淘汰”为事件A ,因为甲答对每个题的概率均为35,所以甲答错每个题的概率均为25.则甲答了3题都错,被淘汰的概率为33328C 5125⎛⎫= ⎪⎝⎭;甲答了4个题,前3个1对2错,被淘汰的概率为22323272C 555625⎛⎫⨯⨯= ⎪⎝⎭;甲答了5个题,前4个2对2错,被淘汰的概率为2224322432C 5553125⎛⎫⎛⎫⋅⨯= ⎪⎪⎝⎭⎝⎭. 所以选手甲被海的概率()87243299212562531253125P A =++=. (2)易知X 的可能取值为3,4,5,对应甲被淘汰或进入复赛的答题个数,则()3333333273C C 5525P X ⎛⎫⎛⎫==+= ⎪ ⎪⎝⎭⎝⎭,()2222333232322344C C 555555625P X ⎛⎫⎛⎫==⨯⨯+⨯⨯=⎪ ⎪⎝⎭⎝⎭, ()2224322165C 55625P X ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭. X 的分布列为则()7234216256225413456255625E X =⨯+⨯+⨯=. 4.(2022·湖南·长沙一中模拟预测)某靶场有A ,B 两种型号的步枪可供选用,其中甲使用A B ,两种型号的步枪的命中率分别为14,13;,(1)若出现连续两次子弹脱靶或者子弹打光耗尽的现象便立刻停止射击,若击中标靶至少3次,则可以获得一份精美礼品,若甲使用B 型号的步枪,并装填5发子弹,求甲获得精美礼品的概率;(2)现在A B ,两把步枪中各装填3发子弹,甲打算轮流使用A B ,两种步枪进行射击,若击中标靶,则继续使用该步枪,若未击中标靶,则改用另一把步枪,甲首先使用A 种型号的步枪,若出现连续两次子弹脱靶或者其中某一把步枪的子弹打光耗尽的现象便立刻停止射击,记X 为射击的次数,求X 的分布列与数学期望. 【答案】(1)1381(2)分布列见解析;X 的数学期望为3512.【解析】(1)甲击中5次的概率为513⎛⎫ ⎪⎝⎭1243=,甲击中4次的概率为14511C (1)()33-⋅10243=,甲击中3次的概率为()322511C 3133⎛⎫⎛⎫-⋅- ⎪⎪⎝⎭⎝⎭28243=, 所以甲获得精美礼品的概率为11028391324324324324381++==. (2)X 的所有可能取值为2,3,4,5,(2)P X =11(1)(1)43=--321432=⨯=,(3)P X ==111113(1)(1)14434416⨯--+⨯⨯=,(4)P X ==1111111(1)1(1)(1)(1)4334334-⨯⨯⨯+-⨯⨯-⨯-524=,11111111(5)(1)(1)1(1)(1)144334334P X ==⨯-⨯⨯-⨯+-⨯⨯-⨯⨯1111(1)14433+⨯-⨯⨯⨯548=,所以X 的分布列为:所以1355()23452162448E X =⨯+⨯+⨯+⨯3512=. 5.(2022·全国·二模(理))“百年征程波澜壮阔,百年初心历久弥坚”.为庆祝中国建党一百周年,哈市某高中举办了“学党史、知党情、跟党走”的党史知识竞赛.比赛分为初赛和决赛两个环节,通过初赛选出两名同学进行最终决赛.若该高中A ,B 两名学生通过激烈的竞争,取得了初赛的前两名,现进行决赛.规则如下:设置5轮抢答,每轮抢到答题权并答对则该学生得1分,答错则对方得1分.当分差达到2分或答满5轮时,比赛结束,得分高者获胜.已知A ,B 每轮均抢答且抢到答题权的概率分别为23,13,A ,B 每一轮答对的概率都为12,且两人每轮是否回答正确均相互独立. (1)求经过2轮抢答A 赢得比赛的概率;:(2)设经过抢答了X 轮后决赛结束,求随机变量X 的分布列和数学期望.【答案】(1)14(2)分布列见解析;期望为134【解析】(1)记事件C 为“经过2轮抢答A 赢得比赛” A 学生每轮得一分的概率()2111132322P A =⨯+⨯=,B 学生每轮得一分的概率()1121132322P B =⨯+⨯=,()21124P C ⎛⎫== ⎪⎝⎭,所以经过2轮抢答A 赢得比赛的概率为14.(2)X 的可能取值为2,4,5.2轮比赛甲赢或乙赢的概率为()2221122C 22P X ⎛⎫=== ⎪⎝⎭,4轮比赛甲赢或乙赢的概率为()121111142C 22224P X ==⨯⨯⨯=, 5轮比赛甲赢或乙赢的概率为()11151424P X ==--=.X 的分布列为:()111132452444E X =⨯+⨯+⨯=,数学期望为134.6.(2022·湖南·长沙市明德中学二模)沙滩排球是一项每队由两人组成的两队在由球网分开的沙地上进行比赛的运动.它有多种不同的比赛形式以适应不同人、不同环境下的比赛需求.国家沙滩排球队为备战每年一次的世界沙滩排球巡回赛,在文昌高隆沙湾国家沙滩排球训练基地进行封闭式训练.在某次训练中,甲、乙两队进行对抗赛,每局依次轮流发球(每队不能连续发球),连续赢得2个球的队获胜并结束该局比赛,并且每局不得超过5个球.通过对甲、乙两队过去对抗赛记录的数据分析,甲队发球甲队赢的概率为23,乙队发球甲队赢的概率为12,每一个球的输赢结果互不影响,已知某局甲先发球. (1)求该局第二个球结束比赛的概率;(2)若每赢1个球记2分,每输一个球记0分,记该局甲队累计得分为ξ,求ξ的分布列及数学期望. 【答案】(1)12(2)分布列见解析,18754【解析】(1)记:“甲队发球甲队赢”为事件A ,“乙队发球甲队赢”为事件B ,“第二个球结束比赛”为事件C ,则()23P A =,()12P B =,()()1132P A P B ==,,C AB AB =,因为事件AB 与AB 互斥,所以()()()()P C P ABAB P AB P AB ==+()()()()P A P B P A P B =+2111132322=⨯+⨯=,所以该局第二个球结束比赛的概率为12.(2)依题意知随机变量ξ的所有可能取值为0246,,, ()()()()1110326P P AB P A P B ξ====⨯=;()()()()2P P ABA ABAB P ABA P ABAB ξ===+21111115323323236=⨯⨯+⨯⨯⨯=; ()()4P P AB ABAABABAABABA ξ==()()()()P AB P ABA P ABABA P ABABA=+++21112111112121153++=323233232332323108=⨯+⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯; ()()()()()6P P ABAB ABABA ABABA P ABAB P ABABA P ABABAξ===++21212121211112113232323233232354=⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=. 所以ξ的分布列为ξ0 2 46 P16536531081154故数学期望()15531118702466361085454E ξ=⨯+⨯+⨯+⨯=. 1.(2022·江苏省木渎高级中学模拟预测)2012年国家开始实施法定节假日高速公路免费通行政策,某收费站统计了2021年中秋节前后车辆通行数量,发现该站近几天车辆通行数量2100(,)0N ξσ~,若()(1200,80)01200P a P b ξξ>=<<=,则当82ab b a ≥+时下列说法正确的是( )A .12a =B .14b =C .34a b +=D .12a b -=【答案】C【解析】因2100(,)0N ξσ~,且()(1200,80)01200P a P b ξξ>=<<=,则有122b a +=,即21a b =-,不等式82ab b a ≥+为:24(1)1(21)0b b b -≥⇔-≤,则12b =,14a =, 所以34a b +=,14a b -=-,A ,B ,D 均不正确,C 正确.故选:C2.(2022·江苏·高三专题练习)随机变量()2,XN μσ,已知其概率分布密度函数22()21()e2x f x μσσπ-=在2x =处取得最大值为12π,则(0)P X >=( )附:()0.6827,(22)0.9545P X P X μσμσμσμσ-≤≤+=-≤≤+=. A .0.6827 B .0.84135C .0.97725D .0.9545【答案】B【解析】由题意2μ=,1122σππ=,2σ=,所以2(2)41()e2x f x π-=, (022)0.6827P X ≤≤=,所以1(0)(10.6827)0.158652P X <=-=, (0)10.158650.84135P X ≥=-=.故选:B .3.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量题组四 正态分布(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人);故选:B4.(2022·广东·大埔县虎山中学高三阶段练习)(多选)已知某校高三年级有1000人参加一次数学模拟考试,现把这次考试的分数转换为标准分,标准分的分数转换区间为(]60,300,若使标准分X 服从正态分布N()180,900,()0.6826P X μσμσ-<≤+=,(22)0.9545P X μσμσ-<≤+=,3309().973P X μσμσ-<≤+=,则( )A .这次考试标准分超过180分的约有450人B .这次考试标准分在(]90,270内的人数约为997C .甲、乙、丙三人恰有2人的标准分超过180分的概率为38D .()2402700.0428P X <≤= 【答案】BC【解析】依题意得180μ=,2900σ=,30σ=,因为()()11802P X P X μ>=>=, 所以这次考试标准分超过180分的约有110005002⨯=人,故A 不正确;()()90270180330180330P X P X <≤=-⨯<≤+⨯(33)P X μσμσ=-<≤+=0.9973,所以这次考试标准分在(]90,270内的人数约为10000.9973997⨯≈人,故B 正确; 依题意可知,每个人的标准分超过180分的概率为12,所以甲、乙、丙三人恰有2人的标准分超过180分的概率为223113C 1228⎛⎫⎛⎫⋅⋅-= ⎪⎪⎝⎭⎝⎭,故C 正确; ()240270P X <≤()180230180330P X =+⨯<≤+⨯()23P X μσμσ=+<≤+。
频率分布表
例2、为了了解一大片经济林的生长情况,随机测量其中的100株的 底部周长,得到如下数据表(长度单位:cm):
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108
合计
பைடு நூலகம்
100 1
频率分布表的制作
1、计算数据中最大值与最小值的差,
即全距。据此,决定组数和组距。
组距
全距 组数
2、分组:通常对组内数据所在区间取 左闭右开区间,最后一组取闭区间。
3、登记频数,计算频率,列出频率分 布表
练习1
1. 某电子元件厂生产一批同型号的电子元件,今 从中随机地抽取40个测得其电阻值如下:
168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166
频率分布表
B、1/14
C、0.03
D、3/14
3、将一个容量为50的样本数据分组后,组距和频数如下:
[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9; [21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6; [30.5,33.5],3.
则估计小于30的数据大约占总体的( A)
161
165
174
156
167
166
162
161
164
166
168
165
171
167
170
165
170
152
175
174
165
170 160 180 151 177 178 167 161
170
155 170 174 168 158 165 163 165
168
166 168 173 158 175 158 164 174
练习1
1. 某电子元件厂生产一批同型号的电子元件,今 从中随机地抽取40个测得其电阻值如下:
101 101 107 92 99 97 102 98 99 113 93 106 103 101 90 87 95 99 98 103 102 96 94 100 94 97 110 103 99 103 108 102 102 100 94 105 98 97 107 101
问题情境
为了了解7月25日至8月24日北京地区的气温分布状况, 我们对以往年份此段时间的日最高气温进行抽样,得到如 下样本(单位:C )
7月25 日至8 月10 日
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
茎叶图
知识探究(二)
自主学习课本
茎叶图
70 页内容,交流回答 骤; 重复的数据如何处理?
1. 归纳出制作茎叶图的步 2 . 在制作茎叶图时,出现 3 . 什么是中位数? 4 . 用茎叶图处理数据有何
优缺点?
探究展示
1. 归纳出制作茎叶图的步 骤;
第一步,将每个数据分为“茎”(高位)和 “叶”(低位)两部分; 第二步,将最小的茎和最大的茎之间的数 按小大次序排成一列; 第三步,将各个数据的叶按大小次序写在茎 右(左)侧. 第一步中,如果是两位数字,则茎为十位上的数字, 叶为个位上的数字,如89,茎:8,叶:9; 如果是三位数则茎为百位上的数字,叶为十位上的和 个位上的数字,如123,茎:1,叶:23.
频率
组距
总体密度曲线
月均用 水量/t
总体密度曲线反映了总体在各个范围内取 值的百分比,精确地反映了总体的分布规律。
是研究总体分布的工具.
3. 说出图 2 . 2 - 3中阴影部分表示的意义
频率 组距
月均用 水量/t
a
b
表示总体在某个区间 (a, b) 内取值的百分比)。 总体密度曲线的实际意义在于: 总体密度曲线与x轴,直线x=a,x=b围成的面积 等于x在[a,b]取值时的概率.
知识探究(一)频率分布折线图 总体密度曲线
自主学习课本 69 页内容,交流回答 图? 密度曲线有何联系?
1. 如何做出频率分布折线 2. 频率分布折线图与总体
3. 说出图 2 . 2 - 3中阴影部分表示的意义 4 . 对于一个总体,如果存 这条曲线是否唯一?能 确地画出总体密度曲线 在总体密度曲线, 否通过样本数据准 ?
4.已知样本:12,7,11,12,11,12,10,10, 9,8,13,12,10,9,6,11,8,9,8,10, 那么频率为0.25的样本的范围是( D ) A. [5.5,7.5) B. [7.5,9.5) C. [9.5,11.5) D. [11.5,13.5) 5.频率分布直方图中,小长方体的面积等于( A.相应各组的频数 B.相应各组的频率 C.组数 D.组距
第八章第一讲频率分布直方图
第一讲 频率分布直方图一:考纲解读、有的放矢统计部分要求不太高,主要是考抽样方法与频率分布直方图和茎叶图有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.二:核心梳理、茅塞顿开3. 作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.4. 频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.5. 作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.三:例题诠释,举一反三知识点1:利用频率分布直方图分析总体分布例题1:(2011中山期末A )2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 ( ) A .30辆 B .60辆 C .300辆D .600辆变式:(2009山东卷理B)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品 净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45变式:(2011杭州质检B )某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2(2010安徽卷B )某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45, (Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
必修2数学第九章统计知识点
必修2数学第九章统计知识点一、随机抽样。
1. 简单随机抽样。
- 定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
- 常用方法:抽签法和随机数法。
- 抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
- 随机数法:利用随机数表、随机数生成器或统计软件来产生随机数,根据随机数抽取样本。
2. 系统抽样。
- 定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。
- 步骤:- 先将总体的N个个体编号。
- 确定分段间隔k,对编号进行分段,当(N)/(n)(n是样本容量)是整数时,取k = (N)/(n);当(N)/(n)不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数N'能被n整除,这时k=(N')/(n)。
- 在第1段用简单随机抽样确定第一个个体编号l(l≤ k)。
- 按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l + k),再加k得到第3个个体编号(l+2k),依次类推,直到获取整个样本。
3. 分层抽样。
- 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样。
- 步骤:- 根据已有的信息,将总体分成互不相交的层。
- 计算各层中个体的个数与总体个数的比。
- 按各层个体数占总体数的比确定各层应抽取的样本容量。
- 在每一层中进行简单随机抽样或系统抽样,获取相应的样本个体,合在一起得到分层抽样的样本。
- 特点:使样本具有较强的代表性,而且在各层抽样时,可灵活选用不同的抽样方法。
二、用样本估计总体。
直方图和其他频率分布图(histogram and other frequency distributions)
直方图和其他频率分布图(histogram and other frequency distributions)直方图和其他频率分布图(histogram and other frequency distributior.s包括多边形图、茎叶图、点图、分位图、CDF图、累积多边形图。
概述频率分布表明了一组数据不同数值出现的频数。
直方图是最常用的频率分布图,与条形图很相似,但是两者之问有些重要的区别。
这部分也包含了其他的频率分布图。
多边形图和直方图的形状一样,但是用线而不是条柱连接频率值;茎叶图通过运用单个数值作为数据点的标识来保存单个数值:点图是在一条垂线上用小圆圈表示每个数据点;分位图和累积点线图表示有多少测量值(或测量值的百分比)小于或等于每个值。
适用场合·数据是数值型时;·想弄清楚数据分布的形状;·确定一个过程的输出是否近乎符合正态分布;·分析一个过程是否满足顾客的要求;·分析供应商的过程输出的分布情况;·检查两个时间段内过程是否发生交化;·确定两个或多个过程输出是否不同;·将分布情况快速简单地表示出来。
决策树(图表5. 68)有助于确定最适合于表示不同的数据和目的的图形。
实施步骤构建1.从一个过程中搜集至少50个连续的数据点。
如果没有那么多数据,就使用点图。
2.用直方图计算表(参阅图表5.81)建立直方图。
通过填写计算表确定组数,组距和组边界值。
计算完步骤2的组距(W)后,判断并将其调整到一个方便计算的数比如,你可以将0.9调整到1.0。
W的小数位不能比图中数的小数位多。
3.在图纸上画x轴和y轴。
y轴表示数据出现的个数。
用计算表中计算得到的L值在x轴标刻度。
这些数值之差是组距。
条柱间不要留空隙。
4.对于每个数据,准确找出其落入的组,并在该组上增加一个x或涂上一段条柱。
如果数据刚好落在组限处,则将该数据记入其右侧的一组内。
茎叶图
体密度曲线。
2.用样本分布直方图去估计相应的总体分布时,一
般样本容量越大,频率分布直方图就会无限接近 总体密度曲线,就越精确地反映了总体的分布规 律,即越精确地反映了总体在各个范围内取值百 分比。
二.茎叶图
• 茎叶图,类似直方图,但又与直方图不同,它的 思路是将数组的数按位数进行比较,将数大小基 本不变或变化不大的位作为一个主杆(茎),将 变化大的位的数作为分枝(叶),列在主杆的后 面,这样就可以清楚地看到每个主杆后面的几个 数,每个数具体是多少。 · 茎叶图在质量管理上用途与直方图差不多,但它通 常是作为更细致的分析阶段使用。由于它是用数字 组成直方图,所以在做的时候比直方图还,通常我 们常使用专业的软件进行绘制。
2.茎叶图的特征:
1)用茎叶图表示数据有两个优点:一是从统计图 上没有原始数据信息的损失,所有数据信息都可以 从茎叶图中得到;二是茎叶图中的数据可以随时记 录,随时添加,方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字 的数据,对位数多的数据不太容易操作;而且茎叶 图只方便记录两组的数据,两个以上的数据虽然能 够记录,但是没有表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能 遗漏.
学习目标
1、会列频率分布表,会画频率分布直方图; 2、会运用频率分布表和直方图分析和估计总 体分布;
自主学习
• 阅读教材 P6567 完成《导航》“知识梳理”
思考题: 某市政府为了节约生活用水,计划在 本市试行居民生活用水定额管理,即确定一个居 民月用水量标准a ,用水量不超过a的部分按平价 收费,超过a的部分按议价收费。
3.频率分布折线图的优点是它反映了数据 的变化趋势,如果样本容量不断增大, 分组的组距不断缩小,那么折线图就趋 向于总体分布的密度曲线。
怎么画频率分布折线图频数分布表茎叶图作频率分布直方图的步骤
频率分布:样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.频率分布折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表。
茎叶图:(1)茎是指中间的一列数,叶是从茎的旁边生长出来的数。
(2)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出;(3)茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
1、频率分布样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.2、频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
3、频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
数学苏教版3教案:2.2.3茎叶图含解析
2。
2.3茎叶图整体设计教材分析通过比较甲、乙两个运动员比赛得分情况引入茎叶图,从而得出画茎叶图的步骤,从茎叶图中的枝叶分布情况就可以感受到样本数据的分布特点。
结合实例说明,可根据数据的特点灵活地决定茎叶图中数据的茎和叶的划分.茎叶图,频率分布表和频率分布直方图都是用来描述样本数据的分布情况的。
茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.三维目标1。
通过实例使学生掌握茎叶图的意义及画法,体会分布的意义和作用,在表示样本数据的过程中,进一步学会列频率分布表及画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2。
使学生进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布。
重点难点教学重点:1。
使学生掌握茎叶图的意义及画法,结合实例体会茎叶图的优点;2.继续掌握如何用样本频率分布估计总体分布。
教学难点:对频率分布直方图的理解和应用.课时安排1课时教学过程导入新课设计思路一:(复习导入)一般地,对于n 个数x 1,x 2,…,x n ,我们把n n x x x n +++...21叫做这n个数的算术平均数,简称平均数。
平均数常用于表示一组数据的平均水平。
计算平均数时,所有数据都参加运算,它能充分利用数据所描述的信息,因此在生活中较为常见,但它易受端点值的影响。
一般地,n 个数根据大小顺序排列后,处于中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数。
由中位数的定义可知,当数据的个数是奇数时最中间的一个数据是中位数;当数据的个数是偶数时,则最中间两个数据的平均数是中位数.中位数受端点值的影响小,但不能充分利用所有数据的信息.众数则是一组数据中出现次数最多的那个数据.为了避开以上缺点,今天学习——茎叶图.因为所有信息都可以从茎叶图中得到体现。
设计思路二:(事例导入)某篮球运动员某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.如何分析该运动员的整体水平及发挥的稳定程度?推进新课新知探究除了前几天学的图、表以及上面的各种数能帮助我们分析数据外,统计中还有一种用来表示数据的茎叶图(stem and leaf display).顾名思义,茎是指中间的一列数,叶就是指从茎的两旁生长出来的数,中间的数字表示得分的十位数,旁边的数字分别表示两名运动员得分的个位数,像这样用来表示数据,帮助我们理解样本数据的图,我们称为茎叶图.制作茎叶图的方法是:当所给数据为一位数时,可将0作为茎叶较长的茎,而它本身作为叶;当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”;当所给的数据为三位数时,可将百位和十位作为“茎”,而个位数字作为“叶”.茎相同的数据共用一个茎,茎按从小到大的顺序从上到下排列,共用茎的叶一般要按从大到小(也可以从小到大)的顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开,竖线的左边是茎,右边是叶。
茎叶图
高中数学新课程中茎叶图的考点茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。
通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。
公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。
(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。
并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。
茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。
如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。
通过此操作,很容易求出各个数据段的频率分布或频率百分比。
下面我们通过几个例子来阐述上述问题。
例1右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图。
其中左边两位数字从左到右的分别表示学生身高的百位数字和十位数字, 15 5 5 7 8 右边的数字表示学生身高的个位数字,从图中可以得到这10个同学 16 1 3 3 5身高的中位数是() 17 1 2A.161cm B. 162cm C.163cm D.164cm解析:15 ∣5表示身高155cm。
这10个数字分别是:155cm、155cm、157cm、158cm、161cm、163cm、163cm、165cm、171cm、172cm。
所以中位数为 =162cm。
评注:由样本数据来求样本的中位数,一般先将所有的数据按从小到大排序。
若个数为奇数则取正中间一个,若个数为偶数,则取中间两个数的平均值。
茎叶图的优点就是对数据不需要排序,可以快速的求出统计量。
例2某中学高一(1)班中段考试数学成绩的茎叶图如右图所示,那么优秀率(90分以上)和最低分分别是() 5 1235A.15%,15B.15%,51 6 023*******C.10%,51D.10%,15 7 122345556677898 023367789 1245解析:我们可以将茎叶图转化为样本数据,可以知道最低分为51分。
2019艺体生文化课-数学(文科)第十章 第2节 频率直方图、2x2列联表、茎叶图、线性回归方程、相关关系
(ti t)2
i 1
【解析】 (1)由折线图中数据和附注中参考数据得t 4,
7
7
(ti t)2 28, ( yi y)2 0.55.
i 1
i 1
7
7
7
(ti t)( yi y) ti yi t yi 40.17 4 9.32 2.89,
3.求方差公式:S 2
1 n [(x1
x)2
( x2
x)2
( x3
x)2
...
( xn
x)2 ].
频率分布直方图中求方差的参考公式: S 2 (x1 x)2 f1 (x2 x)2 f2 (x3 x)2 f3 ... (xn x)2 fn (其中x1,x2,…,xn取各分段的中间值)
考点2:2×2列联表 【例2】 为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对 30名六年级学生进行了问卷调查得到如下2×2列联表:平均每天 喝500ml以上为常喝,体重超过50kg为肥胖.
常喝 不常喝 合计
肥胖
6
2
8
不肥胖
4
18
22
合计
10
20
30
已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为
9.32 7
1.331及(1)得
b
(ti
i 1 n
t)( yi y) (ti t)2
2.89 28
0.103,
i 1
a
y
b
t
1.331
频率分布直方图、茎叶图
例 某市政府为了节约生活用水,计划在本市试 行居民生活用水定额管理,即确定一个居民月用水 量标准a ,用水量不超过a的部分按平价收费,超过 a的部分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?
取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表
五、画出频率分布直方图(纵轴表示频率/组距)
频率/组距
0.ห้องสมุดไป่ตู้0 0.40 0.30 0.20 0.10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
如果当地政府希望85%以上的居民每月的用水量不超出 标准,根据频率分布表和频率分布直方图,你能对制定 月用水量提出建议吗?
1)、列出频率分布表 2)、估计电子元件寿命在100h~400h以内的频率 3)、估计电子元件寿命在400h以上频率
课堂练习:
1、为检测某种产品的质量,抽取了一个容量为30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件.
(1) 列出样本的频率分布表; (2)根据上述结果,估计此种产品为二级品或三级品的概率 约是多少.
1
频率/ 组距
0.020 0.053 0.060 0.073 0.067 0.033 0.027
频率分布直方图如下: 频率/组距
0.070 0.060 0.050 0.040 0.030 0.020 0.010
12.5 15.5
例2、对某电子元件进行寿命跟踪调查,情况如下:
寿命(h) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30
茎叶图
高中数学新课程中茎叶图的考点茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。
通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。
公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。
(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。
并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。
茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。
如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。
通过此操作,很容易求出各个数据段的频率分布或频率百分比。
下面我们通过几个例子来阐述上述问题。
例1右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图。
其中左边两位数字从左到右的分别表示学生身高的百位数字和十位数字,15 5 5 7 8右边的数字表示学生身高的个位数字,从图中可以得到这10个同学16 1 3 3 5身高的中位数是()17 1 2A.161cm B. 162cm解析:15 ∣5表示身高155cm。
这10个数字分别是:155cm、155cm、157cm、158cm、161cm、163c m、163cm、165cm、171cm、172cm。
所以中位数为 =162cm。
评注:由样本数据来求样本的中位数,一般先将所有的数据按从小到大排序。
若个数为奇数则取正中间一个,若个数为偶数,则取中间两个数的平均值。
茎叶图的优点就是对数据不需要排序,可以快速的求出统计量。
例2某中学高一(1)班中段考试数学成绩的茎叶图如右图所示,那么优秀率(90分以上)和最低分分别是() 5 1235%,15 %,51 6 09%,51 %,15 7 98 023367789 1245解析:我们可以将茎叶图转化为样本数据,可以知道最低分为51分。
高考数学一轮复习第十一章统计与统计案例2用样本估计总体课件新人教A版2
;b.决定组距与
组数;c. 将数据分组
;d.列频率分布表;e.画频率分布直方
图.
-3知识梳理
双基自测
(3)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中
点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,
底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方
24
图如图所示,则在抽测的60株树木中,有
株树木的底部
周长小于100 cm.
解析 由题意知,在抽测的60株树木中,底部周长小于100 cm的株
数为(0.015+0.025)×10×60=24.
-11考点1
考点2
考点3
考点 1
组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体
在各个范围内取值的百分比,它能提供更加精细的信息.
(4)茎叶图:茎叶图中茎是指 中间 的一列数,叶是从茎的 旁边
生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,
它不但可以保留所有信息,而且可以随时记录,给数据的记录和表
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽
11
1
= ,
取比例为
25+15+10+5
5
所以月平均用电量在[220,240)的用户中应抽取25×
1
5 =5(户).
-14考点1
直方图和茎叶图
2.下面给出4个茎叶图
则数据6,23,12,13,27,35,37,38,51可以由图 ______表示.
【解析】选A.因为在40~49之间无数据,有数据51,
从而茎4无叶,茎5有叶为1.
5.某班25人的数学成绩茎叶图如下图所示, 则最高分为 ______,最低分为______,优秀
率(90分以上)为 ______.
为3∶2∶1,因此从身高在[140,150]内的学生
中选取的人数应为
18× 1 =3人.答案:0.030
6
3
50辆汽车经过某一段公路的时速记录如图所 示:
将其分成7组. (1)列出样本的频率分布表; (2)画出频率分布直方图以及频率分布折线图; 3)根据上述结果,估计汽车时速在哪组的几率最 大?
【解析】(1)由茎叶图,数据最大值为33,最小值为13,分 为7组,组距为3,则频率分布表为:
【解析】根据茎叶图中数据的排列规 律,分析数据,可得最高分为91,最
1 低分为51,优秀率为 =4%. 25
答案:91
51
4%
6.(2010·福州高一检测)甲、乙两个小组各10 名学生的英语口语测试成绩如下(单位:分): 甲组:76 83 乙组:82 74 84 85 89 79 80 91 89 79 90 84 86 81 87 86 82 85
【例】有关部门从甲、乙两个城市所有的自动售货 机中分别随机抽取16台,记录某天上午各自的销售 情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25, 58,14,18,30,41; 乙:22,31,32,42,20,27,48,23,38,43,
12,34,18,10,34,23.
1)请作出这两组数据的茎叶图;2)将这两组数据
茎叶图
17 ,超过 50%,说明该市空气质量有待进一步改善。 30
5 300
41 51 61 71 81 91 101 111 空气污染指 数
(Ⅲ)答对下述两条中的一条即可: (1) 该市一个月中空气污染指数有 2 天处于优的水平,占当月天数的
1 ,有 26 天处于良的水平,占当 15
13 14 月天数的 ,处于优或良的天数共有 28 天,占当月天数的 。说明该市空气质量基本良好。 15 15 1 轻微污染有 2 天,占当月天数的 。污染指数在 80 以上的接近轻微污染的天数有 15 天,加上处于轻微 15
.解:(1)频率分1,71) [71,81) [81,91) [91,101) [101,111) 频数 2 1 4 6 10 5 2 频率 2 30 1 30 4 30 6 30 10 30 5 30 2 30
(2)频率分布直方图
10 300
频率/组距
注: 1、重复出现的数据要重复记录,不能遗 漏;特别是“叶”部分;
2、所有的信息都可以从这个茎叶图中得到; 3、茎叶图便于记录和表示;
4、不足的是其分析只是粗略的,对差异不 大的两组数据不易分析;表示三位数以上 的数据时不够方便;
例:甲、乙两篮球运动员上赛季每场比赛 的得分如下,试比较这两位运动员的得分 水平:
茎叶图
知识回顾
频率分布直方图
注意 1.纵轴 :频率/组距 2.小长方形面积表示频率
1.求极差 2.决定组距与组数
步骤
3.将数据分组
4.列频率分布表 5.画频率分布直方图
3.小长方形的面积之和为1
我们将样本的数据有条理的列出来,从中观察数据 的分布情况,这种方法就是茎叶图。 制作茎叶图的方法 将所有两位数的十位数字作为“茎”,个位数字作 为“叶”,茎相同者共用一个茎,茎按从小到大的 顺序从上向下列出,共茎的叶依次在同一行列出。
频率分布直方图与茎叶图..
(1)极差为67-28=39,取组距为5,分为8 组. 样本频率分布表:
分 组 频数 频率 [27,32) 3 0.06 [32,37) 3 0.06 [37,42) 9 0.18 [42,47) 16 0.32 [47,52) 7 0.14 [52,57) 5 0.10 [57,62) 4 0.08 [62,67] 3 0.06 合 计 50 1.00
合计
频数
4 8 15 22 25 15 5 4 2 100
频率
0.04
0.08 0.15
0.22 0.25 0.15
0.05 0.04 0.02
1
组距=0.5
频率/组距 0.08 0.16 0.3 0.44 0.5 0.3 0.1 0.08 0.04 2.00
第 频率/组距 (组距=0.5) 五 步: 0.6
出总体上在20—60元之间其 0.024
频率分布直方图如右图所示 0.01
,为具体了解同学们购买课
外读物的具体情况,按支出 的情况进行分层抽样,抽出
元 20 30 40 50 60
一个容量为100的样本进行分
析,其中支出在 [50,60)
元的同学应抽取 30 人。
课堂测试:
例1.关于频率分布直方图中小长方形的高说法,
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67
年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
理论迁移 2 频率
某校共有5000名学生,该校 组距 学生每月课外读物方面的支 0.036
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
极差 4.1 组数= 8.2 组距 0.5
所以将数据分成9组较合适. 第三步: 将数据分组:( 给出组的界限) [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.
第四步: 列频率分布表.
(包括分组、频数、频率、频率/组距)
组距=0.5
分组 [0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5) 合计
(2)解:如图:茎为成绩的整环数,叶为小数点后的数字
甲
乙
8
5 7
2 4 4
7
8
1 5 1 1 7 1 1 2 7 8
9
10
8
7
5
1
(2)乙成绩大致对称,甲成绩的中位数为9.05, 乙成绩的中位数为9.15,所以乙成绩较甲好,乙成绩较集中 于峰值,甲成绩分散所以乙发挥的稳定性好,甲波动大。
小结:
1.不易知一个总体的分布情况时,往往从总体中 抽取一个样本,用样本的频率分布去估计总体的 频率分布,样本容量越大,估计就越精确. 2. 目前有:频率分布表、直方图、茎叶图. 3.当总体中的个体取值很少时,用茎叶图估计总 体的分布;当总体中的个体取值较多时,将样本 数据恰当分组,用各组的频率分布描述总体的分 布,方法是用频率分布表或频率分布直方图。
当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距
月均用 水量/t
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
思考
1.对于任何一个总体,它的密度曲线是不是一定存在?它 的密度曲线是否可以被非常准确地画出来? 2.图中阴影部分的面积表示什么?
1.实际上,尽管有些总体密度曲线是客观存在 的,但一般很难想函数图象那样准确地画出来, 我们只能用样本的频率分布对它进行估计,一 般来说,样本容量越大,这种估计就越精确
二、茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一 个有效数字,两边的数字表示个位数,即第二个有效数字,它 的中间部分像植物的茎,两边部分像植物茎上长出来的叶子, 因此通常把这样的图叫做茎叶图
频率分布直方图如下:
频率 组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 0.5 月均用水量 /t 4.5
1 1.5 2 2.5 3
3.5 4
思考:上例的样本容量为100,如果增至1000,其频率分布直方
图的情况会有什么变化(组距和组数)?假如增至10000呢?
茎 叶 0 8 1 345 2 36 8 3 389 4 5 1
阅读70页最后一段,说出茎叶图的 优缺点?
茎叶图的特征:
两个优点: 一是:没有原始数据信息的损失; 二是:茎叶图中的数据可以随时记录,随时添 加,方便记录与表示。 三个局限: 一是:只便于表示两位有效数字的数据; 二是:茎叶图只方便记录两组的数据; 三是:数据量不能太大
思考:从频率分布直方图中,你能得到任意 区间(a,b)的频率?有什么困难?
一、频率分布折线图与概率密度曲线
频率/组距 (取组距中点, 并连线 )
0.6
0.5
0.4
0.44
0.5
0.3
0.2
0.16
0.3
0.3
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频数 4 8 15 22 25 15 5 4 2 100
频率
0.04
0.08 0.15 0.22 0.25 0.15 0.05 0.04 0.02 1
频率/组距 0.08
0.16
0.3 0.44 0.5 0.3
0.1 0.08 0.04 2.00
第 五 步: 画 出 频 率 分 布 直 方 图.
频率/组距 (组距=0.5)
甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好, 另,乙的叶较甲的更集中,所以乙较甲发挥更稳定。
画茎叶图要注意什么:
1.将每个数据分为茎(高位)和叶(低位) 两部分,在此例中,茎为十位上的数字, 叶为个位上的数字; 2.将最小茎和最大茎之间的数按大小 次序排成一列,写在左(右)侧; 3.将各个数据的叶按大小次序 写在其茎右(左)侧.
总体密度曲线:
在样本频率分布直方图中,当样本容量增加,作图时所 分的组数增加,组距减少,相应的频率折线图会越来越 接近于一条光滑曲线,统计中称这条光滑曲线为总体密 度曲线. 它能够精确地反映了总体在各个范围内取值的 百分比,它能给我们提供更加精细的信息. 频率
组距
0
a
b
月均用水量/t
总体密度曲线
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表: 分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67] 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
合作探究 :茎叶图
(一种被用来表示数据的图)
例: 甲乙两人比赛得分记录如下: 甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,说明哪一个成绩好.
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
理论迁移
2
频率 组距
某校共有5000名学生,该校 0.036 学生每月课外读物方面的支 出总体上在20—60元之间其 0.024 频率分布直方图如右图所示 0.01 ,为具体了解同学们购买课 外读物的具体情况,按支出 的情况进行分层抽样,抽出 一个容量为100的样本进行分 析,其中支出在 [50,60 ) 元的同学应抽取 30 人。
频数 2 11 13 4 茎 10 11 12 13 叶 7, 8 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 4, 2, 3, 0
练习2:
某次运动会甲乙两名射击运动员的成绩(环数) 如下: 甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7, 7.2,7.8,10.8 乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2, 10.1,9.1 (1)用茎叶图表示甲乙的成绩 (2)根据茎叶图分析甲乙的成绩
0.6
0.5 0.5请大家阅读第 0.44 67页,直方图有 0.4 哪些优点和缺 0.3 0.3 0.3 点?
小长方形的面 月均用水量最 多的在哪个区 积总和 积=?=? 间?
0.2
0.16
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布 的总体趋势。 从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据信 息就被抹掉了。
练习1:
下表一组数据是某车间30名工人加工零件的个数, 设计一个 茎叶图表示这组数据,并说明这一车间的生产情况.
134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112
用样本的频率分布估计总体分布
衡阳县六中高一年级 刘碧华
用样本的频率分布估计总体分布 一 频率分布图和频率分布直方图
二 频率分布折线图 和总体密度曲线
三
莖叶图
理论迁移
1
某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比 例约是多少.
甲
8 4, 6, 3 3, 6, 8 3, 8, 9 1 0 1 2 3 4 5
乙
2, 5, 1, 4, 0
5 4 6, 1, 6, 7, 9 9
叶
茎
叶
甲 8 4 6 3 3 6 8 0 1 2 2 5
乙
5 4
3 8 9
3
4
1 6 1 6 7 9
4 0 9
1
5
主要从对称性,中位数(体现成绩好坏), 稳定性(即集中程度)来分析 分析:甲得分除51分外大致对称,乙基本上也对称。
频率
组距
0
a
b
月均用水量/t