高三数学(人教版)第一轮复习单元讲座 第19讲 用样本估计总体及线性相关关系
人教版高中数学高考一轮复习--用样本估计总体(课件)
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
人教版高三数学一轮复习精品课件5:11.2 用样本估计总体
1.了解分布的意义与作用,会列频率分布表、会画频率分布直 方图、频率折线图、茎叶图,理解它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(如平均数、标准差),并 作出合理的解释.
高三一轮总复习 ·新课标 ·数学
限时规范特训
路漫漫其修远兮,吾将上下而求索!
第十一章 第2讲
第3页
1 条重要规律——方差和标准差刻画样本数据的分散程度 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、 方差越大,数据的离散程度越大,标准差、方差越小,数据的离 散程度越小. 2 个必会比较——频率分布直方图与茎叶图的优点和缺点 (1) 频率分布直方图: 优点:频率分布直方图能够很容易地表示大量数据,非常直观地 表明分布的规律.
考点 2 样本的数字特征
[判一判] 判断下列说法是否正确(在括号内填“√”或“× ”). (1)平均数、众数与中位数从不同的角度描述了一组数据的集 中趋势.(√) (2)一组数据的平均数一定大于这组数据中的每个数据.(×) (3)一组数据的方差越大,说明这组数据的波动越大.(√) (4)一组数据的众数可以是一个或几个,那么中位数也具有相 同的结论.(×)
抓住2个必备考点 突破3个热点考向 破译5类高考密码 迎战2年高考模拟
君不见,黄河之水天上来,奔流到海不复回。 君不见,高堂明镜悲白发,朝如青丝暮成雪。 人生得意须尽欢,莫使金樽空对月。 天生我材必有用,千金散尽还复来。 烹羊宰牛且为乐,会须一饮三百杯。 岑夫子,丹丘生,将进酒,杯莫停。 与君歌一曲,请君为我倾耳听。 钟鼓馔玉不足贵,但愿长醉不复醒。 古来圣贤皆寂寞,惟有饮者留其名。 陈王昔时宴平乐,斗酒十千恣欢谑。 主人何为言少钱,径须沽取对君酌。 五花马,千金裘,呼儿将出换美酒,与尔同销万古愁
高考数学第一轮知识点总复习 第二节 用样本估计总体
平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
高考数学一轮复习 第2节 用样本估计总体课件
0.18.则样本数据在区间[10,12)内的频数为36. [答案] B
本例条件不变,问: (1)样本数据的众数约为多少? (2)样本数据的平均数是多少? 解:(1)众数应为最高矩形的中点对应的横坐标,故应为9. (2)平均数为3×0.02×2+5×0.05×2+7×0.15×2+ 9×0.19×2+0.09×11×2=8.12.
答案:A
3.某部门计划对某路段进行限速,为调查限速60 km/h
是否合理,对通过该路段的300辆汽车的车速进行检 测,将所得数据按[40,50),[50,60),[60,70),[70,80] 分组,绘制成如图所示的频率分布直方图.则这300 辆汽车中车速低于限速的汽车有 ( )
A.75辆
B.120辆
中位数
直方图的面积应该 相等 .
数字特征 平均数
定义 样本数据的算术平均数.即 1 (x1+x2+„+xn) n x= .
1 2 2 2 [( x - x ) + ( x - x ) +„+ ( x - x ) ]. 1 2 n 2 s =n
方差
其中s为标准差.
1.一个容量为32的样本,已知某组样本的频率为0.375, 则该组样本的频数为 A.4 C.12 B.8 D.16 ( )
解析:频数=32×0.375=12.
答案: C
2.(教材习题改编)某同学进入高三后,
4次月考的数学成绩的茎叶图如图,
11
4 8
12 6 13 2
则该同学数学成绩的平均分是(
A.125 C.45 B.122.25 D.129.5
)
114+126+128+132 解析:由茎叶图知平均值为 =125, 4
第 九 章 统 计、 统 计 案 例 及 算 法 初 步
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
高三数学第一轮复习单元讲座第19讲用样本估计总体及线性相关关系
高三新数学第一轮复习第十九讲—用样本估计总体及线性相关关系一.知识整合:1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
2.频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图: 具体做法如下:(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图。
注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:bx a y+=ˆ。
其中2121121)())((xn x yx n yx x x y y x xb n i i ni ii ni i ni i i--=---=∑∑∑∑====,x b y a -=。
高考数学一轮总复习课件:随机抽样、用样本估计总体
6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )
(人教A版)高考数学一轮复习精品学案:用样本估计总体及线性相关关系
2019年高考数学一轮复习精品学案(人教版A 版)用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识. 2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布.预测2019年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=n i i x x n S 叫做这n 个数据方差;同时=s )(11∑=-ni i x x n 叫做这n 个数据的标准差。
2024年高考数学一轮复习(新高考版)《用样本估计总体》课件ppt
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × ) (2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,
方差不变.( √ )
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.
题型三 总体离散程度的估计
例3 (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新 设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产 了10件产品,得到各件产品该项指标数据如下.
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5 旧设备和新设备生产产品的该项指标的样本平均数分别记为 x 和 y ,样 本方差分别记为 s21和 s22. (1)求 x , y ,s21,s22;
∴x=190. 故a=0.025 0,众数为190,中位数为190.
(2)若树苗高度在185 cm及以上是可以移栽的合格树苗.从样本中用比例分 配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格 树苗分别应抽取多少株?
由题意可知,合格树苗所占频率为(0.030 0+0.025 0+0.008 0+0.002 0) ×10=0.65,不合格树苗所占频 率为1-0.65=0.35, 所以不合格树苗抽取20×0.35= 7(株),合格树苗抽取20×0.65= 13(株), 故不合格树苗、合格树苗应分别 抽取7株和13株.
数为
A.102
√ B.103
C.109.5 D.116
高三数学第一轮复习 用样本估计总体与向量间的相关性图课件 新人教B版
∑ (x - x)(y
i
n
i
- y)
2
∑x
- nx
2
=
i =1
∑ (x - x)
i i =1
n
,
7.使离差平方和Q= 法叫做最小二乘法.
∑ (y
i =1
2 为 a bx ) i i
最小
的方
返回目录
考点1
绘制频率分布直方图
[2010年高考安徽卷]某市2010年4月1日—4月30 日对空气污染指数的监测数据如下(主要污染物为可 吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,9 1,77,86,81,83,82,82,64,79,86,85,75,71,49,45. 返回目录
频率
2 30 1 30 4 30 6 30 10 30 5 30 2 30
[41,51)
[51,61)
2
1
[61,71)
[71,81) [81,91) [91,101) [101,111)
4
6 10 5 2
返回目录
(2)频率分布直方图如图所示.
返回目录
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当 1 月天数的 15 ; 有26天处于良的水平,占当月天数 3 4 的 15 ;处于优或良的天数为28,占当月天数的 .说明 15 该市空气质量基本良好.
1 ②轻微污染有2天,占当月天数的 ;污染指数在80以上 15
的接近轻微污染的天数15,加上处于轻微污染的天数17, 17 占当月天数的 ,超过50%;说明该市空气质量有待 30 进一步改善.
高考数学一轮复习 用样本估计总体课件
C. 3
D. 4
解析:四种说法都正确,甲队的平均进球数多于乙队,故
第一句正确;乙队标准差较小,说明技术水平稳定;甲队
平均进球数是3.2,但其标准差却是3,离散程度较大,由
此可判断甲队表现不稳定;平均进球数是1.8,标准差只有
0.3,每场的进球数相差不多,可见乙队的确很少不进球. 答案:D
4.如图是某兴趣小组学生在一次数学测验中 的得分茎叶图,则该组男生的平均得分与
图的一部分(如下图),已知从左到右前5个小组的频率分别 为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.
(1)请将频率分布直方图补充完整;
(2)该校参加这次铅球测试的男生有多少人?
(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球 测试的成绩的合格率; (4)在这次测试中,你能确定该校参加测试的男生铅球成 绩的众数和中位数各落在哪个小组内吗?
(3)频率分布表和频率分布直方图是一组数据频率分布的两 种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标. (5)中位数为平分频率分布直方图面积且垂直于横轴的直线 与横轴交点的横坐标.
为了了解某校初中毕业男生的体能状况,从该校 初中毕业班学生中抽取若干名男生进行铅球测试,把所得
数据(精确到0.1米)进行整理后,分成6组画出频率分布直方
[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=
∴乙稳定.
答案:乙
频率分布直方图反映样本的频率分布:
(1)频率分布直方图中横坐标表示组距,纵坐标表示
频率=组距×
,
(2)频率分布直方图中各小长方形的面积之和为1,因此在 频率分布直方图中组距是一个固定值,所以各小长方形高 的比也就是频率比.
高中数学必修3用样本估计总体(高三第一轮复习)PPT
● [规律方法] ● (1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征. ● (2)中位数是样本数据居中的数. ● (3)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分散,
标准差、方差越小,数据越集中.
●
[跟踪训练]
●
3.(2012·山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,
样本的数字特征 [典题导入]
(1)(2012·江西高考)样本(x1,x2,…,xn)的平均数为-x ,
样本(y1,y2,…,ym)的平均数为-y (-x ≠-y ).若样本(x1,x2,…, xn,y1,y2,…,ym)的平均数-z =α-x +(1-α)-y ,其中 0<α<12,则
n,m 的大小关系为
(2)(0.003 6+0.006 0+0.004 4)×50×100=70.
答案 (1)0.004 4 (2)70
茎叶图的应用
● [典题导入]
●
(2012·陕西高考)从甲、乙两个城市分别随机抽取16台
自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图
所示).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别 为m甲、m乙,则
● [跟踪训练]
● 1.(2013·湖北高考)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至 350度之间,频率分布直方图如图所示.
(1)直方图中x的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的 户数为________.
解析 (1)根据频率和为1,得(0.002 4+0.003 6+ 0.006 0+x+0.002 4+0.001 2)×50=1,解得x= 0.004 4;
高三数学第一轮复习课件(ppt)目录
第一章
集合与常用逻辑用语
1.1 集合的概念与运算 1.2 命题及其关系、充分条件与必要条件 1.3 简单的逻辑联结词、全称量词与存在量词
目录 CONTENTS
第二章
函数
2.1 函数及其表示 2.2 函数的单调性与最值 2.3 函数的奇偶性与周期性 2.4 一次函数、二次函数 2.5 指数与指数函数 2.6 对数与对数函数 2.7 幂函数 2.8 函数的图象及其变换 2.9 函数与方程 2.10 函数模型及其应用
12.1 算法与程序框图 12.2 基本算法语句 12.3 合情推理与演绎推理 12.4 直接证明与间接证明 12.5 数学归纳法 12.6 数系的扩充与复数的引入
目录 CONTENTS
选修4系列
选修4-1 几何证明选讲(选考) 选修4-4 坐标系与参数方程(选考) 选修4-5 不等式选讲(必考)
目录 CONTENTS
第十一章
概率与统计
11.1 事件与概率 11.2 古典概型与几何概型 11.3 离散型随机变量及其分布列 11.4 二项分布及其应用 11.5 离散型随机变量的均值与方差、正态分布 11.6 随机抽样与用样本估计总体 11.7 变量间的相关关系
目录 CONTENTS
第十二章 算法初步、推理与证明、复数
目录 CONTENT第S五章
平面向量
5.1 平面向量的概念及其线性运算
5.2 平面向量的基本定理及坐标运算
5.3 平面向量的数量积及其应用
第六章
数列
6.1 数列的概念与简单表示法 6.2 等差数列及其前n项和 6.3 等比数列及其前n项和 6.4 数列的通项与求和 6.5 数列的综合应用
目录 CONTENTS
高三数学一轮复习讲义(用样本估计总体)学生
课题:用样本估计总体知识点一、频率分布直方图1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的特征数估计总体的特征数.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线 (1)频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2)总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.3.作频率分布直方图的步骤:(1)作出频率分布表:①求极差(即一组数据中最大值与最小值得差)②决定组距和组数:绘制频数分布表和频数分布直方图时要将一批数据分组,•组距和组数的确定没有固定的标准,通常数据越多,所分的组数也越多,当数据在100个以内时,•根据数据的多少常分成5─12组.一般地,所分的小组里含最小值,不含最大值,•即数据x 满足a ≤x<b(2)建立直角坐标系:X 轴为组距;Y 轴为频率/组距4.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.【典型例题】【例1】(2023·全国·高三专题练习)某校1000名学生参加数学竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( ) A .频率分布直方图中aB .估计这20名学生数学考试成绩的第60百分位数为80C .估计这20名学生数学考试成绩的众数为80D .估计总体中成绩落在[50,60)内的学生人数为110【例2】(2022·天津滨海新·模拟预测)某品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,销售额都在区间[5,25](单位:百万元)内,将其分成5组:[5,9),[9,13,[13,17),[17,21),[21,25],并整理得到如下的频率分布直方图,下列说法正确的是( ) A .频率分布直方图中aB .估计全部销售员工销售额的中位数为15C .估计全部销售员工中销售额在区间[9,13内有64人D .估计全部销售员工销售额的第75百分位数为17【例3】(2022·全国·模拟预测)(多选)某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,分别从不同地铁站点随机抽取1000名市民对该项目进行评分,统计发现评分均在[]40,100内,把评分分成[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[]90,100六组,并绘制成频率分布直方图(如图所示).则下列判断正确的是( ) A .图中aB .该次满意度评分的平均分为85C .该次满意度评分的众数为85D .大约有34%的市民满意度评分在[)60,80内【例4】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a ,b 的值;【举一反三】1.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a =_________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.2.(2022·全国·高三专题练习)某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92. (1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.知识点二、茎叶图茎叶图:定义是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数画法对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎优缺点用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便【典型例题】【例1】为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h ),试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 服用B 药的20位患者日平均增加的睡眠时间: (1)作出茎叶图;(2)从茎叶图看,哪种药的疗效更好?A 药B 药 0. 1. 2.3.【例2】某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则x y +的值为( ) A .9 B .10 C .11 D .13【举一反三】1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I 所示;若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为( )A 、3B 、4C 、5D 、6 2.某车间20名工人年龄数据如下表:年龄(岁) 工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20知识三、用样本的数字特征估计总体的数字特征1.用样本的特征数估计总体的特征数 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即12n 1(x +x +...+x )x n=. 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 样本方差2222121[()()...()]n s x x x x x x n=-+-++- 标准差222121[()()...()]n s x x x x x x n=-+-++-其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.2.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.3.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.4.平均数与方差都是重要的特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,掌握公式不难求出,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【典型例题】【例1】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( ) A .46,45,56 B .46,45,53 C .47,45,56 D .45,47,53【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[)00.50.5,1⋅⋅⋅,,,[]4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.请说明理由;(3)估计居民月均用水量的中位数.【举一反三】1.某市高三学生数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为_____.2.(2022·新疆克拉玛依·三模(文))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a 的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.【课堂巩固】1.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) A .众数 B .平均数 C .中位数 D .标准差2.某班学生一次数学考试成绩频率分布直方图如图所示,数据分组依次为]150,130[),130,110[),110,90[),90,70[,若成绩大于等于90分的人数为36,则成绩在)130,110[的人数为()A.12B.9C.15D.183.为了研究某药物的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.184.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为.【课后练习】正确率:__________1.某学校高一、高二、高三年级的学生人数之比为4:3:3,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则从高二年级抽取的学生人数为()A.15 B.20 C.25 D.302.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析。
高考数学一轮复习 热点难点精讲精析 10.2用样本估计总体与变量间的相关关系
高考一轮复习热点难点精讲精析:10.2用样本估计总体与变量间的相关关系一、用样本估计总体(一)频率分布直方图在总体估计中的应用※相关链接※频率分布直方图反映样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.※例题解析※〖例〗为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学生全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.思路解析:利用面积求得每组的频率→求样本容量→求频率和→求达标率→分析中位数.解答:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88,则高一学生的达标率为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.注:利用样本的频率分布可近似地估计总体的分布,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表和频率分布直方图,充分利用所给的数据正确地作出估计.(二)用样本的分布估计总体※相关链接※茎叶图刻画数据的优点(1)所有的数据信息都可以从茎叶图中得到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.注:当数据是两位有效数字时,用茎叶图显得容易、方便.而当样本数据较大和较多时,用茎叶图表示,就显得不太方便.※例题解析※〖例〗在某电脑杂志的一篇目文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?思路解析:(1)将十位数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得到结论.解答:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在10~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为读物须通俗易懂、简明.(三)用样本的数字特征估计总体的数字特征〖例〗甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.思路解析:(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解答:(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.2222222222221013121416==1351314121214==1351=[(1013)(1313)(1213)(1413)(1613)]451[(1313)(1413)(1213)(1213)(1413)]0.85x x s s ++++++++-+-+-+-+-==-+-+-+-+-=甲乙甲乙,(2)由2s 甲>2s 乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.注:(1)运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定.(2)平均数与方差都是重要的数字特征,是对总体的一种简单的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(3)平均数、方差的公式推广①若数据123,,,,n x x x x 的平均数为x ,那么12,,,n mx a mx a mx a +++的平均数是mx a +. ②数据123,,,,n x x x x 的方差为2s . a.22222111[()];n s x x x nx n=+++- b.数据12,,,n x a x a x a +++的方差也为2s ; c.数据12,,,n ax ax ax 的方差为22a s .二、变量间的相关关系(一)利用散点图判断两个变量的相关关系※相关链接※1.散点图在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.注:函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.2.正相关、负相关从散点图可知,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.如年龄的值由小变大时,体内脂肪含量也在由小变大.反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.※例题解析※〖例〗在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系。
高考数学二轮练习学案:第19讲用样本估计总体及线性相关关系
2019 年高考数学二轮练习优选教学设计:第 19 讲用样本估计整体及线性有关关系注意事项:仔细阅读理解,结合历年的真题,总结经验,查找不足!重在审题,多思虑,多理解!不论是单项选择、多项选择仍是阐述题,最重要的就是看清题意。
在阐述题中,问题大多拥有委婉性,特别是历年真题部分,在给考生较大发挥空间的同时也大大增加了考试难度。
考生要仔细阅读题目中供应的有限资料,明确观察要点,最大限度的挖掘资料中的有效信息,建议考生答题时用笔将要点勾勒出来,方便屡次细读。
只有经过仔细商酌,推测命题老师的妄图,积极联想知识点,剖析答题角度,才能够将考点锁定,明确题意。
第 19 讲用样本估计整体及线性有关关系一、课标要求:1、用样本估计整体①经过实例领悟散布的意义和作用,在表示样本数据的过程中,学会列频次散布表、画频次散布直方图、频次折线图、茎叶图,领悟他们各自的特点;②经过实例理解样本数据标准差的意义和作用,学会计算数据标准差;③能依照实责问题的需求合理地采纳样本,从样本数据中提取基本的数字特点〔如平均数、标准差〕,并作出合理的讲解;④在解决统计问题的过程中,进一步领悟用样本估计整体的思想,会用样本的频次散布估计整体散布,会用样本的基本数字特点估计整体的基本数字特点;初步领悟样本频次散布和数字特点的随机性;⑤会用随机抽样的基本方法和样本估计整体的思想,解决一些简单的实责问题;能经过对数据的剖析为合理的决议供应一些依照,认识统计的作用,领悟统计思想与确定性思想的差别;⑥形成对数据办理过程进行初步谈论的意识。
2、变量的有关性①经过收集现实问题中两个有关系变量的数据作出散点图,并利用散点图直观认识变量间的有关关系;②经历用不同样估计方法描绘两个变量线性有关的过程。
知道最小二乘法的思想,能依照给出的线性回归方程系数公式成立线性回归方程。
“统计”是在初中“统计初步” 基础上的深入和扩展,本讲主要会用样本的频次散布估计整体的散布,并会用样本的特点来估计整体的散布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
普通高中课程标准实验教科书—数学 [人教版]高三新数学第一轮复习教案(讲座19)—用样本估计总体及线性相关关系一.课标要求:1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差;③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识。
2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二.命题走向“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
预测2007年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.要点精讲1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
2.频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图: 具体做法如下:(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图。
注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:bx a y+=ˆ。
其中2121121)())((xn xy x n yx x xy y x xb ni ini ii ni ini i i--=---=∑∑∑∑====,x b y a -=。
我们称这个方程为y 对x 的回归直线方程。
四.典例解析 题型1:数字特征例1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.解析: (1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20。
(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米)。
20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是21(9+10)=9.5(米)。
样本平均数4.9)112311610495817(201=⨯+⨯+⨯+⨯+⨯+⨯=x (米) 所以,估计这批手榴弹的平均杀伤半径约为9.4米。
点评:(1)根据总体、个体、样本、样本容量的概念答题.要注意:总体、个体和样本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径。
(2)读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平均杀伤半径.另外在这里要会简便计算有多个重复数据的样本的平均数。
例2.为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:0.6 3.7 2.2 1.5 2.8 1.7 1.2 2.1 3.2 1.0(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);(3)在(2)的条件下,若生产一套学生桌椅需木材0.07m 3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。
计算中需用的有关数据为:每盒筷子100双,每双筷子的质量为5g ,所用木材的密度为0.5×103kg/m 3;(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。
解析:(1)0.2)0.12.31.22.17.18.25.12.27.36.0(101=+++++++++=x 所以,该县1999年消耗一次性筷子为2×600×350=420000(盒)。
(2)设平均每年增长的百分率为X ,则2(1+X )2=2.42, 解得X 1=0.1=10%,X 2=-2.1(不合题意,舍去)。
所以,平均每年增长的百分率为10%; (3)可以生产学生桌椅套数为726007.0105.035060010042.2005.03=⨯⨯⨯⨯⨯⨯(套)。
(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.点评:本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解决问题.对于第(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题的解.对于第(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法来解.对于第(3)小题,用到了物理公式m =ρv , 体现了各学科知识之间的联系,让学生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题.第(4)小题只要能够运用随机抽样方法,能体会到用样本估计总体的统计思想就可解决,在文字表述上要注意简洁、明了、正确。
题型2:数字特征的应用例3.(2002年全国高考天津文科卷(15))甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t / hm 2)其中产量比较稳定的小麦品种是 甲 。
解析:x ¯甲 = 1 ( 9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,x ¯乙 = 1 ( 9.4 + 10.3 + 10.8 + 9.7 + 9.8)= 10.0;s 2甲 = 1 ( 9.82 + … + 10.22) – 102 = 0.02,s 2甲 = 1 ( 9.42 + … + 9.82) – 102 = 0.244 >0.02 。
点评:方差与平均数在反映样本的特征上一定要区分开。
例4.(2005江苏7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下: 9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(A )9.4, 0.484 (B )9.4, 0.016 (C )9.5, 0.04 (D )9.5, 0.016 答案:D ; 解析:7个数据中去掉一个最高分和一个最低分后,余下的5个数为:9.4, 9.4, 9.6, 9.4, 9.5。
则平均数为:5.946.955.94.96.94.94.9≈=++++=x ,即5.9=x 。
方差为:016.0])5.95.9()5.94.9()5.94.9[(512222=-+⋅⋅⋅+-+-=s 即 016.02=s ,故选D 。
点评:一定要根据实际的题意解决问题,并还原实际情景。
题型3:频率分布直方图与条形图例5.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.(1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少 解析:(1)样本的频率分布表为产品 频数 频率 一级晶 5 0.17 二级晶 8 0.27 三级晶 13 0.43 次品40.13(2)样本频率分布的条形图为:(3)此种产品为二极品或三极品的概率约为0.27+0.43=0.7。
点评:条形图中纵坐标一般是频数或频率。
例6.(2006重庆理,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是(A)20 (B)30(C)40 (D)50答案:C;解析:根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40。
点评:熟悉频率、频数、组距间的关系式。
例7.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)(1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率。