高中数学新课标人教A版必修三《总体特征数之方差》1学案
[精品]新人教A版必修三高中数学第二章2.2.2用样本的数字特征估计总体的数字特征导学案
2.22 用样本的数字特征估计总体的数字特征1.掌握众数、中位数、平均数、标准差、方差的定义和特征.2.会求众数、中位数、平均数、标准差、方差,并能用之解决有关问题.1.众数(1)定义:一组数据中出现次数的数称为这组数据的众数.(2)特征:一组数据中的众数可能个,也可能没有,反映了该组数据的.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.【做一做1】 数据组8,-1,0,4,17,4,3的众数是. 2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是的,反映了该组数据的.在频率分布直方图中,中位数左边和右边的直方图的面积.中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.【做一做2】数据组-5,7,9,6,-1,0的中位数是.3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据1,的平均数为\t()=2,…,n(2)特征:平均数对数据有“取齐”的作用,代表该组数据的.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起,平均数可以反映出更多的关于样本数据全体的,但平均数受数据中的影响较大,使平均数在估计总体时可靠性降低.【做一做3】 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其平均数是.4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式计算s=可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较;标准差较小,数据的离散程度较.【做一做4】一组数据的单位是,平均数是\t(),标准差为s,则( )A.\t()与s的单位都是B.\t()与s的单位都是c.\t()与s的单位都是D.\t()与s的单位不同5.方差[](1)定义:标准差的平方,即s2=(2)特征:与的作用相同,描述一组数据围绕平均数波动程度的大小.(3)取值范围:数据组1,2,…,n的平均数为\t(),方差为s2,标准差为s,则数据组a1+b,a2+b,…,a n+b(a,b为常数)的平均数为a\t()+b,方差为a2s2,标准差为as【做一做5】下列刻画一组数据离散程度的是( )A.平均数B.方差.中位数D.众数6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用的平均数、众数、中位数、标准差、方差估计.这与上一节用的频率分布近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.【做一做6-1】下列判断正确的是( )A.样本平均数一定小于总体平均数B.样本平均数一定大于总体平均数.样本平均数一定等于总体平均数[]D.样本容量越大,样本平均数越接近总体平均数【做一做6-2】电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为( )A.27 B.28 .29 D.30答案:1.(1)最多(2)不止一集中趋势【做一做1】 42.(1)中间(2)唯一集中趋势相等[]【做一做2】 3 将该组数据按从小到大排列为-5,-1,0,6,7,9,则中位数是0+62=33.(1)1+2+…+n n(2)平均水平 信息 极端值 【做一做3】 147 平均数是110(15+17+14+10+15+17+17+16+14+12)=1474.(1)错误! (2)平均数 大 小 【做一做4】 \t()与s 的单位都与数据组中的数据单位相同,是5.(1)1n[(1-\t())2+(2-\t())2+…+(n -\t())2] (2)标准差 (3)[0,+∞)【做一做5】 B 方差刻画一组数据离散程度的大小.6.样本 样本【做一做6-1】 D【做一做6-2】 B 这10个数据的平均数是110(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.1.理解众数、中位数、平均数剖析:(1)众数体现了样本数据的最大集中点,容易计算,但它只能表达样本数据中很少一部分信息,显然对其他数据信息的忽略使其无法客观地反映总体特征.(2)中位数不受少数几个极端值的影响,容易计算,但它对极端值的不敏感有时也会成为缺点.(3)由于平均数与每一个样本的数据有关,“越离群”的数据,对平均数的影响也越大,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因为这个原因,与众数、中位数比较起,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.如在体育、文艺等各种比赛的评分中,使用的是平均数,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止由于个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.(4)在一组数据中,它们的众数、中位数、平均数可能相同,也可能不同,而实际问题中,计算平均数时应该注意按实际要求进行计算.(5)实际问题中求得的平均数、众数和中位数应带上单位.2.众数、中位数、平均数与频率分布直方图的关系剖析:(1)在样本数据的频率分布直方图中,众数的估计值就是最高矩形的中点的横坐标.(2)在频率分布直方图中,中位数左右两侧的直方图的面积相等,但是因为样本数据的频率分布直方图只是直观地表明分布的特征,因而从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数的值不一致.(3)平均数显然是频率分布直方图的“重心”.我们知道,n个样本数据1,2,…,n的平均数\t()=1n(1+2+3+…+n),则就有n\t()=1+2+3+…+n,所以\t()对数据有“取齐”的作用,代表了一组数据的数值平均水平.在频率分布直方图中,平均数是直方图的平衡点,假设横轴表示一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡.3.理解方差与标准差剖析:(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围是[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.题型一计算方差(标准差)【例题1】从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为.反思:求一组数据的方差和标准差的步骤如下:①先求平均数\t()②代入公式得方差和标准差s2=1n[(1-\t())2+(2-\t())2+…+(n-\t())2],s=错误!题型二众数、中位数、平均数的应用【例题2】某工厂人员及月工资构成如下:(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么?分析:(由平均数的定义)→(计算平均数)→(已知数据从小到大排列)→(得中位数、众数)→(结论) 反思:(1)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.题型三方差的应用【例题3】甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203 204 202 196 199 201 205 197 202 199乙:201 200 208 206 210 209 200 193 194 194(1)分别计算两个样本的平均数与方差.(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?反思:研究两个样本的波动情况或比较它们的稳定性、可靠性、平整性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准.若平均数相等,则再比较两个样本方差的大小作出判断.在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式计算平均数和方差,这样可避免计算的烦琐,降低错误率.题型四易错辨析【例题4】小明是班里的优秀生,他的历次数成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,怎样给小明评价?错解:这五次数考试的平均分是96+98+95+93+455=854,则按平均分给小明一个“良好”. 错因分析:这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数水平,因而应该用中位数衡量小明的数成绩.答案:【例题1】 2105这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,平均成绩为300100=3,则该100人成绩的标准差为错误! =2105【例题2】 解:(1)由表格可知,众数为2 000元.把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.【例题3】解:(1)\t()甲=110(3+4+2-4-1+1+5-3+2-1)+200=2008\t()乙=110(1+0+8+6+10+9+0-7-6-6)+200=2015s\al(2,甲)=796,s\al(2,乙)=3805(2)∵200<\t()甲<\t()乙,∴甲台包装机包装的10袋糖果的平均质量更接近于200克.∵s\al(2,甲)<s\al(2,乙),∴甲台包装机包装的10袋糖果的质量比较稳定.【例题4】正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”.1.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为( )A.3与3 B.23与3 .3与23D.23与232.(2011·北京海淀二模,理5)某赛季甲、乙两名篮球运动员各13场比赛的得分情况用茎叶图表示如下:根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是( )A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的中位数大于乙运动员得分的中位数.甲运动员的得分平均值大于乙运动员的得分平均值D.甲运动员的成绩比乙运动员的成绩稳定3.抛硬币20次,抛得正面朝上12次,反面朝上8次.如果抛到正面朝上得3分,抛到反面朝上得1分,则平均得分是,得分的方差是.4.某人5次上班途中所花的时间(单位:分钟)分别为,y,10,11,9已知这组数据的平均数为10,方差为2,则2+y2=5.某校高二年级在一次数选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数竞赛.答案:1.D 中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.2.D 甲运动员比赛得分的最高分为47,最低分为18,极差为29,乙运动员比赛得分的最高分为33,最低分为17,极差为16,所以A项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分(18的中位数为26,所以B项正确;甲运动员的得分平均值x甲=113+18+19+20+21+26+30+32+33+35+40+41+47)=343,乙13(17+17+19+19+22+25+26+27+运动员的得分平均值x乙=113,甲运动员的得分平均值大于乙运动员29+29+30+32+33)=32513的得分平均值,所以项正确;由茎叶图知甲得分较为分散,乙得分较为集中,故甲的成绩没有乙的成绩稳定.=3.22 096 总得分为12×3+8×1=44,则平均分是4420[(3-22)2×12+(1-22)2×8]=09622,方差s2=120=10,4.208 由平均数为10,得(+y+10+11+9)×15则+y=20;又由于方差为2,则[(-10)2+(y-10)2+(10-10)2+(11-=2,10)2+(9-10)2]×15整理得2+y2-20(+y)=-192,则2+y2=20(+y)-192=20×20-192=208 5.解:设甲乙两人成绩的平均数分别为x甲,x乙,则x甲=130+1(380751)6-+++++=133,x乙=130+1(318426)6-++-+=133,2 s 甲=2222221[(6)5(3)42(2)]6-++-+++-=473,2 s 乙=2222221[0(4)51(5)3]6+-+++-+=383因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.。
最新人教版高中数学必修3第二章“总体方差(标准差)的估计”教案
总体方差(标准差)的估计
教学要求:理解方差和标准差的意义,会求样本方差和标准差。
教学过程:
看一个问题:甲乙两个射击运动员在选拔赛中各射击20次,成绩如下:
问:派谁参加比赛合适?
一、方差和标准差计算公式:
样本方差:s 2=n
1〔(x 1—x )2+(x 2—x )2+…+(x n —x )2〕
样本标准差:s=
])()()[(n
122
221----++-+-x x x x x x n 方差和标准差的意义:描述一个样本和总体的波动大小的特征数。
标准差大说明波动大。
一般的计算器都有这个键。
例一、要从甲乙两名跳远运动员中选拔一名去参加运动会,选拔的标准是:先看他们的平均成绩,如果两人的平均成绩相差无几,就要再看他们成绩的稳定程度。
为此对两人进行了15次比赛,得到如下数据:(单位:cm):
如何通过对上述数据的处理,来作出选人的决定呢?
x甲≈
x乙≈
s甲≈
s乙≈
说明:总体平均数描述一总体的平均水平,方差和标准差描述数据的波动情况或者叫稳定程度。
二、练习:
1、
根据以上数据,说明哪个波动小?
2、从甲乙两个总体中各抽取了一个样本:
根据上述样本估计,哪个总体的波动较小?
3、甲乙两人在相同条件下个射击20次,命中的环数如下:
问谁射击的情况比较稳定?
三、作业:
1、为了考察甲乙两种小麦的长势,分别从中抽取10株苗,测得苗高如下:
哪种小麦长得比较整齐?
2、某农场种植的甲乙两种水稻,在连续6年中各年的平均产量如下:
哪种水稻的产量比较稳定?。
高中数学《总体分布的估计》教案1(1) 新人教A版必修3
总体分布的估计(1)用样本的数字特征估计总体的数字特征教学目标:知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征(板出课题)。
【探究新知】<一>、众数、中位数、平均数〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。
例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
2019-2020学年数学高中人教A版必修3学案:2.2.2用样本的数字特征估计总体的数字特征 第2课时 Word版含解析
第二章统计2.2用样本估计总体2.2.2用样本的数字特征估计总体的数字特征(第2课时)学习目标正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.合作学习一、设计问题,创设情境问题1:平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断.如某地区的统计报表显示,此地区的中学生的平均身高为176cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,如果这个平均数是从五十万名中学生中抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身高.因此,只有平均数还难以概括样本数据的实际状态.我们应该引入什么样的概念才能解决这个问题呢?问题2:(1)有甲、乙两种钢筋,现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:kg/mm2),哪种钢筋的质量较好?(2)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600,880,880,620,960,570,900(平均773)乙:800,860,850,750,750,800,700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(3)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,他们的人均收入达到了1.6万元,民政局即宣布该市生活水平已达到小康水平,你认为这样的结论是否符合实际?(4)如何考察样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?二、信息交流,揭示规律讨论结果:标准差:方差:三、运用规律,解决问题【例题】甲、乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm): 甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.4425.4025.4225.3525.4125.39乙25.4025.4325.4425.4825.4825.4725.4925.4925.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产的零件内径的尺寸看,谁生产的质量较高?四、变式训练,深化提高某地区全体九年级的3000名学生参加了一次数学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3000名学生的平均分、合格率(60及60分以上均属合格).五、反思小结,观点提炼请同学们想一想1.本节课我们学习过哪些知识内容?2.你认为学习这些有什么意义?布置作业课本P82习题2.2A组第6,7题.课后巩固:1.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为.2.若给定一组数据x1,x2,…,x n的方差为s2,则ax1,ax2,…,ax n的方差是.3.在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:试判断选谁参加某项重大比赛更合适?4.某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.参考答案一、设计问题,创设情境问题1:标准差,方差二、信息交流,揭示规律问题2:讨论结果:(1)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差.由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(2)选择的依据应该是,产量高且稳产,所以选择乙更为合理.(3)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(4)把问题(2)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小,如何用数字去刻画这种分散程度呢?考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x1,x2,…,x n,表示这组数据的平均数.x i到的距离是|x i-|(i=1,2,…,n).于是,样本数据x1,x2,…,x n到的“平均距离”是s=---.由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:s=---.意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定;标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数=1.973,标准差s=0.868,所以+s=2.841,+2s=3.709;-s=1.105,-2s=0.237.这100个数据中,在区间[-2s,+2s]=[0.237,3.709]外的只有4个,也就是说,[-2s,+2s]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s2——方差来代替标准差,作为测量样本数据分散程度的工具:s2=[(x1-)2+(x2-)2+…+(x n-)2].显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.三、运用规律,解决问题【例题】分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40mm的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得甲≈25.401,乙≈25.406;s甲≈0.037,s乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40mm),但是差异很小;从样本标准差看,由于s甲<s乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.四、变式训练,深化提高解:运用计算器计算得:=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此估计总体3000名学生的平均分是79.40分,合格率是96%.五、反思小结,观点提炼1.用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确.课后巩固:1.9.5,0.0162.a2s23.解:甲=33,乙=33,甲乙,乙的成绩比甲稳定,选乙参加比赛更合适.4.解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x条),做上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则条鱼中带有标记的条数鱼塘中所有带有标记的鱼的条数鱼塘中鱼的总条数这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中鱼的平均重量,进而估计全部鱼的重量,最后估计出收入.。
高中数学 2.5用样本的数字特征估计总体的数字特征精品学案 新人教A版必修3
学案5 用样本的数字特征估计总体的数字特征【课标导航】(1)了解众数、中位数、平均数并会求一组数据的平均数. (2)理解方差、标准差的概念并会求方差、标准差. (3)会用方差、标准差估计总体的数字特征. (4)形成对数据处理过程进行初步评价的意识.重点:用样本平均数和标准差估计总体的平均数与标准差. 难点:能应用相关知识解决简单的实际问题.考点:平均数、标准差、众数、中位数等基本概念主要以填空题的形式考查,并与概率相联系,难度很小.【知识导引】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕ 甲运动员:7,8,6,8,6,5,8,10,7,4; 乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗? 【自学导拨】一、众数、中位数、平均数 1.众数一组数据中重复出现次数 的数称为这组数的众数. 2. 中位数把一组数据按从小到大的顺序排列,把处于最中间位置的那个数称为这组数据的中位数. (1) 当数据个数为奇数时,中位数是按从小到大的顺序排列的 的那个数. (2) 当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的 . 3. 平均数如果有n 个数123,,,n x x x x ,那么 叫这n 个数的平均数.4.实际问题中求得的众数、中位数、平均数应带上单位. 二、标准差、方差1.数据的离散程度可用极差、 、 来描述.样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的数据为123,,,n x x x x ,样本的平均数为x ,则定义2s ,2s 表示方差.2.为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根s = ,s 表示样本标准差.不要漏写单位.三、如何从频率分布直方图中估计众数、中位数、平均数呢? 众数:最高矩形的中点.中位数:左右两边直方图的面积相等.平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.【教材导学】【例1】:据报道,某公司的33名职工的月工资(以元为单位)如下: 职务 董事长 副董事长 董事 总经理 经理 管理员 职员 人数 1 1 2 1 5 3 20 工资5 5005 0003 5003 0002 5002 0001 500(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法. 【点拨】:先计算出平均数、中位数、然后根据平均数、中位数的意义得出结论. 【解析】:(1)平均数是=1 500+≈1 500+591=2 091(元).中位数是1 500元,众数是1 500元.(2)平均数是≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.【反思】:在用平均数估计总体的时候,样本中的每一个数据都会影响到平均数的大小,因此在实际操作中,一定要注意个别极端值对平均数的影响.【变式练习一】:某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200 250 220 200 100人数 1 6 5 10 1 23(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?【例2】:甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.【点拨】:(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.【解析】:解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x甲=10+13+12+14+165=13(分),x乙=13+14+12+12+145=13(分),s 甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4(分),s 乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8(分).(2)由s s乙甲>可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.【反思】:一组数据的方差,刻画了这组数据的波动大小(即各数据偏离平均数的大小,也称离散性、差异性).方差越大,说明这组数据的波动越大,即这组数据越分散;方差越小,说明这组数据越集中.【变式练习二】:(2010·南通模拟)从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):甲:25 41 40 37 22 14 19 39 21 42乙:27 16 44 27 44 16 40 40 16 40 问:(1)哪种玉米苗长得高?(2)哪种玉米苗长得齐?【例3】:若128,,k k k 的平均数为8,方差为3,则()()()12823,23,,23k k k ---的平均数为 ,方差为 .【点拨】:根据平均数和方差的定义求解. 【解析】:(1)因为128,,k k k 的平均数为1288k k k k +++=,()()()12823,23,,23k k k ---的平均数为()128268'26286108k k k k k +++-⨯==-=⨯-=,(2)因为128,,k k k 得方差为3,即()()()222128138k kkkk k ⎡⎤=-+-++-⎢⎥⎣⎦所以()()()12823,23,,23k k k ---的方差()()()()()()()()()()()()2222128222128222128222128126'26'26'812626262626268144481484312s k k k k k k k k k k k k k k k k k k k k k k k k ⎡⎤=--+--++--⎢⎥⎣⎦⎡⎤=--++--+++--+⎢⎥⎣⎦⎡⎤=-+-++-⎢⎥⎣⎦⎡⎤=⨯-+-++-⎢⎥⎣⎦=⨯= 【反思】:若12,,n x x x 的平均数为x ,方差为2s ,则12,,,n ax b ax b ax b +++ 的平均数为ax b +,方差为22a s ,标准差为as .【变式练习三】:若一组数据12,,n x x x 的平均数为4,方差为2,则1262,62,,62n x x x --- 的平均数为 ,标准差为 .【基础导测】 1. 下列说法正确的是A.在两组数据中,平均数较大的一组方差较大B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小C.方差的求法是求出各个数据与平均数的差的平方后再求和D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高.2.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x=A 21B 22C 20 D233.(2010山东文)在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(A)92 , 2 (B) 92 , 2.8(C) 93 , 2 (D) 93 , 2.84.样本101,98,102,100,99的标准差为A B.0 C.1 D.25.一组数据的每一数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差为4.4,则原来数据的平均数和方差分别是、.6.甲、乙、丙、丁四人参加射击项目选拔赛,成绩如下:则加奥运会的最佳人选是.7.(2010·镇江模拟)某班甲、乙两学生的高考备考成绩如下:甲:512 554 528 549 536 556 534 541 522 538乙:515 558 521 543 532 559 536 548 527 531(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分.8. 对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s )甲 27 38 30 37 35 31 乙332938342836(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s )数据的平均数、中位数、标准差,并判断选谁参加比赛更合适.【知能提升】1.某人5次上班途中所花的时间(单位:min )分别为:x ,y ,10,11,9.已知这组数据的平均数是10,方差为2,则x y -的值为 A .1 B .2 C .3 D .42. (2010陕西文)如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本标准差分别为sA 和sB ,则(A) A x >B x ,sA >sB (B) A x <B x ,sA >sB (C) A x >B x ,sA <sB (D)A x <B x ,sA <sB3.一个容量为40的样本数据依次为1240,,x x x ,若这个样本的标准差为 3.9s =,记()()()222121*1n s x x x x x x n ⎡⎤=-+-++-⎢⎥⎣⎦-,则*s =A .2B 2C .5.44.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为①甲队的技术比乙队好 ②乙队发挥比甲队稳定 ③乙队几乎每场都进球 ④甲队的表现时好时坏A .1B .2C .3D .4 5.若40个数的平方和为56,平均数为2,则这组数据的方差是 ,标准差是 . 6.若数据1220,,x x x 这20个数据的平均数为x ;方差为0.20,则1220,,,x x x x 这21个数据的方差为 .7.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:⑴请填写下表:⑵请从下列三个不同的角度对测试结果进行分析: ①从平均数和中位数结合看(谁的成绩好些); ②从平均数和9环以上的次数看(谁的成绩好些); ③从折线图上两人射击环数的走势看(分析谁更有潜力).8.为了保护学生的视力,教室内的日光灯在使用了一段时间后必须更换,已知某校使用的100乙甲次数环数十九八七六五四三二一10987654321只日光灯在必须换掉之前的使用天数如下表(2)若定期更换,可选择多长时间统一更换合适?9. 某班40人随机分为两组,第一组18人,第二组22人,两组学生在某次数学检测中的成绩如下表,求全班的平均成绩和标准差.【数学探究】1.(09四川文)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲:0.598 0.625 0.628 0.595 0.639 乙:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A .甲批次的总体平均数与标准值更接近 B .乙批次的总体平均数与标准值更接近 C .两个批次总体平均数与标准值接近程度相同 D .两个批次总体平均数与标准值接近程度不能确定。
2019-2020学年数学高中人教A版必修3学案:2.2.2用样本的数字特征估计总体的数字特征 第1课时 Word版含解析
第二章统计2.2用样本估计总体2.2.2用样本的数字特征估计总体的数字特征(第1课时)学习目标1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养“实事求是”的科学态度和严谨的学习态度.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识与现实世界的联系.合作学习一、设计问题,创设情境问题1:在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定吗?问题2:在日常生活中,我们往往并不需要了解总体的分布形态,关心的则是总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?二、信息交流,揭示规律问题3:(1)什么是众数、中位数、平均数?(2)如何从频率分布直方图中估计众数、中位数、平均数?请大家翻回到课本看看原来抽样的数据,有没有2.25这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)提问:那么,如何从频率分布直方图中估计中位数呢?怎样利用频率分布直方图估计众数、中位数、平均数?三、运用规律,解决问题【例1】(1)若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是;(2)如果两组数x1,x2,…,x n和y1,y2,…,y n的平均数分别是x和y,那么数组x1+y1,x2+y2,…,x n+y n 的平均数是.活动:学生思考或交流,教师提示,根据平均数的定义得到结论.【例2】某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班:1128610684100105981029410787112949499901209895119108100961151111049510811110510410711910793102981121129992102938494941009084114乙班:116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110四、变式训练,深化提高下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.五、反思小结,观点提炼学生自己总结,并且相互交流心得.布置作业课本P82习题2.2A组第5题.课后巩固:1.某单位年收入在10000到15000、15000到20000、20000到25000、25000到30000、30000到35000、35000到40000及40000到50000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.2.从甲、乙两个公司各随机抽取50名员工的月工资数据:甲公司:800800800800800100010001000100010001000100010001000100012001200120012001200120012001200120012001200120012001200120012001200120012001200150015001500150015001500150020002000200020002000250025002500乙公司:700700700700700700700700700700700700700700700100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010001000100010006000800010000试计算这两个公司50名员工月工资的平均数、众数、中位数,并估计这两个企业员工的平均工资.参考答案一、设计问题,创设情境问题1:略问题2:通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.二、信息交流,揭示规律问题3:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数或中间两个数的平均数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数的估计值是2.25t(最高的矩形的中点)(如图①),它告诉我们,该市月均用水量为2.25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们多多少.分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:分析:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计出中位数的值为2.02.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:频率分布直方图中中位数左右两边小矩形面积的和相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.三、运用规律,解决问题【例1】解:(1);(2)x+y.【例2】分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.四、变式训练,深化提高分析:要确定这100名学生的日平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示各组学生的睡眠时间.解:方法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),这100名学生的日平均睡眠时间约为=7.39(h).答:估计该校学生的日平均睡眠时间约为7.39h.方法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).答:估计该校学生的日平均睡眠时间约为7.39h.五、反思小结,观点提炼1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征.2.平均数对数据有“取齐”的作用,代表一组数据的平均水平.3.形成对数据处理过程进行初步评价的意识.课后巩固:1.解:估计该单位职工的平均年收入为12500×10%+17500×15%+22500×20%+27500×25%+32500×15%+37500×10%+45 000×5%=26125(元).答:估计该单位人均年收入约为26125元.2.解:甲公司:员工月工资平均数1320,众数1200,中位数1200;乙公司:员工月工资平均数1330,众数1000,中位数1000.从总体上看乙公司员工月平均工资比甲公司多,原因是乙公司有几个收入较高的员工影响了工资平均数.。
人教A版高中数学必修三 2.2.2 《用样本的数字特征估计总体的数字特征》导学案
§2.2.2 用样本的数字特征估计总体的数字特征◆ 课前导学 (一)学习目标1.知道样本的平均数、样本的方差,样本标准差的定义;2.会计算样本平均数和样本标准差;3.通过实例清楚样本数据表准差的作用. (二)重点难点重点:通过样本的方差,样本标准差估计总体; 难点:理解样本标准差的意义与作用. (三)预习指导◎学习目标一:知道样本的平均数、样本的方差,样本标准差的定义.1.一般地,如果有几个数1x ,2x ,…,n x ,那么x = ,叫做这n 个数的算术平均数,可简称平均数或均值.2.一般地,设样本的元素为1x ,2x ,…,n x ,样本的平均数为x ,定义S 2= ,S= ,其中S 2表示样本方差,S 表示样本标准差,它们描述了一组数形围绕平均数波动的大小. ◆ 课中导学◎学习目标二:会计算样本平均数和样本标准差. (一)小试身手1.从总体中抽取样本4,8,6,5,7,则样本平均数为( ) A .7 B .6 C .5 D .4 2.在样本方差计算公式()()()[]21022212202020101-++-+-=x x x s 中,数字10和20分别表示样本的( )A .容量,方差B .平均数,容量C .容量,平均数D .校准差,平均数3.从养猪场中任意抽5头猪,重量(单位:千克)分别是315,317,308,310,295,则它的样本方差为( )A .1545B .309C .8.63D .59.6 (一) 巩固深化◎学习目标三:通过实例清楚样本数据表准差的作用.例1某工厂人员及工资构成如下表:(1)指出这个问题中的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?例2某化肥厂甲,乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99乙:110,115,90,85,75,115,110(1)这种抽样方法是什么抽样?(2)估计甲、乙两车间的平均值与方差,并说明哪个车间产品稳定.(二)课堂练习1.已知某班一个学习小组数学成绩如下:92,90,85,93,95,86,88,91,则它的样本方差为()A.5.5 B.6.5 C.10.5 D.9.52.若M个数的平均数是x,N个数的平均数是Y,则M+N个数的平均数是__________________. 3.一组数据中的每一个数据都减去80得一组新数据,若求得新数据的平均数是 1.2,方差是4.4,则原来数据的平均数和方差分别是,.◆课后导学一.选择题1、可以描述总体稳定性的统计量是()A样本平均数x B样本中位数 C 样本方差2s D样本最大值2、已知容量为40的样本方差2s =4,那么s 等于( ) A 4 B 2 C2 D 13、与总体单位不一致的量是( ) A s B x C 2s D 1x4、一个样本的方差是])15()15()15[(101S 21022212-+⋅⋅⋅+-+-=x x x ,则这个样本的平均数与样本容量分别是( )A 、10,10B 、6,15C 、15、10D 、由1021x x ,x ⋅⋅⋅确定,105、若样本1,,1,121+⋅⋅⋅++n x x x 的平均数为10,其方差为2,则对于样本2,,2,221+⋅⋅⋅++n x x x 的下列结论正确的是( )A 、平均数为10,方差为2B 、平均数为11,方差为3C 、平均数为11、方差为2D 、平均数为14,方差为4 6、如果数据n x x x ,,,21⋅⋅⋅的平均数是x ,方差是2S ,则32,,3,23221+⋅⋅⋅++n x x x 的平均数和方差分别是( )A 、x 和SB 、32+x 和42SC 、32+x 和2SD 、32+x 和9124S 2++S7、从甲、乙两种玉米苗中各抽10株,测得它们的株高分别如下:(单位:cm )根据以上数据估计( )A 、甲种玉米比乙种玉米不仅长得高而且长得整齐B 、乙种玉米比甲种玉米不仅长得高而且长得整齐C 、甲种玉米比乙种玉米长得高但长势没有乙整齐D 、乙种玉米比甲种玉米长得高但长势没有甲整齐8、一组数据的方差是2s ,将这组数据中的每一个数据都乘以2,所得到的一组数据的方差是( )A、 22s ; B、 22s ; C、24s ; D、2s9、下列说法正确的是:( )A.甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样B.期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好C.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好D.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好二、填空题:10、已知一组数据1,2,1,0,-1,-2,0,-1,则这组数数据的平均数为;方差为;11、若5,-1,-2,x的平均数为1,则x= ;12、已知n个数据的和为56,平均数为8,则n= ;13、某商场4月份随机抽查了6天的营业额,结果分别如下(单位:万元):2、8,3、2,3、4,3、7,3、0,3、1,试估算该商场4月份的总营业额,大约是_____________万元.三.解答题14、对某种新品电子元件进行寿命终极度实验,情况如下:(1)列出频率分布表,画出频率分布直方图和累积频率分布图(2)估计合格品(寿命100—400h者)的概率和优质品(寿命40h以上者)的概率(3)估计总体的数学平均值15、为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100支日光灯再必须换掉前的使用天数如下:试估计这种日光灯的平均使用寿命和标准差.。
高中数学2.2.2用样本的数字特征估计总体的数字特征导学案新人教A版必修3
用样本的数字特点预计整体的数字特点【学目】1.掌握众数、中位数、均匀数、准差、方差的定和特点.2.会求众数、中位数、均匀数、准差、方差,并能用之解决相关.【学要点】用本的数字特点估体的数字特点前案【知接】甲、乙两名士在同样条件下各射靶两次,每次命中的数分是:甲: 8,6,7,8,6,5,9,10,4,7乙: 6,7,7,8,6,7,8,7,9,51.甲、乙两士命中数的均匀数x 甲、 x 乙各是多少?2.由 x 甲, x 乙可否判断两人的射水平?3.察上述两数据,你哪个人的射水平更定?【知梳理】1.众数(1)定:一数据中出次数 ______的数称数据的众数.(2)特点:一数据中的众数可能 ________个,也可能没有,反应了数据的__________ .2.中位数(1) 定:一数据按从小到大的序排成一列,于______地点的数称数据的中位数.(2)特点:一数据中的中位数是 ______ 的,反应了数据的 __________.在率散布直方中,中位数左和右的直方的面 ______.3.均匀数(1)定:一数据的和与数据的个数的商.数据x1, x2,⋯, xn 的均匀数 x = ____________.(2)特点:均匀数数占有“取”的作用,代表数据的________.任何一个数据的改都会惹起平均数的化,是众数和中位数都不拥有的性.所以与众数、中位数比起来,均匀数能够反应出更多的对于本数据全体的 ______,但均匀数受数据中________的影响大,使均匀数在估体靠谱性降低.4.准差(1)定:准差是本数据到均匀数的一种均匀距离,一般用s 表示,往常用以下公式来算s= ______________________________.(2)特点:准差描绘一数据________波的大小,反应了一数据化的幅度和失散程度的大小.准差大,数据的失散程度____;准差小,数据的失散程度____.5.方差(1)定:准差的平方,即 s2 = ________________________.(2)特点:与 ________的作用同样,描绘一数据均匀数波程度的大小.(3)取范: ________.知拓展:数据 x1,x2,⋯,xn 的均匀数x ,方差 s2 ,准差 s,数据ax1+ b,ax2+ b,⋯,axn+ b(a ,b 常数 ) 的均匀数 a x + b,方差a2s2,准差as.6.用本估体现实中的整体所包括的个体数常常好多,整体的均匀数、众数、中位数、标准差、方差是不知道的,所以,往常用 ______的均匀数、众数、中位数、标准差、方差来预计.这与上一节用______的频次散布来近似地取代整体散布是近似的.只需样本的代表性好,这样做就是合理的,也是能够接受的.小结:用样本的数字特点预计整体的数字特点分两类:用样本均匀数预计整体均匀数;用样本标准差预计整体标准差.样本容量越大,预计就越精准.自主小测11、数据组 8,- 1,0,4 ,7,4,3 的众数是 __________ .2、数据组- 5,7,9,6,-1 ,0的中位数是__________.3 、 10 名工人某天生产同一部件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其均匀数是__________.4、一组数据的单位是m,均匀数是x ,标准差为s,则 ()A. x 与 s 的单位都是km B. x 与 s 的单位都是cmC. x 与 s 的单位都是m D.x与s的单位不同课上导教案【例题解说】题型一计算方差 ( 标准差 )【例题1】从某项综合能力测试中抽取100 人的成绩,统计以下表,则这 100 人成绩的标准差为 ________.分数54321人数2010303010【例题 2】某工厂人员及月薪资组成以下:人员经理管理人员高级技工工人学徒共计月薪资 (元)22 000 2 500 2 200 2 000 1 00029 700人数16510123共计22 00015 00011 00020 000 1 00069 000(1)指出这个问题中的众数、中位数、均匀数.(2)这个问题中,均匀数能客观地反应该工厂的月薪资水平吗?为何?【例题 3】甲、乙两台包装机同时包装质量为200 克的糖果,从中各抽出10 袋,测得其实质质量分别如下( 单位:克 ) :甲: 203204202196199201205197202199乙: 201200208206210209200193194194(1)分别计算两个样本的均匀数与方差.(2) 从计算结果看,哪台包装机包装的10 袋糖果的均匀质量更靠近于200 克?哪台包装机包装的10 袋糖果的质量比较稳固?【例题4】小明是班里的优异学生,他的历次数学成绩是96,98,95,93分,但近来的一次考试成绩只有45分,原由是他带病参加了考试.期末评论时,如何给小明评论?.【当堂检测】1.如图,是某篮球运动员在一个赛季的30 场比赛中得分的茎叶图,则得分的中位数与众数分别为()A.3 与 3B.23 与 3C.3 与 23D.23 与 232.(2011 ·北京海淀二模,理5) 某赛季甲、乙两名篮球运动员各13 场比赛的得分状况用茎叶图表示以下:依据上图,对这两名运动员的成绩进行比较,以下四个结论中,不正确的选项是()A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的中位数大于乙运动员得分的中位数C.甲运动员的得分均匀值大于乙运动员的得分均匀值D.甲运动员的成绩比乙运动员的成绩稳固3.抛硬币20 次,抛得正面向上12 次,反面向上8 次.假如抛到正面向上得 3 分,抛到反面向上得 1 分,则均匀得分是__________,得分的方差是________ __.4.某人 5 次上班途中所花的时间( 单位:分钟 ) 分别为 x, y,10,11,9.已知这组数据的均匀数为10,方差为 2,则 x2+ y2= __________.5.某校高二年级在一次数学选拔赛中,因为甲、乙两人的比赛成绩同样,进而决定依据平常在同样条件下进行的六次测试确立出最正确人选,这六次测试的成绩数据以下:甲127138130137135131乙133129138134128136求两人比成的均匀数以及方差,而且剖析成的定性,从中出一位参加数学.【与收】【知接】答案【提示】x 甲= 7 ; x 乙= 7 .【提示】因为 x 甲= x 乙,故没法判断.【提示】从数字散布来看,甲命中的数分别,乙命中的数集中,故乙的射水平更定.知梳理答案:1. (1) 最多 (2) 不只一集中2. (1)中(2) 独一集中相等3. (1)x1+ x2+⋯+ xn(2) 均匀水平信息极端n4. (1)1- x+- x+⋯+-x(2) 均匀数大小n5. (1)1- x )2 +(x2 - x )2+⋯+ (xn - x )2] [(x1n(2)准差 (3)[0 ,+∞)B方差刻画一数据失散程度的大小.6.本本自主小: 1、 40+62、 3将数据按从小到大摆列-5,- 1, 0,6,7,9,中位数是2=3.13、 14.7均匀数是10(15 +17+ 14+ 10+ 15+ 17+ 17+ 16+14+ 12) = 14.7.4、 C x 与 s 的位都与数据中的数据位同样,是m.5、 B方差刻画一数据失散程度的大小.6、 D17、 B10个数据的均匀数是10(30 + 35+25+ 25+30+ 34+26+ 25+29+ 21) = 28,日生的池的均匀寿命估28 小.答案:210300【例1】5100 人的成5×20+4×10+3×30+2×30+1×10=300,均匀成100= 3,100 人成的准差1-+-+-+-+-100210=.5把 23 个数据按从小到大( 或从大到小 ) 的次序摆列,排在中间的数应是第12 个数,其值为 2 200 ,故中位数为 2 200 元.均匀数为 (22 000 + 15 000 +11 000 + 20 000 +1 000) ÷23=69 000 ÷23= 3 000( 元) .(2)固然均匀数为 3 000 元 / 月,但由表格中所列出的数据可见,只有经理在均匀数以上,其他的人都在均匀数以下,故用均匀数不可以客观真切地反应该工厂的薪资水平.1【例题 3】解: (1) x 甲=(3 + 4+ 2-4- 1+ 1+ 5- 3+ 2- 1) + 200= 200.8.101x乙=10 (1 +0+ 8+ 6+10+ 9+ 0- 7- 6-6) + 200=201.5. s2甲= 7.96 ,s2乙= 38.05.(2)∵ 200< x 甲< x 乙,∴甲台包装机包装的10 袋糖果的均匀质量更靠近于200 克.∵ s2甲< s2乙,∴甲台包装机包装的10 袋糖果的质量比较稳固.【例题 4】正解:小明 5 次考试成绩,从小到大摆列为45,93,95,96,98,中位数是95,应评定为“优异”.当堂检测答案:1. D中位数是指一组数据按从小到大( 或从大到小 ) 的次序挨次摆列,处在中间地点的一个数 ( 或最中间两个数据的均匀数) ,从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23 出现了 3 次,次数最多,所以众数也是23,所以选D.2. D甲运动员比赛得分的最高分为47,最低分为18,极差为 29,乙运动员比赛得分的最高分为33,最低分为 17,极差为 16,所以 A 项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分的中位数为126,所以 B 项正确;甲运动员的得分平均值x甲=13(18+18+19+20+21+26+30+32+33+35+403431+ 41+ 47) =13,乙运动员的得分均匀值x乙=13(17+17+19+19+22+25+26+27+29+29+30+32325+ 33) =13,甲运动员的得分均匀值大于乙运动员的得分均匀值,所以 C 项正确;由茎叶图知甲得分较为分别,乙得分较为集中,故甲的成绩没有乙的成绩稳固.44 3. 2.2 0.96总得分为12×3+ 8×1= 44,则均匀分是201= 2.2 ,方差 s2=20 [(3 -2.2)2 ×12+ (1 -2.2)2 ×8] = 0.96.。
高中数学《总体特征数之方差》学案1 北师大版必修3
总体特征数的估计(二)【目标引领】 1. 学习目标:理解样本数据的方差,标准差的意义和作用,学会计算数据的方差、标准差,并使学生领会通过合理的抽样对总体的稳定性水平作出科学的估计的思想。
掌握从实际问题中提取数据,利用样本数据计算方差,标准差,并对总体稳定性水平估计的方法。
2. 学法指导:①.方差和标准差计算公式:设一组样本数据n 21x ,,x ,x ,其平均数为x ,则 样本方差:s 2=n1〔(x 1—x )2+(x 2—x )2+…+(x n —x )2〕 样本标准差:s=])x x ()x x ()x x [(n12n 2221----++-+- ②.方差和标准差的意义:描述一个样本和总体的波动大小的特征数。
标准差大说明波动大。
【教师在线】 1. 解析视屏:①若给定一组数据n 21x ,,x ,x ,方差为s 2,则n 21ax ,ax ,ax 的方差为22s a②若给定一组数据n 21x ,,x ,x ,方差为s 2,则b ax ,b ax ,b ax n 21+++ 的方差为22s a ;特别地,当1=a 时,则有b x ,,b x ,b x n 21+++ 的方差为s 2,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性;③方差刻画了数据相对于均值的平均偏离程度;对于不同的数据集,当离散程度越大时,方差越大;④方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感,标准差的单位与原始测量数据单位相同,可以减弱极值的影响。
2. 经典回放:例1: 要从甲乙两名跳远运动员中选拔一名去参加运动会,选拔的标准是:先看他们的平均成绩,如果两人的平均成绩相差无几,就要再看他们成绩的稳定程度。
为此对两人进行了15次比赛,得到如下数据:(单位:cm ):如何通过对上述数据的处理,来作出选人的决定呢? 解:x 甲≈750.2x 乙≈750.6s 甲≈16.4 s 乙≈9.6甲乙两名跳远运动员的平均成绩相差无几,乙的成绩较稳定,所以选拔乙去参加运动会比较合适。
高中数学必修三教案:2.3.2 方差与标准差(1)
2.3.2方差与标准差(1)教学目标:1.正确理解样本数据方差、标准差的意义和作用,2.学会计算数据的方差、标准差;3.会用样本的基本数字特征估计总体的基本数字特征.教学重点:用样本数据的方差和标准差估计总体的方差与标准差.教学难点:理解样本数据的方差、标准差的意义和作用,形成对数据处理过程进行初步评价的意识.教学方法:引导发现、合作探究.教学过程:一、创设情景,揭示课题有甲、乙两种钢筋,现从中各抽取一个标本(如表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.提出问题:哪种钢筋的质量较好?二、学生活动由图可以看出,乙样本的最小值100低于甲样本的最小值100,最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range ).由图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.考察样本数据的分散程度的大小,最常用的统计量是方差和标准差. 三、建构数学 1.方差:一般地,设一组样本数据1x ,2x ,…,n x ,其平均数为-x ,则称- 212)(1x x n s ni i -=∑=为这个样本的方差.因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差的算术平方根称为这组数据的标准差.2.标准差:21)(1-=-=∑x x n s ni i 标准差也可以刻画数据的稳定程度. 3.方差和标准差的意义:描述一个样本和总体的波动大小的特征数,标准差大说明波动大. 四、数学运用例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定.解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例2为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.分析用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,285,315,345,375,由此算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天)这些组中值的方差为1/100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2128.60(天2).故所求的标准差约462128 (天)6.答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.巩固深化,反馈矫正:(1)课本第71页练习第2,4,5题;(2)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为;五、归纳整理,整体认识1.用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本方差、标准差估计总体方差、标准差.样本容量越大,估计就越精确.2.方差、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.精美句子1、善思则能“从无字句处读书”。
人教课标版高中数学必修3《用样本的数字特征估计总体的数字特征》参考学案
2.2.2 用样本的数字特征估计总体的数字特征课前预习学案一、预习目标:通过预习,初步理解众数、中位数、平均数、标准差、方差的概念。
二、预习内容:1、知识回顾:作频率分布直方图分几个步骤?各步骤需要注意哪些问题?2、众数、中位数、平均数的概念众数:______________________________________________________________ 中位数:_____________________________________________________________ 平均数:______________________________________________________________ 3.众数、中位数、平均数与频率分布直方图的关系:众数在样本数据的频率分布直方图中,就是_______________________________ 中位数左边和右边的直方图的________应该相等,由此可估计中位数的值。
平均数是直方图的___________.4.标准差、方差标准差s=___________________________________________________________ 方差s2=___________________________________________________________ 三、提出疑惑同学们,通过你的自主学习,你还有哪些疑惑,请把它填在下面的表格中课内探究学案一、学习目标:1. 能说出样本数据标准差的意义和作用,会计算数据的标准差2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释;3. 会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识。
二、学习内容1.众数、中位数、平均数思考1:分别利用原始数据和频率分布直方图求出众数、中位数、平均数,观察所得的数据,你发现了什么问题?为什么会这样呢?思考2:你能说说这几个数据在描述样本信息时有什么特点吗?由此你有什么样的体会?练一练:假如你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。
人教A版高中数学必修三新课标用样本的数字特征估计总体的数字特征教案(1)
2.2.2 用样本的数字特征估计总体的数字特征整体设计教学分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.三维目标1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排2课时教学过程第1课时众数、中位数、平均数导入新课思路1在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题)思路2在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.推进新课新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例思路1例 1 (1)若M 个数的平均数是X,N 个数的平均数是Y,则这M+N 个数的平均数是___________;(2)如果两组数x 1,x 2,…,x n 和y 1,y 2,…,y n 的样本平均数分别是x 和y,那么一组数x 1+y 1,x 2+y 2,…,x n +y n 的平均数是___________.活动:学生思考或交流,教师提示,根据平均数的定义得到结论.解:(1)N M NY MX ++; (2)2y x +. 例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班:112 86 106 84 100 105 98 102 94 10787 112 94 94 99 90 120 98 95 119108 100 96 115 111 104 95 108 111 105104 107 119 107 93 102 98 112 112 9992 102 93 84 94 94 100 90 84 114乙班:116 95 109 96 106 98 108 99 110 10394 98 105 101 115 104 112 101 113 96108 100 110 98 107 87 108 106 103 97107 106 111 121 97 107 114 122 101 107107 111 114 106 104 104 95 111 111 110分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.思路2例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.睡眠时间人数频率[6,6.5) 5 0.05[6.5,7) 17 0.17[7,7.5) 33 0.33[7.5,8) 37 0.37[8,8.5) 6 0.06[8.5,9) 2 0.02合计100 1分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.(设计者:路波)。
2019-2020学年高中数学《样本估计总体的数字特征》导学案(一)新人教版必修3
2019-2020学年高中数学《样本估计总体的数字特征》导学案(一)新人教版必修3(一)问题提出1、如何从样本数据中求众数、中位数、平均数?2、如何绘制频率分布直方图?3、如何从频率分布直方图中估计众数、中位数、平均数?4、利用众数、中位数、平均数估计总体的数字特征时各自的优缺点。
讨论如果:1、略。
2、画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.3、估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.4、众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.(二)讲案睡眠时间人数频率[6,6.5) 5 0.05[6.5,7) 17 0.17[7,7.5) 33 0.33[7.5,8) 37 0.37[8,8.5) 6 0.06[8.5,9) 2 0.02合计100 1个范围,可以用各组区间的组中值近似地表示.练习:1. 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.(答案:26125元)2.如下图是高一某班60名学生参加某次数学考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班成绩的众数为_______,中位数约为_______,优良(120分以上为优良)率为________.(三)练案从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资思考:你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?(以上语句具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.)练习:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
人教A版高中同步学案数学选择性必修三精品课件 第七章 离散型随机变量的数字特征 离散型随机变量的方差
1.理解取有限个值的离散型随机变量的方差及标准差的概念.2.能计算简单离散型随机变量的方差,并能解决一些实际问题.3.掌握方差的性质.
1
基础落实·必备知识全过关
2
重难探究·能力素养全提升
01
基础落实·必备知识全过关
知识点1 离散型随机变量的方差、标准差
设离散型随机变量的分布列如下表所示.
×
(2)若是常数,则.()
√
(3)离散型随机变量的方差反映了随机变量偏离于期望的平均程度. ( )
√
(4)标准差与随机变量本身有相同的单位,在实际问题中应用更广泛. ( )
√
2.随机变量的方差与样本的方差有何不同?_________________________________________________________________________________________________________________________________________________________________________________
探究点一 求离散型随机变量的方差
【例1】从4名男生和2名女生中任选3人参加演讲比赛,设随机变量表示所选3人中女生的人数,求的方差.
解由题意,的可能取值为0,1,2,,,1,2,所以的分布列为
0
1
2
所以,所以的方差.
规律方法1.求离散型随机变量的方差的基本步骤:_2.已知随机变量求时,注意的应用,这样既可以避免求随机变量的分布列,又能避免复杂的计算,可简化计算过程.
提示样本的方差是随着样本的不同而变化的,因此它是一个随机变量,而随机变量的方差是通过大量试验得出的,刻画了随机变量与其均值的平均偏离程度,因此它是一个常量而非变量.
人教A版高中数学必修三新课标用样本的数字特征估计总体的数字特征导学案(1)
2.什么叫中位数?有什么意义?
3.什么叫众数?有什么意义?
练习1:某公司员工的月工资情况如表所示:
月工资/元
8000
5000
4000
2000
1000
800
700
600
500
员工/人
1
2
4
6
12
8
20
5
2
(1)分别计算该公司员工月工资的平均数、中位数、和众数。
(2)公司经理会选取上面哪个数来代表该公司员工的月工资情况?税务官呢?工会领导呢?
达标训练
1.课本31页练习
2.教辅资料
作业
布置
习题1-4 1,2
学习小结/教学
反思
【解】
4.什么叫极差?有什么意义?
5.什么叫方差?有什么意义?
练习2:在上一节中,从甲、乙两个城市随机抽取的16台自动售货机的销售额可以用茎叶图表示,如图
(1)甲乙两组数据的中位数、众数、极差分别是多少?
(2)你能从图中分别比较甲乙两组数据平均数和方差的大小吗?
精讲互动
例1甲、乙两台机床同时生产直径是40mm的零件。为了检验产品质量,从两台机床生产的产品中各抽取10件进行测量,结果如下表所示
甲
40.0
39.8
40.1
40.2
39.9
40.0
40.2
39.8
40.2
39.8
乙
40.0
40.0
39
9
ห้องสมุดไป่ตู้40.0
39.9
40.1
40.1
40.1
40.0
39.9
(1)你能选择适当的数分别表示这两组数据的离散程度吗?
人教A版高中数学必修三学用样本的数字特征估计总体的数字特征导学案新
山东省堂邑中学2014届高三上学期9月假期自主学习反馈检测理科数学试题第I 卷(选择题) 2013-9-5一、选择题1.设m,n 是不同的直线,,αβ是不同的平面,下列命题中正确的是A .若m//,,,n m n αβαβ⊥⊥⊥则B .若m//,,,//n m n αβαβ⊥⊥则C .若m//,,//,n m n αβαβ⊥⊥则D .若m//,,//,//n m n αβαβ⊥则2.已知某个几何体的三视图如右图所示,根据图中标出的数字,得这个几何体的体积是() (A )31(B )32(C )34(D )383..某工厂八年来某种产品总产量C 与时间t 的函数关系如图所示.下列说法:①前三年中产量增长的速度越来越快;②前三年中产量增长的速度保持稳定;③第三年后产量增长的速度保持稳定;主视图 侧视图俯视图 211⑤第三年后,这种产品停止生产.其中说法正确的是 ( )A .②⑤B .①③C .①④D .②④4.函数sin (0)y x ωω=>的部分如图所示,点A 、B 是最高点,点C 是最低点,若ABC ∆是直角三角形,则ω的值为A .2πB .4πC .3π D .π 5.命题“x ∀∈R ,20x >”的否定是( ) (A )x ∀∈R ,20x ≤(B )x ∃∈R ,20x > (C )x ∃∈R ,20x < (D )x ∃∈R ,20x ≤6.若,,a b c 是空间三条不同的直线,,αβ是空间中不同的平面,则下列命题中不正确的是( )(A )若c α⊥,c β⊥,则//αβ(B )若b α⊂,b β⊥,则αβ⊥(C )当,b a αα⊂⊄且c 是a 在α内的射影,若b c ⊥,则a b ⊥(D )当b α⊂且c α⊄时,若//c α,则//b c7. 从1,2,……,9这九个数中,随机抽取3个不同的数,则这3个数的和为偶数的概率是( )A .95B .94C .2111D .21108.若数列{}n a 的通项为2(2)n a n n =+,则其前n 项和n S 为( ) (A ) 112n -+ (B )31121n n --+ (C )31122n n --+ (D )311212n n --++ 9.已知三棱锥的底面是边长为1的正三角形,其正视图与俯视图如图所示,则其侧视图的面积为( )A D 10.设圆锥曲线C 的两个焦点分别为1F 、2F ,若曲线C 上存在点P 满足1PF :12F F :2PF =4:3:2,则曲线C 的离心率等于( )(A )2332或 (B )223或 (C )122或 (D )1322或 11.下列有关命题的说法正确的是( )A .命题“若21x =,则1x =” 的否命题为“若21x =,则1x ≠”B .“1x =-”是“2560x x --=”的必要而不充分条件C .命题“存在x R ∈,使得210x x ++<”的否定是“对任意x R ∈,均有210x x ++<”D .命题“若x y =,则sin sin x y =”的逆否命题为真命题12.下列命题中正确的是(1)已知i b a b a b a R b a )()(,,++-=∈是则为纯虚数的充要条件(2)当z 是非零 实数时,21≥+z z 恒成立 (3)复数3)1(i z -=的实部和虚部都是2- (4)设z 的共轭复数为z ,若i zz z z z z -==⋅=+则,8,4 A. (1)(2) B. (1)(3) C. (2)(3) D. (2)(4)第II 卷(非选择题)二、填空题13.执行如图的程序框图,输出的A 为14.在ABC ∆中,sin cos A A +=,4,5AC AB ==, 则ABC ∆的面积是_ _ 15.如图,在正方形ABCD 中,已知2AB =,M 为BC 的中点,若N 为正方形 内(含边界)任意一点,则AM AN ⋅的取值范围是 .16.已知实数x 、y 满足10201x y x y x -+≥⎧⎪+-≥⎨⎪≤⎩,则2x y +的最大值是 .三、解答题17.如图,在四棱锥P-ABCD 中,PA ⊥平面ABCD , AB//CD ,∠DAB=90°,PA=AD=DC=1,AB=2,M 为PB 的中点.(I )证明:MC//平面PAD ;(II )求直线MC 与平面PAC 所成角的余弦值.18.已知椭圆22221(0)x y C a b a b+=>>:1F (-2,0). (1) 求椭圆C 的方程;(2) 若直线y=x+m 与椭圆C 交于不同的两点A ,B ,且线段AB 的中点M 在圆x 2+y 2=1上,求m 的值.19.(本小题满分10分)如图,已知三棱锥V A BC -中90V A B V A C A BC ???o 且1,2,2BC A C V A ===.(1)求证:VAB BC ^平面.(2)求C V 与平面C A B 所成的角.(3)求二面角B V A C --的平面角.20.已知椭圆C :22221(0)x y a b a b+=>>)0,2(-F . (Ⅰ)求出椭圆C 的方程;(Ⅱ) 若直线y x m =+与曲线C 交于不同的A 、B 两点,且线段AB 的中点M 在圆221x y +=上,求m 的值.21.已知函数),(3)(23R b a x bx ax x f ∈-+=,在点))1(,1(f 处的切线方程为02=+y .(Ⅰ)求函数)(x f 的解析式;(Ⅱ)若对于区间]2,2[-上任意两个自变量的值21,x x ,都有c x f x f ≤-|)()(|21,求实数c 的最小值; (Ⅲ)若过点)2)(,2(≠m m M ,可作曲线)(x f y =的三条切线,求实数m 的取值范围.22.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路 ”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到反感“中国式过马路 ”的路人的概率是158. (Ⅰ)请将上面的列表补充完整(在答题卡上直接填写结果,不需要写求解过程),并据此资料分析反感“中国式过马路 ”与性别是否有关?())()()(())((22d b c a d c b a bc ad d c b a ++++-+++=χ 当2χ<2.706时,没有充分的证据判定变量性别有关,当2χ>2.706时,有90%的把握判定变量性别有关,当2χ>3.841时,有95%的把握判定变量性别有关,当2χ>6.635时,有99%的把握判定变量性别有关)(Ⅱ)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中国式过马路”的人数为X ,求X 的分布列和数学期望.参考答案1.C【解析】试题分析:根据题意,由于A .对于若m//,,,n m n αβαβ⊥⊥⊥则,当m 在平面β内不成立,可能斜交 ,错误;对于B .若m//,,,//n m n αβαβ⊥⊥则,同上错误,对于C .若m//,,//,n m n αβαβ⊥⊥则,符合面面垂直的判定定理,成立,对于D .若m//,,//,//n m n αβαβ⊥则,不一定可能相交,错误,故答案为C.考点:空间中点线面的位置关系的运用点评:主要是考查了空间中点线面的位置关系的运用,属于基础题。
人教版高中数学必修三导学案 用样本的数字特征估计总体的特征
2.2.2 用样本的数字特征估计总体的数字特征1.问题导航(1)什么是众数、中位数、平均数、方差、标准差? (2)如何从频率分布直方图中估计众数、中位数、平均数? (3)方差与标准差的联系与区别是什么? 2.例题导读通过对例1的学习,理解标准差的意义;通过对例2的学习,学会在实际生活中,如何用平均数与标准差来进行估计.1.众数、中位数、平均数 (1)众数、中位数、平均数的概念①众数:在一组数据中,出现次数最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或中间两个数据的平均数)叫这组数据的中位数.③平均数:指样本数据的算术平均数. 即x =1n(x 1+x 2+…+x n ).(2)众数、中位数、平均数与频率分布直方图的关系众数众数是最高矩形的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点2.标准差与方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示,计算时通常用公式s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].显然,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.(2)方差:标准差s的平方s2,即s2=1n[(x1-x)2+…+(x n-x)2]叫做这组数据的方差,同标准差一样,方差也是用来测量样本数据的分散程度的特征数.1.判断下列各题.(对的打“√”,错的打“×”)(1)数据5,4,4,3,5,2的众数为4;()(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半;()(3)方差与标准差具有相同的单位;()(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.()解析:(1)中的众数应为4和5;(2)正确;(3)二者单位不一致;(4)正确,平均数也应减去该常数,方差不变.答案:(1)×(2)√(3)×(4)√2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数解析:选D.平均数、中位数、众数皆为50,故选D.3.已知五个数据3,5,7,4,6,则该样本的标准差为________. 解析:∵x =15×(3+5+7+4+6)=5,∴s =15×[(3-5)2+…+(6-5)2]= 2. 答案: 24.标准差、方差的意义是什么?解:标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.中位数、平均数的综合应用下面是某快餐店所有工作人员一周的收入表:老板大厨二厨采购员杂工服务生会计3 000元450元350元400元320元320元410元(1)计算所有人员的周平均收入;(2)这个平均收入能反映打工人员的周收入的一般水平吗?为什么?(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗?[解](1)周平均收入x1=17(3 000+450+350+400+320+320+410)=750(元).(2)这个平均收入不能反映打工人员的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.(3)去掉老板的收入后的周平均收入x2=16(450+350+400+320+320+410)=375(元),这能代表打工人员的周收入水平.方法归纳平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.扫一扫进入91导学网(91daoxue.)极差、众数、中位数、平均数的作用和求法1.(1)10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>aC.c>a>b D.c>b>a解析:选D.总和为147,a=14.7;样本数据17分布最广,即频率最大,为众数,c=17;从小到大排列,中间一位,或中间二位的平均数,即b=15.(2)某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:班级平均分众数中位数标准差甲班79708719.8乙班797079 5.2①请你对下面的一段话给予简要分析:甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均分是79分,得70分的人最多,我得了85分,在班里算是上游了!”②请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.解:①由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.②甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;乙班学生成绩的中位数是79,平均数为79,说明平均水平与甲班相同,而标准差较小说明乙班分数大多数都集中在79分左右,高分人数和低分人数都较少,建议培养高分学生,提高平均水平.用频率分布表或直方图求数字特征已知一组数据:125121123125127129125128130129 126124125127126122124125126128(1)填写下面的频率分布表:分组频数频率[120.5,122.5)[122.5,124.5)[124.5,126.5)[126.5,128.5)[128.5,130.5]合计(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.(链接教材P76例1)[解](1)分组频数频率[120.5,122.5)20.1[122.5,124.5)30.15[124.5,126.5)80.4[126.5,128.5)40.2[128.5,130.5]30.15合计201(2)频率分布直方图如图:(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.又∵前两个小矩形的频率和为0.25.∴设第三个小矩形底边的一部分长为x.则x×0.2=0.25,得x=1.25.∴中位数为124.5+1.25=125.75.事实上中位数为125.5.使用“组中值”求平均数:x=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,平均数的精确值为x=125.75.方法归纳利用频率分布直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数左右两侧直方图的面积相等.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标.④利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.2.(1)(2015·福建检测)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m0,平均值为x,则()A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D.由题意得m 0=5,m e =5+62=5.5,x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030=17930,显然x >m e >m 0,故选D. (2)某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:①高一参赛学生的成绩的众数、中位数; ②高一参赛学生的平均成绩.解:①用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65,又∵第一个小矩形的面积为0.3,∴设第二个小矩形底边的一部分长为x ,则x ×0.04=0.2,得x =5,∴中位数为60+5=65.②依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, ∴平均成绩约为67分.标准差、方差的应用甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定.(链接教材P77例2)[解](1) x甲=16(99+100+98+100+100+103)=100,x乙=16(99+100+102+99+100+100)=100.s2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同,又s2甲>s2乙,所以乙机床加工零件的质量更稳定.[互动探究]在本例中,若甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?解:甲的数据为99+10,100+10,98+10,100+10,100+10,103+10,平均数为100+10=110,方差仍为16[(109-110)2+(110-110)2+(108-110)2+(110-110)2+(110-110)2+(113-110)2]=73.方法归纳在实际应用中,常常把平均数与标准差结合起来进行决策,在平均值相等的情况下,比较方差或标准差以确定稳定性.3.(2014·高考陕西卷)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x -和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x -,s 2+1002B.x -+100,s 2+1002 C.x -,s 2 D.x -+100,s 2解析:选D.x 1+x 2+…+x 1010=x -,y i =x i +100,所以y 1,y 2,…,y 10的均值为x -+100,方差不变,故选D.数学思想分类讨论思想在解决统计问题中的应用某班4个小组的人数为10,10,x ,8,已知这组数据的中位数与平均数相等,求这组数据的中位数.[解] 该组数据的平均数为14(x +28),中位数一定是其中两个数的平均数,由于x 不知是多少,所以要分几种情况讨论.(1)当x ≤8时,原数据按从小到大的顺序排列为x ,8,10,10,其中位数为12×(10+8)=9.若14(x+28)=9,则x =8,此时中位数为9.(2)当8<x ≤10时,原数据按从小到大的顺序排列为8,x ,10,10,其中位数为12(x +10).若14(x+28)=12(x +10),则x =8,而8不在8<x ≤10的范围内,所以舍去.(3)当x >10时,原数据按从小到大的顺序排列为8,10,10,x ,其中位数为12×(10+10)=10.若14(x +28)=10,则x =12,此时中位数为10. 综上所述,这组数据的中位数为9或10. [感悟提高]在解决问题时,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,这就需要对条件进行分类讨论.当在数据中有未知数x求其中位数时,因x的取值不同,所以数据由大到小(或由小到大)的排列顺序不同,故中位数也不同,这就是本题分类讨论的原因.1.一组数据的方差一定是()A.正数B.负数C.任意实数D.非负数解析:选D.方差可为0和正数.2.(2015·长沙四校联考)为了了解某同学的数学学习情况,对他的6次数学测试成绩(满分100分)进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是()A.中位数为83 B.众数为85C.平均数为85 D.方差为19解析:选C.易知该同学的6次数学测试成绩的中位数为84,众数为83,平均数为85,方差为19.7.3.某班50名学生右眼视力的检查结果如表所示:视力0.10.20.30.40.50.60.70.8 1.0 1.2 1.5人数11343446810 6 则该班学生右眼视力的众数为________,中位数为________.解析:中间位置的数据0.8为中位数,出现次数最多的数据1.2是众数.答案:1.20.84.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.甲:________,乙:________,丙:________.解析:甲的众数为8,乙的平均数为8,丙的中位数为8.答案:众数平均数中位数[A.基础达标]1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是() A.85、85、85B.87、85、86C.87、85、85 D.87、85、90解析:选C.从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.2.(2015·合肥检测)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差解析:选C.由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为12+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2 5×[(4-6),C对;甲、乙的成绩的极差均为4,D错.+(9-6)2]=1253.十八届三中全会指出要改革分配制度,要逐步改变收入不平衡的现象.已知数据x1,x2,x3,…,x n是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入x n+1,则这n+1个数据中,下列说法正确的是() A.年收入平均数大大增大,中位数一定变大,方差可能不变B.年收入平均数大大增大,中位数可能不变,方差变大C.年收入平均数大大增大,中位数可能不变,方差也不变D.年收入平均数可能不变,中位数可能不变,方差可能不变解析:选B.插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.4.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,甲、乙两人这几场比赛得分的平均数分别为x甲,x乙;标准差分别是s甲,s乙,则有()A.x甲>x乙,s甲>s乙B.x甲>x乙,s甲<s乙C.x甲<x乙,s甲>s乙D.x甲<x乙,s甲<s乙解析:选C.观察茎叶图可大致比较出平均数与标准差的大小关系.5.(2013·高考山东卷)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:87794010x 9 1则7个剩余分数的方差为( ) A.1169 B.367 C .36D.677解析:选B.根据茎叶图,去掉1个最低分87,1个最高分99, 则17[87+94+90+91+90+(90+x )+91]=91, ∴x =4.∴s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=367.6.已知样本9,10,11,x ,y 的平均数是10,标准差是2,则xy =________. 解析:由平均数是10,得x +y =20,由标准差是2,得15[(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2]=2, ∴(x -10)2+(y -10)2=8,∴xy =96. 答案:967.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下: 甲:6,8,9,9,8; 乙:10,7,7,7,9.则两人的射击成绩较稳定的是________. 解析:由题意求平均数可得 x甲=x 乙=8,s 2甲=1.2,s 2乙=1.6,s 2甲<s 2乙,∴甲稳定.答案:甲8.(2013·高考辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.解析:设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5,则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x-7|=3可得x=10或x=4.由|x-7|=1可得x=8或x=6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.答案:109.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.解:(1)乙班的平均身高较高.(可由茎叶图判断或计算得出)(2)因为甲班的平均身高为x=12=11010(158+162+…+182)=170(cm),所以甲班的样本方差s[2×92+2×(-2)2+12+(-7)2+(-8)2+122+(-12)2+02)]=57.2.10.(2014·高考课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标[75,85)[85,95)[95,105)[105,115)[115,125) 值分组频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.[B.能力提升]1.下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的有()A.0个B.1个C.2个D.3个解析:选C.一组数据的众数不一定唯一,即①不对;一组数据的方差必须是非负数,即②不对;根据方差的定义知③正确;根据频率分布直方图的概念知④正确.2.某市有15个旅游景点,经计算,黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万,被统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为() A.s=s1B.s<s1C.s>s1D.不能确定解析:选C.由已知,两次统计所得的旅游人数总数没有变,即两次统计的各景点旅游人数的平均数是相同的,设为x,则s=115[(15-x)2+(23-x)2+(x2-x)2+…+(x15-x)2],s1=115[(20-x)2+(18-x)2+(x2-x)2+…+(x15-x)2].若比较s与s1的大小,只需比较(15-x)2+(23-x)2与(20-x)2+(18-x)2的大小即可.而(15-x)2+(23-x)2=754-76x+2x2,(20-x)2+(18-x)2=724-76x+2x2,所以(15-x)2+(23-x)2>(20-x)2+(18-x)2.从而s>s1.3.甲、乙两同学在高考前各做5次立定跳远测试,测得甲的成绩如下(单位:米):2.20,2.30,2.30,2.40,2.30.若甲、乙两人的平均成绩相同,乙的成绩的方差是0.005,那么甲、乙两人成绩较稳定的是________.解析:求得甲的平均成绩为2.30,甲的成绩的方差是0.004.由已知得甲、乙平均成绩相同,但甲的成绩的方差比乙的小,所以甲的成绩较稳定.答案:甲4.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有________.解析:去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.答案:a 2>a 15.(2013·高考安徽卷)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2 的值. 解:(1)设甲校高三年级学生总人数为n . 由题意知30n=0.05,解得n =600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-530=56.(2)设甲、乙两校样本平均数分别为x 1′,x 2′. 根据样本茎叶图可知30(x 1′-x 2′)=30x 1′-30x 2′=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92 =2+49-53-77+2+92=15.因此x 1′-x 2′=0.5.故x 1-x 2的估计值为0.5分. 6.(选做题)在每年的春节后,某市政府都会发动公务员参与到植树绿化活动中去.林业管理部门在植树前,为了保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽测了10株树苗,量出它们的高度如下(单位:厘米),甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,27,46,14,26,10,44,46.(1)画出两组数据的茎叶图,并根据茎叶图对甲、乙两种树苗的高度作比较,写出两个统计结论;(2)设抽测的10株甲种树苗高度平均值为x,将这10株树苗的高度依次输入,按程序框(如图)进行运算,问输出的S大小为多少?并说明S的统计学意义.解:(1)茎叶图:统计结论:(任意两个即可)①甲种树苗的平均高度小于乙种树苗的平均高度;②甲种树苗比乙种树苗长得整齐;③甲种树苗的中位数为27,乙种树苗的中位数为28.5;④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近,乙种树苗的高度分布比较分散.(2)x=27,S=35,S表示10株甲种树苗高度的方差.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体特征数的估计(二)
【目标引领】 1. 学习目标:
理解样本数据的方差,标准差的意义和作用,学会计算数据的方差、标准差,并使学生领会通过合理的抽样对总体的稳定性水平作出科学的估计的思想。
掌握从实际问题中提取数据,利用样本数据计算方差,标准差,并对总体稳定性水平估计的方法。
2. 学法指导:
①.方差和标准差计算公式:
设一组样本数据n 21x ,,x ,x ,其平均数为x ,则 样本方差:s 2
=
n
1〔(x 1—x )2+(x 2—x )2+…+(x n —x )2
〕
样本标准差:s=
]
)x x ()
x x ()
x x [(n
12
n 2
22
1-
-
-
-++-+-
②.方差和标准差的意义:描述一个样本和总体的波动大小的特征数。
标准差大说明波动大。
【教师在线】 1. 解析视屏:
①若给定一组数据n 21x ,,x ,x ,方差为s 2
,则n 21ax ,ax ,ax 的方差为22s a
②若给定一组数据n 21x ,,x ,x ,方差为s 2,则b ax ,b ax ,b ax n 21+++ 的方差为22s a ;特别地,当1=a 时,则有b x ,,b x ,b x n 21+++ 的方差为s 2
,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性;
③方差刻画了数据相对于均值的平均偏离程度;对于不同的数据集,当离散程度越大时,方差越大;
④方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感,标准差的单位与原始测量数据单位相同,可以减弱极值的影响。
2. 经典回放:
例1: 要从甲乙两名跳远运动员中选拔一名去参加运动会,选拔的标准是:先看他们的平均成绩,如果两人的平均成绩相差无几,就要再看他们成绩的稳定程度。
为此对两人进行了15次比赛,得到如下数据:(单位:cm ):
如何通过对上述数据的处理,来作出选人的决定呢? 解:x 甲≈750.2
x 乙≈750.6
s 甲≈16.4 s 乙≈9.6
甲乙两名跳远运动员的平均成绩相差无几,乙的成绩较稳定,所以选拔乙去参加运动会比较合适。
点评:总体平均数描述一总体的平均水平,方差和标准差描述数据的波动情况或者叫稳定程度。
例2:证明方差的两个性质
①.若给定一组数据n 21x ,,x ,x ,方差为s 2
,则n 21ax ,ax ,ax 的方差为22s a
②.若给定一组数据n 21x ,,x ,x ,方差为s 2,则b ax ,b ax ,b ax n 21+++ 的方差为22s a ; 解:设一组样本数据n 21x ,,x ,x ,其平均数为12n
x x x n
+++ =x ,则
样本方差:s 2
=
n
1〔(x 1—x )2+(x 2—x )2
+…+(x n —x )2
〕
另一组样本数据n 21ax ,ax ,ax ,其平均数为12n
a x a x a x n
+++ =a x ,则
样本方差=
n
1〔(ax 1—a x )2
+(ax 2—a x )2
+…+(ax n —a x )2
〕
=a
2
n
1〔(x 1—x )2+(x 2—x )2+…+(x n —x )2
〕
=22s a .
同样:另一组样本数据b ax ,b ax ,b ax n 21+++ ,其平均数为
12n a x b a x b a x b
n
++++++ =a x +b,
样本方差=n
1〔(ax 1+b —a x -b )2
+(ax 2+b —a x -b )2
+…+(ax n +b —a x -b )2
〕
= a
2
n
1〔(x 1—x )2+(x 2—x )2+…+(x n —x )2
〕
=22s a .
点评:特别地,当1=a 时,则有b x ,,b x ,b x n 21+++ 的方差为s 2
,这说明将一组数据的
每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性。
【同步训练】
1.若821k ,,k ,k 的方差为3,则)3k (2,),3k (2),3k (2821--- 的方差为________
.
2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:7.9,4.9,6.9,9.9,4.9,4.8,4.9,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 ( ) A .484.0,4.9 B .016.0,4.9 C .04.0,5.9 D .016.0,5.9 3. 从甲乙两个总体中各抽取了一个样本:
根据以上数据,说明哪个波动小?
4.
5.为了考察甲乙两种小麦的长势,分别从中抽取10株苗,测得苗高如下:
哪种小麦长得比较整齐?
6.从A、B两种棉花中各抽10株,测得它们的株高如下:(CM)
A、 25 41 40 37 22 14 19 39 21 42
B、 27 16 44 27 44 16 40 16 40 40
(1) 哪种棉花的苗长得高?
(2) 哪种棉花的苗长得整齐?
【拓展尝新】
7.“用数据说话”,这是我们经常可以听到的一句话,但数据有时也会被利用,从而产生误导。
例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元。
这时年收入的平均数会比中位数大得多。
尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问。
你认为“我们单位的收入比别的单位高”这句话应当怎么理解?
【解答】
1.12 2.D
3.甲波动小 4.乙情况比较稳定 5.甲种小麦长得比较整齐
6.乙种棉花的苗长得高,甲种棉花的苗长得整齐。
7.从收入的平均数及数据的稳定程度(两极分化的程度)来分析。