用样本的数字特征估计总体的数字特征 说课稿 教案 教学设计

合集下载

用样本的数字特征估计总体的数字特征 说课稿 教案 教学设计

用样本的数字特征估计总体的数字特征  说课稿  教案  教学设计

用样本的数字特征估计总体的数字特征1 理解教材新知(层析教材,新知无师自通)知识点一众数、中位数、平均数[提出问题]现从甲、乙、丙三个厂家生产的同一种产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下(单位:年)甲:3,4,5,6,8,8,8,10乙:4,6,6,6,8,9,12,13丙:3,3,4,7,9,10,11,12问题:三家广告中都称其产品的使用寿命为8年,利用初中所学的知识,你能说明为什么吗?提示:三个厂家是从不同角度进行了说明,以宣传自己的产品.其中甲:众数为8年,乙:平均数为8年,丙:中位数为8年.[导入新知]众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.[化解疑难]三种数字特征的比较[提出问题]甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.问题1:甲、乙两战士命中环数平均数x -甲,x -乙各是多少? 提示:x -甲=7环,x -乙=7环.问题2:由x -甲,x -乙能否判断两人的射击水平? 提示:由于x -甲=7环,x -乙=7环,所以不能判断.问题3:观察上述两组数据,你认为哪个人的射击水平更稳定?提示:从数字分布来看,甲命中的环数较分散,乙命中的环数较集中.故乙的射击水平更稳定.[导入新知]标准差、方差的概念与计算公式(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示,s = 1n[x 1-x 2+x 2-x 2+…+x n -x 2].(2)方差:标准差的平方s 2叫做方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中,x n 是样本数据,n 是样本容量,x 是样本平均数. [化解疑难]对方差与标准差概念的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差. 2 突破 常考题型(锁定考向,考题千遍不离其宗) 题型一 众数、中位数、平均数的计算[例1] (1)已知一组数据按从小到大排列为-1,0,4,x ,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.【解析】 ∵中位数为5,∴4+x2=5,即x =6∴该组数据的众数为6,平均数为-1+0+4+6+6+156=5.【答案】 6 5(2)下面是某快餐店所有工作人员一周的收入表:②这个平均收入能反映打工人员的周收入的一般水平吗?为什么?③去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗? 【解】 ①周平均收入x 1=17(3 000+450+350+400+320+320+410)=750(元).②这个平均收入不能反映打工人员的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.③去掉老板的收入后的周平均收入x 2=16(450+350+400+320+320+410)=375(元).这能代表打工人员的周收入水平.[类题通法]利用样本数字特征进行决策时的两个关注点(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征. (2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.[活学活用]从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如下图所示),设甲、乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙【解析】选B 由茎叶图知,甲的平均数为(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.562 5,乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.562 5,所以x 甲<x乙.甲的中位数为(18+22)÷2=20,乙的中位数为(27+31)÷2=29, 所以m 甲<m 乙.题型二 标准差(方差)的计算机应用[例2] 甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数; (2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?【解】 (1)x 甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)法一:由方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2. 法二:由方差公式s 2=1n [(x ′21+x ′22+…+x ′2n )-n x ′2]计算s 2甲,s 2乙,其中x ′i =x i -a ,x′=1n i =1nx ′i .由于两组原始数据都在数字7附近且平均数都是7,所以选取a =7. x ′i 甲=x i 甲-71-11-1-223-3x ′2i 甲=(x i 甲-7)21 1 0 1 1 4 4 9 9 0 x′i 乙=x i 乙-7-1 0 0 1 -1 0 1 0 2 -2 x′2i 乙=(x i 乙-7)2111144所以,s 2甲=110[(x ′21甲+x ′22甲+…+x ′210甲)-10x′2甲] =110×(1+1+0+1+1+4+4+9+9+0-10×0) =110×30=3. 同理,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s 2甲>s 2乙,说明甲战士射击情况波动大. 因此,乙战士比甲战士射击情况稳定.从成绩的稳定性考试,应选择乙参加比赛. [类题通法]1.计算标准差的算法2.标准差(方差)的两个作用(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小. (2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性.[活学活用]随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)计算甲班的样本方差;(2)计算乙班的样本方差,并判断哪个班的身高数据波动较小. 解:(1)x 甲=158+162+163+168+168+170+171+179+179+18210=170.甲班的样本方差为s 2甲=110×[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.(2)同(1)中的算法,求得x乙=171,s2乙=110×(122+92+62+32+12+22+52+72+72+102)=49.8.s2乙<s2甲,因此乙班的身高数据波动较小.题型三数字特征的综合应用[例3]从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数.(2)这50名学生的平均成绩.【解】(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应约位于第四个小矩形内.设其底边为x,高为0.03,∴令0.03x=0.2得x≈6.7,故中位数应约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65.[类题通法]众数、中位数、平均数与频率分布直方图的关系众数众数是最高长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点[活学活用]为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.【解析】(1)(0.040×10+0.025×10)×20=13.(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.【答案】(1)13(2)62.5(3)64数字特征的计算失误[典例]对一组样本数据x i(i=1,2,…,n),如将它们改为x i-m(i=1,2,…,n),其中m≠0,则下面结论正确的是()A.平均数与方差都不变B.平均数与方差都变了C.平均数不变,方差变了D.平均数变了,方差不变【解析】若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b(a≠0)的平均数为a x+b,方差为a2s2,标准差为a2s2,于是知道正确答案应为D.【答案】D[易错防范](1)本题易误认为样本数据变化了,则样本的平均数与方差也会随之改变,从而误选B.(2)若x1,x2,x3,…,x n的平均数为x,方差为s2,标准差为s,则以下数据的平均数,方差和标准差有以下规律:数据平均数方差标准差x1,x2,x3,…,x n x s2sx 1+b ,x 2+b ,…,x n +b (b 为常数) x +b s 2 s ax 1,ax 2,…,ax n (a 为常数) a x a 2s 2 |a |s ax 1+b ,ax 2+b ,…,ax n +b(a ,b 为常数)a x +ba 2s 2|a |s一组数据的方差为s 2,平均数为x ,将这组数据中的每一个数都乘以2,所得的一组新数据的方差和平均数为( )A.12s 2,12x B .2s 2,2x C .4s 2,2xD .s 2,x【解析】选C 将一组数据的每一个数都乘以a ,则新数据组的方差为原来数据组方差的a 2倍,平均数为原来数据组的a 倍.故答案选C. 4 应用 落实体验(自主演练,百炼方成钢)[随堂即时演练]1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a【解析】选C 将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a =110(10+12+14×2+15×2+16+17×3)=14.7,中位数b =15,众数c =17,显然a <b <c ,选D.2.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )A .减少计算量B .避免故障C .剔除异常值D .活跃赛场气氛【解析】选C 因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是________.【解析】按从小到大排列后可得其中位数为91+922=91.5,平均数为87+89+90+91+92+93+94+968=91.5.【答案】91.5,91.54.样本中共有五个个体,其值分别为a ,0,1,2,3,若该样本的平均值为1,则样本方差为________.【解析】由题意知15(a +0+1+2+3)=1,解得a =-1.所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.【答案】25.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如下图所示:(1)请填写下表:平均数 中位数 命中9环以上的次数(含9环)甲 7 乙(2)①从平均数和中位数相结合看,谁的成绩好些?②从平均数和命中9环及9环以上的次数相结合看,谁的成绩好些? ③从折线图中两人射击命中环数的走势看,谁更有潜力?解:(1)由图可知,甲打靶的成绩为:2,4,6,8,7,7,8,9,9,10;乙打靶的成绩为:9,5,7,8,7,6,8,6,7,7.甲的平均数是7,中位数是7.5,命中9环及9环以上的次数是3; 乙的平均数是7,中位数是7,命中9环及9环以上的次数是1. (2)由(1)知,甲、乙的平均数相同.①甲、乙的平均数相同,甲的中位数比乙的中位数大,所以甲成绩较好. ②甲、乙的平均数相同,甲命中9环及9环以上的次数比乙多,所以甲成绩较好. ③从折线图中看,在后半部分,甲呈上升趋势,而乙呈下降趋势,故甲更有潜力.。

《利用样本统计量的数字特征估计总体的数字特征》教案

《利用样本统计量的数字特征估计总体的数字特征》教案

《利用样本统计量的数字特征估计总体的
数字特征》教案
利用样本统计量的数字特征估计总体的数字特征
一、教学目标
1. 了解样本统计量和总体数字特征的关系;
2. 掌握使用样本的数字特征估计总体的数字特征的方法;
3. 能够应用样本统计量进行总体数字特征的估计。

二、教学内容
1. 总体数字特征与样本统计量的关系:
- 了解总体和样本的概念;
- 掌握总体数字特征与样本的数字特征之间的对应关系。

2. 使用样本统计量估计总体的数字特征:
- 掌握使用样本均值估计总体均值的方法;
- 掌握使用样本方差估计总体方差的方法;
- 了解其他样本统计量估计总体数字特征的方法。

3. 应用样本统计量进行总体数字特征的估计:
- 了解样本容量对估计精度的影响;
- 掌握样本容量确定的方法。

三、教学方法
1. 讲授法:通过讲解总体数字特征与样本统计量的关系,以及使用样本统计量估计总体的数字特征的方法;
2. 案例分析法:通过具体案例,引导学生运用样本统计量进行总体数字特征的估计。

四、教学评估
1. 课堂练:请学生根据给定的样本数据,估计相应总体的数字特征;
2. 作业:要求学生完成相关的题,深入理解和应用所学知识。

五、教学反思
本次教学通过讲授和案例分析相结合的方式,帮助学生理解样本统计量的数字特征如何估计总体的数字特征。

通过课堂练习和作业,学生能够灵活运用所学方法进行数字特征的估计,提高了实践能力。

用样本的数字特征估计总体的数字特征 说课稿 教案 教学设计

用样本的数字特征估计总体的数字特征  说课稿  教案  教学设计

用样本的数字特征估计总体的数字特征
教学目标:1.通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。

2.进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。

教学重点:通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。

进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初
步体会样本频率分布和数字特征的随机性。

教学过程:
1.本均值:
2.样本标准差:
3.通过例1、例2、例3、例4、例5熟悉上述两个公式
4.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。

在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

5.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变
(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍
(3)一组数据中的最大值和最小值对标准差的影响,区间的应用;
“去掉一个最高分,去掉一个最低分”中的科学道理
小结:通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。

进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。

1。

高中数学-用样本的数字特征估计总体的数字特征教案-新人教A版必修3

高中数学-用样本的数字特征估计总体的数字特征教案-新人教A版必修3

高中数学-用样本的数字特征估计总体的数字特征教案-新人教A版必修3-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN用样本的数字特征估计总体的数字特征一.教学任务分析(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征,并做出合理的解释.(2)会用样本的基本数字特征估计总体的基本数字特征.形成对数据处理过程进行初步评价的意识.(3) 在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解统计的作用二.教学目标:(1)知识与技能: (1) 能利用频率颁布直方图估计总体的众数,中位数,平均数.(2) 能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法.(3)初步体会、领悟“用数据说话”的统计思想方法.(2)过程与方法:在有关数据的搜集、整理、分析的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。

(3)情感态度与价值观:培养学生勇于探索和创新的精神以及优化他们的个性品质;构造和谐的教学氛围,增加互动,促进师生情感交流.[重点]根据实际问题对样本数据中提取基本的数据特征并作出合理解释估计总体的基本数字特征.[难点]用样本的数字特征估计总体的数字特征,统计思维的建立↓↓↓↓↓四.教学情境设计:1.创设情景,揭示课题上一节我们学习了用图、表组织样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布. 在日常生活中,我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态.因此我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征(板出课题).2.探究:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”我们初中时学习众数、中位数、平均数等数字特征.我们共同回忆一下什么是众数、中位数、平均数众数—一一组数中出现次数最多的数.中位数——将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数——将所有数相加再除以这组数的个数,所得到得数.热身训练:求下列各组数据的众数、中位数、平均数(1)1 ,2,3,3,3,4,6,7,7,8,8,8(2)1 ,2,3,3,3,4,6,7,8,9,9答案:(1)众数是:3和8 中位数是:5 平均数是:5(2)众数是:3 中位数是:4 平均数是:5例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数众数=2.3(t)、中位数=2.0(t)、平均数=1.973(t)那么从频率分布直方图你能得到这些数据的众数,中位数,平均数吗? 3.如何在频率直方图中估计众数、中位数、平均数呢1)如何从频率分布直方图中估计众数2)学生交流讨论,回答从频率分布直方图可以看出:月均用水量的众数是2.25t (最高的矩形的中点),它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少. 思考1:请大家看看原来抽样的数据,有没有2.25 这个数值呢根据众数的定义,2.25怎么会是众数呢为什么0.10.20.30.4月均用水量/t请学生思考交流,回答这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.表2-1 100为居民的月均用水量(单位:t)2.20.61.81.21.01.52.02.22.52.82.4 0.8 1.7 1.0 1.0 1.6 2.1 2.3 2.6 2.5 2.4 0.5 1.5 1.2 1.4 1.7 2.1 2.4 2.7 2.6 2.3 0.9 1.6 1.3 1.3 1.8 2.3 2.3 2.8 2.5 2.0 0.7 1.8 1.4 1.3 1.9 2.4 2.4 2.93.04.3 0.8 1.9 3.5 1.4 1.8 2.3 2.4 2.9 3.2 4.1 0.6 1.7 3.6 1.3 1.7 2.2 2.3 2.8 3.3 3.8 0.5 1.5 3.7 1.2 1.6 2.1 2.3 2.7 3.2 0.4 0.3 0.4 0.2 1.2 1.5 2.2 2.2 2.6 3.4 1.6 1.9 1.8 1.6 1.0 1.5 2.0 2.0 2.5 3.1显然通过频率分布直方图的估计精度较低,其估计结果与数据分组有关,在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体的特征.归纳总结:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内. 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.3)如何从频率分布直方图估计中位数4)学生交流讨论,回答分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等. 由此可以估计中位数的值.设中位数为x ,则5.05.0)2(22.015.008.004.0=⨯-++++x求出02.2=x观察频率分布直方图估计中位数频率 00.10.20.30.40.50.6月均用水量/t在上图中,红色虚线代表居民月平均用水量的中位数的估计值.其左边的直方图的面积是50个单位.右边的直方图的面积也是50个单位.由此可以估计出中位数的值为2.02.思考2:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(样本数据的频率分布直方图把原始的一些数据给遗失了)3) 如何从频率分布直方图中估计平均数学生交流讨论,回答平均数等于是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.以上图为例来讲解求解过程;02.202.025.404.075.306.025.314.075.225 .025.222.075.115.025.108.075.004.025.0=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯平均数为2.02由此居民的月用水量的平均数是2.02t.大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考3:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?让学生讨论,并举例优点:对极端数据不敏感的方法能够有效地预防错误数据的影响.对极端值不敏感有利的例子:如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,如:考察表中2-1中的数据如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能过有效地预防错误数据的影响.用抗极端数据强的中位数表示数据的中心值更准确.缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作.这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.4)对众数,中位数,平均数估计总体数字特征的认识(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2) 中位数不受少数几个极端值的影响, 容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.探究:“用数据说话”这是我们经常可以听到的一句话.但是数据有时也会被利用,从而产生误导.例如一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多,尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释以员工平均工资收入水平去描述他们单位的收入情况.这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平.这个老板的话有误导与蒙骗行五、例题例:某公司的33名职工的月工资(单位:元)如下表:(1)求该公司职工月工资的平均数、中位数、众数.(2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3)你认为哪个统计量更能反映这个公司员工的工资水平?解析:(1)公司职工月工资的平均数为:2091336900033201500320005250030002350050005500≈=⨯+⨯+⨯++⨯++=x (元)若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.(2)若董事长、副董事长的工资提升后,职工月工资的平均数为:3288331085003320150032000525003000235002000030000≈=⨯+⨯+⨯++⨯++=x (元)中位数是1500元,众位是1500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.六、巩固练习假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。

用样本的数字特征估计总体的数字特征教学设计

用样本的数字特征估计总体的数字特征教学设计

用样本的数字特征估计总体的数字特征教学设计教学目标:通过本节课的学习,学生能够理解和掌握用样本的数字特征估计总体的数字特征的方法和步骤,能够灵活运用这些方法解决实际问题。

教学内容:1.引入:介绍样本和总体的概念,以及估计总体的数字特征的重要性。

2.用样本均值估计总体均值的方法:a.讲解样本均值和总体均值的概念b.讲解样本均值的性质(无偏性和一致性)c.讲解用样本均值估计总体均值的公式d.给出一个实例,引导学生计算样本均值并估计总体均值e.给出一个实际问题,引导学生用样本均值估计总体均值3.用样本方差估计总体方差的方法:a.讲解样本方差和总体方差的概念b.讲解样本方差的性质(无偏性和一致性)c.讲解用样本方差估计总体方差的公式d.给出一个实例,引导学生计算样本方差并估计总体方差e.给出一个实际问题,引导学生用样本方差估计总体方差4.用样本比例估计总体比例的方法:a.讲解样本比例和总体比例的概念b.讲解样本比例的性质(无偏性和一致性)c.讲解用样本比例估计总体比例的公式d.给出一个实例,引导学生计算样本比例并估计总体比例e.给出一个实际问题,引导学生用样本比例估计总体比例5.综合练习:给出几个综合性的问题,要求学生根据已给的数据进行估计总体的数字特征。

教学步骤:1.引入:通过举例子引出样本和总体的概念,以及估计总体的数字特征的重要性。

让学生思考在实际生活中为什么需要估计总体的数字特征。

2.教师讲解用样本均值估计总体均值的方法和步骤,讲解样本均值的无偏性和一致性。

给出一个实例,引导学生计算样本均值并估计总体均值。

3.教师讲解用样本方差估计总体方差的方法和步骤,讲解样本方差的无偏性和一致性。

给出一个实例,引导学生计算样本方差并估计总体方差。

4.教师讲解用样本比例估计总体比例的方法和步骤,讲解样本比例的无偏性和一致性。

给出一个实例,引导学生计算样本比例并估计总体比例。

5.综合练习:给出几个综合性的问题,要求学生根据已给的数据进行估计总体的数字特征。

用样本的数字特征估计总体的数字特征说课稿 教案 教学设计

用样本的数字特征估计总体的数字特征说课稿 教案 教学设计
教材分析
本章节是学生在初中学过的简单的统计知识一个深化。学生通过本章的学习应体会统计思维与确定性思维的差异。在本章中学生应通过实习作业较为系统地经历数据收集与处理的全过程。学生在了解统计问题时,应该包括两个方面的信息,即问题所涉及的总体和变量,处理统计问题时,学生对于随机性的理解是困难的,为此在教学过程中要通过日常生活中大量的实例以助理解。
解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗ቤተ መጻሕፍቲ ባይዱ(见课本P69)
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
考试说明:1.理解样本数据标准差的意义和作用,会计算数据标准差及方差。2.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。

人教版高中数学必修3《用样本数字特征估计总体数字特征》说课稿(4)

人教版高中数学必修3《用样本数字特征估计总体数字特征》说课稿(4)

人教版高中数学必修3《用样本数字特征估计总体数字特征》说课稿(4) 各位读友大家好,此文档由网络收集而来,欢迎您下载,谢谢人教版高中数学必修3《用样本的数字特征估计总体的数字特征》说课稿各位老师:大家好!我叫***,来自**。

我说课的题目是《用样本的数字特征估计总体的数字特征》,内容选自于高中教材新课程人教A版必修3第二章第二节,课时安排为三个课时,本节课内容为第一课时。

下面我将从教材分析、教学目标分析、教学方法与手段分析、教学过程分析四大方面来阐述我对这节课的分析和设计:一、教材分析1.教材所处的地位和作用在上一节我们已经学习了用图、表来组织样本数据,并且学习了如何通过图、表所提供的信息,用样本的频率分布估计总体的分布情况。

本节课是在前面所学内容的基础上,进一步学习如何通过样本的情况来估计总体,从而使我们能从整体上更好地把握总体的规律,为现实问题的解决提供更多的帮助。

2教学的重点和难点重点:⑴能利用频率颁布直方图估计总体的众数,中位数,平均数.⑵体会样本数字特征具有随机性难点:能应用相关知识解决简单的实际问题。

二、教学目标分析1.知识与技能目标能利用频率颁布直方图估计总体的众数,中位数,平均数.能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法。

2、过程与方法目标:通过对本节课知识的学习,初步体会、领悟”用数据说话”的统计思想方法。

3、情感态度与价值观目标:通过对有关数据的搜集、整理、分析、判断培养学生”实事求是”的科学态度和严谨的工作作风。

三、教学方法与手段分析1、教学方法:结合本节课的教学内容和学生的认知水平,在教法上,我采用”问答探究”式的教学方法,层层深入。

充分发挥教师的主导作用,让学生真正成为教学活动的主体。

2。

教学手段:通过多媒体辅助教学,充分调动学生参与课堂教学的主动性与积极性。

四、教学过程分析1.复习回顾,问题引入「屏幕显示」〈问题1〉在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了。

38447_《用样本的数字特征估计总体的数字特征》教案3(人教B版必修3)

38447_《用样本的数字特征估计总体的数字特征》教案3(人教B版必修3)

用样本的数字特征估计总体的数字特征-------------------------------------众数、中位数、平均数一课标要求(一)知识与技能要求能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征,并作出合理的解释(二)过程与方法要求在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征(三)情感态度与价值观要求体会统计对决策的作用,提高学习统计知识的兴趣二重点与难点重点:样本众数、中位数、平均数的意义及求法,实际问题中三数的应用。

难点:样本频率分布直方图中众数、中位数、平均数的求法,实际问题中三数的应用三教学过程(一)导入上一节我们学习了用图、表来组织样本数据,并且学习了如何通过图、表所提供的信息,用样本的频率分布估计总体的分布。

为了从整体上更好地把握总体的规律,我们还需要通过样本的数据对总体的情况进行研究。

这节课我们从三个数字特征——众数、中位数、平均数来估计总体的情况。

(二)讲授新课(1)三数概念1、众数在一组数据中,出现次数最多的数据叫做这一组数据的众数。

2、中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。

3、平均数一组数据的总和除以数据的个数所得的值。

如:5、5、5、6、6、6、6、7、7、7众数为6中位数为6平均数也可以说平均数为各个不同数字乘以相应频率之和。

众数为2.3,中位数为2.0,平均数为2.0问题:在频率分布直方图中,我们如何来求出这三个数?如(2)频率分布直方图中的三数1.众数频率分布直方图中最高小长方形底边中点的横坐标.上图中,众数为2.25.1)原始数据中的众数不同,为什么?在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。

由于小长方形的面积表示频率,所以取最高小长方形底边中点的横坐标作为众数2)它有什么优缺点?能够体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。

初中数学用样本估计总体优秀教案

初中数学用样本估计总体优秀教案

初中数学用样本估计总体优秀教案(经典版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。

文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的经典范文,如工作计划、工作总结、发言致辞、自我鉴定、合同协议、条据文书、规章制度、心得体会、教学资料、其他范文等等,想了解不同范文格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, our store provides various types of classic sample texts for everyone, such as work plans, work summaries, speeches, self-evaluation, contract agreements, documents, rules and regulations, experiences, teaching materials, other sample texts, etc. If you want to learn about different sample formats and writing methods, please pay attention!初中数学用样本估计总体优秀教案初中数学用样本估计总体优秀教案(通用5篇)在教学工作者开展教学活动前,常常要写一份优秀的教案,教案有助于学生理解并掌握系统的知识。

《用样本的数字特征估计总体的数字特征1》参考教学方案

《用样本的数字特征估计总体的数字特征1》参考教学方案

用样本的数字特征估计总体的数字特征(1)1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差。

2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。

3.会用样本的基本数字特征估计总体的基本数字特征。

4.形成对数据处理过程进行初步评价的意识。

【教学重点】用样本平均数和标准差估计总体的平均数与标准差。

【教学难点】能应用相关知识解决简单的实际问题。

(一)知识回顾 回顾初中所学三数概念:1、众数:在一组数据中,出现次数最多的数据叫做这一组数据的众数。

2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。

3、平均数:一组数据的总和除以数据的个数所得的值。

(二)新课导入美国NBA 在2011——2012年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30, 36,36,37,39,44,49;乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,39.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就应有相应的数据作为比较依据,即通过样本数字特征对总体的数字特征进行研究.所以今天我们开始学习用样本的数字特征估计总体的数字特征。

(三)新课讲授探究:众数、中位数、平均数与频率分布直方图的关系思考1:如何在样本数据的频率分布直方图中,估计出众数的值?举例加以说明。

答:众数大致的值就是样本数据的频率分布直方图中最高矩形的中点的横坐标。

例如,在2.2.1(一)节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数估计是2.25 t,如图所示:思考2:如何在样本数据的频率分布直方图中,估计出中位数的值?举例加以说明。

答:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数使得在它左边和右边的直方图的面积应该相等,由此可以估计中位数的值,下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02 t思考3:如何在样本数据的频率分布直方图中估计出平均数的值?答:平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和为平均数。

高中数学必修3《用样本的数字特征估计总体的数字特征》说课稿

高中数学必修3《用样本的数字特征估计总体的数字特征》说课稿

用样本的数字特征估计总体的数字特征说课稿尊敬的各位专家,老师,您们好,今天我为大家展示的课例是《用样本的数字特征估计总体的数字特征》.我的说课流程共分为以下5个环节,首先我对本课的教材内容做简要的分析.一、教材透视本节课是在已经学习了用图、表来组织样本数据,用样本的频率分布估计总体分布的基础上,进一步挖掘样本,从形的角度,利用样本的频率分布直方图来估计总体的数字特征,体现用样本估计总体的思想,以及统计思维与确定性思维的差异.同时它也为我们制定决策提供依据,因此学好本节课能帮助学生逐步建立用样本估计总体的统计思想,提高解决实际问题的能力.在初中的课标中对这段内容的要求,可用两个词来概括:“了解”和“感受”;而高中与初中不同点则可用一个字来体现:“会”.于是我将本课的教学重点确定为:教学重点:能用频率分布直方图估计总体的数字特征并对数字特征作出评价二、学情分析1.学生已有的认知基础通过初中和高二前面的学习,学生已有“统计初步知识”的数学现实,能从样本中直接提取样本的数字特征,能用频率分布直方图来呈现数据的分布形态,现实生活中很多数量化的实际问题也为学生的认知提供了经验基础.2.学生面临的问题学生对统计思想的认识还停留在表层,对用频率分布直方图估计总体的数字特征的认识及估算方法比较模糊;应用数字特征解决简单的实际问题并作出合理的决策比较困难.教学难点:应用数字特征解决简单的实际问题并作出合理的决策三、教法厘定针对学生的认知特点,我在教法上采用的是“问题探究式教学”,学法上采用“自主探究、合作交流”的方法.为落实重点,让学生在在自主探索与合作交流中经历数字特征的生成过程;在反思总结、阅读教材中建构知识和方法的正确认识;为突破难点,采用设置问题串的形式,通过追问的方式、结合生活实例,引导学生认识三个数字特征的特点并作出了合理的决策.四、程序预设为了全面达成教学目标,我预设了以下六个教学环节:(一)情境引入1.提出问题以阳光体育运动为背景,提出了以下的实际问题:【视频1】[设计意图]:数学源于生活,又服务于生活.将发生在学生身边的实际问题引入课堂,更有利于激发学生兴趣和参与意识.2. 展示同学们收集、整理数据的过程为了解决这个问题,课前让学生通过实习作业分组对我校同学的锻炼时间进行了数据收集与初步整理.在实习作业中,并没有指明抽样的方法和数据处理的方式,这为学生的探究留足了空间,同时为了避免方向的茫目性,我提供了研究的方向,重点关注了以下两方面的内容:(1)通过制作样本频率分布直方图(也可用其它图表组织样本数据)对数据进行初步分析.(2)探究我校同学锻炼时间的平均水平,大部分人的锻炼时间集中在那个时长?位于中间水平的锻炼时间又是多少?通过制作样本频率分布直方图既巩固了上节课的内容,又为本节课作了铺垫.通过探究这三个问题将用众数、中位数、平均数来刻画数据的特征并分析数据的思想显性化;直接在样本中求这三个数字特征,有利于学生回顾知识和方法,为在直方图中估计数字特征作铺垫,有助于学生在以有的知识和经验上构建新知.【收集数据视频】[设计意图]: 通过实习作业可让学生从实际出发,较为系统地经历数据收集与初步整理的过程,感受统计的思想在实际问题中的应用价值,体会数学知识与现实生活的联系.真正实现参与统计的完整过程.(二)问题探究以学生自己收集的数据作出的频率分布直方图探讨了以下几个问题:(PPT)问题1:(1)如何从频率分布直方图中估计众数?(2)从频率分布直方图中估计的众数与原始数据中的众数是否一样,你能解释其中的原因吗?问题2:如何从频率分布直方图中估计平均数,为什么?问题3: (1)在直方图中中位数左右两边小矩形的面积有什么关系?(2)如何从频率分布直方图中估计中位数?为了充分发挥学生的主体性,根据本课内容的特点及学生的认知基础,本环节的探索全部交于学生.1、对众数的探究采用了自主学习2、对平均数和中位数的探究,在学生独立思考后采用了合作学习,再由小组推荐代表展示探究成果,由学生的“说”和生生、师生间的“评”展开活动.【众数视频】获取数字特征可以从原始数据直接提取,也可以通过频率分布直方图获得,通过对比这两种方法,使学生明白从直方图中得到的数字特征实际上是一个估计值.针对问题2,学生能想到用定义求平均数,但由直方图求数据的总和会比较困难.在探究的过程中通过小组讨论,部分学生能类比众数的求法取每组的中点作为每组的数据的代表值来求数据的总和【平均数视频】同时我引导学生对求平均数的式子作以下变形:【图片】针对问题3,学生对在直方图中为什么中位数左右两边小矩形框面积相等,会有些疑惑.在探究的过程中我通过引导学生复习中位数的概念和求法来寻找在直方图中估计中位数的方法.【中位数视频】为了加深对数字特征特点的认识,我设计了以下两个追问:(PPT)追问1:有同学在录入数据时不小心将数据中的80全部录为800,平均数和中位数是否会发生变化?追问2:中位数不受少数几个极端值的影响,你认为这一特征是他的优点还是缺点?可以举例说明.【图片】253355459...95360X ⨯+⨯+⨯++⨯=3532535 (95606060)X =⨯+⨯++⨯通过对比极端数值对平均数和中位数的影响以及例举生活中的实例,可让学生进一步的体会数字特征的特点,为合理制定决策提供依据,突破难点.(三)归纳提升在充分体验的基础上,学生已经能够自主归纳由直方图获取数字特征的方法及数字特征的作用和局限性.【图片】(四)制定决策在此基础上学生已经可估计出我校同学锻炼时间这个总体的数字特征了,于是我们又回到课前的“阳光体育运动”的问题.( PPT)问题4:以这三个估计值为依据,你认为我校同学体育锻炼的时间达到“使大部分学生能做到每天锻炼一小时”的目标了吗?【视频】这是一个开放性的问题,所以对学生的发言给与充分的肯定,让学生在发表自己的见解的同时,深化对三种数字特征的认识和理解,并能综合数字特征的特点,做出合理决策. 再次突破难点(五)应用反馈为了强化认识、内化新知我设计了例1:( PPT)例1 (2016年四川改编)教材原型:人教A版必修3第65页探究我国是世界上严重缺水的国家之一,城市缺水问题较为突出,成都市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图,(1)试估计成都市居民月均用水量的众数、平均数.(2)如果希望85%的居民月均用水量不超过标准a,那么标准a定为多少比较合理呢?【视频】本例是以教材为原型,改编而成的高考题,设计的目的在于让学生明白,高考题来源于教材,而又高于教材.通过本例,进一步检测学生对教学目标:“会用频率分布直方图估计总体的数字特征的达成情况(六)反思小结在反思小结的环节中,我引导学生带着以下几个问题阅读教材:(PPT)1.本节课你在数学知识和方法上有哪些收获?2.你能从频率直方图中估计众数、中位数、平均数吗?3.众数、中位数、平均数有哪些作用和局限性?4.如果你作为一名决策者,你在处理数量化表示的实际问题时需要注意些什么?【图片】通过回归教材,以及师生共同小结与反思,使学生认识统计对于现实的意义,丰富和完善学生的认知结构,使知识与技能内化为学生的数学能力.附:板书设计(PPT)五、教学评价现代数学教学和新课改要求教学能从“让学生学会”向“让学生会学”转变、从“教教材”向“用教材教”转变,使数学教学真正成为数学活动的教学.所以,本节课我认为并不仅仅是单纯的知识教学,而更应该重视对统计思想的渗透和学生实践创新能力的培养.我从“阳光体育运动”案例入手,通过实习作业让学生较为系统地经历数据收集与初步整理的过程,从学生自己收集的数据得到的频率分布直方图出发,让学生在自主探索、合作交流中经历数字特征的生成过程以及应用数字特征分析实际问题并作出合理决策的过程,这样既激发了学生的学习兴趣,又分化突破了难点.教学过程中,我不断设问,不断变式,给每个学生提供思考、创造、表现的机会,意在培养学生发现问题解决问题的能力,逐步渗透数形结合及统计的思想.。

高中数学新人教版A版精品教案《用样本的数字特征估计总体的数字特征》

高中数学新人教版A版精品教案《用样本的数字特征估计总体的数字特征》

《用样本的数字特征估计总体的数字特征》教学设计(第一课时众数、中位数、平均数)【教材分析】:“用样本的数字特征估计总体的数字特征(众数、中位数、平均数)”是《普通高中课程标准实验教科书数学必修三》(人教A版)第二章第二节第二小节第一课时的教学内容。

这节课我们将学习如何从样本中提取基本信息(众数、中位数、平均数)来推断总体的情况。

统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据。

【学情分析】:我们班级是双语班,大多数同学相对于平行班基础要弱一点,上课学习安排的内容相对少点,讲解比较细致,语速也比较慢,只安排了众数、中位数、平均数,在频率分布直方图下求众数、中位数是重点讲解,就把在频率分布直方图下求平均数安排在下一节课上,这节课我们将学习如何从样本中提取基本信息(众数、中位数、平均数)来推断总体的情况。

【三维目标】:★知识与技能:1. 能够用样本的基本数字特征来估计总体的基本数字特征。

2. 能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际对问题作出合理的判断,制定解决问题的有效方法。

★过程与方法:1初步体会、领悟“用数据说话”的统计思想方法。

★情感态度与价值观:1通过对有关数据的收集、整理、分析、判断培养学生“实事求是”的科学态度。

【教学重点】:1. 根据实际问题的样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征。

【教学难点】:1准确求出样本的数字特征,并理解其意义并体会样本数据具有随机性。

【课前准备】:多媒体课件、教学设计、导学案(提前发给同学们预习使用)【教学方法】:启发式、探究式【教学过程】:★【复习导入】:对一个未知总体,我们常用样本的频率分布来估计总体的频率分布,其中表示样本数据的频率分布的基本方法有哪些?★【学生回答】:图、表、总体数据的数字特征★【老师提问】:下图是某赛季东、西部球队数据,那么如何比较东部赛区与西部赛区的优劣呢?(高中生对NBA的热爱超乎我们的想象,他们感兴趣的话题就更愿意去探讨与研究)★【老师总结】如果要求我们根据上面的数据,估计、比较某赛季东部赛区与西部赛区的优劣,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征来估计总体的数字特征★【学生复习回顾初中知识】众数、中位数、平均数(把导学案的知识点过一遍)1众数的定义: 在一组数据中,出现数据叫做这一组数据的众数2中位数的定义: 将一组数据按依次排列,把处在位置的一个数据(或两个数据的)叫做这组数据的中位数3平均数的定义:一组数据的除以数据的所得到的数4一组数据中的众数可能,中位数是的,求中位数时,必须先.5众数规定为频率分布直方图中6中位数左右两边的直方图的面积★【问题1】众数、中位数及平均数中,哪个量最能反映总体的情况?学生回答:由于与每个数都相关,所以最能反映总体的情况★【问题2】单纯依据众数、中位数及平均数中的一个量能对总体做出准确的判断吗?(目的让学生体会它们各自的优缺点)学生回答:★【练习】:求下列一组数的众数、中位数、平均数(请两位同学上黑板,题目简单,预测都可以做正确。

用样本的数字特征估计总体的数字特征说课稿 教案 教学设计

用样本的数字特征估计总体的数字特征说课稿  教案 教学设计

用样本的数字特征估计总体的数字特征【教学目标】(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。

(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。

(3)会用样本的基本数字特征估计总体的基本数字特征。

(4)形成对数据处理过程进行初步评价的意识。

【教法指导】本节重点是用样本平均数和标准差估计总体的平均数与标准差;难点是能应用相关知识解决简单的实际问题。

本节知识的主要学习方法是动手与观察,思考与交流,归纳与总结。

加强新旧知识之间的联系,培养自己分析问题、解决问题的能力,从而获得学习数学的方法。

【教学过程】☆情境引入☆1、“工资明明没有怎么涨,但统计部门却说平均工资又比上年上涨了百分之十几”,这是怎么回事?2、张村有个张千万,隔壁九个穷光蛋,平均起数一数,个个都是张百万。

你如何理解这种现象?☆探索新知☆1、探索样本数据的基本的数字特征各有什么特点?2、样本数据的基本的数字特征与频率分布直方图有什么联系?3、样本数据的基本的数字特征的精确性如何?【教师释疑】1.众数特征一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.[破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.2.中位数特征一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.3.平均数特征平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起,平均数可以反映出更多的关于样本数据全体的极端值,但平均数受数据中信息的影响较大,使平均数在估计总体时可靠性降低.4.标准差特征标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.5.方差(1)特征与标准差的作用相同,描述一组数据围绕平均数波动程度的大小.(2)取值范围 [0,+∞)[知识拓展]数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用样本的平均数、众数、中位数、标准差、方差估计.这与上一节用样本的频率分布近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.规律总结用样本的数字特征估计总体的数字特征分两类用样本平均数估计总体平均数;用样本标准差估计总体标准差,样本容量越大,估计就越精确.☆经典题型☆题型一中位数、众数、平均数的应用某工厂人员及工资构成如下表(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?【分析】先结合众数、中位数、平均数的意义求出众数、中位数、平均数,再结合影响平均数的因素作答.【解析】(1)由题中表格可知众数为1 200,中位数为 1 220,平均数为(2 200+1 250×6+1 220×5+1 200×10+490)÷23=1 230(元/周).虽然平均数为1 230元/周,但从题中表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.规律总结关于众数、中位数、平均数的几个问题(1)一组数据中的众数可能不止一个,如果两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.(2)一组数据中的中位数是唯一的,求中位数时,必须先将这组数据按从小到大(或从大到小)的顺序排列.(3)由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具备的性质.题型二标准差、方差的应用[例2]甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是甲8,6,7,8,6,5,9,10,4,7;乙6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?题型三频率分布直方图与数字特征的综合应用某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求 (1)高一参赛学生的成绩的众数、中位数.(2)高一参赛学生的平均成绩.。

用样本的数字特征估计总计的数字特征教案

用样本的数字特征估计总计的数字特征教案

用样本的数字特征估计总计的数字特征教案第一章:引言1.1 教学目标让学生理解用样本估计总体的概念。

让学生掌握用样本的数字特征估计总体的数字特征的方法。

让学生能够应用样本数字特征估计总体数字特征。

1.2 教学内容引入总体和样本的概念。

介绍用样本估计总体的意义。

讲解用样本的数字特征估计总体数字特征的方法。

1.3 教学活动教师通过实际例子引入总体和样本的概念。

教师讲解用样本估计总体的意义,并给出具体例子。

教师讲解用样本的数字特征估计总体数字特征的方法,并通过例题进行讲解。

第二章:样本均值的估计2.1 教学目标让学生掌握样本均值的估计方法。

让学生能够应用样本均值估计总体均值。

2.2 教学内容介绍样本均值的概念。

讲解样本均值的估计方法。

给出样本均值的估计公式。

2.3 教学活动教师讲解样本均值的概念,并给出具体例子。

教师讲解样本均值的估计方法,并通过例题进行讲解。

教师给出样本均值的估计公式,并解释其含义。

第三章:样本方差的估计3.1 教学目标让学生掌握样本方差的估计方法。

让学生能够应用样本方差估计总体方差。

3.2 教学内容介绍样本方差的概念。

讲解样本方差的估计方法。

给出样本方差的估计公式。

3.3 教学活动教师讲解样本方差的概念,并给出具体例子。

教师讲解样本方差的估计方法,并通过例题进行讲解。

教师给出样本方差的估计公式,并解释其含义。

第四章:样本标准差的估计4.1 教学目标让学生掌握样本标准差的估计方法。

让学生能够应用样本标准差估计总体标准差。

4.2 教学内容介绍样本标准差的概念。

讲解样本标准差的估计方法。

给出样本标准差的估计公式。

4.3 教学活动教师讲解样本标准差的概念,并给出具体例子。

教师讲解样本标准差的估计方法,并通过例题进行讲解。

教师给出样本标准差的估计公式,并解释其含义。

5.1 教学目标让学生通过练习巩固所学知识。

5.2 教学内容教师给出练习题,学生进行练习。

5.3 教学活动教师给出练习题,学生进行练习,教师进行解答和讲解。

2.3.2《用样本的数字特征估计总体数字特征》教案(苏教版必修3)

2.3.2《用样本的数字特征估计总体数字特征》教案(苏教版必修3)

第三课时 2.3.2 用样本的数字特征估计总体数字特征(一)教学要求:正确理解样本数据分布直方图的意义和作用,从样本频率分布直方图中提取基本的数字特征(如众数、中位数、平均数),并做出合理的解释. 会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.教学重点:从样本频率分布直方图中提取基本的数字特征(如众数、中位数、平均数). 教学难点:对比初中所学众数、中位数、平均数的概念.教学过程:一、复习准备:1. 提问:作样本频率分布直方图的基本步骤是怎样的?2. 讨论:如何通过样本的频率分布直方图分析出一些规律?(给出一个图,试着分析)3. 已知数据:10,11,12,12,13,13,13,14,15,根据初中所学的知识,试求中位数、众数、平均数.复习:初中学习的中位数、众数、平均数概念?(样本众数:样本观测值中出现次数最多的数;样本中位数:将一组数据从按大小依次排列,处在最中间的一个数据;平均数.)讨论:如何通过样本的数字特征来了解总体的数字特征?引入:这节课学习如何通过频率分布直方图分析数字特征(中位数、众数、平均数).二、讲授新课:1、教学众数、中位数、平均数的估计:①讨论:结合教材月平均用水量的频率分布直方图,如何估计众数?(注意哪段范围的数最多)②估计众数:频率分布直方图面积最大的方条的横轴中点数字. (最高矩形的中点)③思考:从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t,翻回到课本第56页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(结论:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。

)④讨论:结合教材月平均用水量的频率分布直方图,如何估计中位数?(注意中位数分离标准)⑤估计中位数:中位数把频率分布直方图分成左右两边面积相等.原因:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。

示范教案( 用样本的数字特征估计总体的数字特征)

示范教案( 用样本的数字特征估计总体的数字特征)

2.2.2 用样本的数字特征估计总体的数字特征整体设计教学分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.三维目标1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排2课时教学过程第1课时众数、中位数、平均数导入新课思路1在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题)思路2在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.推进新课新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况. 同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例思路1例 1 (1)若M 个数的平均数是X,N 个数的平均数是Y ,则这M+N 个数的平均数是___________;(2)如果两组数x 1,x 2,…,x n 和y 1,y 2,…,y n 的样本平均数分别是x 和y,那么一组数x 1+y 1,x 2+y 2,…,x n +y n 的平均数是___________.活动:学生思考或交流,教师提示,根据平均数的定义得到结论.解:(1)NM NY MX ++; (2)2y x +. 例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班:112 86 106 84 100 105 98 102 94 10787 112 94 94 99 90 120 98 95 119108 100 96 115 111 104 95 108 111 105104 107 119 107 93 102 98 112 112 9992 102 93 84 94 94 100 90 84 114乙班:116 95 109 96 106 98 108 99 110 10394 98 105 101 115 104 112 101 113 96108 100 110 98 107 87 108 106 103 97107 106 111 121 97 107 114 122 101 107107 111 114 106 104 104 95 111 111 110分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.思路2例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.(设计者:路波)第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x1,x2,…,x n,x表示这组数据的平均数.x i到x的距离是|x i-x|(i=1,2,…,n).于是,样本数据x1,x2,…,x n到x的“平均距离”是S=nx xxxxxn ||||||21-++-+-.由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=])()()[(122221x x x x x x nn -++-+- . 意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709;x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具:s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40, (12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例 2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+ 25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2).故所求的标准差约6.2128≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.知能训练(1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉。

用样本的数字特征估计总体的数字特征说课

用样本的数字特征估计总体的数字特征说课
频率 组距
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
16
四. 教 学 过 程
2、中位数:在样本中,有50%的个体小 于或等于中位数,也有50%的个体大于或 等于中位数,因此,在频率分布直方图中, 中位数左边和右边的直方图的面积应该相 等,由此可以估计中位数的值。下图中虚 线代表居民月均用水量的中位数的估计值, 此数据值为2.02t.
14
四. 教 学 过 程 二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。 例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
15
四. 教 学 过 程
相关题的解法
Ppt演示区
27
谢谢大家!
学法
观察发现法、自主探究法、 合作交流法
9
三、教学方法
教法
创设情境,激疑探究 分组活动,师生互动 及时引导,赏识评价 逐层深入,达成目标
10
三、教学方法
学法
细致观察,归纳概括 主动参与,动手实践 合作协助,探索因果 形成认知,指导应用
11
四. 教 学 过 程
1、课题引入
下面是从高一学生中随机抽的 两组学生,要为他们做衣服, 参加活动
19
频率 组距
四. 教 学 过 程
0.5 0.4 0.3
0.2
0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用样本的数字特征估计总体的数字特征整体设计教学分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.三维目标1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排2课时教学过程第1课时众数、中位数、平均数导入新课思路1在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题)思路2在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.推进新课新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息. (2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例思路1例1 (1)若M 个数的平均数是X,N 个数的平均数是Y,则这M+N 个数的平均数是___________;(2)如果两组数x 1,x 2,…,x n 和y 1,y 2,…,y n 的样本平均数分别是x 和y,那么一组数x 1+y 1,x 2+y 2,…,x n +y n 的平均数是___________.活动:学生思考或交流,教师提示,根据平均数的定义得到结论.解:(1)NM NY MX ++; (2)2y x +. 例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班:112 86 106 84 100 105 98 102 94 10787 112 94 94 99 90 120 98 95 119108 100 96 115 111 104 95 108 111 105104 107 119 107 93 102 98 112 112 9992 102 93 84 94 94 100 90 84 114乙班:116 95 109 96 106 98 108 99 110 10394 98 105 101 115 104 112 101 113 96108 100 110 98 107 87 108 106 103 97107 106 111 121 97 107 114 122 101 107107 111 114 106 104 104 95 111 111 110分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.思路2例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.(设计者:路波)第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110 120 130 125 120 125 135 125 135 125 乙115 100 125 130 115 125 125 145 125 145 哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1)利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4)不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i=1,2,…,n).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是S=nx x x x x x n ||||||21-++-+- . 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:s=])()()[(122221x x x x x x nn -++-+- . 意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s=0.868,所以x +s=2.841,x +2s=3.709;x -s=1.105,x -2s=0.237.这100个数据中,在区间[x -2s,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s, x +2s ]几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据分散程度的工具:s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:即s 甲=2.用类似的方法,可得s 乙≈1.095.由s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.应用示例思路1例1 画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm 的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得甲x ≈25.401,乙x ≈25.406;s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 解:运用计算器计算得:100450126024701880309012100⨯+⨯+⨯+⨯+⨯+⨯=79.40, (12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.例 2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这些组中值的方差为1001×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+。

相关文档
最新文档