第九章抽样统计分析的基本知识
2023年人教版高中数学第九章统计考点题型与解题方法
(名师选题)2023年人教版高中数学第九章统计考点题型与解题方法单选题1、下列抽样方法是简单随机抽样的是()A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.2、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的4,5×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题3、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A4、数据x1,x2,x3,…,x m的平均数为x,数据y1,y2,y3,…,y n的平均数为y,则数据x1,x2,x3,…,x m,y1,y2,y3,…,y n的平均数为()A.xn +ymB.xm+ynC.nx+mym+n D.mx+nym+n答案:D分析:利用平均数的计算公式计算.由题意得:x1+x2+x3+⋯+x m=mx,y1+y2+y3+⋯+y n=ny,所以x1+x2+x3+⋯+x m+y1+y2+y3+⋯+y nm+n =mx+nym+n故选:D5、人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是()A.人口数逐次增加,第二次增幅最大B.第六次普查人数最多,第四次增幅最小C.第六次普查人数最多,第三次增幅最大D.人口数逐次增加,从第二次开始增幅减小答案:C分析:人口数由柱状图判断,增幅由折线图判断.A.人口数逐次增加,第三次增幅最大,故错误;B.第六次普查人数最多,第六次增幅最小,故错误;C.第六次普查人数最多,第三次增幅最大,故正确;D.人口数逐次增加,从第三次开始增幅减小,故错误;故选:C6、新冠肺炎疫情的发生,我国的三大产业均受到不同程度的影响,其中第三产业中的各个行业都面临着很大的营收压力.2020年7月国家统计局发布了我国上半年国内经济数据,如图所示:图1为国内三大产业比重,图2为第三产业中各行业比重.以下关于我国上半年经济数据的说法正确的是()A.第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本持平B.第一产业的生产总值超过第三产业中“房地产业”的生产总值C.若“住宿餐饮业”生产总值为7500亿元,则“金融业”生产总值为32500亿元D.若“金融业”生产总值为41040亿元,则第二产业生产总值为166500亿元答案:D分析:利用扇形统计图和第三产业中各行业比重统计图的数据即可求解.对于A,57%×6%=3.42%<6%,错误;对于B,57%×13%=7.41%>6%,错误;对于C,75003%×16%=4000(亿),错误;对于D,根据题意,第二产业生产总值为4104016%×57%×37%=166500亿元,正确.故选:D.7、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x,方差为s2,则()A.x=5,s2=2B.x=5,s2=1.6C.x=4.9,s2=1.6D.x=5.1,s2=2答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.8、中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:则下列结论中不正确的是()A.这一星期内甲的日步数的中位数为11600B.乙的日步数星期四比星期三增加了1倍以上C.这一星期内甲的日步数的平均值大于乙D.这一星期内甲的日步数的方差大于乙答案:B分析:对于A:直接求出中位数;对于B:求出乙的星期三和星期四步数,计算可得;对于C:分别计算出甲、乙平均数,即可判断;对于D:分别计算出甲、乙方差,即可判断;对于A:甲的步数:16000,7965,12700,2435,16800,9500,11600.从小到大排列为:2435,7965,9500,11600,12700,16000,16800.中位数是11600.故A正确;对于B:乙的星期三步数7030,星期四步数12970.因为129707030≈1.84<2,所以没有增加1倍上.故B不正确;对于C:x甲=17(16000+7965+12700+2435+16800+9500+11600)=11000,x乙=17(14200+12300+7030+12970+5340+11600+10060)=10500.所以x甲>x乙.故C正确;对于D:s甲2=17[(16000−11000)2+(7965−11000)2+(12700−11000)2+(2435−11000)2+(16800−11000)2+(9500−11000)2+(11600−11000)2]≈20958636s乙2=17[(14200−10500)2+(12300−10500)2+(7030−10500)2+(12970−10500)2+(5340−10500)2+(11600−10500)2+(10060−10500)2]≈9014429所以s甲2>s乙2.故D正确;故选:B.9、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.10、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.11、某高中为了解学生课外知识的积累情况,随机抽取200名同学参加课外知识测试,测试共5道题,每答对一题得20分,答错得0分.已知每名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是()A.该次课外知识测试及格率为90%B.该次课外知识测试得满分的同学有30名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有3000名学生,则课外知识测试成绩能得优秀的同学大约有1440名答案:C分析:由百分比图知,成绩为100分、80分、60分、40分的百分比分别为12%, 48%, 32%, 8%,结合各项的描述即可判断其正误.由图知,及格率为1−8%=92%,故A错误.该测试满分同学的百分比为1−8%−32%−48%=12%,即有12%×200=24名,B错误.由图知,中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确.由题意,3000名学生成绩能得优秀的同学有3000×(48%+12%)=1800,故D错误.故选:C12、为了了解全校240名高一学生的身高情况,从中随机抽取40名高一学生进行测量,在这个问题中,样本指的是()A.240名高一学生的身高B.抽取的40名高一学生的身高C.40名高一学生D.每名高一学生的身高答案:B分析:找出考查的对象是某校高一学生的身高,得到样本是抽取的40名高一学生的身高.总体是240名高一学生的身高情况,则个体是每个学生的身高情况,故样本是40名学生的身高情况.故选:B.小提示:本题考查的抽样相关概念的理解,注意区分总体、个体、样本、样本容量这四个概念,属于基础题. 双空题13、一组数据:7,6,3,2,8,3,5,6,9,7的中位数是___________;85%分位数是___________.答案:68分析:首先将数据从小到大排列,即可求出中位数与85%分位数;解:将数据从小到大排列为:2、3、3、5、6、6、7、7、8、9,故中位数为6,又10×85%=8.5,故这一组数据的85%为第9个数为8;所以答案是:6;8;14、设样本数据x1、x2、…、x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,⋯,10),则y1、y2、⋯、y10的均值和方差分别为________,_________.答案:1+a4解析:由题意得出110∑x i10i=1=1,110∑(x i−1)210i=1=4,然后利用平均数和方差的计算公式可计算出数据y1、y2、⋯、y10的均值和方差.由题意可得110∑x i10i=1=1,110∑(x i−1)210i=1=4,则y1、y2、⋯、y10的均值为y=110∑y i10i=1=110∑(x i+a)10i=1=110(∑x i10i=1+10a)=110∑x i10i=1+a=1+a,方差为s2=110∑(y i−y)210i=1=110∑[(x i+a)−(1+a)]210i=1=110∑(x i−1)210i=1=4.所以答案是:1+a;4.小提示:本题考查平均数和方差的计算,灵活利用平均数和方差公式计算是解答的关键,考查计算能力,属于基础题.15、某校高一年级三个班共有学生120名,这三个班的男女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=_________.现用分层抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为________.答案: 24 9分析:由于每个个体被抽到的概率都相等,由x120=0.2,可得得x的值.先求出三班总人数为 36,用分层抽样的方法在全年级抽取30名学生,求出每个学生被抽到的概率为30120,用三班总人数乘以此概率,即得所求.由题意可得x120=0.2,解得x=24.三班总人数为120−20−20−24−20=36,用分层抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9,所以答案是: 24; 9.小提示:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.16、下表记录了某地区一年之内的月降水量.根据上述统计表,该地区月降水量的中位数是______;80%分位数是_________.答案: 56 64分析:根据中位数和百分位数求解数据按从小到大排序得:46,48,51,53,53,56,56,56,58,64,66,71,它的中位数为56;80%×12=9.6,第10个数是64所以答案是:56,6417、要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为________、________.答案:分层抽样简单随机抽样解析:根据分层抽样和简单随机抽样的定义直接判断即可.解析:①各层间差距较大,宜用分层抽样;②总体较少,宜用简单随机抽样.所以答案是:分层抽样,简单随机抽样.小提示:本题考查抽样方法,旨在考查学生对概念的掌握程度,考查阅读能力.解答题18、某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有m(m>20)人,按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计这m人的平均年龄和第80百分位数;(2)现从以上各组中采用分层随机抽样的方法抽取20人,担任本市的宣传使者.若第四组宣传使者的年龄的平,第五组宣传使者的年龄的平均数与方差分别为43和1,求这m人中35~45岁所有人均数与方差分别为37和52的年龄的方差.答案:(1)平均年龄32.25岁,第80百分位数为37.5;(2)10.分析:(1)直接根据频率分布直方图计算平均数和百分位数;(2)由分层抽样得第四组和第五组分别抽取4人和2人,进而设第四组、第五组的宣传使者的年龄的平均数分别为x4,x5,方差分别为s42,s52,第四组和第五组所有宣传使者的年龄平均数为z,方差为s2,进而根据方差{4×[s42+(x4−z)2]+2×[s52+(x5−z)2]},代入计算即可得答案.公式有s2=16解:(1)设这m人的平均年龄为x,则x=22.5×0.05+27.5×0.35+32.5×0.3+37.5×0.2+42.5×0.1=32.25.设第80百分位数为a,由5×0.02+(40−a)×0.04=0.2,解得a=37.5.(2)由频率分布直方图得各组人数之比为1:7:6:4:2,故各组中采用分层随机抽样的方法抽取20人,第四组和第五组分别抽取4人和2人,设第四组、第五组的宣传使者的年龄的平均数分别为x4,x5,方差分别为s42,s52,,s52=1,则x4=37,x5=43,s42=52设第四组和第五组所有宣传使者的年龄平均数为z,方差为s2.=39,则z=4x4+2x56{4×[s42+(x4−z)2]+2×[s52+(x5−z)2]}=10,s2=16因此,第四组和第五组所有宣传使者的年龄方差为10,据此,可估计这m人中年龄在35~45岁的所有人的年龄方差约为10.19、为了推进分级诊疗,实现“基层首诊、双向转诊、急慢分治、上下联动”的诊疗模式,某城市自2020年起全面推行家庭医生签约服务.已知该城市居民约为1000万,从0岁到100岁的居民年龄结构的频率分布直方图如图1所示.为了解各年龄段居民签约家庭医生的情况,现调查了1000名年满18周岁的居民,各年龄段被访者签约率如图2所示.(1)估计该城市年龄在50岁以上且已签约家庭医生的居民人数;(2)据统计,该城市被访者的签约率约为44%.为把该城市年满18周岁居民的签约率提高到55%以上,应着重提高图2中哪个年龄段的签约率?并根据已有数据陈述理由.答案:(1)195.99万;(2)应着重提高30-50这个年龄段的签约率,理由见解析.解析:(1)根据题中频率分布直方图与各年龄段被访者的签约率,分别计算50岁以上各年龄段的居民人数,再求和,即可得出结果;(2)根据题中条件,先确定年龄在18-30岁的人数,年龄在30-50岁的人数,以及年龄在50岁以上的人数,即可确定结果.(1)该城市年龄在50-60岁的签约人数为:1000×0.015×10×55.7%=83.55万;在60-70岁的签约人数为:1000×0.010×10×61.7%=61.7万;在70-80岁的签约人数为:1000×0.004×10×70.0%=28万;在80岁以上的签约人数为:1000×0.003×10×75.8%=22.74万;故该城市年龄在50岁以上且已签约家庭医生的居民人数为:83.55+61.7+28+22 .74=195.99万;(2)年龄在10-20岁的人数为:1000×0.005×10=50万;年龄在20-30岁的人数为:1000×0.018×10=180万.所以,年龄在18-30岁的人数大于180万,小于230万,签约率为30.3%;年龄在30-50岁的人数为1000×0.037×10=370万,签约率为37.1%.年龄在50岁以上的人数为:1000×0.032×10=320万,签约率超过55%,上升空间不大.故由以上数据可知这个城市在30-50岁这个年龄段的人数为370万,基数较其他年龄段是最大的,且签约率非常低,所以为把该地区满18周岁居民的签约率提高到以上,应着重提高30-50这个年龄段的签约率.20、某服装公司计划今年夏天在其下属实体店销售一男款衬衫,上市之前拟在该公司的线上旗舰店进行连续20天的试销,定价为260元/件.试销结束后统计得到该线上专营店这20天的日销售量(单位:件)的数据如图.(1)若该线上专营店试销期间每件衬衫的进价为200元,求试销期间该衬衫日销售总利润高于9500元的频率.(2)试销结束后,这款衬衫正式在实体店销售,每件衬衫定价为360元,但公司对实体店经销商不零售,只提供衬衫的整箱批发,大箱每箱有70件,批发价为160元/件;小箱每箱有60件,批发价为165元/件.某实体店决定每天批发大小相同的2箱衬衫,根据公司规定,当天没销售出的衬衫按批发价的8折转给另一家实体店.根据往年的销售经验,该实体店的销售量为线上专营店销售量的80%,以线上专营店这20天的试销量估计该实体店连续20天的销售量.以该实体店连续20天销售该款衬衫的总利润作为决策,试问该实体店每天应该批发2大箱衬衫还是2小箱衬衫?答案:(1)0.55;(2)该实体店应该每天批发2大箱衬衫.分析:(1)先利用不等式性质求得要使得日销售总利润高于9500元时日销售衬衫的件数的取值范围,然后根据频数分布图计算对应的天数,从而求得响应频率;.(2)由题可知,该实体店20天的日销售量情况为3天日销售量为48件,6天日销售量为80件,7天日销售量为128件,4天日销售量为160件.分别就选择批发2小箱时和2大箱时各种情况下的日利润列举计算,并求得相应的总利润,进行比较大小即可做出判断.解:(1)因为试销期间每件衬衫的利润为260−200=60元,≈158.3,所以要使得日销售总利润高于9500元,则日销售衬衫的件数大于950060=0.55.故所求频率为7+420(2)由题可知,该实体店20天的日销售量情况为3天日销售量为48件,6天日销售量为80件,7天日销售量为128件,4天日销售量为160件.若选择批发2小箱,则批发成本为60×2×165=19800元,当日销售量为48件时,当日利润为48×360+0.8×(120−48)×165−19800=6984元;当日销售量为80件时,当日利润为48×360+0.8×(120−80)×165−19800=14280;当日销量为128件或160件时,当日利润为120×360−19800=23400元.所以这20天销售这款衬衫的总利润为6984×3+14280×6+23400×11=364032元.若选择批发2大箱,则批发成本为70×2×160=22400元,当日销售量为48件时,当日利润为48×360+0.8×(140−48)×160−22400=6656元;当日销售量为80件时,当日利润为80×360+0.8×(140−80)×160−22400=14080元;当日销量为128件时,当日利润为128×360+0.8×(140−128)×160−22400=25216元.当日销售量为160件时,当日利润为140×360−22400=28000元.所以这20天销售这款衬衫的总利润为6656×3+14080×6+25216×7+28000×4=392960元. 因为392960>364032,所以该实体店应该每天批发2大箱衬衫.。
高考数学总复习(一轮)(人教A)教学课件第九章 统计、成对数据的统计分析第1节 随机抽样、统计图表
解析:(2)最先读到的4袋牛奶的编号是614,593,379,242,向右读得
到203,722,104,再下一个数是887,887大于850,故舍去,再下一个
数是088.
考点二
分层随机抽样
角度一
条形图和
直观描述不同类别或分组数据的
直方图
折线图
频数和频率
描述数据随时间的变化趋势
4.频率分布直方图的制作步骤
(1)求极差:极差为一组数据中 最大值
与最小值的差.
(2)决定组距与组数:当样本量不超过100时,常分成 5~12
组,
一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表:一般分四列,即分组、 频数累计、频数、 频率 .
A.0.61
B.0.675
)
C.0.74
D.0.8
√
解析:(2)由分层抽样可得高三(1)班抽取的人数 n1=
×10=6,
+
高三(2)班抽取的人数 n2=
于是总的样本平均数 =
×10=4,
+
×+×.
=1.2,
所以总的样本方差
2
2
2
s = ×[1+(1-1.2) ]+ ×[0.35+(1.5-1.2) ]=0.8.故选 D.
容量为20的一个样本,则每个个体被抽到的概率为(
A.
B.
C取到的概率是
.故选D.
=
材料员-专业基础知识-抽样统计分析基本知识
材料员-专业基础知识-抽样统计分析基本知识[单选题]1.如果一个总体是由质量明显差异的几个部分组成,则宜采用()。
A.整群抽样B.分层随机抽样C.系统抽样D.简单随机抽样(江南博哥)正确答案:B参考解析:分层抽样试讲质量明显差异的几个部分分成若干层,使层内质量均匀,而层间差异较为明显。
[单选题]2.抽样一般程序的第一步为()。
A.制定抽样框B.制定抽样方案C.界定抽样总体D.预估样本质量正确答案:C参考解析:抽样一般程序的第一步为界定抽样总体。
[单选题]3.对于左缓坡型直方图,其可能的原因是()A.分组组数不当B.原材料发生变化,或者临时他人顶班作业C.操作中对上限控制太严D.数据收集不正常正确答案:C参考解析:左缓坡型主要是由于操作中对上限控制太严造成的。
[单选题]4.在统计工作中,可以根据产品的质量管理规程或实际()选定总体的范围。
A.工作需要B.功能需要C.特性需要D.其他需求正确答案:A参考解析:在统计工作中,可以根据产品的质量管理规程或实际工作需要选定总体的范围。
[单选题]5.分层抽样的特点是()。
A.层内差异小,层间差异大B.层间差异小,层内差异大C.层问差异小D.层间差异大正确答案:A参考解析:因为只有层间差异大,才能保证抽样的有效性,而层内差异小是要保证层内每个个体的差别不大,能够使其抽样精确度提高。
[单选题]6.简单随机抽样又称纯随机抽样,()随机抽样。
A.局部B.不完全C.完全D.其他正确答案:C参考解析:简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
[单选题]7.在数理统计分析法中,用来显示在质量控制中两种质量数据之间关系的方法是:()。
A.统计调查表法B.直方图法C.控制图法D.相关图法正确答案:D参考解析:统计调查表法是利用专门设计的统计表对数据进行收集、整理和粗略分析质量状态的一种方法。
直方图法是用以描述质量分布状态的一种分析方法。
第九章抽样统计分析的基本知识演示文稿ppt
随机抽样 样本 检测 整理
二、质量数据的收集方法★
(一)全数检验 (二)随机抽样检验
(一)全数检验
全数检验是对总体中的全部个体逐一 观察、测量、计数、登记,从而获得对总 体质量水平评价结论的方法。
(二)随机抽样检验★
抽样检验是按照随机抽样的原则,从 总体中抽取部分个体组成样本,根据对样 品进行检测的结果,推断总体质量水平的 方法。
(三) 质量数据分布的规律性
以质量标准为中心的质量数据分布, 可用一个“中间高、两端低、左右对称” 的几何图形表示,即一般服从正态分布
整群抽样一般是将总体按自然存在的 状态分为若干群,并从中抽取样品群,组 成样本,然后在中选群内进行全数检验的 方法。
如对原材料质量进行检测,可按原包 装的箱、盒为群随机抽取,对中选箱、盒 做全数检验;每隔一定时间抽出一批产品 进行全数检验等。
5. 多阶段抽样
多阶段抽样又称多级抽样,是将各种 单阶段抽样方法结合使用,通过多次随机 抽样来实现的抽样方法。
标准差小说明数据分布的集中程度高, 离散程度小,均值对总体的代表性好。
标准差的平方是方差,能确切地说明数 据的离散程度和波动规律,是最常用的反映 数据变异程度的特征值。
(3) 变异系数(离散系数)
1) 总体的变异系数
Cv
2) 样本的变异系数 Rxmaxxmin
变异系数又称离散系数,是用标准差除以算术 平均数得到的相对数。它表示数据的相对离散波动 程度。变异系数小,说明分布集中程度高,离散程 度小,均值对总体(样本)的代表性好。
1. 简单随机抽样 2. 分层抽样 3. 等距抽样 4. 整群抽样 5. 多阶段抽样
1. 简单随机抽样
简单随机抽样又称纯随机抽样、完全随机 抽样,是对总体不进行任何加工,直接进行随 机抽样,获取样本的方法。
人教版高中数学必修二《第九章 统计》单元导学案及答案
人教版高中数学必修二《第九章统计》单元导学案《9.1.1简单的随机抽样》导学案【学习目标】1.体会随机抽样的必要性和重要性2.理解随机抽样的目的和基本要求;3.掌握简单随机抽样中的抽签法、随机数法的一般步骤【自主学习】知识点1 统计的基本概念1.总体:一般把所考察对象的某一数值指标的全体构成的集合看成总体.2.个体:构成总体的每一个元素作为个体.3.样本:从总体中抽出若干个个体所组成的集合叫样本.4.样本容量:样本中个体的数目叫样本容量.知识点2 简单随机抽样1.一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的四个特点(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作.(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.知识点3 抽签法和随机数法1.抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.3.利用随机数法抽取个体时的注意事项(1)定起点:事先应确定以表中的哪个数(哪行哪列)作为起点. (2)定方向:读数的方向(向左、向右、向上或向下都可以).(3)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.知识点4 总体平均数和加权平均数1.一般地,总体中有N 个个体,它们的变量值分别为Y 1,Y 2,…,Y N ,则称∑==++=Ni iN YN N Y Y Y Y 1211 为总体均值,又称总体平均数.2.一般地,对于f 1个x 1,f 2个x 2,…,f n 个x n ,共f 1+f 2+…+f n 个数组成的一组数据的平均数为x 1f 1+x 2f 2+…+x n f nf 1+f 2+…+f n.这个平均数叫做加权平均数,其中f 1, f 2,…, f n 叫做权,这个“权”,含有权衡所占份量的轻重之意,即f i (i =1,2,…,k )越大,表明x i 的个数越多,“权”就越大.【合作探究】探究一 简单随机抽样的判断【例1】下面的抽样是简单随机抽样吗?为什么?(1)小乐从玩具箱中的10件玩具中随意拿出一件玩,玩后放回,再拿出一件,连续拿出四件;(2)某学校从300名学生中一次性抽取20名学生调查睡眠情况.解 (1)不是简单随机抽样,因为玩具被放回了,不符合“不放回抽样”这一特点. (2)不是简单随机抽样,因为一次性抽取不符合“逐个抽取”这一特点.反思与感悟 当抽样具有:(1)总体中个体数是有限的,(2)逐个抽取,(3)不放回抽取,(4)每个个体被抽到的机会等可能时,为简单随机抽样,否则不是简单随机抽样.【练习1】下面的抽样方法是简单随机抽样的是( )A .盒子中有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里B .某车间包装一种产品,在自动包装传送带上,每隔5分钟抽一包产品,称其重量是否合格C .某校分别从行政人员、教师、后勤人员中抽取2人,14人,4人了解对他们学校机构改革的意见D .从8台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)答案 D解析 依据简单随机抽样的特点知,只有D 符合.探究二 简单随机抽样等可能性应用【例2】一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是________,第三次抽取时,剩余每个小球被抽到的可能性是________.答案310 18解析 因为简单随机抽样过程中每个个体被抽到的可能性均为n N ,所以第一个空填310.因为本题中的抽样是不放回抽样,所以第一次抽取时,每个小球被抽到的可能性为110,第二次抽取时,剩余9个小球,每个小球被抽到的可能性为19,第三次抽取时,剩余8个小球,每个小球被抽到的可能性为18.反思与感悟 简单随机抽样,每次抽取时,总体中各个个体被抽到的概率相同,在整个抽样过程中各个个体被抽到的机会也都相等.【练习2】从总体容量为N 的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N 的值为( )A .120B .200C .150D .100答案 A解析 因为从含有N 个个体的总体中抽取一个容量为30的样本时,在每次抽取一个个体的过程中任意一个个体被抽到的可能性为1N,在整个抽样过程中每个个体被抽到的可能性为30N ,所以30N=0.25,从而有N =120.故选A.探究三 抽签法的应用【例3】某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.解 方案如下:第一步,将18名志愿者编号,号码为01,02,03,…,18. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放到一个不透明的盒子中,充分搅匀. 第四步,从盒子中依次取出6个号签,并记录上面的编号. 第五步,与所得号码对应的志愿者就是医疗小组成员.反思与感悟 一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.【练习3】从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴. 解 第一步,将20架钢琴编号,号码是01,02,…,20. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀. 第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号. 第五步,与所得号码对应的5架钢琴就是要进行质量检查的对象.探究四 随机数法的应用【例4】假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?解 第一步,将800袋牛奶编号为000,001, (799)第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7). 第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.【练习4】总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )A .答案D解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01.其中第二个和第四个都是02,重复.可知对应的数值为08,02,14,07,01,则第5个个体的编号为01.探究五 总体平均数和加权平均数【例5】小林在八年级第一学期的数学书面测验成绩分别为:平时考试第一单元得84分,第二单元得76分,第三单元得92分;期中考试得82分;期末考试得90分,如果按照平时、期中、期末的权重分别为10%、30%、60%计算,那么小林该学期数学书面测验的总平均成绩应为多少分?解:x (平时单元测试平均成绩)=84+76+923=84(分).所以总平均成绩为84×10%+82×30%+90×60%10%+30%+60%=87(分).所以小林该学期数学书面测验的总平均成绩应为87分【练习5】2. “一世”又叫“一代”.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也”,清代·段玉裁《说文解字注》:“三十年为一世,按父子相继曰世”.而当代中国学者测算“一代”平均为25年.另根据国际一家研究机构的研究报告显示,全球家族企业的平均寿命其实只有26年,约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代甚至更久远(为了研究方便,超过四代的可忽略不计).根据该研究机构的研究报告,可以估计该机构所认为的“一代”大约为()A. 23年B. 22年C. 21年D. 20年答案:B【分析】设“一代”为x年,根据约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代,列出频率分布表,然后根据平均寿命其实只有26年,利用平均数的求法求解.【详解】设“一代”为x年,由题意得:企业寿命的频率分布表为:又因为全球家族企业的平均寿命其实只有26年,所以家族企业的平均寿命为:0.540.50.28 1.50.14 2.50.04 3.526⨯+⨯+⨯+⨯=,x x x xx≈,解得22故选:B《9.1.2分层随机抽样 9.1.3获取数据的途径》导学案【学习目标】1.理解并掌握分层随机抽样,会用分层随机抽样从总体中抽取样本2.记住分层随机抽样的特点和步骤3.利用分层随机抽样的方法解决实际问题4.了解获取数据的途径,并学会简单应用【自主学习】知识点1 分层随机抽样的概念 (1)定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)适用范围当总体是由差异明显的几个部分组成时,往往采用分层随机抽样. (3)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.知识点2 分层随机抽样的步骤(1)根据已掌握的信息,将总体分成若干部分.(2)根据总体中的个体数N 和样本量n 计算出抽样比k =nN.(3)根据抽样比k 计算出各层中应抽取的个体数:n N·N i (其中N i 为第i 层所包含的个体总数).(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n 的样本.【合作探究】探究一 分层随机抽样的概念【例1-1】(1) 下列问题中,最适合用分层随机抽样抽取样本的是( ) A .从10名同学中抽取3人参加座谈会B .一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分,现从中抽取12人了解有关情况C .从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )A .每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【答案】(1)B (2)C[分析] 当总体由差异明显的几部分组成时,该样本的抽取适合用分层随机抽样,结合题中的四个选项及分层随机抽样的特点可对(1)(2)作出判断.[解析] (1)A中总体个体无明显差异且个数较少,不适合用分层随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.(2)保证每个个体等可能地被抽取是简单随机抽样和分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.归纳总结:1.使用分层随机抽样的前提:,分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.2.使用分层随机抽样应遵循的原则:(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.【练习1】某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A.抽签法B.随机数法C.分层随机抽样法D.任何抽样法都可以【答案】 C解析:由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样法.探究二分层随机抽样的设计【例2】某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.[分析] 观察特征→确定抽样方法→求出比例→确定各层样本数→从各层中抽样→成样[解] 因机构改革关系到每个人的不同利益,故采用分层随机抽样方法较妥. ∵20100=15,∴105=2,705=14,205=4. ∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人. 因副处级以上干部与工人数都较少,将他们分别按1~10和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.这样便得到了一个容量为20的样本.归纳总结:分层随机抽样的特点1适用于总体由差异明显的几部分组成的情况.2更充分体现和反映了总体的情况.3等可能抽样,每个个体被抽到的可能性都相等.【练习2】某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取的数量为( )A .15,15,16B .6,30,10C .10,13,23D .12,16,18 【答案】 B解析:三种型号的轿车共9 200辆,抽取样本为46辆,则按469 200=1200的比例抽样,所以依次应抽取1 200×1200=6(辆),6 000×1200=30(辆),2 000×1200=10(辆). 探究三 获取数据的途径【例3】为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )A .通过调查获取数据B .通过试验获取数据C .通过观察获取数据D .通过查询获得数据【答案】D [因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.]归纳总结:【练习3】下列调查方案中,抽样方法合适、样本具有代表性的是( )A.用一本书第1页的字数估计全书的字数B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有一些名人的名字,要求每个学生只能在一个名字下面画“√”,以了解全省中学生最崇拜的人物是谁D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查【答案】B[A中样本缺少代表性(第1页的字数一般较少);B中抽样保证了随机性原则,样本具有代表性;对于C,城市中学与农村中学的规模往往不同,学生崇拜的人物也未必在所列的名单之中,这些都会影响数据的代表性;D中总体数量很大,而样本容量太少,不足以体现总体特征.]《9.2.1总体取值规律的估计》导学案【学习目标】1.学会用频率分布直方图表示样本数据2.能通过频率分布直方图对数据做出总体统计【自主学习】知识点1 频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差.(2)决定组距与组数.组距与组数的确定没有固定的标准,一般来说,数据分组的组数与数据的个数有关,数据的个数越多,所分组数越多,当样本量不超过100时,常分为5~12组.(3)将数据分组.(4)列频率分布表,计算各小组的频率,作出频率分布表.(5)画频率分布直方图.其中横轴表示样本数据,纵轴表示频率与组距的比.知识点2 频率分布直方图的意义频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.【合作探究】探究一 频率分布概念的理【答案】【例1】例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 【答案】 D【答案】析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.归纳总结:由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失.【练习1】一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 【答案】 D【答案】析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.探究二 频率分布直方图的绘制【例2】某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?【答案】(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.归纳总结:频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.【练习2】如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.【答案】(1)样本频率分布表如下:(2)(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.探究三频率分布直方图的应用【例3】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).【答案】 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.归纳总结:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.【练习3】某学校组织学生参加数学测试,某班学生的成绩频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生总人数是( )A.45 B.50 C.55 D.60【答案】 B【答案】析结合频率分布直方图,得分低于60分的人数占总人数的频率为20×(0.005+0.01)=0.30,所以总人数为150.30=50,故选B.《9.2.2总体百分位数的估计》导学案【学习目标】1.理解百分位数的概念2.掌握计算百分位数的方法【自主学习】知识点1 百分位数(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.知识点2 如何计算百分位数下面的步骤来说明如何计算第p百分位数.第1步:以递增顺序排列原始数据(即从小到大排列).第2步:计算 i =np %.第3步:①若 i 不是整数,将 i 向上取整.大于i 的比邻整数即为第p 百分位数的位置;②若i 是整数,则第p 百分位数是第i 项与第(i +1)项数据的平均值.【合作探究】探究一 百分位数的计算【例1】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g) 如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0. (1)分别求出这组数据的第25,75,95百分位数. (2)请你找出珍珠质量较小的前15%的珍珠质量.(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.[解] (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4, 则第25百分位数是8.0+8.32=8.15,第75百分位数是8.6+8.92=8.75,第95百分位数是第12个数据(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g ,第50百分位数为8.5 g, 第95百分位数是9.9 g ,所以质量小于或等于8.15 g 的珍珠为次品,质量大于8.15 g 且小于或等于8.5 g 的珍珠为合格品,质量大于8.5 g 且小于等于9.9 g 的珍珠为优等品,质量大于9.9 g 的珍珠为特优品.【练习1】以下数据为参加数学竞赛决赛的15人的成绩: 78,70,72,86,88,79,80,81,94,84,56,98,83,90,91, 则这15人成绩的第80百分位数是( ) A .90 B .90.5 C .91 D .91.5答案B [把成绩按从小到大的顺序排列为: 56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.]探究二 百分位数的综合应用【例2】某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y (单位:元)关于月用电量x (单位:千瓦时)的函数解析式. (2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a ,b 的值.(3)根据(2)中求得的数据计算用电量的75%分位数.[解] (1)当0≤x ≤200时,y =0.5x ;当200<x ≤400时,y =0.5×200+0.8×(x -200)=0.8x -60; 当x >400时,y =0.5×200+0.8×200+1.0×(x -400)=x -140. 所以y 与x 之间的函数解析式为 y =⎩⎪⎨⎪⎧0.5x ,0≤x ≤200,0.8x -60,200<x ≤400,x -140,x >400.(2)由(1)可知,当y =260时,x =400,即用电量不超过400千瓦时的占80%, 结合频率分布直方图可知⎩⎪⎨⎪⎧0.001×100+2×100b +0.003×100=0.8,100a +0.000 5×100=0.2,解得a =0.001 5,b =0.002 0. (3)设75%分位数为m ,。
抽样统计分析的基本知识点考题
抽样统计分析的基本知识(一)数理统计的基本概念、抽样调查的方法Z9.1.1全数检查和抽样检查的基本概念,理解总体、单位产品、批和样品、样本统计量、抽样分布、抽样检验的含义。
(P213)判断题1. (易)与全数检查相比,抽样检查的错判往往不可避免,因此供方和需方都要承担风险,因此应选择全数检查。
【答案】错误【解析】鉴于单位产品质量的波动性和样本抽取的偶然性,抽样检查的错判往往不可避免,因此供方和需方都要承担风险,但与全数检查相比,其明显的优势是经济性。
见教材第9章第1节P213。
2. (易)“不合格”是对单位产品的判定。
【答案】错误【解析】“不合格”是对质量特性的判定,“不合格品”是对单位产品的判定,单位产品的质量特性不符合规定,即为不合格。
见教材第9章第1节P214。
3. (易)样本统计量是样本的函数,是一个随机变量。
【答案】正确【解析】样本统计量是随机变量,随着抽到的样本单位不同其取值也会有变化,统计量是样本的函数,是一个随机变量。
见教材第9章第1节P214。
单选题1. (中)组成总体的基本元素称为()。
A.样本B.个体C.单位产品D.子样【答案】B【解析】在数理统计学中,总体是所研究对象的全体,个体是组成总体的基本元素,样本是从总体中随机抽取出来,被抽中的个体称为样品。
见教材第9章第1节P213。
Z9.1.2 样本数据特征值的含义,常用的数据特征值有算数平均数、中位数、极差、标准差、变异系数等,掌握其计算公式。
(P215)判断题1. (易)当样本数为偶数时,取居中两个数的平均值作为中位数。
【答案】正确【解析】样本中位数是将样本数据按数值大小有序排列后,位置居中的数值,当样本数为偶数时,取居中两个数的平均值作为中位数。
见教材第9章第1节P215。
2. (易)标准差小,说明分布集中程度低,离散程度小。
【答案】错误【解析】标准差值小,说明分布集中程度高,离散程度小,均值对总体的代表性好。
见教材第9章第1节P215。
人教A版(新教材)高中数学第二册(必修2)课件3: 第九章统计章末复习
分组
频数
频率
60.5~70.5
8
0.16
70.5~80.5
10
0.20
80.5~90.5
18
0.36
90.5~100.5 14
0.28
合计
50
1
(2)在被抽到的学生成绩中,在 85.5~95.5 分的个数是 9+7=16,占样 本的比例是1560=0.32,即获得二等奖的概率约为 32%,所以获得二等 奖的学生约有 800×32%=256(名).
(1)填充频率分布表中的空格(将答案直接填在表格内),并作出
频率分布直方图;
分组
频数 频率
60.5~70.5
0.16
70.5~80.5
10
80.5~90.5
18
0.36
90.5~100.5
合计
(2)若成绩在 85.5~95.5 分的学生为二等奖,问参赛学生中获得
二等奖的学生约有多少名?
解 (1)频率分布表如下表所示,频率分布直方图如图所示.
三、利用样本的百分位数估计总体的百分位数 [典例 3] 一家保险公司决定对推销员实行目标管理,即给推销员 确定一个具体的销售目标.确定的销售目标是否合适,直接影响 到公司的经济效益.如果目标定得过高,多数推销员完不成任务, 会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员 的工作潜力.下面一组数据是部分推销员的月销售额(单位:千元).
二、利用样本的频率分布估计总体的取值规律 本章主要利用统计表、统计图分析估计总体的分布规律.要熟练掌握绘 制统计图表的方法,明确图表中有关数据的意义是正确分析问题的关键, 从图形与图表中获取有关信息并加以整理,是近年来高考命题的热点. [典例 2] 为了让学生了解更多有关“一带一路”倡议的信息,某中学举 行了一次“丝绸之路知识竞赛”,共有 800 名学生参加了这次竞赛.为 了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满 分为 100 分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:
9.1.1简单随机抽样方法
本章知识结构框图如下: 实际问题
总体 普 查
总体数据
简单随机抽样、分层随机抽样
总体数据的特征 总体的取值规律
总体的百分位数
估计 估计
样本数据的特征 样本的取值规律
样本的百分位数
样本
总体的平均数、中位数 估计 样本的平均数、中位数
众数 总体的标准差、方差 估计 样本的标准差、方差
极差
极差
决策与建议
样本观测数据
二、本章学习任务与指导 三个任务的完成,就生成了一个统计问题完整解决的基本思路:首先要根据实际需求, 用适当的方法获取样本数据,选择适当的统计图表对样本数据进行整理和描述,在此 基础上用各种统计方法对样本数据进行分析,从样本数据中提取需要的信息,推断总 体的情况,进而解决相应的实际问题,获得结论,为人们制定决策提出建议
总体 ____调__查__对__象___的全体叫作总体
个体 组成总体的每一个_调__查__对__象__成为个体
抽样调查 根据一定目的,从总体中抽取_一__部__分___个__体__进行调查,并以此为依据对 总体的情况作出估计和推断的调查方法,成为抽样调查
样本 从总体中抽取的那部分___个__体___成为样本
二、本章学习任务与指导 从本章知识结构图中可以看出,本章有三大学习任务:面对实际问题的解决,为人们 的决策提供什么样的建议,始终是我们学习本章的第一任务,也是我们学好本章的目标 驱动任务,也就是教材9.3节内容 那么,要完成这一任务,需要我们用样本的数据特征及其分布的规律性来估计、推断 出总体的数据特征及其分布的规律,例如,总体的取值规律、百分数、集中趋势、离 散程度等等,这是学习本章的第二任务也就是教材9.2节内容 要完成第二大任务,即“用样本估计总体”,就需要我们抽取“好”的或“高质量”的 样本,这就存在一个如何抽取样本的问题,即抽样方法问题,这是学习本章的第三任务。 也就是教材9.1节内容
抽样统计分析的基本知识
抽样统计分析的基本知识引言在统计学中,抽样是一种常用的数据分析方法,通过从总体中选择一部分样本数据进行分析,从而得出关于总体的结论。
抽样统计分析为我们提供了一种有效的方式来推断总体特征,并进行决策或预测。
本文将介绍抽样统计分析的基本知识,包括抽样方法、样本量的确定和抽样误差的控制等内容。
一、抽样方法抽样方法是确定如何从总体中选取样本的方式。
常见的抽样方法有以下几种:1. 简单随机抽样简单随机抽样是指从总体中按照概率相等的方式选择样本,每个样本的选取是相互独立的。
简单随机抽样常用的方式有抽签、随机数表等。
简单随机抽样的优点在于样本的代表性较高,能够减小抽样误差。
然而,简单随机抽样的缺点在于实施起来可能比较复杂,且对总体的特征了解较少的情况下可能效果不佳。
2. 系统抽样系统抽样是从总体中选取样本的方法之一,通过确定一个固定的抽样间距,从总体中选取每隔固定间距的样本。
系统抽样的优点在于实施简单,抽样结果仍具有一定的代表性。
不过,需要注意的是如果总体呈现出周期性或有规律的特点,系统抽样可能引入系统误差,导致样本的代表性出现偏差。
3. 整群抽样整群抽样是将总体划分为若干个互不重叠的群体,然后从这些群体中随机选择部分群体作为样本。
整群抽样的优点在于可以减少抽样的成本,提高调查的效率。
然而,整群抽样可能引入群体间的差异性,因此在分析时需要考虑群体间的相似性程度。
4. 分层抽样分层抽样是将总体划分为互不重叠的若干个层次,然后从每个层次中分别进行抽样。
分层抽样的优点在于可以针对不同层次的特点进行分析,提高样本的代表性。
然而,在进行分层抽样时需要事先对总体的特征有一定了解,并且分层的选择要合理。
5. 整体抽样整体抽样是指直接选取总体中的全部元素作为样本。
整体抽样的优点在于样本的代表性最高,不会引入抽样误差。
然而,整体抽样的缺点在于样本量较大,造成调查成本的增加。
二、样本量的确定样本量的确定是保证抽样结果具有一定代表性的重要因素。
新教材高中数学第九章统计1
分层随机抽样市体育协会组织了“健步走”活动,活动共有10 000余人参加,按参加者年龄分老年组、青年组和少年组。
活动后市电视台拟从参加比赛的人群中抽取10人进行采访。
【问题1】上述问题中总体有什么特征?【问题2】抽取样本时采用抽签法合适吗?【问题3】你认为怎样抽取样本更合理?1.分层随机抽样(1)分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)应用:抽取样本.1.本质:对于含有差异明显几个层的总体随机抽样的一种方法,即按照一定比例进行抽样.2.混淆:不要与简单随机抽样混淆.3.简单随机抽样和分层随机抽样的区别和联系(1)区别:简单随机抽样是从总体中逐个抽取样本;分层随机抽样则首先将总体分成几层,在各层中按比例分别抽取样本.(2)联系:①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再将它放回,即不放回抽样. 2.分层随机抽样中的总体平均数与样本平均数1层 2层 层个体数 M N 层样本量 m n 层个体 变量值 X 1,X 2,…,X MY 1,Y 2,…,Y N层样本 的个体 变量值x 1,x 2,…,x m y 1,y 2,…,y n层总体 平均数X =X 1+X 2+…+X M M =1M∑i =1MX iY =Y 1+Y 2+…+Y N N =1N∑i =1NY i层样本 平均数x =x 1+x 2+…+x m m =1m ∑i =1mx iy =y 1+y 2+…+y n n =1n∑i =1ny i总体平 均数W =∑i =1M X i +∑i =1NY iM +N样本平 均数w =∑i =1mx i +∑i =1ny im +n3.获取数据的途径 获取数据的基本途径有: (1)通过调查获取数据; (2)通过试验获取数据; (3)通过观察获取数据; (4)通过查询获取数据.1.分层随机抽样时,样本是在各层中分别抽取吗?2.分层随机抽样中,个体数量较少的层抽取的样本量较少,这是公平的吗?3.观察法是获取样本数据的途径吗?4.在比例分配的分层随机抽样中,可以直接用样本平均数w估计总体平均数W,是吗?提示:1.是;2.是;3.是;4.是.阅读教材P181问题3,如果要抽取一个有代表性的样本,男、女生的抽取比例大致是多少?提示:326∶386=163∶193.1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )A.简单随机抽样B.抽签法C.随机数法D.分层随机抽样【解析】选D.从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样.2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用比例分配的分层随机抽样法从中抽取一容量为20的样本,则抽取管理人员______人.【解析】20160=18,设管理人员为x人,则x32=18,得x=4.答案:4基础类型一获取数据的途径(数学抽象)1.“中国天眼”为500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )A.通过调查获取数据 B.通过试验获取数据C.通过观察获取数据 D.通过查询获得数据【解析】选C.“中国天眼”主要是通过观察获取数据.2.下列哪些数据一般是通过试验获取的( )A.2021年济宁市的降雨量B.2021年全国新生儿人口数量C.某学校高一年级同学的数学测试成绩D.某种特效中成药的配方【解析】选D.某种特效中成药的配方的数据一般通过试验获得.3.下列调查所抽取的样本具有代表性的是( )A.利用某地七月份的日平均最高气温值估计该地全年的日平均最高气温B.在农村调查市民的平均寿命C.利用一块试验水稻田的产量估计水稻的实际产量D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验【解析】选D.A项中某地七月份的日平均最高气温值不能代表全年的日平均最高气温;B项中在农村调查得到的平均寿命不能代表市民的平均寿命;C项中试验田的产量与水稻的实际产量相差可能较大,只有D项正确.1.获取数据的基本途径:观察、查询、调查、试验.2.根据调查问题的特点设计抽样调查的不同方案,应遵循的原则:(1)要考虑如何保证调查内容的真实性;(2)要考虑如何合理地获取样本,以确保其典型性、代表性.基础类型二分层随机抽样的概念(数学抽象)【典例】1.分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行( ) A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【解析】选C.为了保证每个个体等可能的被抽取,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.2.下列问题中,适合用分层随机抽样抽取样本的是( )A.学校从10个优秀节目中抽取3个参加县元旦晚会B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C.某学校有男、女学生各500名,为了解学生的期末复习情况,拟抽取100名学生进行调查D .某啤酒厂质检员从生产流水线上,抽取样本检查产品质量【解析】选B.A 中总体所含个体无差异且个数较少,适合用简单随机抽样;C 中总体虽然分男、女两个层,但是要了解期末复习情况,没有必要采取分层随机抽样;D 中总体所含个体无差异,不适合用分层随机抽样;B 中总体所含个体差异明显,并且要了解购买能力,与收入关系密切,适合用分层随机抽样.分层随机抽样的特点(1)适用于总体由差异明显的几部分组成的情况; (2)更充分地反映了总体的情况;(3)等概率抽样,每个个体被抽到的概率都相等.为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) A .抽签法抽样 B .按性别分层随机抽样 C .按年龄段分层随机抽样 D .随机数法抽样【解析】选C.该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女差异不大,所以按年龄段分层随机抽样具有代表性,比较合理.【加固训练】为了保证分层随机抽样时每个个体被等可能地抽取,必须要求( ) A .每层等可能抽取 B .每层抽取的个体数相等C .每层抽取的个体数可以不一样多,但必须满足抽取n i =n·N i N (i =1,2,…,k)个个体(其中i 是层的序号,k 是总层数,n 为抽取的样本容量,N i 是第i 层中的个体数,N 是总体容量)D .只要抽取的样本容量一定,每层抽取的个体数没有限制【解析】选C.分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样. A 中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故A 不正确; B 中,由于每层的个体数不一定相等,每层抽取同样多的个体数,显然从总体来看,各层的个体被抽取的可能性就不相等了,因此B 也不正确;C 中,对于第i 层的每个个体,它被抽到的可能性与层数i 无关,即对于每个个体来说,被抽取为样本的可能性是相同的,故C 正确;D 显然不正确.综合类型 分层随机抽样的应用(数据分析)比例分配的计算【典例】我国古代数学专著《九章算术》中有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A .104人 B .108人 C .112人 D .120人【解析】选 B.由题意可知,这是一个分层随机抽样的问题,其中北乡可抽取的人数为300×8 1008 100+7 488+6 912 =300×8 10022 500=108.分层随机抽样中按比例分配计算时,用到的两个关系式(1)样本量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.分层随机抽样的实际应用【典例】某政府机关在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.(1)若上级机关为了了解政府机构改革的意见,要从中抽取20人了解情况,应用何种方法抽取,请具体实施操作;(2)若要从工人中抽取2人作为工人代表,应用何种方法抽取.【解析】(1)由于机构改革关系到各人的不同利益,故采用分层随机抽样的方法为妥. 抽取过程如下:①将在编人员按副处级以上干部、一般干部、工人分成三层;②因为10020 =5,105 =2,705 =14,205 =4,所以从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.③由于副处级以上干部与工人人数都较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.④将这20人合在一起,构成样本.(2)要从工人中抽取2人作为工人代表,应用抽签法抽取最合适.分层随机抽样的步骤【加固训练】一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【解析】由题意知,该抽样为比例分配的分层随机抽样,抽取步骤如下:(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为100500 =15 ,则在不到35岁的职工中抽取125×15 =25(人);在35岁至49岁的职工中抽取280×15 =56(人);在50岁及50岁以上的职工中抽取95×15=19(人).(3)在各层按随机数法抽取样本. (4)汇总每层抽样,组成样本.用样本平均数估计总体平均数【典例】某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,按分层随机抽样的方法获得了部分学生一周的锻炼时间(单位:h),数据如下.甲 6 6.5 7 7.5 8 乙 6 7 8 9 10 11 12 丙34.567.5910.51213.5(1)(2)估计这个学校高一的学生中,一周的锻炼时间超过10个小时的百分比; (3)估计这个学校高一年级学生一周的平均锻炼时间.【解析】(1)由题干中的表格可知,按分层随机抽样的方法从甲、乙、丙3个班中分别抽取5个,7个,8个学生.故三个班学生人数之比为5∶7∶8.(2)由题意知,抽取的20个学生中,一周的锻炼时间超过10小时的有5人,故一周的锻炼时间超过10个小时的百分比为520=25%.(3)从甲班抽取的5名学生的总时间为6+6.5+7+7.5+8=35. 从乙班抽取的7名学生的总时间为6+7+8+9+10+11+12=63.从丙班抽取的8名学生的总时间为3+4.5+6+7.5+9+10.5+12+13.5=66. 则35+63+665+7+8 =16420=8.2.即这个学校高一年级学生一周的平均锻炼时间为8.2小时.在分层随机抽样中,如果第一层的样本量为m ,平均值为x ;第二层的样本量为n ,平均值为y ,则样本的平均值为mx +ny m +n.1.某学校为了解三年级、六年级、九年级这三个年级之间的学生的课业负担情况,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A .抽签法B .简单随机抽样 C.分层随机抽样D .随机数法【解析】选C.根据年级不同产生差异及按人数比例抽取易知应为分层随机抽样. 2.为了报考理想的大学,小明需要获取近年来我国各大学会计专业录取人数的相关数据,他获取这些数据的途径最好是( ) A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获得数据【解析】选D.因为近年来我国各大学会计专业录取人数的相关数据有存储,所以小明获取这些数据的途径最好是通过查询获得数据.3.为调查某快餐店各分店的经营状况,某统计机构用分层随机抽样的方法,从A ,B ,C 三个城市中抽取若干家某快餐店分店组成样本进行深入研究,有关数据见下表:(单位:个)城市 某快餐店数量抽取数量A 26 2B 13 x C39y则样本量为( )A.4 B.6 C.10 D.12【解析】选B.设所求的样本量为n,由题意得n26+13+39=226,解得n=6.4.从总体容量为N的一批零件中用分层抽样抽取一个容量为30的样本,若每个零件被抽取的可能性为0.25,则N等于______.【解析】分层抽样是等可能抽样,故总体容量为30÷0.25=120.答案:1205.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为______.【解析】ω=2020+30×3+3020+30×8=6.答案:6。
巧解高中数学必修二第九章统计知识点总结归纳
(名师选题)巧解高中数学必修二第九章统计知识点总结归纳单选题1、下面的四个问题中,可以用抽样调查方法的是()A.检验10件产品的质量B.银行对公司10万元存款的现钞的真假检验C.跳伞运动员检查20个伞包及伞的质量D.检验一批汽车的防碰撞性能答案:D分析:根据抽样与普查的概念,分析即可得答案.根据抽样与普查的概念可得,A、B、C一般采用普查方法,需逐一检验,D采用抽样调查的方法.故选:D2、国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为()随机数表如下:015432876595428753467953258657413369832445977386524435786241A.13B.24C.33D.36答案:D分析:随机数表进行读数时,确定开始的位置以及位数,逐一往后即可,遇到超出范围或重复的数字跳过即可.根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,所以第一组数字为32,作为第一个号码;第二组数字58,舍去;第三组数字65,舍去;第四组数字74,舍去;第五组数字13,作为第二个号码;第六组数字36,作为第三个号码,所以选取的第三个号码为36故选:D3、甲、乙两支曲棍球队在去年的国际比赛中,甲队的平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队的平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为()①甲队的技术比乙队好;②乙队发挥比甲队稳定;③甲队的表现时好时坏.A.0B.3C.2D.1答案:B分析:根据平均数、方差的知识,对四个说法逐一分析,由此得出正确选项.∵甲队平均数大于乙队的平均数,∴甲队的技术比乙队好,又∵甲队的标准差大于乙队的标准差,∴乙队发挥比甲队稳定,甲队的表现时好时坏,故①②③都对.故选:B小提示:本题主要考查平均数、方差在实际生活中的应用,属于基础题.4、某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002, (699)700,从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第8个样本编号是()322118342978645407325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324577892345A.623B.368C.253D.072答案:B解析:从表中第5行第6列开始向右读取数据,每3个数为一个编号,不在编号范围内或重复的排除掉,第8个数据即为答案.从表中第5行第6列开始向右读取数据,依次得到253,313,457,860(舍),736(舍),253(舍),007,328,623,457(舍),889(舍),072,368由此可得出第8个样本编号是368故选:B5、某班统计一次数学测验成绩的平均分与方差,计算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x̅,s2,新平均分和新方差分别为x̅1,s12,若此同学的得分恰好为x̅,则()A.x̅=x̅1,s2=s12B.x̅=x̅1,s2<s12C.x̅=x̅1,s2>s12D.x̅<x̅1,s2=s12答案:C分析:利用平均数和方差的公式即可求解.设这个班有n个同学,分数分别是a1,a2,a3,…,a n,第i个同学的成绩a i=x̅没录入,第一次计算时,总分是(n−1)x̅,方差s2=1n−1[(a1−x̅)2+(a2−x̅)2+⋅⋅⋅+(a i−1−x̅)2+(a i+1−x̅)2+⋅⋅⋅+(a n−x̅)2];第二次计算时,x̅1=(n−1)x̅+x̅n=x̅,方差s12=1n [(a1−x̅)2+(a2−x̅)2+⋅⋅⋅+(a i−1−x̅)2+(a i−x̅)2+(a i+1−x̅)2+⋅⋅⋅+(a n−x̅)2]=n−1ns2,故s2>s12.故选:C.填空题6、下图是一名护士为一位病人测量体温所得数据的折线统计图.以下描述正确的是__________.(填上所有正确的序号)①护士平均每天为病人测量4次体温;②第一天病人病情并未得到有效控制,体温在不断反复;③从第二天凌晨起病人体温在一直下降;④病人体温的极差为2.7℃.答案:②④分析:根据体温折线图可得答案.由折线图看判断出:因为三天总共只有11个数据,所以①项不正确:②项正确:从第二天凌晨到第三天凌晨病人体温都在下降,但随后有所回升,所以③项不正确:因为极差等于39.5−36.8=2.7,所以④项正确.所以答案是:②④.7、一个容量为100的样本,其数据的分组与各组的频数如下表:答案:0.52分析:根据图表,样本数据落在[10,40)上的频数为13+24+15=52,根据频率公式即可得解.样本数据落在[10,40)上的频数为13+24+15=52.则样本数据落在[10,40)上的频率为52=0.52.100所以答案是:0.528、一组样本数据的频率直方图如图所示,试估计此样本数据的50百分位数为________.答案:1009分析:设第50百分位数为a,根据频率分布直方图可得0.4+(a−10)×0.09=0.5,解方程即可求解.,设第50百分位数为a,则0.02×4+0.08×4+(a−10)×0.09=50100.解得a=1009.所以答案是:10099、已知一组样本数据5、2、3、6,则该组数据的第70百分位数为__________.答案:5分析:首先计算指数,再由百分位数的定义可得答案.解:这组样本数据5、2、3、6,从小到大排列为2、3、5、6,又4×70%=2.8,则该组数据的第70百分位数为第3个数5,所以答案是:5.解答题10、某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?答案:(1)选法一是抽签法,选法二不是抽签法;理由见解析(2)相等分析:(1)根据抽签法的特征,分析即得解(2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的,分析即得解(1)选法一满足抽签法的特征,是抽签法.选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分;(2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的,因此选法一中抽取1个号签的概率和选法二中摸到红球的概率相等,均为140故这两种选法中每名员工被选中的可能性相等,均为1.40。
高中数学必修二第九章统计基础知识点归纳总结(带答案)
高中数学必修二第九章统计基础知识点归纳总结单选题1、下列调查所抽取的样本具有代表性的是()A.利用某地七月份的日平均最高气温值估计该地全年的日平均最高气温B.在农村调查市民的平均寿命C.利用一块实验水稻田的产量估计水稻的实际产量D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验答案:D分析:根据抽取样本要具的广泛性和代表性,抽取的样本必须是随机的,逐个分析判断即可A项中某地七月份的日平均最高气温值不能代表全年的日平均最高气温;B项中在农村调查得到的平均寿命,不具代表性;C项中利用一块实验水稻田的产量估计水稻的实际产量,不具代表性;D项抽取的样本是随机的,具有代表性.故选:D2、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案:C分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%> 50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+ 9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.小提示:本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的×组距.估计值.注意各组的频率等于频率组距3、下列调查方式合适的是().A.为了了解一批头盔的抗压能力,采用普查的方式B.为了了解一批玉米种子的发芽率,采用普查的方式C.为了了解一条河流的水质,采用抽查的方式D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽查的方式答案:C分析:根据抽查和普查的特点,对每个选项进行逐一分析,即可判断和选择.对于选项A,采用普查的方式测试头盔的抗压能力,成本较高,不适合,故A错误;对于选项B,采用普查的方式测试玉米种子的发芽率,较为繁琐且工作量较大,不适合,故B错误;对于选项C,采用抽查的方式了解河流的水质,适合,故C正确;对于选项D,为了了解5个人每周体育锻炼的时间,适合采用普查的方式,故D错误.故选:C.4、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是()A.各班植树的棵数不是逐班增加的B.4班植树的棵数低于11个班的平均值C.各班植树棵数的中位数为6班对应的植树棵数D.1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.5、2020年广东12月份天气预报历史记录中1号至8号的数据如表所示,则()C.这8天的最低气温的极差为5°C D.这8天的最低气温的中位数为11.5°C答案:D分析:由极差等于一组数据中的最大值与最小值的差,并根据中位数的定义,求最高、最低气温数据的中位数即可判断各项的正误.=22°C,这8天的最低气温的这8天的最高气温的极差为23−19=4°C,这8天的最高气温的中位数为21+232=11.5°C,故选:D.极差为15−9=6°C,这8天的最低气温的中位数为11+1226、某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10B.09C.71D.20答案:B分析:按照题意依次读出前4个数即可.从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B7、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的4,5×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题8、2021年是中国共产党成立100周年,某学校团委在7月1日前,开展了“奋斗百年路,启航新征程”党史知识竞赛.团委工作人员将进入决赛的100名学生的分数(满分100分且每人的分值为整数)分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100]得到如图所示的频率分布直方图,则下列关于这100名学生的分数说法错误的是()A.分数的中位数一定落在区间[85,90)B.分数的众数可能为97C.分数落在区间[80,85)内的人数为25D.分数的平均数约为85答案:B分析:根据小矩形的面积之和等于1,求出b=0.05,根据中位数的求法可判断A;根据众数的求法可判断B;由在区间[80,85)上的概率可判断C;由平均数的的计算公式:小矩形的底边中点横坐标与小矩形面积的乘积之和可判断D.A,由频率分布直方图可得(0.01+0.02×2+0.03+b+0.07)×5=1,解得b=0.05,前三组的概率为(0.02×2+0.05)×5=0.45<0.5,前四组的概率为(0.02×2+0.05+0.07)×5=0.7>0.5,所以分数的中位数一定落在第四组[85,90)内,故A正确;B,分数的众数可能为87.5,故B错误;C,分数落在区间[80,85)内的人数约为0.05×5×100=25,故C正确.D,分数的平均数为:72.5×0.02×5+77.5×0.02×5+82.5×0.05×5+87.5×0.07×5+92.5×0.03×5+97.5×0.01×5=85,故D正确.故选:B多选题9、2020年突如其来的新冠肺炎疫情对房地产市场造成明显的冲击,如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,某同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断正确的是()A.日成交量的中位数是16B.日成交量超过平均成交量的只有1天C.10月7日认购量量的增长率大于10月7日成交量的增长率D.日认购量的方差大于日成交量的方差答案:BD解析:根据拆线图判断各数据特征后判断各选项.由拆线图日成交量的中位数是26,A错;日成交量均值为13+8+32+16+26+38+1667≈42.7,大于均值的只有一天,B正确;10月7日认购量量的增长率为y1=276−112112≈1.464,成交量的增长率为y2=166−3838≈3.368,显然C错;日认购量的均值为223+105+91+107+100+112+276≈144.857,7由各数据与均值的差可以看出日认购量的方差大于日成交量的方差,D正确.故选:BD.小提示:关键点点睛:本题考查统计图表,考查拆线图的识别.解题关键是由拆线图得出各数据,然后求得各数据特征.如中位数,均值,增长率,方差,解题中还要善于估值,如本题中的方差,从而大致比较出大小.10、成立时间少于10年.估值超过10亿美元且未上市的企业,称为独角兽企业.2021年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2021年中国新经济独角兽企业TOP200的行业分布图,中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业数量共同占比达到69%.下列说法正确的是()A.随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B.这12个行业TOP200榜单中独角兽企业数量的中位数是17C.中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业超过130家D.2021年中国新经济独角兽企业TOP200榜单中汽车交通、企业服务、文化娱乐的企业数量共同占比超过40% 答案:ABC分析:结合图表对选项进行分析,由此确定正确选项.A选项,由图可知,汽车交通行业独角兽企业TOP200榜单中数量最多,是由A选项正确.=17,B选项正确.B选项,数据为8,8,12,13,16,17,17,18,18,19,25,29,中位数为17+172C选项,200×69%=138>130,所以C选项正确.×100%=36.5%<40%,D选项错误.D选项,汽车交通、企业服务、文化娱乐占比29+25+19200故选:ABC11、立德中学举行党史知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分成5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是()A.图中的x值为0.020B.这组数据的极差为50C.得分在80分及以上的人数为400D.这组数据的平均数的估计值为77答案:ACD分析:根据频率分布直方图中所有长方形的面积和为1,以及极值、频数以及平均数的计算,对每个选项进行逐一分析,即可判断和选择.由(0.005+x+0.035+0.030+0.010)×10=1,可解得x=0.020,故选项A正确;频率分布直方图无法看出这组数据的最大值和最小值,故选项B不正确;得分在80分及以上的人数的频率为(0.030+0.010)×10=0.4,故人数为1000×0.4=400,故选项C正确;这组数据的平均数的估计值为:55×0.05+65×0.2+75×0.35+85×0.3+95×0.1=77故选项D正确.故选:ACD.填空题12、某学校有高中学生1000人,其中高一年级、高二年级、高三年级的人数分别为320,300,380,为了调查学生参加“社区志愿服务”的意向,现采用分层抽样的方法从该校学生中抽取一个样本量为200的样本,那么应抽取高二年级学生的人数为________答案:60分析:根据分层抽样,每层的抽样比相同计算即可.因为学校有高中学生1000人,抽取一个样本量为200的样本,故应抽取高二年级学生的人数为2001000×300=60.所以答案是:6013、有一组样本数据x1,x2,x3,x4,该样本的平均数和方差均为m.在该组数据中加入一个数m,得到新的样本数据,则新样本数据的方差为__________.答案:45m##0.8m分析:由平均数和方差的计算公式直接计算即可.样本数据x1,x2,x3,x4,该样本的平均数和方差均为m,在该组数据中加入1个数m,则新样本数据的平均数x̅=15×(4×m+m)=m,方差为s2=15×[4×m+(m−m)2]=45m.所以答案是:45m.14、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]6=2,所以答案是:2解答题15、从甲、乙两人中选选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲78686591074乙9578768677(1)分别计算甲、乙两人射击命中环数的平均数:(2)选派谁去参赛更好?请说明理由.答案:(1)甲乙的平均数均为7;(2)选派乙,理由见解析.分析:(1)应用平均数的求法求甲乙平均数;(2)由(1)知甲乙平均数相同,求出甲乙的方差并比较大小,即可确定选派方法.(1)由题设,甲的平均数为x̅1=7+8+6+8+6+5+9+10+7+410=7,乙的平均数为x̅2=9+5+7+8+7+6+8+6+7+710=7.(2)甲的方差为s12=110∑(x i−x̅1)210i=1=0+1+1+1+1+4+4+9+0+910=3,乙的方差为s22=110∑(x i−x̅2)210i=1=4+4+0+1+0+1+1+1+0+010=1.2.由(1)知:x̅1=x̅2,而s12>s22,所以选派乙去参赛更好.。
新人教A版高中数学必修2第九章统计的第一节第一课时—简单随机抽样-经典教学设计
(3)通过调查历城二中高一学生的平均身高来估计济南市高一学生的平均身高,请你写出此次调查的总体,个体样本和样本容量。
通过熟悉的生活情境引入普查、抽样调查的适用范围,回顾总体、样本、个体、样本容量的概念。
通过提问,从学生熟悉的具体问题入手,迅速吸引学生的注意力,体会到了抽样调查的必要性。
2.简单随机抽样的特点:
总体有限,逐个抽取,等概率抽样。
3.简单随机抽样的方法:
抽签法和随机数法
学生回顾本节课所学知识点。
小结本节课知识点,加深对知识点的记忆理解。总结提炼,理清脉络,有利于帮助学生建构知识体系,起到画龙点睛的作用。
6.课后作业
1.一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.选用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
此处设计遵循由特殊到一般的认知规律,让学生在观察中归纳,在具体问题中进行总结,自然而然地形成简单随机抽样的概念,培养数学抽象的学科核心素养,最终实现突破难点的目的。
2.实践探究,形成概念
请小组在全班范围内交流,教师在学生回答基础上完善补充,得到下列结论:
(1)一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n(1≤n<N)个个体作为样本,每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样。如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单抽样。
分层随机抽样课件-高一数学人教A版(2019)必修第二册
(4)汇总每层抽取的样本,组成总体的样本.
反思感悟
分层随机抽样的过程中,如何保证每个个体被抽到的可能性相同
要求各层所抽取的个体数与该层所包含的个体 数之比等于样本容量与总体容量之比
跟踪训练2
某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比 为2∶3∶5,现要从所有高中学生中抽取一个容量为200的样本,调 查该市高中学生的视力情况,试写出抽样过程.
总体平均数
知识梳理
样本平均数
一般地,总体中有 N 个个体,它们的变量值分别为
Y1
,Y2
,…
,YN
,
则
称
Y
=
Y1+Y2+…+YN N
=
1 N
N
Y
i
i=1
为 总体均值 ,又称总体平均数.
如果从总体中抽取一个容量为 n 的样本,它们的变量值
分别为 y1,y2,…,yn,则称 y =
y1+y2+…+yn n
注意 每一个子总体称为 层 . 在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这
种样本量的分配方式为比例分配.
例1 某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他
们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样
方法是
A.抽签法
B.随机数法
√C.分层随机抽样 D.其他抽样方法
5
随堂演练
1234
某校高三年级有男生500人,女生400人,为了解该年级学生的体重状况,
从男生中随机抽取25人,从女生中随机抽取20人进行调查.这种抽样方
法是
√A.分层随机抽样 C.随机数法
2024秋季人教A版高中数学必修第二册第九章统计《随机抽样:信息技术应用统计软件的应用》
听课记录:2024秋季人教A版高中数学必修第二册第九章统计《随机抽样:信息技术应用统计软件的应用》教学目标(核心素养)•知识与技能:学生能够了解并掌握至少一种统计软件的基本操作,能够运用统计软件进行数据录入、处理、分析及结果展示。
•过程与方法:通过实际操作统计软件,培养学生的信息技术应用能力、数据处理能力和问题解决能力,体验信息技术在统计领域的应用价值。
•情感态度价值观:激发学生对信息技术与数学结合的兴趣,培养学生的探索精神和创新意识,认识到信息技术在现代社会中的重要性。
导入教师行为:教师首先展示一个已完成的统计分析报告,该报告通过某统计软件生成,包含图表、数据和结论。
教师提问:“这份报告是如何快速准确地完成的呢?你们知道背后使用了什么工具吗?”引导学生思考信息技术在统计中的应用。
学生活动:学生观察报告,对报告的生成过程感到好奇,纷纷猜测可能使用的工具,并表达出自己对于学习统计软件的兴趣。
过程点评:导入环节通过展示实际成果,激发了学生的学习兴趣和好奇心,为后续统计软件的学习营造了良好的氛围。
教学过程1.1 统计软件介绍教师行为:教师介绍本节课将要学习的统计软件(如Excel、SPSS、R等),简要说明该软件的特点、功能及在统计领域的应用。
同时,教师展示软件的界面,让学生对该软件有初步的认识。
学生活动:学生认真听讲,观察教师展示的软件界面,记录关键信息,对即将学习的软件充满期待。
过程点评:此环节通过教师的介绍和展示,使学生对统计软件有了初步的了解,为后续的实际操作打下了基础。
1.2 统计软件基本操作教师行为:教师以具体任务(如录入一组数据、计算平均值、绘制柱状图等)为例,演示统计软件的基本操作。
在演示过程中,教师注重讲解操作步骤、注意事项和技巧,并适时提问引导学生思考。
学生活动:学生跟随教师的演示进行实际操作,尝试完成相同任务。
在操作过程中,学生遇到问题会主动提问或相互讨论,教师则给予及时指导和帮助。
抽样检的基础必学知识点
抽样检的基础必学知识点
抽样检的基础知识点包括以下内容:
1. 抽样方法:在进行抽样检时,需要选择适当的抽样方法,常见的抽
样方法有简单随机抽样、系统抽样、分层抽样、整群抽样等。
2. 抽样误差:抽样误差是指抽样所引入的估计误差,其大小通常取决
于样本容量的大小和抽样方法的选择。
抽样误差越小,样本代表性越好,估计结果越可靠。
3. 样本容量:样本容量是指进行抽样检的样本数量,通常样本容量越大,估计结果越可靠。
样本容量的确定需要考虑抽样误差允许范围、
资源和时间等因素。
4. 抽样分布:抽样分布是指某一统计量在大量独立抽样情况下的分布。
常见的抽样分布有正态分布、t分布、卡方分布等。
根据不同的情况选择适当的抽样分布进行参数估计和假设检验。
5. 抽样误差的控制:为了减小抽样误差,可以采取增加样本容量、改
进抽样方法、增加抽样次数等方法进行控制。
合理选择抽样方法和样
本容量可以有效控制抽样误差。
以上是抽样检的基础必学知识点,通过学习这些知识点可以帮助我们
正确进行抽样检,得到可靠的估计结果。
高一第九章统计知识点
高一第九章统计知识点统计是一门研究数据收集、整理、分析和解释的学科,它在现代社会中应用广泛。
无论是生活中还是学习中,我们都会接触到各种数据,因此了解统计知识是很重要的。
本文将介绍高一第九章统计知识的几个重要概念和方法。
一、数据的收集与整理统计学的基础是数据。
在进行统计分析之前,我们首先需要收集和整理数据。
数据可以通过实地观察、问卷调查、实验研究等方式获取。
收集到的数据需要进行整理,包括分类、汇总和整理成表格、图表等形式,以便于后续的统计分析。
二、描述性统计描述性统计是对数据进行描述、总结和整理的方法。
其中常用的方法包括频数分布表、频数分布图、中心与离散趋势、位置与变异度等。
通过描述性统计方法,我们可以更好地了解数据的分布情况,得出一些总结性的结论,从而更好地认识问题。
三、概率与概率分布概率是研究在一定条件下事件发生的可能性的数值表达。
概率的计算方法涉及到频率、比率、百分比等。
概率分布是概率论的主要内容之一,它描述了随机变量的取值与对应的概率之间的关系。
常见的概率分布有均匀分布、正态分布、二项分布等。
掌握概率与概率分布的知识,有助于我们理解随机事件的变化规律。
四、抽样与推断统计抽样是从总体中选择样本,通过对样本的研究来推断总体的一种方法。
推断统计是以概率的理论为基础,通过对样本数据的分析来推断总体的参数或分布特征。
通过合理地设计抽样方案和推断统计方法,我们可以通过研究一小部分数据来推断整个总体的情况。
五、假设检验与显著性水平假设检验是根据样本观察值,对总体参数或分布特征所提出的一个或一组关于这些参数或特征的假设进行证据的推论。
显著性水平是指在统计推断中设定的一个界限,用于判断假设是否成立。
通过假设检验,我们可以对样本数据的真实性进行评估,从而对问题进行决策。
六、回归分析回归分析是通过建立数学模型来研究变量之间的依赖关系,从而预测和解释变量的变化。
回归分析在实际应用中非常广泛,例如经济学中的供求关系、医学中的疾病发病率与影响因素等。
部编版高中数学必修二第九章统计知识点总结归纳
(名师选题)部编版高中数学必修二第九章统计知识点总结归纳单选题1、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.2、从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在[150,160),[160,170),[170,180]三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在[170,180]内的学生中选取的人数应为()A.3B.4C.5D.7答案:B分析:先求得a 的值,然后结合分层抽样的知识计算出正确答案.依题意(0.005+0.015+a +0.035+0.02)×10=1,解得a =0.025,身高在[150,160),[160,170),[170,180]三组内的学生比例为0.025:0.035:0.02=5:7:4,用分层抽样的方法选取16人参加一次活动,则从身高在[170,180]内的学生中选取的人数应为4人故选:B3、某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团.已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:其中x :y :z =5:3:2,且“泥塑”社团的人数占两个社团总人数的35.为了了解学生对两个社团活动的满意程度,从中抽取一个容量为50的样本进行调查,则从“剪纸”社团的高二年级学生中应抽取的人数为( )A .4B .6C .9D .10答案:B 分析:先按分层抽样求出高二年级人数,再按样本占总体的比例得解.因为“泥塑”社团的人数占总人数的35,所以“剪纸”社团的人数占总人数的25,人数为800×25=320. 因为“剪纸”社团中高二年级人数比例为y x+y+z =35+3+2=310,所以“剪纸”社团中高二年级人数为320×310=96.以从“剪纸”社团的高二年级学生中抽取的人数为96×50800=96×116=6.故选:B.4、某书店新进了一批书籍,下表是某月中连续6天的销售情况记录:本B.1110本C.1340本D.1278本答案:A分析:由表格中的数据可以看出每天的销售数量在一个数值附近波动,故用平均数估计总体即可.(30+40+28+44+38+42)=37(本),该月共31由表中6天的销售情况可得,一天的平均销售量为16天,故该月的销售总量约为37×31=1147(本).故选: A5、某地教育局为了解“双减”政策的落实情况,在辖区内高三年级在校学生中抽取100名学生,调查他们课后完成作业的时间,根据调查结果绘制如下频率直方图.根据此频率直方图,下列结论中不正确的是()A.所抽取的学生中有25人在2小时至2.5小时之间完成作业B.该地高三年级学生完成作业的时间超过3小时的概率估计为35%C.估计该地高三年级学生的平均做作业的时间超过2.7小时D.估计该地高三年级有一半以上的学生做作业的时间在2小时至3小时之间答案:D分析:对A,利用直方图中2小时至2.5小时之间的频率判断A;对B,计算超过3小时的频率可判断B;对C,根据直方图中平均数的公式计算,可判断C;对D,计算做作业的时间在2小时至3小时之间的频率,可判断D.对A,直方图中2小时至2.5小时之间的频率为(2.5−2)×0.5=0.25,故所抽取的学生中有100×0.25=25人在2小时至2.5小时之间完成作业,故A正确;对B,由直方图得超过3小时的频率为0.5×(0.3+0.2+0.1+0.1)=0.35,所以B正确;对C,直方图可计算学生做作业的时间的平均数为:1.25×0.05+1.75×0.15+2.25×0.25+2.75×0.20+3.25×0.15+3.75×0.10+4.25×0.05+4.75×0.05=2.75>2.7,所以C正确;对D,做作业的时间在2小时至3小时之间的频率为0.5×(0.5+0.4)=0.45<0.5,所以D错误.故选:D.6、人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是()A.人口数逐次增加,第二次增幅最大B.第六次普查人数最多,第四次增幅最小C.第六次普查人数最多,第三次增幅最大D.人口数逐次增加,从第二次开始增幅减小答案:C分析:人口数由柱状图判断,增幅由折线图判断.A.人口数逐次增加,第三次增幅最大,故错误;B.第六次普查人数最多,第六次增幅最小,故错误;C.第六次普查人数最多,第三次增幅最大,故正确;D.人口数逐次增加,从第三次开始增幅减小,故错误;故选:C7、某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66674037146405711105650995866876832037905716031163149084452175738805905223594310若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()A.10B.09C.71D.20答案:B分析:按照题意依次读出前4个数即可.从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选:B8、某大学工程学院共有本科生1200人、硕士生400人、博士生200人,要用分层抽样的方法从中抽取一个容量为180的样本,则应抽取博士生的人数为()A.20B.25C.40D.50答案:A分析:直接利用分层抽样,即可计算.因为学院共有本科生1200人、硕士生400人、博士生200人,×180=20.所以应抽取博士生的人数为2001200+400+200故选:A多选题9、2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如下图所示:经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区()A.2030年煤的消费量相对2020年减少了B.2030年天然气的消费量是2020年的5倍C.2030年石油的消费量相对2020年不变D.2030年水、核、风能的消费量是2020年的7.5倍答案:BD分析:设2020年该地区一次能源消费总量为a,计算出2030年该地区煤、石油、天然气以及水、核、风能的消费量,逐项判断可得出合适的选项.设2020年该地区一次能源消费总量为a,2020年煤的消费量为0.6a,规划2030年煤的消费量为a×2.5×0.3=0.75a>0.6a,故A错误;2020年天然气的消费量为0.1a,规划2030年天然气的消费量为a×2.5×0.2=0.5a=5×0.1a,故B正确;2020年石油的消费量为0.2a,规划2030年石油的消费量为a×2.5×0.2=0.5a>0.2a,故C错误;2020年水、核、风能的消费量为0.1a,规划2030年水、核、风能的消费量为a×2.5×0.3=0.75a=7.5×0.1a,故D正确.故选:BD.10、冬末春初,乍暖还寒,人们容易感冒发热.若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热.下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为()A.中位数为3,众数为2B.均值小于1,中位数为1C.均值为2,标准差为√2D.均值为3,众数为4答案:BC分析:根据题意,设连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,然后根据选项,结合反例依次判定,即可求解.由题意,连续7天,每天体温高于37.3℃的人数分别为a,b,c,d,e,f,g,可得0≤a≤b≤c≤d≤e≤f≤g,对于A中,取2,2,2,2,3,4,6,则满足中位数为3,众数为2,但第7天的人数6>5,所以A不正确;对于B中,若g≥6,由中位数为1,可知均值为1(a+b+c+d+e+f+g)≥1,与均值小于1矛盾,所以7B正确;对于C中,当均值为2,标准差为√2时,a+b+⋯+g=14,且(a−2)2+⋯+(g−2)2=14,若g≥6,则(a−2)2+(b−2)2+⋯+(g−2)2>14,例如:1,1,1,1,2,3,5,符合题意,所以C正确;对于D中,取0,1,2,4,4,4,6,则满足均值为3,众数为4,但第7天人数6>5,所以D不正确.故选:BC.11、小明用某款手机性能测试APP对10部不同品牌的手机的某项性能进行测试,所得的分数按从小到大的顺序(相等数据相邻排列)排列为:81,84,84,87,x,y,93,96,96,99,已知总体的中位数为90,则()A.x+y=180B.该组数据的均值一定为90C.该组数据的众数一定为84和96D.若要使该总体的标准差最小,则x=y=90答案:ABD分析:依题意可得x+y=180,即可求出平均数,即可判断A、B,再利用特殊值判断C,利用基本不等式判断D;(81+84+84+87+x+y+93+解:因为总体的中位数为90,所以x+y=180,所以该组数据的均值为11096+96+99)=90,故A正确,B正确,当x=y=90时,众数为84,90,96,当x=87,y=93时,众数为84,87,93,96,故C错误;要使该总体的标准差最小,即方差最小,即(x−90)2+(y−90)2最小,又(x−90)2+(y−90)2≥(x+y−180)2=0,当且仅当x−90=y−90时,即x=y=90时等号成立,故D正确.2故选:ABD填空题12、某工厂为了解产品的生产情况,随机抽取了50个样本,若样本数据x1,x2,⋯,x50的方差为8,则数据3x1−1,3x2−1,⋯,3x50−1的方差为___________.答案:72分析:根据方差的性质可得答案.样本数据x1,x2,⋯,x50的方差为8,所以数据3x1−1,3x2−1,⋯,3x50−1的方差为32×8=72.所以答案是:72.13、某学校组织学生参加数学测试,成绩的频率分布直方图如下,数据的分组依次是[20,40),[40,60),[60,80),[80,100],则可估计这次数学测试成绩的第40百分位数是_________.答案:65分析:利用百分位数的定义求解.解:成绩在[20,60)的频率是(0.005+0.01)×20=0.3,成绩在[20,80)的频率为0.3+0.02×20=0.7,所以第40百分位数一定在[60,80)内,×20=65,所以这次数学测试成绩的第40百分位数是60+0.4−0.30.4所以答案是:65。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三) 质量数据分布的规律性
以质量标准为中心的质量数据分布, 可用一个“中间高、两端低、左右对称” 的几何图形表示,即一般服从正态分布
28
29
(三) 质量数据分布的规律性
正态分布曲线具有以下几个性质: 1.分布曲线对称于X=μ 2.X=μ时,曲线处于最高点;当X向左右
远离时,曲线不断地降低,整个曲线是 中间高两边低的形状; 3.若曲线与横坐标轴所组成的面积等于1, 则曲线与X=μ±σ所围成的面积为0.6825; 与 X=μ±2σ 所 围 的 面 积 为 0.9545 ; 与 X=μ±3σ所围成的面积为0.9973 。
22
五、质量数据的分布特征
(一) 质量数据的特征 (二) 质量数据波动的原因★ (三) 质量数据分布的规律性
23
(一)、质量数据的特征
➢ 个体数值的波动性 ➢ 总体(样本)分布的规律性 ➢ 质量数据的集中趋势 ➢ 质量数据的离中趋势 ➢ 反映了总体(样本)质量变化的内
在规律性
24
(二)、质量数据波动的原因★
20
17 17
3. 直方图的观察与分析
15 13
10
5
7
3 1
12
6 3 1
正常型直方图: 中间高,两侧低,左 右接近对称 横坐标—质量特性 纵坐标—频数(频率)
-6.5
-4.5
-2.5
-0.5
1.5
3.5
46
1.直方图的用途★★★
即频数分布直方图法,它是将收集到的 质量数据(>50个)进行分组整理,绘制成频 数分布直方图,用以描述质量分布状态的一 种分析方法,所以又称质量分布图法。
(2) 利用ABC分类法,确定主次因素。将累 计频率曲线按(0%-80%)、(80% -90%)、(90%-100%)分为三部 分,各曲线下面所对应的影响因素分别 为A(主)、B(次)、C(一般)三类 因素。
39
4. 排列图的应用
(1) 按不合格点的内容分类,可以分析出造 成质量问题的薄弱环节。
(2) 按生产作业分类,可以找出生产不合格 品最多的关键过程。
13
4. 整群抽样
整群抽样一般是将总体按自然存在的 状态分为若干群,并从中抽取样品群,组 成样本,然后在中选群内进行全数检验的 方法。
如对原材料质量进行检测,可按原包 装的箱、盒为群随机抽取,对中选箱、盒 做全数检验;每隔一定时间抽出一批产品 进行全数检验等。
14
5. 多阶段抽样
多阶段抽样又称多级抽样,是将各种 单阶段抽样方法结合使用,通过多次随机 抽样来实现的抽样方法。
12
3. 等距抽样
等距抽样又称机械抽样、系统抽样, 是将个体按某一特性排队编号后均分为n组 ,这时每组有K=N/n个个体,然后在第 一组内随机抽取第一件样品,以后每隔一 定距离(K号)抽选出其余样品组成样本的方 法。如在流水作业线上每生产100件产品抽 出一件产品做样品,直到抽出n件产品组成 样本。
四、质量数据的特征值★
(一)描述数据集中趋势的特征值 (二)描述数据离中趋势的特征值
17
(一)描述数据集中趋势的特征值
(1) 算术平均数(均值)
总体算术平均数
1 N
(X1 X2 X N )
1 N
N i 1
Xi
样本算术平均数
(2) 样本中位数
样本中位数是将样本数据按数值大小有序排 列后,位置居中的数值。当样本数n为奇数时, 数列居中的一位数即为中位数;当样本数n为偶 数时,取居中两个数的平均值作为中位数。
(2) 制订对策。绘制因果分析图不是目的,而 是要根据图中所反映的主要原因,制订改 进的措施和对策,限期解决问题,保证产 品质量。具体实施时,一般应编制一个对 策计划表。
44
第三节、直方图法、控制图法与相关图法
一、直方图法 二、控制图法 三、相关图法
45Leabharlann 一、直方图法1. 直方图的用途
频数
2. 直方图的绘制(P145)
分层抽样又称分类或分组抽样,是将总体 按某一特性分为若干组,然后在每组内随机抽 取样品,组成样本的方法。
由于对每组都有抽取,样品在总体中分布 均匀,更具代表性,特别适用于总体比较复杂 的情况。如研究混凝土浇筑质量时,可以按生 产班组分组、或按浇筑时间(白天、黑夜;或 季节)分组或按原材料供应商分组后,再在每 组内随机抽取个体。
120
105 A
B
C
80 率 70
90
60 %
75
50
60
40
45
30
30
20
15
10
0
0
表面 截面 平面 垂直 标高 其他
平整 尺寸 水平 度
度
度
38
3.排列图的观察与分析★★★
(1) 观察直方形,大致可看出各项目的影响 程度。排列图中的每个直方形都表示一 个质量问题或影响因素。影响程度与各 直方形的高度成正比。
48
(1) 观察直方图的形状、判断质量分布状态
对称分布 (正态分布)
折齿分布
左缓坡型
孤岛型
双峰型
绝壁型
49
折齿分布
对称分布(正态分布) 生产过程正常,质 量稳定
折齿分布 分组不当或组距确定不当
(一)全数检验 (二)随机抽样检验
8
(一)全数检验
全数检验是对总体中的全部个体逐一 观察、测量、计数、登记,从而获得对总 体质量水平评价结论的方法。
9
(二)随机抽样检验★
抽样检验是按照随机抽样的原则,从 总体中抽取部分个体组成样本,根据对样 品进行检测的结果,推断总体质量水平的 方法。
1. 简单随机抽样 2. 分层抽样 3. 等距抽样 4. 整群抽样 5. 多阶段抽样
3
一、总体、样本及统计推断工作过程
1、总体、个体 2、样本 3、统计推断工作过程
4
1、总体、个体
➢ 总体也称母体,是所研究对象的全体。N ➢ 个体,是组成总体的基本元素。 ➢ 有限总体,无限总体。 ➢ 一般把每件产品检测得到的某一质量数据
(强度、几何尺寸、重量等)即质量特性 值视为个体,产品的全部质量数据的集合 即为总体。
1、 偶然性原因 2、 系统性原因
25
1、偶然性原因
偶然性因素:具有随机发生的;是不 可避免、难以测量和控制的;或者是在经 济上不值得消除。
它们大量存在,但对质量的影响很小 ,属于允许偏差、允许位移范畴,引起的 是正常波动,一般不会因此造成废品,生 产过程正常稳定。
通常把4M1E因素的这类微小变化归 为影响质量的偶然性原因、不可避免原因 或正常原因。
实际应用中,通常按累计频率划分为A 类(0%-80%)、 B 类(80%-90%)、 C类(90%-100%)三部分,A类为主要因 素,B类为次要因素,C类为一般因素。
34
2. 排列图的作法
1) 收集整理数据 2) 排列图的绘制
35
1) 收集整理数据
按不合格点的频数按由大到小的顺序排列各检 查项目,以全部不合格点为总数,计算各项的频数和 累计频率。
5
2、样本
样本也称子样,是从总体中随机抽取出来, 并根据对其研究结果推断总体质量特征 的那部分个体。
被抽中的个体称为样品,样品的数目称样 本容量,n
6
3、统计推断工作过程
总体质量状况
生产过程 一批产品
推断 分析
样本质量特征值
是否正常 是否合格
随机抽样 样本 检测 整理
7
二、质量数据的收集方法★
10
1. 简单随机抽样
简单随机抽样又称纯随机抽样、完全随机 抽样,是对总体不进行任何加工,直接进行随 机抽样,获取样本的方法。
一般的做法是对全部个体编号,然后采用 抽签、摇号、随机数字表等方法确定中选号码, 相应的个体即为样品。
这种方法常用于总体差异不大,或对总体 了解甚少的情况。
11
2. 分层抽样
18
(二)描述数据离中趋势的特征值
(1) 极差R
R xmax xmin
(2) 标准偏差 (3) 变异系数
19
(2) 标准偏差(标准差或均方差)
N
Xi 2
1) 总体的标准偏差 i1 N
n
xi x2
2) 样本的标准偏差 S i1
(n<50)
n 1
(n≥50)
20
(2) 标准偏差(标准差或均方差)(续)
标准差小说明数据分布的集中程度高, 离散程度小,均值对总体的代表性好。
标准差的平方是方差,能确切地说明数 据的离散程度和波动规律,是最常用的反映 数据变异程度的特征值。
21
(3) 变异系数(离散系数)
1) 总体的变异系数
Cv
2) 样本的变异系数
变异系数又称离散系数,是用标准差除以算术 平均数得到的相对数。它表示数据的相对离散波动 程度。变异系数小,说明分布集中程度高,离散程 度小,均值对总体(样本)的代表性好。
30
(三) 质量数据分布的规律性
即在正常生产的情况下,质量特性 在区间(μ-σ)~(μ+σ)的产品有 68.25%;在区间(μ-2σ)~(μ+2σ)的 产品有95.45%;在区间(μ-3σ)~ (μ+3σ)的产品有99.73% 。质量特性在 μ±3σ范围以外的产品非常少,不到3‰ (0.3%)。
根据正态分布曲线的性质,可以认 为,凡是在μ±3σ范围内的质量差异都是 正常的,不可避免的,是偶然性因素作 用的结果。
通过直方图,可了解产品质量的波动情 况,掌握质量特性的分布规律,以便对质量 状况进行分析判断。同时可通过质量数据特 征值的计算,估算施工生产过程总体的不合 格品率,评价过程能力等。
47
3.直方图的观察与分析★★★