第15章 样本含量估计思考与练习参考答案

合集下载

南京市秦淮中学0轮复习苏教版2019必修第二册第15章:概率 知识点扫描+典型例题+自我训练学生版

南京市秦淮中学0轮复习苏教版2019必修第二册第15章:概率  知识点扫描+典型例题+自我训练学生版

模块一:自主学习 回归教材知识点一: 样本空间样本点:随机试验的每一个可能结果称为样本点,用ω表示. 样本空间:所有样本点组成的集合,记为Ω. 知识点二: 随机事件事件类型 定义随机事件 样本空间的子集,简称事件必然事件 Ω(全集) 不可能事件 ∅(空集)基本事件当一个事件仅包含单一样本点时,称该事件为基本事件知识点三:事件的关系与运算1.事件的包含关系:事件B 发生必导致事件A 发生,称事件A 包含事件B (或事件B 包含于事件A ),记作BA . 2.事件的运算定义符号图示并事件(或和事件) 一般地,事件A 与事件B 至少有一个发生,即为事件C 发生 C =A +B (或C =A ∪B )交事件(或积事件)一般地,事件A 与事件B 同时发生,即为事件C 发生C =AB (或C =A ∩B )知识点四: 古典概型如果某概率模型具有以下两个特点:(1)样本空间Ω只含有有限个样本点.(2)每个基本事件的发生都是等可能的. 那么我们将满足上述条件的随机试验的概率模型称为古典概型. 知识点五: 古典概型的概率公式在古典概型中,如果样本空间Ω={ω1,ω2,…,ωn }(其中,n 为样本点的个数),那么每一个基本事件{ωk }(k =1,2,…,n )发生的概率都是1n .如果事件A 由其中m 个等可能基本事件组合而成,即A 中包含m 个样本点,那么事件A 发生的概率为P (A )=mn .知识点六: 概率的基本性质 1.随机事件的概率范围为0≤P (A )≤1.2.必然事件和不可能事件分别用Ω和∅表示,必然事件的概率为1,不可能事件的概率为0,即P (Ω)=1,P (∅)=0.知识点七 频率的稳定性一般地,对于给定的随机事件A ,在相同条件下,随着试验次数的增加,事件A 发生的频率会在随机事件A 发生的概率P (A )的附近摆动并趋于稳定,我们将频率的这个性质称为频率的稳定性.知识点八 频率与概率的关系若随机事件A 在n 次试验中发生了m 次,则当试验次数n 很大时,可以用事件A 发生的频率m n 来估计事件A 的概率,即P (A )≈m n . 知识点九 概率的意义对于随机现象,虽然事先无法确定某个随机事件是否发生,但是在相同条件下进行大量重复试验时,可以发现随机事件的发生与否呈现出某种规律性. 知识点十 互斥事件不能同时发生的两个事件称为互斥事件. 知识点十一: 互斥事件的加法公式如果事件A ,B 互斥,那么事件A +B 发生的概率,等于事件A ,B 分别发生的概率的和,即P (A +B )=P (A )+P (B ).一般地,如果事件A 1,A 2,…,A n 两两互斥,那么P (A 1+A 2+…+A n )=P (A 1)+P (A 2)+…+P (A n ). 随机事件的概率还具有以下常用性质:①对立事件:如果两个互斥事件必有一个发生,那么称这两个事件为对立事件.事件A 的对立事件记为A ,对立事件概率公式P(A )=1-P(A). ②当A B ⊆时,()()P A P B ≤③当,A B 不互斥时,()()()()P A B P A P B P AB +=+- 知识点十二:相互独立事件的概念①概念:如果事件A 是否发生不影响事件B 发生的概率,那么称A ,B 为相互独立事件. ②结论:A ,B 相互独立⇔P (AB )=P (A )P (B ).③独立事件的推广:如果事件A 1,A 2,…,A n 相互独立,那么P (A 1A 2…A n )=P (A 1)P (A 2)…P (A n ). 知识点十三: 相互独立事件的性质如果事件A 与B 相互独立,那么A 与B ,A 与B ,A 与B 也都相互独立.模块二:自我体验 前测训练1.下列事件是必然事件的是( )A .从分别标有数字1,2,3,4,5的5张标签中任取一张,得到标有数字4的标签B .函数y =log a x (a >0且a ≠1)为增函数C .平行于同一条直线的两条直线平行D .随机选取一个实数x ,得2x <02.集合A ={2,3},B ={1,2,4},从A ,B 中各任意取一个数,构成一个两位数,则所有样本点的个数为( )A .8B .9C .12D .113.抛掷一枚质地均匀的骰子,记事件A ={出现的点数是1或2},事件B ={出现的点数是2或3或4},则事件“出现的点数是2”可以记为( )A .A ∪B B .A ∩BC .A ⊆BD .A =B4.从甲、乙等5名学生中随机选出2人,观察选出的2人,设事件M 为“甲被选中”,则事件M 含有的样本点个数为( )A .2B .4C .6D .8 5.从5人中选出2人担任正、副班长,则样本点个数为( )A .10B .15C .20D .25 6.甲、乙、丙三名同学站成一排,甲站在中间的概率是( ) A.16 B.12 C.13 D.23 7.下列结论正确的是( )A .事件A 的概率P (A )的值满足0<P (A )<1B .若P (A )=0.999,则A 为必然事件C .灯泡的合格率是99%,从一批灯泡中任取一个,是合格品的可能性为99%D .若P (A )=0.001,则A 为不可能事件8.在一次随机试验中,彼此互斥的事件A ,B ,C ,D 的概率分别是0.2,0.2,0.3,0.3,则下列说法正确的是( )A .A +B 与C 是互斥事件,也是对立事件 B .B +C 与D 是互斥事件,也是对立事件 C .A +C 与B +D 是互斥事件,但不是对立事件 D .A 与B +C +D 是互斥事件,也是对立事件9.从装有十个红球和十个白球的罐子里任取两球,下列情况中是互斥但不对立的两个事件是( )A .至少有一个红球,至少有一个白球B .恰有一个红球,都是白球C .至少有一个红球,都是白球D .至多有一个红球,都是红球10.一个电路上装有甲、乙两根保险丝,甲熔断的概率为0.85,乙熔断的概率为0.74,甲、乙两根保险丝熔断与否相互独立,则两根保险丝都熔断的概率为( )A .1B .0.629C .0D .0.74或0.8511.某人提出一个问题,甲先答,答对的概率为0.4,如果甲答错,由乙答,答对的概率为0.5,则问题由乙答对的概率为( )A .0.2B .0.8C .0.4D .0.312.已知甲、乙、丙3名运动员击中目标的概率分别为0.7,0.8,0.85,且3人是否击中目标相互独立.若他们3人向目标各发1枪,则目标没有被击中的概率为________. 13.将一枚骰子先后投掷两次,两次向上点数之和为5的倍数的概率为________. 15.从1,2,3,4,5中任意取出两个不同的数,则其和为5的概率是________.16.容量为200的样本的频率直方图如图所示.根据样本的频率直方图计算样本数据落在[6,10)内的频数为________,估计数据落在[2,10)内的概率约为______.17.已知甲、乙、丙3名运动员击中目标的概率分别为0.7,0.8,0.85,且3人是否击中目标相互独立.若他们3人向目标各发1枪,则目标没有被击中的概率为________. 模块三:要点导学 各个击破 典例评析例1、一个袋中装有四个形状大小完全相同的球,球的编号分别为1,2,3,4. (1)从袋中随机取两个球,求取出的球的编号之和不大于4的概率;(2)先从袋中随机取一个球,该球的编号为m ,将球放回袋中,然后再从袋中随机取一个球,该球的编号为n ,求n <m +2的概率变式训练:已知关于x 的二次函数2()1f x mx nx =--,令集合{}1,2,3,4M =,{}1,2,4,6,8N =-,若分别从集合M 、N 中随机抽取一个数m 和n ,构成数对(),m n . (1)列举数对(),m n 的样本空间;(2)记事件A 为“二次函数()f x 的单调递增区间为[)1,+∞”,求事件A 的概率; (3)记事件B 为“关于x 的一元二次方程()2f x =有4个零点”,求事件B 的概率.例题2:如图,从参加环保知识竞赛的学生中抽出40名,将其成绩(均为整数....)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)80~90这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛成绩的平均数、众数、中位数.(3)从成绩是80分以上(包括80分)的学生中选两人,求他们在同一分数段的概率.变式训练:从某学校的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和195cm 之间,将测量结果按如下方式分成八组:第一组[)155160,,第二组[)160165,,,第八组[]190195,,下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.(1)求第七组的频率;(2)估计该校的800名男生的身高的平均数和中位数;(3)若从身高属于第六组和第八组的所有男生中随机抽取两名男生,记他们的身高分别为x ,y ,事件{}5E x y =-≤,求()P E .模块四:课后练习 巩固提升一、单选题1.某人忘记了电话号码的最后一个数字,随意拨号,则拨号不超过三次而接通电话的概率为()A.910B.310C.18D.1102.某班准备到郊外野营,为此向商店订购了帐篷.如果下雨与不下雨是等可能的,能否准时收到帐篷也是等可能的,只要帐篷如期运到,他们就不会淋雨,那么下列说法中正确的是().A. 一定不会淋雨B. 淋雨机会为34C. 淋雨机会为12D. 淋雨机会为143.在一个试验中,若()()()1P A B P A P B=+=,事件A与事件B的关系是()A. 互斥不对立B. 对立不互斥C. 互斥且对立D. 以上答案都不对4.某学校计划从2名男生和3名女生中任选3人参加抗疫英雄事迹演讲比赛,记事件M为“至少有2名女生参加演讲”,则下列事件中与事件M对立的是()A. 恰有2名女生参加演讲B. 至多有2名男生参加演讲C. 恰有1名女生参加演讲D. 至多有2名女生参加演讲5.《孙子算经》是中国古代重要的数学著作.其中的一道题:“今有木,方三尺,高三尺,欲方五寸作枕一枚.问:得几何?”意思是:“有一块棱长为3尺的正方体方木,要用它制作棱长为5寸的正方体枕头,可制作多少个?”现有这样的一个正方体木料,其外周已涂上油漆,则从切割后的正方体枕头中任取一块,恰有一面涂上油漆的概率为(注:1尺10=寸)()A. 125216B.827C.49D.146.现有1名女教师和2名男教师参加说题比赛,共有两道备选题目,若每位选手从中有放回地随机选出一道题进行说题,其中恰有一男一女抽到同一道题的概率为()A. 13B.23C.12D.347.如图,现有一迷失方向的小青蛙在3处,它每跳动一次可以等可能地进入相邻的任意一格(若它在1,2,4,5处,跳动一次,只能进入3处,若在3处,则跳动一次可以等机会进入1,2,4,5处),则它在第三次跳动后,首次进入5处的概率是()A.316B.14C.16D.128. 从一批苹果中随机抽取50个,其质量(单位:克)的频数分布表如下:分组 [80,85)[85,90)[90,95)[95,100]频数5102015用分层随机抽样的方法从质量在[80,85)和[95,100]内的苹果中共抽取4个,再从抽取的4个苹果中任取2个,则有1个苹果的质量在[80,85)内的概率为()A.14B.13C.12D.16二:多选题9. 下列说法错误的有()A. 随机事件A 发生的概率是频率的稳定值,频率是概率的近似值B. 在同一次试验中,不同的基本事件不可能同时发生C. 任意事件A 发生的概率()P A 满足0()1P A <<D. 若事件A 发生的概率趋近于0,则事件A 是不可能事件10. 抛掷三枚硬币,设事件i A =“第i 枚硬币正面朝上”,1i =,2,3.则() A. 1A 与2A 互斥 B. 12A A 与3A 相互独立C. 231()4P A A =D. 123()4P A A =11. 下列关于各事件发生的概率判断正确的是()A. 若从甲、乙、丙三人中任选两人担任课代表,则甲被选中的概率为13B. 已知四条线段的长度分别是1,3,5,7,则“从这四条线段中任取三条线段能构成一个三角形”的概率是14C. 一只蚂蚁在如图所示的树枝上寻觅食物,若蚂蚁在每个岔路口都会随机地选择一条路径,则它能获得食物的概率为1 3D. 已知集合{2,3,4,5,6,7}A=,{2,3,6,9}B=,若在A B中任取一个元素,则该元素是A B中元素的概率为3 512.某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示.若从第3,4,5组中用分层随机抽样的方法抽取6名志愿者参与广场的宣传活动,该市决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,则下列结论正确的是() A. 应从第3,4,5组中分别抽取3人、2人、1人B. 第4组志愿者恰有一人被抽中的概率为8 15C. 第5组志愿者被抽中的概率为1 3D. 第3组志愿者至少有一人被抽中的概率为2 3三:填空题13在五个数字1,2,3,4,5中,若随机取出三个数字,则剩下两个数字都是奇数的概率是________(结果用数值表示).14.在一次教师联欢会上,到会的女教师比男教师多12人,从这些教师中随机挑选一人表演节目.若选到男教师的概率为920,则参加联欢会的教师共有________人15.天气预报说,在今后的三天中,每一天下雨的概率均为40%.现采用随机模拟试验的方法估计这三天中恰有两天下雨的概率:先利用计算器产生0到9之间取整数值的随机数,用1,2,3,4表示下雨,用5,6,7,8,9,0表示不下雨;再以每三个随机数作为一组,代表这三天的下雨情况.经随机模拟试验产生了如下20组随机数: 488 932 812 458 989 431 257 390 024 556 734 113 537 569 683 907 966 191 925 271 据此估计,这三天中恰有两天下雨的概率近似为__________.16.一次掷两枚骰子,得到的点数为m 和n ,则关于x 的方程2)0(4x m n x +++=有实数根的概率是________. 四:解答题17.某班有两个课外活动小组.其中第一小组有足球票6张,排球票4张;第二小组有足球票4张,排球票6张.甲从第一小组的10张票中任抽1张,乙从第二小组的10张票中任抽1张.()Ⅰ两人都抽到足球票的概率是多少?()Ⅱ两人中至少有1人抽到足球票的概率是多少?18.全网传播的融合指数是衡量电视媒体在中国网民中影响力的综合指标,根据相关报道提供的全网传播2019年某全国性大型活动的“省级卫视新闻台”融合指数的数据,对名列前20名的“省级卫视新闻台”的融合指数进行分组统计,结果如下表所示.组号分组频数1[4,5)22[5,6)83[6,7)74[7,8]3(1)现从融合指数在[4,5)和[7,8]内的“省级卫视新闻台”中随机抽取2家进行调研,求至少有1家的融合指数在[7,8]内的概率;(2)根据分组统计表求这20家“省级卫视新闻台”的融合指数的平均数.19.甲、乙、丙三人在同一办公室工作.办公室只有一部电话机,设经过该机打进的电话是打给甲、乙、丙的概率依次为16、13、1.2若在一段时间内打进三个电话,且各个电话相互独立,求:()Ⅰ这三个电话是打给同一个人的概率;()Ⅱ这三个电话中恰有两个是打给甲的概率.20.有一种鱼的身体吸收汞,当这种鱼身体中的汞含量超过其体重的1.00ppm (即百万分之一)时,人食用它,就会对人体产生危害.现从一批该鱼中随机选出30条鱼,检验鱼体中的汞含量与其体重的比值(单位:ppm ),数据统计如下:0.07 0.24 0.39 0.54 0.61 0.66 0.73 0.82 0.82 0.820.87 0.91 0.95 0.98 0.98 1.02 1.02 1.08 1.14 1.201.20 1.26 1.29 1.31 1.37 1.40 1.44 1.58 1.62 1.68(1)求上述数据的中位数、众数、极差,并估计这批鱼该项数据的80%分位数; (2)有A ,B 两个水池,两水池之间有10个完全相同的小孔联通,所有的小孔均在水下,且可以同时通过2条鱼.(ⅰ)将其中汞的含量最低的2条鱼分别放入A 水池和B 水池中,若这2条鱼的游动相互独立,均有13的概率进入另一水池且不再游回,求这两条鱼最终在同一水池的概率;(ⅱ)将其中汞的含量最低的2条鱼都先放入A 水池中,若这2条鱼均会独立地且等可能地从其中任意一个小孔由A 水池进入B 水池且不再游回A 水池,求这两条鱼由不同小孔进入B 水池的概率.21.2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(Ⅰ)应从老、中、青员工中分别抽取多少人?(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为,,,,,A B C D E F.享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工项目A B C D E F子女教育○○×○×○继续教育××○×○○大病医疗×××○××住房贷款利息○○××○○住房租金××○×××赡养老人○○×××○(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.22.乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语,已知甲每轮猜对的概率为34,乙每轮猜对的概率为23·在每轮活动中,甲和乙猜对与否互不影响,各轮结果也互不影响,求(1)“星队”在两轮活动中猜对2个成语的概率;(2)“星队”在两轮活动中猜对3个成语的概率;(3)“星队”在两轮活动至少中猜对1个成语的概率;。

卫生统计学I(21级莞临床1-12班)学习通课后章节答案期末考试题库2023年

卫生统计学I(21级莞临床1-12班)学习通课后章节答案期末考试题库2023年

卫生统计学I(21级莞临床1-12班)学习通课后章节答案期末考试题库2023年1.方差分析中对数据的要求有参考答案:任何两个观察值之间不相关###每一水平下的观察值分别服从正态分布###各总体的方差齐性2.统计表的标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。

参考答案:对3.样本含量的估计是在保证研究结论具有一定可靠性的条件下,确定最少的调查单位或实验单位数。

参考答案:对4.估计样本含量时,a 越小,所需要的样本含量越小。

参考答案:错5.估计样本含量时,所定容许误差越小,所需要的样本含量越大。

参考答案:对6.统计表的线条不宜过多,只能采用三条线表示,即顶线、底线和纵标目下的横隔线。

参考答案:错7.方差分析中,组间变异主要反映了参考答案:处理因素的作用8.配对设计均数比较的t检验,其自由度为()。

参考答案:对子数-19.总和生育率用于比较不同出生队列妇女的生育水平,是该队列妇女的实际生育数。

参考答案:错10.测量人口再生育的指标有参考答案:自然增长率、净再生育率、平均世代年数11.标准误的本质是标准差参考答案:对12.测量生育水平的指标有参考答案:出生率、生育率、年龄别生育率、终生生育率及总和生育率13.II型错误越小,则功效越小参考答案:错14.标准差大,则标准误一定大参考答案:错15.I型错误越大,则功效越大参考答案:对16.同一总体中抽样,抽样个数越多,理论上样本均数越接近总体均数,这是因为()参考答案:标准误越小17.( )小,表示该样本均数估计总体均数的可能性大。

参考答案:标准误18.功效越大越好,下列关于提高功效做法正确的是()参考答案:增大样本量###适当增大I型错误19.甲地正常成年男子Hb均数为14.5克%,标准差为1.20克%,从该地随机抽取10名正常成年男子,其Hb均数为12.8克%,标准差为2.25克%。

又从乙地随机抽取15名正常成年男子,其Hb均数为16.8克%,标准差为1.85克%。

人教B版高中数学必修第二册5.1.4用样本估计总体【含答案】

人教B版高中数学必修第二册5.1.4用样本估计总体【含答案】

5.1.4用样本估计总体必备知识基础练进阶训练第一层1.(多选)下列说法中正确的为()A.数据的极差越小,样本数据分布越集中、稳定B.数据的平均数越小,样本数据分布越集中、稳定C.数据的标准差越小,样本数据分布越集中、稳定D.数据的方差越小,样本数据分布越集中、稳定2.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5)4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5)3则总体中大于或等于31.5的数据约占()A.2 11B.13C.1 2D.233.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x 和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()A.x-,s2+1002B.x-+100,s2+1002C.x-,s2D.x-+100,s24.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图所示,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.5.某车间20名工人年龄数据如下表:年龄/岁工人数/人191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,做出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.6.从高三学生中抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图,求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.关键能力综合练进阶训练第二层7.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数大于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差8.(多选)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中的数据用该组区间的中点值为代表,则下列说法中正确的是()A.成绩在[70,80)分的考生人数最多B.不及格的考生人数为1000人C.考生竞赛成绩的平均数约为70.5分D.考生竞赛成绩的中位数约为75分9.某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A ,B ,C 三个级别,其中A 级30棵,B 级60棵,C 级10棵,然后从A ,B ,C 三个级别的苹果树中分别随机抽取了3棵、6棵、1棵,测出其产量,制成了如下统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总产量,那么小李的估计值是________kg.苹果树长势A 级B 级C 级随机抽取棵数361所抽取果树的平均产量/kg 80757010.为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,用茎叶图表示如下:甲乙878593119123(1)根据图中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;(2)求被抽取的这10名职工成绩的平均数和方差.(分层抽样的平均数和方差公式:设样本中不同层的平均数分别为x -1,x -2,…,x -n ,方差分别为s 21,s 22,…,s 2n ,相应的权重分别为w 1,w 2,…,w n ,则这个样本的平均数和方差分别为x -=错误!w i x -i ,s 2=错误!w i [s 2i +(x -i -x -)2],其中x -为样本平均数.)11.某校医务室抽查了高一10位同学的体重(单位:kg )如下:74,71,72,68,76,73,67,70,65,74.(1)求这10个学生体重数据的平均数、中位数、方差、标准差;(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.12.高一(3)班有男同学27名,女同学21名.在一次语文测验中,男同学得分的平均数是82,中位数是75,女同学得分的平均数是80,中位数是80.(1)求这次测验全班成绩的平均数(精确到0.01);(2)估计全班成绩不超过80分的同学至少有多少人;(3)分析男同学得分的平均数与中位数相差较大的主要原因.核心素养升级练进阶训练第三层13.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么从甲、乙生产的零件中抽取的这100件产品的平均尺寸和方差分别是多少?14.已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少.参考答案与解析1.答案:ACD解析:由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故B 不正确,ACD 正确.2.答案:B解析:由题意知样本的容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.3.答案:D解析:因为每个数据都加上100,所以平均数也增加100,而离散程度应保持不变,即方差不变.4.答案:(1)13(2)62.5(3)64解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.(2)设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5.(3)0.20×50+0.40×60+0.25×70+0.10×80+0.05×90=64.5.解析:(1)这20名工人年龄的众数为:30,这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,做出这20名工人年龄的茎叶图如下.(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.6.解析:(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3,而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应大约位于第四个小矩形内.设其底边为x ,高为0.03,∴令0.03x =0.2得x ≈6.7,故中位数应约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.022×10)+95×(0.018×10)=76.4.7.答案:BC解析:由条形统计图知:甲射靶5次的成绩分别为:4,5,6,7,8;乙射靶5次的成绩分别为:5,5,5,6,9,所以x -甲=4+5+6+7+85=6;x -乙=5+5+5+6+95=6.所以x -甲=x -乙.故A 不正确.甲的成绩的中位数为6,乙的成绩的中位数为5,故B 正确.s 2甲=15[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=15×10=2,s 2乙=15[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=15×12=125,因为2<125,所以s 2甲<s 2乙.故C 正确.甲的成绩的极差为:8-4=4,乙的成绩的极差为:9-5=4,故D 不正确.8.答案:ABC解析:由频率分布直方图可知,成绩在[70,80)分的考生人数最多,所以A 正确.不及格的人数为4000×(0.01+0.015)×10=1000(人),所以B 正确.平均分约为(45×0.01+55×0.015+65×0.02+75×0.03+85×0.015+95×0.01)×10=70.5(分),所以C 正确.设中位数约为x 0分,因为(0.01+0.015+0.02)×10=0.45<0.5,(0.01+0.015+0.02+0.03)×10=0.75>0.5,所以0.45+(x 0-70)×0.03=0.5,解得x 0≈71.7,D 错误.9.答案:7600解析:由题中表格各等级苹果树的平均产量可估算果园的苹果总产量为80×3+75×6+70×110×100=7600kg .10.解析:(1)甲单位5名职工成绩的平均数x -甲=87+88+91+91+935=90,乙单位5名职工成绩的平均数x -乙=85+89+91+92+935=90,甲单位5名职工成绩的方差s 2甲=15×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差s 2乙=15×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.∵s 2甲<s 2乙,∴甲单位职工对法律知识的掌握更为稳定.(2)∵甲单位职工的权重w 甲=12,乙单位职工的权重w 乙=12,x -甲=90,x -乙=90,s 2甲=4.8,s 2乙=8,由分层抽样求平均数和方差的公式可得,这10名职工成绩的平均数x -=12×90+12×90=90,这10名职工成绩的方差s 2=w 甲[s 2甲+(x -甲-x -)2]+w 乙[s 2乙+(x -乙-x -)2]=12×[4.8+(90-90)2]+12×[8+(90-90)2]=6.4.11.解析:(1)这10个学生体重数据的平均数为x -=110×(74+71+72+68+76+73+67+70+65+74)=71.这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,∴这10个学生体重数据的中位数为71+722=71.5.这10个学生体重数据的方差为s 2=110×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11.这10个学生体重数据的标准差为s =s 2=11.(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为11.12.解析:(1)利用平均数计算公式,得x -=148×(82×27+80×21)≈81.13.(2)因为男同学得分的中位数是75,所以至少有14名男生得分不超过75分.又因为女同学得分的中位数是80,所以至少有11名女生得分不超过80分.所以全班至少有25人得分不超过80分.(3)男同学得分的平均数与中位数相差较大,说明男同学中两极分化现象严重,得分高的和得分低的相差较大.13.解析:由题知甲机床的平均尺寸和方差分别为x -甲=10,s 2甲=20,乙机床的平均尺寸和方差分别为x -乙=12,s 2乙=40,所以从甲、乙生产的零件中抽出的这100件产品的平均尺寸x -=40×10+60×1240+60=11.2,所以方差s 2=140+60×(40×20+60×40)+40×6040+60×(10-12)2=32.96.14.解析:(1)计算极差:30-21=9.决定组距和组数:取组距为2.∵92=412,∴共分5组.决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下5组:20.5~22.5,22.5~24.5,24.5~26.5,26.5~28.5,28.5~30.5.列出频率分布表如下:分组频数频率20.5~22.520.1022.5~24.530.1524.5~26.580.4026.5~28.540.2028.5~30.530.15合计20 1.00(2)取各小长方形上的中点并用线段连接就构成了频率分布折线图,作出频率分布直方图.(3)由频率分布表和频率分布直方图观察得:样本值出现在23~28之间的频率为0.15+0.40+0.20=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.。

人教A版高中数学必修三专题学案:用样本估计总体(含答案)

人教A版高中数学必修三专题学案:用样本估计总体(含答案)

专题:用样本估计总体※知识要点1.频率分布直方图:横轴表示_____________,纵轴表示__________________,数据落在各小组内的频率用_____ ___________表示,所有长方形面积之和________. 2.作频率分布直方图的步骤(1)求极差(即一组数据中________与________的差);(2)决定________与________; (3)将数据________; (4)列________________; (5)画________________. 3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的________,就得频率分布折线图.(2)总体密度曲线:随着__________的增加,作图时_________ 增加, 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.4.茎叶图:即统计中还有一种被用来表示数据的图, 是指中间的一列数, 是从茎的旁边生长出来的数. 注:茎叶图一般用于表示两位有效数字的数据. 5.众数、中位数、平均数、标准差和方差(1)平均数:x -= ; (2)方差:s 2= ; 6.平均数与方差的重要结论:已知数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则:①x 1+a ,x 2+a ,…,x n +a 的平均数是 ,方差是 ; ②ax 1,ax 2,…,ax n 的平均数是 ,方差是 ; ③mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是 ,方差是 ;※题型讲练【例1】考察频率分布直方图 1.判断下列说法的正误:(1)在频率分布直方图中,小矩形的高表示频率( ) (2)频率分布直方图中各个长方形的面积之和为1( )2.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为________;(2)这800名志愿者中年龄在[25,35)内的人数为________; (3)分别指出改组数据中的众数、中位数和平均数.变式训练1:1.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在[5,9)内的频率和频数分别为____________. 2.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.下表是年龄的频率分布表.(1)求正整数a ,b ,N 的值;(2)该组数据的中位数是 ,平均年龄是 ; (3)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?【例2】考察茎叶图和统计指标 1.判断下列说法的正误:(1)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次( ) (2)茎叶图只适用数据为两位数字( )(3)频率分布直方图中最高长方形底边中点横坐标是众数( ) (4)频率分布直方图中,众数左边和右边的小长方形的面积和是相等的( ) (5)平均数、众数与中位数都描述了一组数据的集中趋势( ) (6)一组数据的方差越大,说明这组数据的波动越大( ) 2.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图. (1)分别指出甲班的众数和乙班的中位数; (2)根据茎叶图通过计算判断哪个班的平均身高较高;(3)计算甲班的样本方差;(4)现从乙班这10名同学中随机抽取两名身高不低于173 cm 的同学,求身高为176 cm 的同学被抽中的概率.变式训练2:1.甲、乙两名射击运动员参加某大型运动会的预选赛,他们2.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的方差s 2=________.3.某班甲、乙两学生的高考备考成绩如下:甲:512 554 528 549 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分.※课后练习1.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为( ) A .32B .0.2C .40D .0.252.某校100名学生期中考试数学成绩的频率分布直方图如下左图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 53.某班的全体学生参加英语测试,成绩的频率分布直方图如上右图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( ) A .45 B .50 C .55 D .60 4.如图是某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为( )A .85,84B .84,85C .86,84D .84,86 5.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x -和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A .x -,s 2+1002 B .x -+100,s 2+1002 C .x -,s 2 D .x -+100,s 2 6.某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x +y 的值为________. 7.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =__________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为____.8.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:从改四个人中选一人参加比赛,最佳人选是 。

统计学方法_课后 习题 答案

统计学方法_课后  习题  答案

思考与练习参考答案第1章绪论一、选择题1. 研究中的基本单位是指( D)。

A.样本 B. 全部对象C.影响因素D. 个体E. 总体2. 从总体中抽取样本的目的是( B )。

A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指( B )。

A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。

A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。

A.受测量精密度限制B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量2. 同质与变异3. 总体与样本4. 参数与统计量5. 误差6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。

而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。

2. 某年级甲班、乙班各有男生50人。

从两个班各抽取10人测量身高,并求其平均身高。

如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。

因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。

样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。

即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。

因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。

高中数学用样本估计总体课文练习答案 新课标 人教版 必修3(A)

高中数学用样本估计总体课文练习答案 新课标 人教版 必修3(A)

用样本估计总体-课文练习答案用样本的频率分布估计总体分布方法点拨P60思考1.不一定.当总体个体数较少或数据的分布过于离散不连续时,总体密度曲线是不存在的.2.不能.不是任何总体都可以准确刻画出来,只能用频率分布来估计,样本容量越大,估计越准确.题目要求列出样本的频率分布表和画出频率分布直方图及频率分布折线图,应注意到已知中提供的是原始数据,需先确定组距、组数、频数及频率.P61练习1.解:(1)①求极差,在上述数据中,极差是364.41-362.51=1.9.②确定组距与组数.如果将组距定为0.25,那么由1.9÷0.25=7.6,组数为8.③决定分点.根据数据的特点,第1小组的起点可取为362.50,第1小组的终点可取为362.75,所得到的分组是[362.50,362.75),[362.75,363.00),…,[364.25,364.50).④列频率分布表.如下表.分组件数频率[362.50,362.75) 5 0.0625 [362.75,363.00) 6 0.075 [363.00,363.25)8 0.1[363.25,363.50)23 0.2875 [363.50,363.75)16 0.2[363.75,364.00)13 0.1625 [364.00,364.25)7 0.0875 [364.25,364.50) 2 0.025 合计80 1.0000按照下列步骤获得样本的频率分布.(1)求最大值与最小值的差.为了避免一个数据既是起点又是终点,从而造成重复计算分组的区间是“左闭右开”的.(2)确定组距与组数.(3)决定分点.(4)列频率分布表.⑤绘制频率分布直方图.频率分布直方图如图2-2-9所示.频率组距1.41.21.00.80.60.40.2[362.50,362.75)[362.75,363.00)[363.00,363.25)[363.25,363.50)[363.50,363.75)[363.75,364.00)[364.00,364.25)[362.25,364.50)尺寸(c m)图2-2-9(5)绘制频率分布直方图.(2)连结频率直方图中各小长方形上端的中点,就得到频率分布折线图.如图2-2-10.频率组距1.41.21.00.80.60.40.20362.50,362.75,363.00,363.25,363.50,363.75,364.00,364.25,364.50尺寸(m )系列1图2-2-10从上表可以看出零件落在[363.25,363.50)内的最多,大多数零件落在[362.75,364.25)内.(6)频率分布折线图2.解:(1)略;(2)能;(3)不能,因为同一学校的各班课外学习时间基本相同,但同一地区的不同学校却存在差异.3.解:所求茎叶图如下图. 10 7 8 011 2 7 6 3 6 8 6 7 2 212 6 8 4 2 7 8 6 1 0 4 3 2 0 13 4 2 3 0各工人此日生产件数图2-2-11从这个茎叶图上可以看出,各工人此日生产件数情况是大致对称的,中位数是126.5;该车间此日生产比较稳定. 用中间的数字表示生产件数的十位数和百位数,右边的数字表示各工人此日生产件数的个位数. 用样本的数字特征估计总体的数字特征P 62 探究方法点拨答案:(1)能.如:众数、中位数、平均数等,但它们各有特点,具体问题时应综合考虑.(2)可以.如:标准差、方差.P 63 思考1正确理解每个数字特征的意义.答案:2.03这个中位数的估计值是由频率分布直方图中得来的,是在假设数据取值连续或均匀的基础上估计出的,但实际问题中数据的取值往往是不均匀的,出现偏差就不难理解.思考2体会“近似”“估计”答案:的确是这样.如:一个班级学生数学考试成绩的中位数不能反映班内“问题学生”与其他学生的具体差距.P 64 探究答案:我们必须问清所谓收入的平均水平具体指的是什么,若是中位数时,实际情况大体与我们从字面上的理解相符,若是平均数,则需要进一步了解企业各类岗位收入的离散情况,再作判断.P 64 练习中位数对极端值不敏感.答案:(1)因为有的公路建设投资2200万元,属极端情况,大多数在20和100之间,此时平均数难以正确客观反映各项目投资的实际分布状况,不宜选用.而众数20万只说明投资20万的项目最多,不能反映其他项目的投资数额.中位数对极端值不敏感,能回避极端数额的影响,25万也较客观,故选中位数.(2)它的缺深入问题,细致分析.点是不能提供各项目投资金额的分布和离散情况.P 70 练习1.答案:用科学计算器可得x 甲=900,x 乙=900,s甲=23.80<s 乙=41.63,所以甲种水稻的产量稳定.2.答案:(1)用科学计算器可得x =496.86g ,s =6.55g ;(2)有14袋,所占百分比为66.7%.3.答案:(1)在上述数据中,最大值是50.1,最小值是1.5,极差是50.1-1.5=48.6.如果将组距定为7,那么由48.6÷7=6.94,组数为7,这个组数是适合的.于是组距为7,组数为7.根据本题中数据的特点,第1小组的起点可取为1.5,第1小组的终点可取为8.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[1.5,8.5),[8.5,15.5),…,[43.5,50.5). 平均数、方差、标准差都可用科学计算器直接得出,但必须掌握笔算方法,因为有时科学计算器不许使用.列频率分布表如下表.频率分布表分 组 频 数 频 率 [1.5,8.5) 6 0.2 [8.5,15.5) 9 0.3 [15.5,22.5) 4 0.13 [22.5,29.5) 5 0.17 [29.5,36.5) 3 0.1 [36.5,43.5) 2 0.06 [43.5,50.5)1 0.03 合计301.00(1)求最大值与最小值的差; (2)确定组距与组数;(3)决定分点; (4)列频率分布表; (5)绘制频率分布直方图.绘制频率分布直方图如图2-2-13所示.0.050.040.030.020.010频率组距[1.5,8.5)[8.5,15.5)[15.5,22.5)[22.5,29.5)[29.5,36.5)[36.5,43.5)[43.5,50.5)死亡率1 图2-2-13(2)x =19.25,s =12.50,如上图“1”位置即平均数是频率直方图的“重心”.死亡率在[6.75,31.75]内的国家有19个,所占比例63%,这说明该疾病死亡率地域性差异较大.P 72 习题2.2A 组最后一行的合计不要遗忘,它可以及时检测你的过程有无错误.1.答案:(1)茎叶图如下.作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填,无需按大小排列.汞含量汞含量0.01.140 0 9 67 10 482 851.21.31.41.51.61.71.81.92.00.10.20.30.40.50.60.70.80.91.02.17494121522824881图2-2-14(2)分布比较分散,大多在0.8到1.6之间. (3)比1.00 ppm 大. (4)x =1.08 ppm ,s =0.45. (5)28条.2.答案:在数据中,最大值是385,最小值是25,极差是385-25=360.如果将组距定为40,那么由360÷40=9,组数为9,这个组数是适合的.于是组距为40,组数为9.根据本题中数据的特点,第1小组的起点可取为25,第1小组的终点可取为65,分组是[25,65),[65,105),…,[345,385]. 列频率分布表如下表. 分 组 频 数 频 率 [25,65) 10 1/6 [65,105) 2 1/12 [105,145) 4 1/15 [145,185) 3 1/20 [185,225) 3 1/20 [225,265) 7 7/60 [265,305) 8 2/15 [305,345) 10 1/6 [345,385] 13 13/60 合 计601绘制频率分布直方图的一般步骤:(1)求最大值与最小值的差; (2)确定组距与组数; (3)决定分点; (4)列频率分布表; (5)绘制频率分布直方图.频率分布直方图如图2-2-15.0.050.060.040.030.020.010频率组距分组[25,65)[65,105)[105,145)[145,185)[185,225)[225,265)[265,305)[305,345)[345,385]1长度(m m )图2-2-15 利用科学计算器得x =238,s =113.94.中位数、众数、平均数如上图所示.平均数是直方图的重心,众数在最高小矩形的中点处,中位数的左右矩形的面积应相等,它们虽都是常用统计量,但数学意义不同,各具特色.3.答案:可以查阅一下这所大学招生的其他信息,中位数是550分,只能说明有50%的学生高于此分数,仍有50%的录取学生的中位数对极端值不敏感.分数低于550分,该生分数520分仍有可能.该例反映了中位数对极端值不敏感这一特点.4.答案:四种说法都正确,一队的平均失球数少于二队,故第一句正确;二队标准差较小,说明技术水平稳定;一队平均失球数是1.5,而其标准差却是1.1,离散程度较大,由此可判断一队表现不稳定;平均失球数是2.1,标准差只有0.4,每场得失球数相差不多,可见二队的确很少不失球.5.答案:(1)难度较大.平均数是3.5万,共50人,所以他们的总收入是165万,而最高收入者一人收入100万,可推知其他人的收入不高.(2)不能.极差只能反映数据变化的最大范围,却不能体现数据的具体分布情况.(3)可以根据自身的情况作出选择,初聘人员的收入一般在较低档.(4)1.5万.均值受极端值影响很大.正确理解平均数、中位数、众数、方差、标准差等各统计量的意义.6.答案:利用科学计算器得x甲=1.5,s甲=1.28,x乙=1.2,s乙=0.87.因x甲=1.5>x乙=1.2,s甲=1.28<s乙=0.87,可知,机床乙的性能较好.7.答案:(1)x=199.75,s=95.26.(2)抽取一样本后得x=169.17,s=56.30.(3)再抽取一样本后得x=166.29,s=59.65.(4)获取一容量是10的样本得x=218.30,s=118.97.同一个总体,抽取的样本不同,平均数、标准差等都会发生改变,这会影响对总体的估计,对总体估计的偏差取决于样本的质量.实际应用时在许可的前提下,适当增加样本容量来提高样本代表性,减少估计偏差.B组先比较平均数,了解平均水平的差距情况,差距显著则可以结合实际情况做出判断选择.若差距不明显则需进一步比较方差或平均数.样本数据的选取应运用正确的样本抽取方法,如用抽签法,切忌挑选数据,使样本缺乏代表性,使所取样本失去研究价值.1.答案:(1)第一次好;(2)第一次;(3)G最强,E最弱;(4)运动员F、H最不一致,C、G、L、I看起来最一致.2.答案:略.了解总体的情况是检查样本的目的,因此要求样本应具有很好的代表性,选择恰当的抽样方法获取高质量的样本.样本的良好客观代表性,完全依赖于恰当的抽样方法.高中数学用样本估计总体课文练习答案新课标人教版必修3(A)。

第15章 样本含量估计案例辨析及参考答案

第15章 样本含量估计案例辨析及参考答案

第15章样本含量估计案例辨析及参考答案案例15-1某研究者为了证明A(HP-1000型超声诊断仪)、B(研究者自制的成像系统)两台仪器测定的结果无差别,作了如下的实验设计:选一个健康人作为受试对象,用A、B 两台仪器前后两次(间隔为1个月)对此人分别重复测定4次,其数据格式如教材表15-9所示。

观测的定量指标分别是:①二尖瓣前叶EC幅度;②左室后壁运动幅度;③ R-R间期。

数据处理方法是:每个指标下有4组数据,既作了方差齐性检验,又作了配对比较的t 检验,P值均大于0.1。

结论:两台仪器的测定结果无差别,可用自制的成像系统取代费用很高的同类进口仪器。

教材表15-9 对一名健康人某一项指标(如二尖瓣前叶EC幅度)测定的结果重复测定顺序号二尖瓣前叶EC幅度A仪器第1次测B仪器第1次测A仪器第2次测B仪器第2次测1 X X X X2 X X X X3 X X X X4 X X X X注:“X”代表各次测定的具体值。

请辨析下列问题:(1)根据研究者的实验实施情况及对实验数据的处理,判断研究者采用的实验设计有何不妥?你认为应该如何设计?(2)按照你的设计,如何确定应选取对象的数量?案例辨析(1)根据研究者的实验实施情况及对实验数据的处理(既作了方差齐性检验,又作了配对比较的t检验),可以判断研究者自己认为其所采用的实验设计类型为配对设计,即对同一个指标,A、B两台仪器每一次测定的结果配成一对。

但是,采用配对设计时,不能考察受试对象接受A、B两台仪器对各项指标的测量的先后顺序对测量结果有无影响。

本研究涉及3个因素,其中1个是实验因素(即仪器),另外两个是区组因素(即测定时间和受试对象),因此,为了实现研究者的实验目的,最好采用交叉设计来安排实验。

采用交叉设计时,选足够数量的健康人,将其随机分为两组,其中一组先接受A 仪器测量后接受B 仪器测量,另一组则按相反顺序接受测量。

(2)研究者在实施实验时仅选一个健康人,用A 、B 两台仪器前后两次(间隔为1个月)对此人分别重复测定4次,从研究者的角度来看,他认为每次每台仪器都作了4次独立重复实验,其实不然。

含量估计思考与练习参考答案

含量估计思考与练习参考答案

第15章样本含量估计思考与练习参考答案一、最佳选择题1. 在假设检验中,样本含量的确定(C)。

A.只与Ⅰ类错误概率有关B.只与Ⅱ类错误概率有关C.与、都有关D. 与、都无关E. 只与、有关2. 以下关于检验功效的描述,不正确的是(C)。

A. 假设检验中,若客观上不成立,但根据假设检验的规则,将有大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为,称为检验功效。

B.检验功效受客观事物差异的大小、个体间变异的大小、样本量和值等要素的影响。

C.假设检验的“阴性”结果(>0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。

D.假设检验得出“阴性”结果(>0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。

E.当假设检验出现“阴性”结果(>0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。

3.在调查研究中,计算配对设计均数比较所需样本含量的公式为(A)。

A. B.C. D.E.4. 在调查研究中,计算两样本率比较所需样本含量的公式为(E)。

A. B.C. D.E.5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出来的一切公式进行相应的统计分析。

下列说法中(C)最正确。

A.题中所说的条件和结论都正确B.题中所说的条件正确,但结论不正确C.题中所说的条件和结论都不正确D.题中所说的条件不正确,但结论正确E.题中所说的条件和结论正确概率为70%,错误概率为30%6.在研究一个因变量依赖多个自变量变化规律时,估计样本含量非常复杂,有人提供了一个经验估算方法,即样本含量N(即拟观测的个体数目)至少应当是自变量个数的10倍。

下列说法中(B)最正确。

A.此法无任何参考价值B.在没有精确算法时,此法有一定的参考价值C.此法根本不能用D.此法永远是正确的E.此法正确的概率为80%,错误的概率为20%二、思考题1. 决定样本含量的依据有哪些?答:决定样本含量的依据有:①犯Ⅰ类错误的概率,即检验水准。

数学北师大版必修3优化训练:1.5用样本估计总体 含解

数学北师大版必修3优化训练:1.5用样本估计总体 含解

§5 用样本估计总体 5.1 估计总体的分布5分钟训练 (预习类训练,可用于课前)1.在用样本频率估计总体分布的过程中,下列说法正确的是( ) A.总体容量越大,估计越精确 B.总体容量越小,估计越精确 C.样本容量越大,估计越精确 D.样本容量越小,估计越精确 答案:C2.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的范围为( )A.5.5—7.5B.7.5—9.5C.9.5—11.5D.11.5—13.5 答案:D解析:只要列出频率分布表,依次对照就可以找到答案,频率分布表如下:分组 频数 频率 5.5—7.5 2 0.1 7.5—9.5 6 0.3 9.5—11.5 8 0.4 11.5—13.5 4 0.2合计20 1.0 从表中可以看出频率为0.2的范围是11.5—13.5.3.(2007山东潍坊一模,理15)某地教育部门为了了解学生在数学答卷中的有关信息,从上次考试的10 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如下图).则这10 000人中数学成绩在[140,150]段的约是___________人.答案:800解析:频率=0.008×10=0.08, ∴约有10 000×0.08=800人.10分钟训练 (强化类训练,可用于课中)1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A.36%B.72%C.90%D.25% 答案:C解析:用样本估计总体时,用样本的合格率代替总体的合格率.而样本合格率为4036×100%=90%. 2.观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重在(2 700,3 000)的频率为( )A.0.001B.0.1C.0.2D.0.3 答案:D 解析:由图可知组距频率=0.001,∴频率=0.001×300=0.3. 3.一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50], 5;(50,60],4;(60,70],2.则样本在区间(-∞,50]上的频率是( )A.5%B.25%C.50%D.70% 答案:D解析:样本在(-100,50]上的频数为2+3+4+5=14,故在(-100,50]上的频率为14÷20=70%. 4.(2007天津高考,文11)从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组[90,100) [100,110) [110,120) [120,130) [130,140) [140,150) 频数1 2 3 10 3 1则这堆苹果中,质量不小于120克的苹果数约占苹果总数的___________%. 答案:70解析:本题主要考查统计知识,质量不小于120克的频数为14,所以频率为2014=70%. 5.一个容量为100的样本,数据的分组和各组的一些相关信息如下:分组 频数频率 [12,15)6 [15,18)0.08 [18,21)[21,24)21 [24,27)0.18 [27,30)16 [30,33)0.10 [33,36)5 合计100 1.00(1)完成上表中每一行的空格; (2)画出频率分布直方图;(3)根据频率分布直方图,总体中小于21的样本数据大约占多大的百分比? 解:(1)补全后的表格为:分组 频数频率 [12,15)6 0.06[15,18) 8 0.08[18,21) 16 0.16[21,24) 21 0.21[24,27) 18 0.18[27,30) 16 0.16[30,33) 10 0.10[33,36) 5 0.05合计100 1.00(2)频率分布直方图为:(3)由频率分布直方图中可以看出,总体中小于21的样本数据大约占30%.30分钟训练(巩固类训练,可用于课后)1.在频率分布直方图中,各个小长方形的面积表示()A.落在相应各组的数据的频数B.相应各组的频率C.该样本所分成的组数D.该样本的样本容量答案:B解析:由直方图的概念知:频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.2.一个容量为35的样本数据,分组后,组距与频数如下:[5,10)5个;[10,15)12个;[15,20)7个;[20,25)5个;[25,30)4个;[30,35)2个.则样本在区间[20,+∞)上的频率为()A.20%B.69%C.31%D.27%答案:C解析:35245++=0.3143,∴选C.3.一个容量为32的样本,已知某组样本的频率为0.125,则该样本的频数为()A.2B.4C.6D.8答案:B4.(2007山东高考,8)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y 分别为()A.0.9,35B.0.9,45C.0.1,35D.0.1,45 答案:A解析:由直方图知x=0.34+0.36+0.18+0.02=0.9,即x=0.9.50y=0.36+0.34=0.7,∴y=35.故选A. 5.有一个容量为50的样本数据分组,各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),3.根据频率分布,估计小于30的数据的频率可能是( )A.80%B.95%C.97%D.90% 答案:D解析:根据所给数据可知小于30的数据个数为3+8+9+11+10=41,而在[27.5,30.5)之间的为6个,如果[27.5,30.5)之内没有小于30的,则小于30的频率为5041=82%,如果[27.5,30.5)之内的数据全部小于30,则小于30的数据个数为47,频率为5047=94%,所以,估计小于30的数据频率应在82%到94%之间,可以判断可能的频率结果应该为D 项.6.容量为100的样本数据,按从小到大的顺序分为8组,但是记录时不小心把第3组数据和第8组数据的部分信息丢失,记录如下:组号1 2 3 4 5 6 7 8 频数10 13 14 15 13 12 频率0.10 0.13 0.14 0.15 0.13 0.12 0.09 则根据上表可知,第3组的频率是____________,第8组的频数是____________. 答案:0.14 9解析:根据第8组的频数0.09可计算出第8组的频数是9,根据总的频率之和为1,可以得出第3组的频率是1-0.10-0.13-0.14-0.15-0.13-0.12-0.09=0.14.7.(2006全国高考卷Ⅱ,16)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出____________人.答案:25解析:在[2 500,3 000)月收入段应抽出=0005.020004.00003.00002.00001.00005.0⨯++++×100=25(人).8.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15)7,[-15,-10)11,[-10,-5)15,[-5,0)40,[0,5)49,[5,10)41,[10,15)20,[15,20)17. (1)列出样本的频率分布表;(2)画出频率分布直方图和折线图; (3)求样本数据不足0的频率. 解:(1)频率分布表如下:分组 频数 频率[-20,-15)7 0.035 [-15,-10)11 0.055 [-10,-5)15 0.075 [-5,0)40 0.200 [0,5)49 0.245 [5,10)41 0.205 [10,15)20 0.100 [15,20)17 0.085 合计200 1.000 (2)频率分布直方图和折线图如下:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.200=0.365.5.2 估计总体的数字特征5分钟训练 (预习类训练,可用于课前)1.在统计中,样本的标准差可以近似地反映( ) A.平均状态 B.波动大小C.分布规律D.最大值和最小值 答案:B解析:由定义知,数据的标准差反映数据的波动大小. 2.下列数字特征一定是数据组中数据的是( )A.众数B.中位数C.标准差D.平均数 答案:A解析:根据各数字特征的意义可知唯有众数一定是原数据中的数. 3.下列叙述不正确的是( )A.样本均值可以近似地描述总体的平均水平B.极差描述了一个样本数据变化的幅度C.样本标准差描述了一组样本数据围绕样本均值波动的大小D.一个班级的数学成绩的方差越大说明成绩越稳定 答案:D解析:方差越大,说明成绩越不稳定,所以D 项错.4.(2006湖南高考,文12)某高校有甲、乙两个数学建模兴趣班,其中甲班40人,乙班50人,现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是___________分. 答案:85解析:由题意知,所求平均成绩为:504081509040+⨯+⨯=85分.10分钟训练 (强化类训练,可用于课中) 1.与总体单位不一致的是( )A.s 2B.sC.xD.三个都不一致 答案:A解析:方差的单位是原始数据单位的平方,所以与总体单位不一致.2.有一个数据为50的样本,数据分组以及各组的频数如下,[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.估计小于30的数据大约占( )A.10%B.92%C.5%D.30% 答案:B解析:样本容量为50,小于30的约有:3+8+9+11+10+5=46,所以,频率≈5046=0.92=92%. 3.一组观察值为4、3、5、6出现的次数分别为3、2、4、2,则样本均值为( ) A.4.55 B.4.5 C.12.5 D.1.64 答案:A 解析:1150242326452334=+++⨯+⨯+⨯+⨯=x ≈4.55.4.设有n 个样本数据x 1、x 2、…、x n ,其标准差为s x ,另有n 个样本数据y 1、y 2、…、y n ,且y k =3x k +5(k=1,2,…,n),其中标准差为s y ,则下列关系正确的是( ) A.s y =3s x +5 B.s y =3s x C.s y =x s 3 D.s y =x s 3+5答案:B解析:设x 1、x 2、…、x n 的平均数为x ,y 1、y 2、y 3、…、y n 的平均数为y ,则y =nnx x x n x x x n y y y n n n 5)(3535353212121++++=++++++=+++ =3x +5∴s y 2=[(3x 1+5-3x -5)2+(3x 2+5-3x -5)2+…+(3x n +5-3x -5)2]÷n=nx x x x x x n ])()()[(922221-++-+-=9s x 2 ∴s y =3s x .5.在一次数据测量中,计算出18个数据的样本均值为50,但是后来发现其中一个数据是86被误记为68,那么这18个数据的正确的样本均值应该是____________. 答案:51解析:根据条件易知,实际18个数据的总和应该是:50×18+(86-68)=918,根据平均数的计算方法可得这组数据实际的均值应该是18918=51. 6.在某次考试中,要对甲、乙两同学的学习成绩进行比较,甲同学的平均分甲x =76,方差2甲s =4,乙同学的平均分乙x =77,方差2乙s =10,则___________同学平均成绩好,___________同学各科发展均衡. 答案:乙 甲解析:∵甲乙x x >,s 2甲<s 2乙, ∴乙甲s s <.∴乙同学平均成绩好,甲同学各科发展均衡.7.从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm) 82,202,352,321,25,293,86,206,115.求样本均值、样本方差和样本标准差. 解:样本均值91=x (82+202+352+321+25+293+86+206+115)=186.9(mm) 样本方差s 2≈91[(82-186.9)2+(202-186.9)2+…+(115-186.9)2]≈12 184.1. 样本标准差s=2s =110.430分钟训练 (巩固类训练,可用于课后)1.已知样本12、7、11、12、11、12、10、10、9、8、13、12、10、9、6、11、8、9、8、10,那么频率为0.25的样本的范围是( )A.[5.5,7.5)B.[7.5,9.5)C.[9.5,11.5)D.[11.5,13.5) 答案:D解析:样本容量为20,发生在[11.5,13.5)的频数为5,∴频率为205=0.25. 2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高1.50 m,由此可推断我国13岁男孩的平均身高为( ) A.1.54 m B.1.55 m C.1.56 m D.1.57 m 答案:C解析:2003005.12006.1300+⨯+⨯=x =1.56.3.甲、乙两人在相同条件下,各射击10次,命中环数如下: 甲:8 6 9 5 10 7 4 8 9 5 乙:7 6 7 8 6 9 6 8 7 7根据上述数据估计两人的技术稳定性,结论是( ) A.甲优于乙 B.乙优于甲 C.两人相同 D.无法比较 答案:B 解析:1059847105968+++++++++=甲x =7.1.107786968767+++++++++=乙x=7.1.又∵s 2乙<s 2甲,乙甲x x =,∴乙优于甲.4.从总体中抽取的样本数据有m 个a ,n 个b ,p 个c ,则总体的平均数μ的估计值为( ) A.3c b a ++ B.3p n m ++ C.3pc nb ma ++ D.pn m pcnb m a ++++ 答案:D解析:样本均值pn m pcnb m a x ++++=,把它作为总体均值的估计.5.(2006重庆高考,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁—18岁的男生体重(kg),得到频率分布直方图如下图:根据图可得这100名学生中体重在[56.5,64.5)的学生人数是( )A.20B.30C.40D.50 答案:C 解析:由组距频率×组距=频率,即(0.03+0.05+0.05+0.07)×2=0.4为体重在[56.5,64.5)的频率.又频率=样本容量频数,∴人数为100×0.4=40.6.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( )A.甲、乙的波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较 答案:C解析:平均数:51=甲x (5+4+3+2+1)=3,51=乙x (4+0+2+1-2)=1, 方差为s 2甲=51[(5-3)2+(4-3)2+…+(1-3)2]=2, s 2乙=51[(4-1)2+(0-1)2+…+(-2-1)2]=4, ∴s 2甲<s 2乙.7.一个样本方差是S 2=101[(x 1-15)2+(x 2-15)2+…+(x 10-15)2],则这个样本均值x =___________,样本容量是___________. 答案:15 108.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.20,则a 1,a 2,…,a 20,x 这21个数据的方差约为___________. 答案:0.19解析:由题意得:201[(a 1-x )2+(a 2-x )2+…+(a 20-x )2]=0.20, ∴(a 1-x )2+(a 2-x )2+…+(a 20-x )2=4,且a 1+a 2+…+a 20=20x ,∴x xx x a a a =+=++++2120212021 ,即a 1,a 2,…,a 20,x 这21个数据的平均数也是x .∴这21个数据的方差是s 2=214])(4[2112=-+x x ≈0.19. 9.甲、乙两台机床同时加工直径100毫米的零件,为了检验产品质量,从产品中各随机抽出6件进行测量,测得数据如下(单位:毫米): 甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.解:(1)61100+=甲x (-1+0-2+0+0+3)=100;61100+=乙x (-1+0+2-1+0+0)=100. s 2甲=61[(-1)2+02+(-2)2+02+02+32]=37,s 2乙=61[(-1)2+02+22+(-1)2+02+02]=1.(2)由(1)知,x 甲=x 乙,s 2甲>s 2乙,∴乙机床加工的这种零件更符合要求. 10.假定下述数据是甲、乙两个供货商的交货天数. 甲:10,9,10,10,11,11,9,11,10,10; 乙:8,10,14,7,10,11,10,8,15,12.估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性. 解:甲x =101(10+9+…+10)=10.1,乙x =101(8+10+…+12)=10.5, s 2甲=101[(10-10.1)2+(9-10.1)2+…+(10-10.1)2]=0.49,s 2乙=101[(8-10.5)2+(10-10.5)2+…+(12-10.5)2]=6.05.从交货天数的平均值来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲是较具一致性与可靠性的厂商.。

九年级数学用样本估计总体含答案

九年级数学用样本估计总体含答案

用样本预计整体一.选择题要认识一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是().这一批灯泡B.抽取的60只灯泡C.这一批灯泡的使用寿命D.抽取的这60只灯泡的使用寿命.假如一组数据x,x,x x,x,的均匀数是x,那么另一组数据x+1,x+2,x+3,x+4,x+5的1241235均匀数是()A.x.B.x2C.3.D.x15.为了考察某地域初中毕业生的数学毕业会考状况,从中抽查了200名考生的数学成绩,在这个问题中,下边说法错误的选项是()A.整体是被抽查的200名考生B.个体是每一个考生的数学成绩C.样本是200名考生的数学成绩D.样本容量是200.某学校生物兴趣小组11人到校外收集植物标本,此中2人每人收集到6件,4人每人收集到3件,5人每人收集到4件,那么这个兴趣小组均匀每人收集到的标本是()A.3件件C.5件件二.填空题:样本1,0,2,1,3,5,的均匀数是________.2.某地举行了一次数学比赛,为了预计均匀成绩,在抽取的局部试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,那么样本容量是___,样本均匀数是_________.3 .某班共有学生50人,均匀身高为168cm,此中30名男生均匀身高为170cm,那么20名女生的均匀身高为___________.三.解答题:1 .大连是一个严重缺水的城市,为鼓舞市民珍惜每一滴水,某居民委员会表彰了100个节俭用水典范户,5月份这100户节俭用水状况以下表所示,求5月份这100户居民的均匀节俭用水量.每户节俭用水量(吨)1节水户数(户)523018(1)某甲鱼养殖专业户共养甲鱼200只,为了与客户签署购销合同,对自已所养甲鱼的总重量进行预计,任意捞了5只,称得重量分别为 1.5,1.4,1.6,2,1.8,( 单位:千克).依据样本均匀数预计甲鱼的总重量约是多少千克?假如甲鱼的市场价为每千克150元,那么该专业户卖出所有甲鱼的收入约为多少元?在北京市危旧房改造中,小强一家搬进了回龙观小区,这个小区冬天用家庭燃气炉取暖,为了估量冬天取暖第一月使用燃气的开销状况 ,从11月15日起,小强连续8天每日夜晚记录了天然气表显示的读数(单住:m3)日期15日16日17日18日19日20日21日22日天然气表显示的读数220 229 241 249 259 270 279 290小强妈妈于11月15日买了一张面值600元的天然气卡,每立方米天然气元,请你估量这张卡够小强家用一个月(按30天计算)吗?为何?综合创新训练四.学科内综合题:1.某出租汽车企业在“五一〞长假时期均匀每日的营业额为5万元,由此推测五月份的总营业额约为5×31=155(万元),依据所学的统计知识,你以为这样的推理适合吗?(1)某田户承包荒山种了44棵苹果树,现已进入第三年收获期,收获时,先任意摘了5棵树上的苹果,称得每棵树摘得的苹果重量以下(单位:千克):35,35,34,39,37.假定市场上苹果售价为每千克5元,那么这年该田户苹果收入将抵达多少元?该田户第一年卖苹果收入为5500元,依据以上估量,试求第二年,第三年卖苹果收入的年均匀增加率.中考题回想五.中考题:1.(2003. 天津)某食品店购进2000箱苹果,从中任取10箱,称得重量分别(单位:千克):为16,16.5,14.5,13.5,15,16.5,15.5,14,14,14.5,假定每千克苹果售价为元,那么利用样本均匀数预计这批苹果的销售额是_________元.2.(2003. 青岛)某林业部门为对辖区内面积为1200公倾的山林进行林业资源检查 ,工作人员在山林中精选了一块面积为 1亩的样当地,经实地盘点,该样当地的树木数目为196棵,预计该山林的树林总量约为________________棵(用科学记数法表示 ,1公倾=15亩).答案:更多资料请接见。

高中数学必修二 9 用样本估计总体(精练)(含答案)

高中数学必修二   9  用样本估计总体(精练)(含答案)

9.2 用样本估计总体(精练)【考点一 频率分布直方图】1.(2021·广西南宁)北京舞蹈学院为了解大一舞蹈专业新生的体重情况,对报到的1000名舞蹈专业生的数据(单位:kg )进行统计,得到如图所示的体重频率分布直方图,则体重在60kg 以上的人数为( )A .100B .150C .200D .250【答案】D【解析】0.04050.01050.25⨯+⨯=,10000.25250⨯=, 故选:D .2.(2021·江苏南京)为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[]10,50内,其中支出金额在[]30,50内的学生有234人,频率分布直方图如图所示,则n 等于( )A .300B .320C .340D .360【答案】D【解析】解:由频率分布直方图知:234[10.010.025]10n=--⨯,∴360=n . 故选:D.3.(2021·宁夏长庆高级中学 )某家庭记录了50天的日用水量数据(单位:3m ),得到频数分布表如下: 50天的日用水量频数分布表(1)在答题卡上作出50天的日用水量数据的频率分布直方图:(2)估计日用水量小于30.35m 的概率; 【答案】(1)答案见解析;(2)0.48. 【解析】(1)(2)由题可知用水量在[0.3,0.4]的频数为10,所以可估计在[0.3,0.35)的频数为5,故用水量小于30.35m 的频数为1513524+++=,其概率为240.4850P ==. 4.(2021·全国·高一专题练习)已知某市2019年全年空气质量等级如表1所示.表12020年5月和6月的空气质量指数如下:5月240 80 56 53 92 126 45 87 56 60191 62 55 58 56 53 89 90 125 124103 81 89 44 34 53 79 81 62 116 886月63 92 110 122 102 116 81 163 158 7633 102 65 53 38 55 52 76 99 127120 80 108 33 35 73 82 90 146 95选择合适的统计图描述数据,并回答下列问题:(1)分析该市2020年6月的空气质量情况.(2)比较该市2020年5月和6月的空气质量,哪个月的空气质量较好?【答案】(1)答案见解析;(2)从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.【解析】(1)根据该市2020年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表(表2).表2从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”.我们还可以用条形图和扇形图对数据作出直观的描述,如图1和图2.从条形图中可以看出,在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少,从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,大多数是“良”和“轻度污染”.因此,整体上6月的空气质量不错.图1图2我们也可以用折线图展示空气质量指数随时间的变化情况,如图3.容易发现,6月的空气质量指数在100附近波动.图3(2)根据该市2020年5月的空气质量指数和空气质量分级标准,可以画出该市这个月的不同空气质量等级的频数和频率分布表(表3).表3为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较(下图).图4由表3和图4可以发现,5月空气质量为“优”和“良”的总天数比6月多.所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.【考点二常见统计图表】1.(2021·全国·月考)(多选)在新冠疫情期间,全国人民万众一心,众志成城,在抓防控疫情同时,又能促进复工复产.为了响应政府号召,积极恢复生产,某市相关部门对本市1500个大型企业的复工情况进行了调查,调查结果如图所示,则下列说法正确的是( )A.其他情况的企业比例为37.4%B.从调查的大型企业中任选一个,该企业是暂未全面恢复生产的概率为0.235C.不超过200个企业倾向于部分岗位恢复生产D.部分岗位恢复生产或暂未复工的企业超过604个【答案】AD【解析】对A ,100%23.5%16.8%22.3%37.4%---=,故A 正确;对B ,暂未全面恢复生产包括部分岗位恢复生产和暂未复工以及其他,占比为77.7%,故对应概率为0.777,故B 错误;对C ,倾向于部分岗位恢复生产的企业个数为150016.8%252⨯=(个),故C 错误;对D ,部分岗位恢复生产或暂未复工的企业个数为()150016.8%23.5%605⨯+≈(个),故D 正确. 故选:AD.2.(2021·全国·高一课时练习)(多选)“小康县”的经济评价标准为①年人均收入不低于7000元;②年人均食品支出(单位:元)不高于年人均收入的35%.某县有40万人,年人均收入如表所示,年人均食品支出如图所示,则该县( )A .未达到标准①B .达到标准①C .达到标准②D .不是小康县【答案】BD【解析】由图表可知年人均收入为()2000340005600058000610000712000516000340⨯+⨯+⨯+⨯+⨯+⨯+⨯÷7050=(元),达到了标准①;年人均食品支出为()140032000524001330001036009402695⨯+⨯+⨯+⨯+⨯÷=(元),则年人均食品支出占年人均收入的2695100%38.2%35%7050⨯≈>,未达到标准②,所以该县不是小康县. 故选:BD .3.(2021·全国·高一课时练习)(多选)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2017年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线统计图.根据该折线统计图,下列结论正确的是( )A.年接待游客量逐年增加B.各年的月接待游客量高峰期大致都在8月C.2017年1月至12月月接待游客量逐月增加D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【答案】ABD【解析】对A,接待游客量虽然逐月波动,但总体上逐年增加,故A正确;对B,折线统计图可知,各年的月接待游客量高峰期大致都在8月,故B正确;对C,2017年8月至9月月接待游客量呈下降趋势,故C错误;对D,折线统计图可知,各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D正确.故选:ABD.4.(2021·广东广雅中学 )如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出正确的选项( )A.2020年下半年,每个月的异地快递量部是同城快递量的6倍以上B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)C.2020年下半年,异地快递量与月份呈正相关关系D.2020年下半年,同城和异地快递量最高均出现在11月【答案】BCD【解析】对于A,2020年7月的异地快递量为572812.9万件,同城快递量为105191.1万件,异地快递量不是同城快递量的6倍,故A不正确;对于B,因为679556.6599604.6708642.6679556.6599604.6679556.6-->,9月异地快递增长率明显高于10月异地快递增长率,故B正确;对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显增加,因此可以判断异地快递量与月份呈正相关关系,故C正确;对于D,由图可看出,同城和异地快递量最高都在11月份,故D正确.故选:BCD5(2021·江苏·高三月考)数据显示,全国城镇非私营单位就业人员平均工资在2011年为40000元,到了2020年,为97379元,比上年增长7.6%.根据下图提供的信息,下面结论中正确的是( )2011-2020年城镇非私营单位就业人员年平均工资及增速A.2011年以来,全国城镇非私营单位就业人员平均工资逐年增长B.工资增速越快,工资的绝对值增加也越大C.与2011年相比,2019年全国城镇非私营单位就业人员平均工资翻了一番多D.2018年全国城镇非私营单位就业人员平均工资首次突破90000元【答案】AC【解析】对选项A:由图可知,2011年以来,全国城镇非私营单位就业人员平均工资逐年增长,只是每年增速有变化,故选项A正确;对选项B:工资增速越快,工资的绝对值增加也越大,这是错误的,工资的绝对值的增加还与上一年的工资水平有关系,故选项B错误;÷≈元,故选项C正对选项C:根据数据2019年全国城镇非私营单位就业人员平均工资为97379 1.07690500确;÷÷≈元,所以对选项D:根据数据2018年全国城镇非私营单位就业人员平均工资为97379 1.076 1.09882423全国城镇非私营单位就业人员平均工资首次突破90000元应为2019年,故选项D错误.故选:AC.【考点三百位分数】1.(2021·湖北省水果湖高级中学高二月考)某校高一年级一名学生一学年以来七次月考物理成绩(满分100分)依次为84,78,82,84,86,89,96,则这名学生七次月考物理成绩的第70百分位数为( ) A.86 B.84 C.96 D.89【答案】A⨯=.所以这名学生七次月考物理成绩的第70百分位数为86.【解析】因为770% 4.9故选:A.2.(2021·安徽·霍邱县第一中学)为了解应届大学毕业生工作之初的薪资情况,随机调查了12名应届大学毕业生,他们的工作之初的基本工资分别为:2850,2950,3050,2880,2755,2710,2890,3130,2940,3325,2920,2880,则样本的第85百分位数是( )A.3050 B.2950 C.3130 D.3325【答案】C【解析】将这组数据从小到大排列为:2710,2755,2850,2880,2880,2890,2920,2940,2950,3050,3130,3325⨯=,可知样本数据的第85百分位数为第11个数,即为3130.由1285%10.2故选:C.3.(2021·江苏如皋·高一月考)为了弘扬体育精神,学校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分分别为10,8,a,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的75百分位数为( )A.8 B.9 C.8.5 D.9.5【答案】C【解析】由题意可得:1088796888a+++++++=,解得:8a=,将这组数据从小到大的顺序排列为6,7,8,8,8,8,9,10,因为875%6⨯=为整数,所以这组数据的75百分位数为898.52+=,故选:C.4.(2021·浙江·)已知100个数据的25百分位数是9.3,则下列说法正确的是( )A.这100个数据中一定有25个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第25个数据C.把这100个数据从小到大排列后,9.3是第25个数据和第26个数据的平均数D.把这100个数据从小到大排列后,9.3是第25个数据和第24个数据的平均数【答案】C【解析】因为100×25%=25为整数,第25个数据和第26个数据的平均数为第25百分位数,所以这100个数据中不一定有25个数小于或等于9.3,故A错误;所以第25个数据和第26个数据的平均数为第25百分位数,是9.3,所以第25个数据不一定是9.3,故B 错误;根据百分位数的定义,可知这100个数据从小到大排列后,9.3是第25个数据和第26个数据的平均数,故C正确,D错误.故选:C.【考点四特征数】1.(2021·广东肇庆)(多选)已知一组数据为-1,1,5,5,0,则该组数据的( )A.众数是5 B.平均数是2C.中位数是5 D.方差是32 5【答案】ABD【解析】数据为-1,1,5,5,0,的众数为5,A正确;数据的平均数为1155025-++++=,B正确;数据的中位数为1,C错误;数据的方差为()()()()()22222 12125252023255--+-+-+-+-=,D正确.故选:ABD.2.(2021·广东·高一月考)(多选)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的有( ) A .中位数为3,众数为3 B .平均数为3,众数为4 C .平均数为3,中位数为3 D .平均数为2,方差为2.4【答案】BD【解析】对于A ,当掷骰子出现的结果为1,2,3,3,6时, 满足中位数为3,众数为3,所以A 不可以判断;对于B ,若平均数为3,且出现点数为6,则其余4个数的和为9, 而众数为4,故其余4个数的和至少为10,所以B 可以判断; 对于C ,当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,所以C 不能判断; 对于D ,若平均数为2,且出现点数6, 则方差221(62) 3.2 2.45S >-=>,所以当平均数为2,方差为2.4时,一定不会出现点数6. 故选:BD.3.(2021·江苏省镇江中学)(多选)甲、乙两位学生的五次数学成绩统计如表所示,则下列判断不正确的是( )A .甲的成绩的平均数等于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 【答案】BD【解析】选项A :甲的成绩的平均数为4050607080605x ++++==甲,乙的成绩的平均数为5050506090605x ++++==乙,故A 正确,选项B :根据表格可得甲的中位数为60,乙的中位数为50,故B 错误,选项C :甲的成绩的方差为222221(4060)(5060)(7060)(8060)2005s ⎡⎤=-+-+-+-=⎣⎦甲, 乙的成绩的方差为222Z 1(5060)3(9060)2402005s ⎡⎤=-⨯+-=>⎣⎦,故C 正确, 选项D :甲的成绩的极差为804040-=,乙的成绩的极差为905040-=,故D 错误. 故选:BD4.(2021·全国·高三月考)在某文艺比赛中,由6名媒体代表组成的甲组、12名专家组成的乙组和12名观众代表组成的丙组分别给选手打分(100分制,选手得分为所有评委打分的平均分).已知甲组对某选手打分为;46,50,52,48,48,56,乙组、丙组对该选手打分的平均分分别为48和56,标准差分别为3.7和11.8,则( ) A .该选手的得分为51.6 B .甲组打分的中位数为50C .相对于丙组,乙组打分稳定性更高D .相对于丙组,乙组对该选手评价更高 【答案】AC【解析】甲组打分平均分为4650524848566+++++=50,6501248125651.6,61212x ⨯+⨯+⨯∴==++故A 正确;将46,50,52,48,48,56,按照从小到大得顺序排列得46,48,48,50,52,56, 所以甲组打分的中位数为48502+=49,B 错误; 根据标准差知乙组评委打分的波动小,稳定性更高,故C 正确; 根据平均数知丙组对选手评价更高,D 错误. 故选:AC.5.(2021·贵州·贵阳市第二十五中学 )已知123,,,,n x x x x 平均数为a ,标准差是b ,则12332,32,32,,32n x x x x ++++的平均数是________,标准差是________.【答案】32a +【解析】解:由题得12n x x x na +++=,(n x a b n++-=则12332,32,32,,32n x x x x ++++的平均数是123232323232n x x x na na nn+++++++==+,12332,32,32,,32n x x x x ++++的标准差是2221(3232)9[()()]3n n x a x a x a b nn+++---++-==.故答案为:32a +;3b .6.(2021·广西河池·高一月考)已知:1x ,2x ,3x …,n x 的平均数为a .则132x +,232x +,…,32n x +的平均数是__________. 【答案】32a +或23a + 【解析】由题()121n x x x x a n=+++=,所以12n x x x na +++=,则132x +,232x +,…,32n x +的平均数: ()()()121323232n x x x n ++++++⎡⎤⎣⎦()()1211323232n x x x n an n a nn=++++=+=+⎡⎤⎣⎦, 故答案为:32a +7(2021·全国·高一课时练习)已知一组数据1x ,2x ,…,10x 的方差是2,且()()()2221210333380x x x -+-++-=,则这组数据的平均数x =___________.【答案】-3或9【解析】由题意可知,2101010221111()22102010i i i i i i x x x x x x ---===-=⇔-+=∑∑∑,因为101110i i x x -==∑,即10110i i x x -==∑,所以210212010i i x x -==+∑,因为()()()10102122212101333903806i i i i x x x x x ==-+-++-=-+=∑∑,所以220106090380x x --+-+=,解得3x -=-或9. 故答案为:-3或9.8.(2021·江西·新余市第一中学高二月考)已知样本910,11,x y ,,的平均数是10,方差是4,则xy =_____; 【答案】91 【解析】因为样本910,11,x y ,,的平均数是10,方差是4,所以()191011105x y ++++=,()()()()()22222191010101110101045x y ⎡⎤-+-+-+-+-=⎣⎦, 则 ()()2220,101018x y x y +=-+-=, 解得 13,7x y ==或 7,13x y ==, 所以91xy =, 故答案为:91 【考点五 综合运用】1.(2021·广东肇庆)为了迎接新高考,某校举行物理和化学等选科考试,其中,600名学生化学成绩(满分100分)的频率分布直方图如图所示,其中成绩分组区间是:第一组[)45,55,第二组[)55,65,第三组[)65,75,第四组[)75,85,第五组[)85,95.已知图中前三个组的频率依次构成等差数列,第一组和第五组的频率相同.(1)求a ,b 的值;(2)估算高分(大于等于80分)人数;(3)估计这600名学生化学成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位数精确到0.1).【答案】(1)0.0200.045a b =⎧⎨=⎩;(2)90;(3)平均值为69.5,中位数为69.4【解析】(1)由题意可知:()0.0050.02520.0050.0250.005101b b a +=⨯⎧⎨++++⨯=⎩,解得0.0200.045a b =⎧⎨=⎩.(2)高分的频率约为:0.0200.005100.005100.1522a ⎛⎫⎛⎫+⨯=+⨯= ⎪⎪⎝⎭⎝⎭. 故高分人数为:6000.1590⨯=.(3)平均值为:500.00510600.02510700.04510800.02010⨯⨯+⨯⨯+⨯⨯+⨯⨯900.0051069.5+⨯⨯=.设中位数为x ,则()0.005100.025100.045650.5x ⨯+⨯+⨯-=,69.4x ≈. 故中位数为69.4.2.(2021·广西·东兰县高级中学 )某企业质管部门,对某条生产线上生产的产品随机抽取100件进行相关数据的对比,并对每个产品进行综合评分(满分100分),下图是这100件产品的综合评分的频率分布直方图.若将综合评分大于等于80分以上的产品视为优等品.(1)求这100件产品中优等品的件数; (2)求这100件产品的综合评分的中位数. 【答案】(1)60;(2)82.5.【解析】(1)由频率和为1得:(0.0050.0100.0250.020)101,0.040a a ++++⨯==. 所以优等品件数为:(0.020.04)1010060+⨯⨯=. (2)设综合评分的中位数为x ,则(0.0050.0100.025)100.040(80)0.5x ++⨯+⨯-=. 解得82.5x =,所以综合评分的中位数为82.5.3.(2021·江西·南城县第二中学 )抚州市为了了解学生的体能情况,从全市所有高一学生中按80:1的比例随机抽取200人进行一分钟跳绳次数测试,将所得数据整理后,分为6组画出频率分布直方图(如图所示),现一,二两组数据丢失,但知道第二组的频率是第一组的3倍.(1)若次数在120以上(含120次)为优秀,试估计全市高一学生的优秀率是多少?全市优秀学生的人数约为多少?(2)求第一组、第二小组的频率是多少?并补齐频率分布直方图; (3)估计该全市高一学生跳绳次数的中位数和平均数?【答案】(1)8640;(2)第一组频率为0.03,第二组频率为0.09.频率分布直方图见解析;(3)中位数为3343,均值为121.9【解析】(1)由频率分布直方图,分数在120分以上的频率为(0.0300.0180.006)100.54++⨯=, 因此优秀学生有0.54200808640⨯⨯=(人); (2)设第一组频率为x ,则第二组频率为3x , 所以30.340.541x x +++=,0.03x =, 第一组频率为0.03,第二组频率为0.09. 频率分布直方图如下:(3)前3组数据的频率和为(0.0030.0090.034)100.46++⨯=,中位数在第四组,设中位数为n,则1100.30.460.5120110n-⨯+=-,3343n=.均值为0.03950.091050.341150.31250.181350.06145121.9⨯+⨯+⨯+⨯+⨯+⨯=.4.(2021·福建·闽江学院附中高一月考)某次数学测试后,数学老师对该班n位同学的成绩进行分折,全班同学的成绩都分布在区间[95,145],制成的频率分布直方图如图所示,已知成绩在区间[125,135)的有12人.(1)求n和该班数学成绩的众数;(2)根据频率分布直方图,估计本次测试该班的数学平均分(同一组数据用该组数据区间的中点值表示).【答案】(1)60n=,众数:120;(2)118.5【解析】1)由频率分布直方图得成绩在区间[125,135)的频率为0.020100.2⨯=,又因为成绩在区间[125,135)的有12人,所以120.2n=,解得60n=.由频率分布直方图得该班数学成绩的众数在[)115,125组内,且为120;(2)由题知[)[)[)[)[]95,105,105,115,115,125,125135,135,145,对于的频率分别为0.15,0.25,0.3,0.2,0.1, 所以本次测试该班的数学平均分为0.151000.251100.31200.21300.1140118.5⨯+⨯+⨯+⨯+⨯=5.(2021·广西·玉林市育才中学)棉花是我国纺织工业重要的原料.新疆作为我国最大的产棉区,对国家棉花产业发展、确保棉粮安全以及促进新疆农民增收、实现乡村振兴战略都具有重要意义.动态、准确掌握棉花质量现状,可以促进棉花产业健康和稳定的发展.在新疆某地收购的一批棉花中随机抽测了100根棉花的纤维长度(单位:mm ),得到样本的频数分布表如下:(1)在图中作出样本的频率分布直方图;(2)根据(1)作出的频率分布直方图求这一棉花样本的众数、中位数与平均数,并对这批棉花的众数、中位数和平均数进行估计.【答案】(1)答案见解析;(2)众数为:275(mm),中位数为:252.5mm ,平均数为:222mm ,购进的这批棉花的众数、中位数和平均数分别约为275mm 、252.5mm 和222mm . 【解析】(1)样本的频率分布直方图如图所示.(2)由样本的频率分布直方图,得众数为:250300275(mm)2+=; 设中位数x 为,(250)0.00850%48%x -⨯=-,则解得252.5x =,即中位数为252.5mm . 设平均数为x ,则250.04750.08x =⨯+⨯+1250.11750.12250.16⨯+⨯+⨯+2750.43250.12222⨯+⨯=,故平均数为222mm .由样本的这些数据,可得购进的这批棉花的众数、中位数和平均数分别约为275mm 、252.5mm 和222mm . 6.(2021·云南省玉溪第一中学 )某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有20m m人,按年龄分成5组,其中第一组:[)20,25,第二组:[)25,30,第三组:[)30,35,第四组:[)35,40,第五组:[]40,45,得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计这m 人的平均年龄和第80百分位数;(2)现从以上各组中采用分层随机抽样的方法抽取20人,担任本市的宣传使者.若第四组宣传使者的年龄的平均数与方差分别为37和52,第五组宣传使者的年龄的平均数与方差分别为43和1,求这m 人中35~45岁所有人的年龄的方差.【答案】(1)平均年龄32.25岁,第80百分位数为37.5;(2)10. 【解析】解:(1)设这m 人的平均年龄为x ,则22.50.0527.50.3532.50.337.50.242.50.132.25x =⨯+⨯+⨯+⨯+⨯=.设第80百分位数为a ,由50.02(40)0.040.2a ⨯+-⨯=,解得37.5a =. (2)由频率分布直方图得各组人数之比为1:7:6:4:2,故各组中采用分层随机抽样的方法抽取20人,第四组和第五组分别抽取4人和2人, 设第四组、第五组的宣传使者的年龄的平均数分别为4x ,5x ,方差分别为24s ,25s ,则437x =,543x =,2452s =,251s =, 设第四组和第五组所有宣传使者的年龄平均数为z ,方差为2s . 则4542396x x z +==, ()(){}222224545142106s s x z s x z ⎡⎤⎡⎤=⨯+-+⨯+-=⎢⎥⎢⎥⎣⎦⎣⎦, 因此,第四组和第五组所有宣传使者的年龄方差为10,据此,可估计这m 人中年龄在35~45岁的所有人的年龄方差约为10.7.(2021·广西·玉林市第十一中学)为了选拔参加自行车比赛的选手,对自行车运动员甲、乙两人在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s )的数据如下:(1)画出茎叶图;(2)估计甲、乙两运动员的最大速度的均值和方差,并判断谁参加比赛更合适. 【答案】(1)茎叶图见解析;(2)派乙更合适 【解析】(1)茎叶图如下:(2)甲的平均数为:()112730313537386x =+++++=33, 乙的平均数为:216x =(28+29+33+34+36+38)=33, 甲的方差为:()2114736944162563S =+++++=, 乙的方差为:()221382516192563S =++++=, 甲、乙的平均数相等,乙的方差更小,则乙的发挥更稳定,故乙参加比赛更合适.8.(2021·河南·高一期末)我国棉花产量居世界首位,产棉省市区有22个新疆是长绒棉的主产区,新疆棉区日照充足,气候干旱,雨量稀少,属灌溉棉区,所产的新疆长绒棉因质地光亮、有弹性,绒长质优,原棉色泽好,备受消费者的青睐.某科技公司欲进一步改良优质棉品质,对甲乙两块试验田种植的两种棉花新品种的棉绒长度进行测量,分别记录抽查数据如下(单位:mm ):甲:10210199981039899;乙:110115908575115110.试从统计的角度分析说明哪个棉花新品种比较稳定.【答案】甲块试验田种植的棉花新品种的棉绒长度比较稳定 【解析】品种甲的平均数1102101999810398991007x ++++++==, 甲的方差为2222222211(102100)(101100)(99100)(98100)(103100)(98100)(99100)7s ⎡⎤=-+-+-+-+-+-+-⎣⎦247= 乙的平均数21101159085751151101007x ++++++==, 乙的方差为2222222221(110100)(115100)(90100)(85100)(75100)(115100)(110100)7s ⎡⎤=-+-+-+-+-+-+-⎣⎦16007= 因为12x x =,2212s s <,所以甲块试验田种植的棉花新品种的棉绒长度比较稳定.。

假设检验案例辨析及参考答案

假设检验案例辨析及参考答案

第5章假设检验案例辨析及参考答案案例5-1 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取25名患者服用了新药,以常规药的疗效均值为,进行检验,无效假设是,对立假设是,检验水平α=1%。

结果值很大,拒绝了无效假设。

“拒绝了无效假设”意味着什么?下面的说法你认为对吗?(1)你绝对否定了总体均数相等的无效假设。

(2)你得到了无效假设为真的概率是1%。

(3)你绝对证明了总体均数不等的备择假设。

(4)你能够推论备择假设为真的概率是99%。

(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。

(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。

提示:就类似的问题,Haller和Kruss(2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。

结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。

(见Statistical Science, 2005, 20(3):223-230.)案例辨析6个选择均不正确。

(1)可能犯Ⅰ类错误。

(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。

(3)可能犯Ⅰ类错误。

(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。

(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是。

(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-=99%是指无效假设成立的条件下不犯错误的概率是99%。

正确做法“拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为。

案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。

最近从该厂一次抽取20个该器械检测,合格13个,计算得到合格率为65.0%;一周后又抽取15个器械检测,合格10个,计算得到合格率为66.7%,分别进行检验,得到两总体率相等的结论,表明合格率没下降,两个合格率的平均值为65.85%,进行检验,得到两总体率不等的结论,表明合格率下降了。

新教材高中数学课时素养评价十六用样本估计总体含解析必修第二册

新教材高中数学课时素养评价十六用样本估计总体含解析必修第二册

课时素养评价十六用样本估计总体(15分钟30分)1.已知数据x1,x2,x3,…,x n是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入x n+1,则这n+1个数据中,下列说法正确的是 ()A.年收入平均数大大增大,中位数一定变大,方差可能不变B.年收入平均数大大增大,中位数可能不变,方差变大C.年收入平均数大大增大,中位数可能不变,方差也不变D。

年收入平均数可能不变,中位数可能不变,方差可能不变【解析】选B。

插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大。

2。

(2020·潍坊高一检测)2019年国庆黄金周影市火爆依旧,《我和我的祖国》、《中国机长》、《攀登者》票房不断刷新,为了解我校高一2 300名学生的观影情况,随机调查了100名在校学生,其中看过《我和我的祖国》或《中国机长》的学生共有80位,看过《中国机长》的学生共有60位,看过《中国机长》且看过《我和我的祖国》的学生共有50位,则该校高一年级看过《我和我的祖国》的学生人数的估计值为()A。

1 150 B.1 380 C。

1 610 D.1 860【解析】选C.依题有接受调查的100名学生中有70位看过《我和我的祖国》,故全校学生中约有2 300×0。

7=1 610人看过《我和我的祖国》这部影片.3。

(2020·惠州高一检测)某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是()A。

这5名男生成绩的标准差大于这5名女生成绩的标准差B。

这5名男生成绩的中位数大于这5名女生成绩的中位数C。

该班男生成绩的平均数大于该班女生成绩的平均数D。

这种抽样方法是一种分层抽样【解析】选A。

5名男生成绩的平均数为=90, 5名女生成绩的平均数为=91,这5名男生成绩的方差为×(22+42+22+42)=8,女生成绩的方差为×(22×3+32×2)=6,男生方差大于女生方差,所以男生标准差大于女生标准差,所以A对;这5名男生成绩的中位数是90,5名女生成绩的中位数为93,所以B错;该班男生和女生成绩的平均数可通过样本估计,但不能通过样本计算得到平均数准确值,所以C错;若抽样方法是分层抽样,则因为男生女生不等,所以分别抽取的人数应不等,所以D错.【补偿训练】为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是,,则下列说法正确的是()A。

高中必考难点题型(带答案)--样本估计总体(解析版)

高中必考难点题型(带答案)--样本估计总体(解析版)

年龄
1 40 10 36 19 27 28 34
2 44 11 31 20 43 29 39
3 40 12 38 21 41 30 43
4 41 13 39 22 37 31 38
5 33 14 43 23 34 32 42
6 40 15 45 24 42 33 53
7 45 16 39 25 37 34 37
故乙组数据的中位数也为65, 即y = 5, 则乙组数据的平均数为:66, 故x = 3, 故选:A.
中等 已测:839次 正确率:51.1%
3. 汽⻋的“燃油效率”是指汽⻋每消耗1升汽油行驶的里程,如图描述了甲、乙、丙三辆汽⻋在不 同速度下燃油效率情况,下列叙述中正确的是( )
A. 消耗1升汽油,乙⻋最多可行驶5千米 B. 以相同速度行驶相同路程,三辆⻋中,甲⻋消耗汽油最多 C. 甲⻋以80千米/小时的速度行驶1小时,消耗10升汽油 D. 某城市机动⻋最高限速80千米/小时,相同条件下,在该市用丙⻋比用乙⻋更省油
=
1 5
×
[(89

90)2
+
(90

90)2 +(91

90)2
+
(88

90)2
+
(92

90)2 ]
=
2
由于2<4,所以乙的平均成绩较为稳定.
一般 已测:4976次 正确率:65.6%
10. 某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元) 都在区间[0.3, 0.9]内,其频率分布直方图如图所示.
5
. =
0.16+0.09+0+0.09+0.16 5

高二数学用样本估计总体练习题及答案

高二数学用样本估计总体练习题及答案

高二数学用样本估计总体练习题及答案1.关于频率分布直方图,正确的说法是直方图的高表示该组上的个体在样本中出现的频数与组距的比值。

2.样本在区间(-50,50]上的频率为25%。

3.样本方差S²能够估计总体稳定性。

4.(1)这种抽样方法是简单随机抽样。

(2)甲车间的数据茎叶图呈现出正态分布,乙车间的数据茎叶图呈现出偏态分布,说明甲车间的生产情况比乙车间更加稳定。

(3)甲车间的平均值为100.14,标准差为8.59,乙车间的平均值为98.57,标准差为16.66,甲车间的产品比较稳定。

5.该小组成绩的平均数、众数、中位数分别为87、85、85.6.数据a1,a2,…,a20,x这21个数据的方差约为0.1905.7.样本的频率分布能够用来估计总体的频率分布。

8.同学平均成绩好,但___同学的成绩波动更大。

9.一位中学生在30天中记忆英语单词的数量如下:2天记忆51个,3天记忆52个,6天记忆53个,8天记忆54个,7天记忆55个,3天记忆56个,1天记忆57个。

求这位中学生30天中的平均记忆量。

10.从一批棉花中抽取9根棉花的纤维长度如下(单位:mm):82,202,352,321,25,293,86,206,115.求样本平均数、样本方差和样本标准差。

11.有甲、乙两个球队,甲队有6名队员,乙队有20名队员,他们的身高数据如下(单位:mm):甲队身高分别为187,181,175,185,173,179;乙队身高分别为180,179,182,184,183,183,183,176,176,181,177,177,178,180,177,184,177,182,177,183.求两队队员的平均身高,比较甲、乙两队身高的整齐程度。

12.甲、乙两台机床在相同技术条件下同时生产一种尺寸为10mm的零件,现从中各抽测10个,它们的尺寸分别如下(单位:mm):甲10,2,10,1,10,9,8,9,9,10;乙10,3,10,4,9,6,9,9,10,10.求上述两个样本的平均数与方差,并估计哪台机床生产的零件质量更好。

14.4-用样本估计总体(同步训练)(含答案)高中数学苏教版(2019)必修二

14.4-用样本估计总体(同步训练)(含答案)高中数学苏教版(2019)必修二

14.4 用样本估计总体(同步训练)-高中数学苏教版(2019)必修二一、选择题1.由小到大排列一组数据1x ,2x ,3x ,4x ,5x ,其中每个数据都小于1-,则对于样本1,1x ,2x -,3x ,4x -,5x 的中位数是( )2.大力开展体育运动,增强学生体质,是学校教育的重要目标之一.某校组织全校学生进行立定跳远训练,为了解训练的效果,从该校学生中随机抽出100人进行立定跳远达标测试,其中高一抽取了40人,高二抽取了30人,高三抽取了30人.达标测试数据如图所示,则估计该校学生的平均达标率为( )A.42%B.46%C.48%D.54%3.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,若样本中有女员工39人,男员工21人,女员工的平均体重为50kg ,标准差为6,男员工的平均体重为70kg ,标准差为4.则所抽取的所有员工的体重的方差为( )A.29B.120C.100D.1124.为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为( )A.0.96B.0.94C.0.79D.0.755.为了学习,宣传和践行党的二十大精神,某班组织全班学生开展了以“学党史,知国情,圆梦想”为主题的党史暨时政知识竞赛活动.已知该班男生20人,女生30人,根据统计解题思路,男生组成绩和女生组成绩的方差分别为2212,s s .记该班成绩的方差为2s ,则下列判断正确的是( )A.2s =2≥2=22212235s s +≥6.某校组织高一1班,2班开展数学竞赛,1班40人,2班30人,根据统计解题思路,两班成绩的方差分别为21s ,22s .记两个班总成绩的方差为2s ,则( )A.2s ≥2≥2=22212437s s +≤二、多项选择题7.近一个月宜昌气温变化很大,为了解其变化情况,近17天最高气温分别为3,2,7,9,12,13,11,10,7,8,5,10,8,m ,14,15,11(其中m 数据缺失),则下列结论中正确的是( )A.这组数据的中位数可能是9B.这组数据的众数可能是10C.m 的值可以通过中位数的值确定,D.m 的值可以通过全部数据的平均数确定8.如图所示,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )A.图(1)的平均数=中位数=众数B.图(2)的平均数<众数<中位数C.图(2)的众数<中位数<平均数D.图(3)的平均数<中位数<众数三、填空题9.某同学10次数学检测成绩统计如下:95,97,94,93,95,97,97,96,94,93,这组数据的众数为___________.10.2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为______.11.某市2022年和2023年5月1日至5日每日的最高气温(单位:℃)如表:则这五天的最高气温更稳定的是________年.(选填“2022”或“2023”)四、解答题12.甲,乙两名射箭运动员在10次射箭训练中,射中的环数分别为:甲9,10,8,9,9,7,8,9,10,8乙9,9,8,8,10,9,9,8,8,9(1)计算这10次训练中甲,乙射中环数的平均数和方差;(2)从计算结果看,哪位运动员的射箭技术更好?13.某中学新建了学校食堂,每天有近2000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐:第三类是面食,如煮面、炒粉等,为了更合理地设置口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表:已知饭堂的售饭窗口一共有20个,就餐高峰期时有240名学生在等待就餐.(1)根据以上调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),求选择选餐的同学取到午餐的最长等待时间;(2)取餐时至多等待多长时间能让80%的同学感到满意?(即在接受等待时长内取到餐,保留整数);(3)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的求解过程.参考答案1.答案:C解析:由于小到大排列一组数据1x ,2x ,3x ,4x ,5x ,其中每个数据都小于1-,所以123451x x x x x <<<<<-,则123451x x x x x >->->-->->,将1,1x ,2x -,3x ,4x -,5x 从小到大排列为1x ,3x ,5x ,1,4x -,2x -,故选:C 2.答案:C100%48%=.3.答案:B215070573921+⨯=+,则样本中所有员工的体重的方差222223921[6(5057)][4(7057)]12039213921s =⨯+-+⨯+-=++.故选:B 4.答案:B1200988.41200800+⨯=+(小时),该地区中学生每天睡眠时间的方差为2280012001(98.4)0.5(88.4)0.9412008001200800⎡⎤⎡⎤⨯+-+⨯+-=⎣⎦⎣⎦++.故选B.,则2222112201[()()()]20s x x x x x x =-+-++- ,()2222122012201[220]20x x x x x x x x =+++-++++ 2222212201[4020]20x x x x x =+++-+202222221220111[20]2020i i x x x x x x ==+++-=-∑ ,同理3022221130i i s y y ==-∑,20222112020ii x s x =∴=+∑,3022213030i i y s y ==+∑1(2030)50x y =+=222203022222212112312323505555i i i i s s x y s x y x x y ==⎛⎫++⎛⎫'∴=+-=++- ⎪⎪⎝⎭⎝⎭∑∑22212236()525s s x y +=+-≥故选:D .6.答案:B解析:设两个班的平均分分别为1x ,2x ,两个班的总的平均分为x ,则()()222221122403040304030s s x x s x x ⎡⎤⎡⎤=+-++-⎣⎦⎣⎦++()()22221122437s x x s x x ⎡⎤⎡⎤+-++-⎣⎦⎣⎦=≥故选:B.7.答案:ABD解析:由题意,若9m <,中位数是9,A 正确:若10m =,众数都是10,B 正确,中位数是10时,10m ≥,m 不确定,C 错误:8.答案:ACD解析:根据平均数,中位数,众数的概念结合图形解题思路判断.9.答案:97解析:在10次数学检测成绩中,93、94、95各有2次,96有1次,97有3次,所以这组数据的众数是97.故答案为:97.10.答案:11解析:由题意得小明同学第一题得6分;第二题选了2个选项,可能得分情况有3种,分别是得0分、4分和6分;第二题选了1个选项,可能得分情况有3种,分别是得0分、2分和3分;由于相同总分只记录一次,因此小明的总分情况有:6分、8分、9分、10分、12分、13分、14分、15分共8种情况,11=,故答案为:11.11.答案:202329.4=,则其方差为222221(2629.4)(2729.4)(3029.4)(3329.4)(3129.4) 6.6225⎡⎤⨯-+-+-+-+-=⎣⎦,23.4=,则其方差为222221(2223.4)(2523.4)(2423.4)(2423.4)(2223.4) 1.445⎡⎤⨯-+-+-+-+-=⎣⎦,因为1.44 6.622<,所以这五天的最高气温更稳定的是2023年;故答案为:202312.答案:(1)甲的平均数为8.7,方差为0.81,乙的平均数为8.7,方差为0.41(2)乙解析:(1)根据题中所给数据,甲的平均数为()19108997891088.710x =+++++++++=甲,()1998810998898.710=+++++++++=,甲的方差为()()()2222198.7108.788.70.8110s ⎡⎤=-+-++-=⎣⎦ 甲,乙的方差为()()()2222198.798.798.70.4110s ⎡⎤=-+-++-=⎣⎦ 乙,故甲的平均数为8.7,标准差为0.81,乙的平均数为8.7,标准差为0.41.22x s s =>甲乙乙,,因为平均数相同,方差越小的技术越稳定,所以乙的技术较为稳定,故乙运动员的射箭技术更好.13.答案:(1)20分钟;(2)18分钟;(3)答案见解析解析:(1)由题意得就餐高峰期时选择选餐的总人数为50240120503020⨯=++人;10=人,所以选择选餐的同学取到午餐的最长等待时间为21020⨯=分钟,(2)由可接受等待时长的频率分布直方图可知,分组为[)5,10,[)10,15,[)15,20,[)20,25的频率分别为0.15,0.45,0.35,0.05,所以可接受等待时长在2025-分钟以内的同学占0.05,即有95%的同学不满意可接受等待时长在1525-分钟以内的同学占0.050.350.4+=,即有60%的同学对等待时间少于15分钟感到满意,所以至多等待的时间[)15,20x ∈,能让80%的同学感到满意()0.6150.070.8x +-⨯=,所以18x ≈分钟,至多等待18分钟,能让80%的同学感到满意.(3)假设设置m 个选餐窗口,n 个套餐窗口,k 个面食窗口,则各队伍的同学最长等待时间如下:即得1207220.51m n ⨯=⨯=::20:3:4n k =,而20m n k ++=,故15m ≈,2n ≈,3k ≈,因此建议设置选餐、套餐、面食三个类别的窗口数分别为15,2,3个.。

高一 用样本估计总体知识点+例题+练习 含答案

高一 用样本估计总体知识点+例题+练习 含答案

1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.2.频率分布折线图和总体分布的密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (3)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数). 【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )1.(2015·陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.答案 137解析 由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137. 2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.答案 91.5和91.5解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.3.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案 19,135.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问10次射靶的情况较稳定的是________. 答案 乙解析 x 甲=4+7+10+9+5+6+8+6+8+810=7.1,x 乙=7+8+6+8+6+7+8+7+5+910=7.1.s 2甲=110[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. s 2甲>s 2乙,∴乙较稳定.题型一频率分布直方图的绘制与应用例1(2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数281410 6(1)评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案12解析志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:①求分数在[70,80)内的频率,并补全这个频率分布直方图;②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解①设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.②平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).题型二茎叶图的应用例2(1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为________.(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为__________. 答案 (1)①④ (2)5,8解析 (1)甲地5天的气温为:26,28,29,31,31, 其平均数为x甲=26+28+29+31+315=29; 方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6; 标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2; 标准差为s 乙= 2. ∴x甲<x 乙,s 甲>s 乙.(2)由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8. 引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好. 解 由原题可知x =5,则甲组平均分为9+12+15+24+275=17.4.而乙组平均分为16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差. 解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.故中位数为18,众数为18.②s 2=15[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(2014·课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲,乙两部门评分的中位数; (2)分别估计该市的市民对甲,乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲,乙两部门的评价.解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲,乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.)题型三 用样本的数字特征估计总体的数字特征例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2015·广东)某工厂36名工人的年龄数据如下表. 工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄 1 40 10 36 19 27 28 34 2 44 11 31 20 43 29 39 3 40 12 38 21 41 30 43 4 41 13 39 22 37 31 38 5 33 14 43 23 34 32 42 6 40 15 45 24 42 33 53 7 45 16 39 25 37 34 37 8 42 17 38 26 44 35 49 9 4318 3627 4236 39(1)年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)? 解 (1)44,40,36,43,36,37,44,43,37.(2)x =44+40+36+43+36+37+44+43+379=40.s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.(3)40-103=1103,40+103=1303在⎝⎛⎭⎫1103,1303的有23个,占63.89%.9.高考中频率分布直方图的应用典例 (14分)(2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得:x =0.007 5, 所以直方图中x 的值是0.007 5.[3分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[14分]温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x +b,方差为a2s2.[失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)1.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为____________.答案0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为410=0.4.2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.答案x+100,s2解析x1+x2+…+x1010=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不变.3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.答案50解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n=150.3=50.4.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的数字特征对应相同的是__________.答案标准差解析利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变.5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.①a1>a2②a2>a1③a1=a2④a1,a2的大小与m的值有关答案②解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________________. 答案 2解析 由题意可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________. 答案367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 8.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08. 由茎叶图知,分数在[50,60]之间的频数为2, 所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016. 10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;(2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧3,96≤x <98,5,98≤x <104,4,104≤x ≤106,求这批产品平均每个的利润.解(1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n. ∵样本中产品净重小于100克的个数是36,∴36n=0.300,∴n=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.100=12,120×0.750=90,120×0.150=18,∴这批产品平均每个的利润为1120×(3×12+5×90+4×18)=4.65(元).B组专项能力提升(时间:30分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.答案①解析由于频率分布直方图的组距为5,排除③、④,又[0,5),[5,10)两组各一人,排除②,①符合条件,故①正确.12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 13.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3(2)6 000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3,6 000.14.若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解 (1)如下表所示频率分布表.(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为 0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件, 依题意505 000=20x +20,解得x =5 000×2050-20=1 980.所以该批产品的合格品件数是1 980.15.(2014·广东)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:12+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-20(30-19)40)2=12.6.。

最新第15章-样本含量估计思考与练习参考答案

最新第15章-样本含量估计思考与练习参考答案

第15章 样本含量估计思考与练习参考答案一、最佳选择题1. 在假设检验中,样本含量的确定( C )。

A. 只与Ⅰ类错误概率α有关B. 只与Ⅱ类错误概率β有关C. 与α、β都有关D. 与α、β都无关E. 只与α、β有关2. 以下关于检验功效的描述,不正确的是( C )。

A. 假设检验中,若0H 客观上不成立,但根据假设检验的规则,将有β大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为β-1,称为检验功效。

B. 检验功效受客观事物差异的大小、个体间变异的大小、样本量和α值等要素的影响。

C. 假设检验的“阴性”结果(P >0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。

D. 假设检验得出“阴性”结果(P >0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。

E. 当假设检验出现“阴性”结果(P >0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。

3.在调查研究中,计算配对设计均数比较所需样本含量的公式为( A )。

A. 2])([δβαSt t n += B. 2])([2δβαSt t n +⨯= C. 2])([δβαSt t N += D. 2221)())(1(2p p Z Z p p n -+-=βαE. =n 22212211)(])1()1()1(2[p p p p p p Z p p Z --+-+-βα4. 在调查研究中,计算两样本率比较所需样本含量的公式为( E )。

A. 2])([δβαSt t n += B. 2])([2δβαSt t n +⨯= C. 2])([δβαSt t N += D. 2221)())(1(2p p Z Z p p n -+-=βαE. 22212211)(])1()1()1(2[p p p p p p Z p p Z n --+-+-=βα5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出来的一切公式进行相应的统计分析。

【精品】高中数学 必修3_用样本估计总体_知识点讲解+巩固练习(含答案)_基础

【精品】高中数学 必修3_用样本估计总体_知识点讲解+巩固练习(含答案)_基础

用样本估计总体【学习目标】1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.5.会用样本的基本数字特征估计总体的基本数字特征.【要点梳理】要点一、频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值与最小值的差,即求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图要点诠释:频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.要点二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.要点诠释:总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.要点三、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.要点诠释: 茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.要点四、众数、中位数与平均数 1.众数一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数.2.中位数将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分.3.平均数样本数据的算术平均数,即121()n x x x x n=+++L . 要点诠释:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.要点五、标准差与方差 1.标准差 样本数据1,2,,n x x x 的标准差的算法:(1)算出样本数据的平均数x .(2)算出每个样本数据与样本数据平均数的差:()12i x x i n -=L , ,, (3)算出(2)中()12i x x i n -=L , ,,的平方. (4)算出(3)中n 个平方数的平均数,即为样本方差. (5)算出(4)中平均数的算术平方根,,即为样本标准差. 其计算公式为:s =2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:2222121[()()()]n s x x x x x x n=-+-++-L 要点诠释:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度;样本方差描述了一组数据围绕平均数波动的大小;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的离散程度.【典型例题】类型一:频率分布表、频率分布直方图例1.(1)为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们的捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是______,若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为________.(2)将容量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79,而剩下的三组中频率依次相差0.05,则剩下的三组中频率最大的一组的频率为________.【答案】(1)11 6 5 (2)0.12【解析】(1)由题意知,极差为30-19=11;由于组距为2,则115.52不是整数,所以取6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.(2)设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1.因为频率总和为1,所以有0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12,所以应填0.12.【总结升华】此类题主要考查在应用频率分布来估计总体的过程中的相关计算问题,其中常用到的就是样本频率的计算:频率=频数样本容量,还要注意此公式的一些变形应用.举一反三:【变式1】如图是一容量为100的样本的频率分布直方图,试根据图形中的数据填空.(1)样本数据落在[6,10)内的频率为________;(2)样本数据落在[10,14)内的频数为________.高清课堂:用样本估计总体400450 例1例2.对某电子元件进行寿命追踪调查,情况如下:寿命/h 100~200 200~300 300~400 400~500 500~600个数20 30 80 40 30 (1)列出频率分布表;(2)画出频率分布直方图;(3)估计该电子元件寿命在100~400 h以内的占总体的比例;(4)估计该电子元件寿命在400 h以上的在总体中占的比例.【思路点拨】理解频率分布直方图的具体含义.【解析】(1)样本频率分布表如下:寿命/h 频数频率100~200 20 0.10200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布直方图如下图所示;(3)估计该电子元件寿命在100~400 h以内占总体的比例为65%;(4)估计该电子元件寿命在400 h以上的在总体中占的比例为35%.【总结升华】本题主要考查对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.学生在理解频率分布直方图时,纵向坐标易错,往往理解成频率,而应该是频率/组距.举一反三:【变式1】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.【变式2】在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高? 【答案】(1)60 (2)四组 18(3)六组 【解析】 (1)依题意知第三组的频率为412346415=+++++.∵第三组的频数为12, ∴本次活动的参评作品数为126015=件). (2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有66018234641⨯=+++++(件). (3)第四组的获奖率是105189=,第六组上交的作品数量为1603234641⨯=+++++(件), ∴第六组的获奖率为2639=. 显然第六组的获奖率较高.类型二:众数、中位数、平均数例3.在一次歌手大奖赛中,6位评委现场给每位歌手评分,然后去掉一个最高分和一个最低分,其余分数的平均数作为该歌手的成绩,已知6位评委给某位歌手的评分是:9.2,9.5,9.4,9.6,9.8,9.5.求这位歌手的得分及6位评委评分的众数和中位数. 【答案】9.5 9.5 9.5【解析】 (1)该歌手得分为1(9.59.49.59.6)9.54x =⨯+++=.(2)9.5在这组数据中出现2次,出现次数最多,故评委评分的众数是9.5. (3)将这组数据按从小到大顺序排列后最中间的两个数都是9.5,故中位数是9.5.【总结升华】 平均数、众数、中位数可能相同,也可能不相同,而实际问题中,计算平均数时应注意按实际要求进行计算.举一反三:【变式1】某射击手打靶10次,所中环数分别为7,8,7,9,9,9,10,6,9,5.求下列各特征数并加以解释:(1)众数;(2)中位数;(3)平均数.【解析】(1)众数是9.众数是9,这说明该射击手每次射击射中9环的可能性较大.(2)将10个数据按小到大的顺序排列有5,6,7,7,8,9,9,9,9,l 0. 中位数是988.52+=. 中位数是8.5,这说明该射击手每次射击以8.5环为等分线,即射中0~8环和9~10环的可能性大体上相当. (3)平均数是787999106957.910x +++++++++==.平均数是7.9,这说明该射击手每次射出的水平近似于8环.类型三:方差、标准差高清课堂:用样本估计总体 400450 例2例4.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm) 甲机床:10.2 10.1 10.0 9.8 9.9 10.3 9.7 10.0 9.9 10.1 乙机床:10.3 10.4 9.6 9.9 10.1 10.9 8.9 9.7 10.2 10.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm ,从计算的结果来看哪台机床加工这种零件较合适?【思路点拨】先分析甲、乙机床的平均数,若平均数基本接近,再考虑两机床的稳定程度. 【解析】101001011.101.102.10101=⨯=++=)(甲Λx ,1010101104.103.10101=⨯=+++=)(乙Λx .∴[]2222101.10101.10102.10101)()()(甲-+-+-=Λs =0.032mm[]22221010104.10103.10101)()()(乙-+-+-=Λs =0.062mm . ∴2甲s <2乙s∴用甲机床比乙机床稳定,即用甲机床加工较合适.举一反三:【变式1】甲、乙两台机床同时加工直径为100 cm 的零件,为了检验质量,各从中抽取6件进行测量,分别记录数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. 【答案】(1)100,100;73,1(2)乙 【解析】(1)16x =甲(99+100+98+100+100+103)=100, 16x =乙(99+100+102+99+100+100)=100, 216s =甲[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,216s =乙[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均数相同,又22s s >乙甲,所以乙机床加工零件的质量更稳定.类型四:茎叶图例5. 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下: 甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50; 乙的得分:8,13,14,16,23,26,28,33,38,39,51. (1)画出甲、乙两名运动员得分数据的茎叶图; (2)根据茎叶图分析甲、乙两运动员的水平.【思路点拨】茎叶图便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据. 【解析】(1)作出茎叶图如右图所示.(2)由茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.【总结升华】 当数据较少时,用茎叶图分析问题的突出优点是:(1)保留原始信息.(2)随时记录.用茎叶图分析数据可以运用数据分布的对称情况,集中分散情况来分析总体情况.举一反三:高清高清课堂:用样本估计总体 400450 例3【变式1】 随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差.【答案】(1)乙班(2)57【解析】(1)由茎叶图可知:甲班身高集中于160179:之间, 而乙班身高集中于170180:之间. 因此乙班平均身高高于甲班;(2) 15816216316816817017117917918217010+++++++++==x甲班的样本方差为()()()()()()()()()()222222222211581701621701631701681701681701017017017117017917017917018217057[-+-+-+-+-+-+-+-+-+-]=【巩固练习】1.下列关于“样本数据的频率分布表、频率分布直方图”的叙述中正确的是( ) A.从频率分布表可以看出样本数据的平均数 B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距2.频率分布直方图中小长方形的面积等于( ) A .组距 B .频率 C . 组数 D .频数3.一个容量为80的样本中,数据的最大值时140,最小值是50,组距是10,则应将样本数据分为( )A .10组B .9组C . 8组D .7组 4.能反映一组数据的离散程度的是( )A .众数B .平均数C . 标准差D .极差 5.下列数字特征一定是数据组中数据的是( ) A .众数 B .中位数 C . 标准差 D .平均数6.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第15章 样本含量估计思考与练习参考答案一、最佳选择题1. 在假设检验中,样本含量的确定( C )。

A. 只与Ⅰ类错误概率α有关B. 只与Ⅱ类错误概率β有关C. 与α、β都有关D. 与α、β都无关E. 只与α、β有关2. 以下关于检验功效的描述,不正确的是( C )。

A. 假设检验中,若0H 客观上不成立,但根据假设检验的规则,将有β大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为β-1,称为检验功效。

B. 检验功效受客观事物差异的大小、个体间变异的大小、样本量和α值等要素的影响。

C. 假设检验的“阴性”结果(P >0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。

D. 假设检验得出“阴性”结果(P >0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。

E. 当假设检验出现“阴性”结果(P >0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。

3.在调查研究中,计算配对设计均数比较所需样本含量的公式为( A )。

A. 2])([δβαSt t n += B. 2])([2δβαSt t n +⨯= C. 2])([δβαSt t N += D. 2221)())(1(2p p Z Z p p n -+-=βαE. =n 22212211)(])1()1()1(2[p p p p p p Z p p Z --+-+-βα4. 在调查研究中,计算两样本率比较所需样本含量的公式为( E )。

A. 2])([δβαSt t n += B. 2])([2δβαSt t n +⨯= C. 2])([δβαSt t N += D. 2221)())(1(2p p Z Z p p n -+-=βαE. 22212211)(])1()1()1(2[p p p p p p Z p p Z n --+-+-=βα5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出来的一切公式进行相应的统计分析。

下列说法中( C )最正确。

A. 题中所说的条件和结论都正确B. 题中所说的条件正确,但结论不正确C. 题中所说的条件和结论都不正确D. 题中所说的条件不正确,但结论正确E. 题中所说的条件和结论正确概率为70%,错误概率为30%6.在研究一个因变量依赖多个自变量变化规律时,估计样本含量非常复杂,有人提供了一个经验估算方法,即样本含量N (即拟观测的个体数目)至少应当是自变量个数的10倍。

下列说法中( B )最正确。

A. 此法无任何参考价值B. 在没有精确算法时,此法有一定的参考价值C. 此法根本不能用D. 此法永远是正确的E. 此法正确的概率为80%,错误的概率为20%二、思考题1. 决定样本含量的依据有哪些?答:决定样本含量的依据有:① 犯Ⅰ类错误的概率α,即检验水准。

② 犯Ⅱ类错误的概率β。

③ 总体平均数μ(或总体概率π)、总体标准差σ。

μ(π)、σ一般未知,通常以样本的)(p X 、S 作为估计值,多由预实验、查阅文献、经验估计而获得。

④ 处理组间的差别δ(所比较的两个总体参数间的差别δ),如21μμδ-=或12μμδ-=。

若研究者无法得到总体参数的信息,可作预实验来估计,也可根据专业要求由研究者规定。

2. 当假设检验的结果为“阴性”(P >0.05)时,对样本含量和检验功效进行复核有何意义?答:当假设检验的结果为“阴性”(P >0.05)时,对样本含量和检验功效进行复核具有重要意义。

通过对样本含量和检验功效进行复核(主要是计算检验功效),可以检查样本含量和检验功效是否偏低,以便正确认识假设检验的结果,避免得出错误的研究结论。

若检验功效偏低,则说明样本含量不足,应加大样本含量,重新进行实验。

三、计算题1. 据说某民族正常人体温平均高于37℃,为了进行核实,拟进行抽样调查。

如果就总体而言平均高出0.1℃便不可忽略,而已知正常人体温的标准差约为0.2℃,那么,为了将Ⅰ、Ⅱ类错误的概率控制在05.0=α和05.0=β,试估计样本含量。

解:据题意,要核实某民族正常人平均体温是否高于37℃,就是要通过抽样对该民族正常人的平均体温作出估计,并检验该平均体温是否高于37℃。

很显然,应采用单侧检验。

又已知δ=0.10,σ=0.20,05.0=α,05.0=β,先取∞=df ,则)(05.0)(∞∞=t t α=1.645,)(05.0)(∞∞=t t β=1.645,将数据代入公式(15-1),得 2)1()(⎥⎦⎤⎢⎣⎡+=δβαS t t n =21.02.0)645.1645.1(⎥⎦⎤⎢⎣⎡⨯+=43.3≈44取431)1(=-=n df ,则 (43)0.05(43) 1.681t t α==,(43)0.05(43) 1.681t t β==,代入公式算得: 2)2()(⎥⎦⎤⎢⎣⎡+=δβαS t t n =2(1.681 1.681)0.20.1+⨯⎡⎤⎢⎥⎣⎦=45.2≈46取(1)145df n =-=,则 (45)0.05(45) 1.679t t α==,(45)0.05(45) 1.679t t β==,代入公式计算得:2)2()(⎥⎦⎤⎢⎣⎡+=δβαS t t n =2(1.679 1.679)0.20.1+⨯⎡⎤⎢⎥⎣⎦=45.1≈46可取46=n ,即需从该民族的正常人群中随机抽取46人进行调查。

2. 某人在进行上述调查之前未经估算便人为决定取样本量25=n 。

试估计检验功效。

解:据题意,有25=n ,δ=0.10,σ=0.20,05.0=α,645.105.0==Z Z α,将数据代入公式(15-20),得855.0645.12.0251.0=-=-=αβσδZ n Z 查表,得检验功效 21805.03802.01+≈-β=0.803 7。

3. 为了比较两类片剂的溶解速率,决定各随机抽取10片,测定 5 min 溶解量,然后作05.0=α水平的检验。

据预实验,两类片剂的变异性相同,标准差约为6个单位,均数之差也约为6个单位,问该项研究的功效有多大?欲使功效达到95%,样本量应当多大?解:已知101=n ,102=n ,6=δ,6=σ,双侧05.0=α,96.12/05.02/==Z Z α,将数据代入公式(15-23),得2/21/1/1αβσδZ n n Z -+==96.110/110/166-+=0.276 1查表,得检验功效4608.02)3610.04606.0(1=+≈-β 要使功效达到95%,需重新估计样本含量:将数据6=δ,6=σ,96.1)(2/05.0)(2/==∞∞t t α,)(05.0)(∞∞=t t β=1.645代入公式(15-6),得5298.5166)645.196.1(4)(42222222/)1(≈=⨯+=+=δβαS t t N 取502)1(=-=N df ,则()5010.22/)000.2021.2()60(2/05.0)40(2/05.0)50(2/05.0)50(2/=+=+≈=t t t t α()5677.12/)671.1684.1()60(05.0)40(05.0)50(05.0)50(=+=+≈=t t t t β将有关数据代入公式(15-6),得5641.5466)5 677.15 010.2(4)(42222222/)2(≈=⨯+=+=δβαS t t N (取比计算结果稍大的偶数)取542)2(=-=N df ,则000.2)60(2/05.0)54(2/05.0)54(2/=≈=t t t α671.1)60(05.0)54(05.0)54(=≈=t t t β将有关数据代入公式(15-6),得5490.5366)671.1000.2(4)(42222222/)3(≈=⨯+=+=δβαS t t N 至此,可取54=N ,即2721==n n 。

也就是说,欲使功效达到95%,当双侧05.0=α,单侧05.0=β时,样本含量应为每类片剂各27片。

4. 甲、乙两医院的内科分别随机调查了30名住院患者,甲医院中对医疗服务表示满意者有20名,乙医院中表示满意者有23名。

经统计检验,尚不能认为两医院内科住院患者的满意率不等。

如想考查两医院内科住院患者的满意率是否相差10%以上,至少应当各调查多少患者?解:667.030/201≈=p ,767.030/232≈=p ,100.0%10==δ,取双侧05.0=α,单侧10.0=β,960.12/05.0=Z ,282.110.0=Z ,取1/12==n n c ,则717.02/)767.0667.0(2/)(21=+=+=p p p ,将数据代入公式(15-9),得221222112/1)(]/)1()1(/)1)(1([p p c p p p p Z c c p p Z n --+-++-=βα =22)100.0(]1/)767.01(767.0)667.01(667.0282.11/)11)(717.01(717.0960.1[-+-++-=424.46≈42512cn n ==1n =425因此,可以认为在双侧05.0=α,单侧10.0=β,两医院随机调查的病例数相等的条件下,想考查两医院内科住院患者的满意率是否相差10%以上,至少应当各调查425例患者。

5. 第4题样本中满意率分别为20/30=67%和23/30=77%,相差10%,差别似乎不小,但统计检验却不能拒绝总体满意率相等的假设。

如果调查人数和满意人数均为现在的10倍,样本中满意率仍分别为67%和77%,再作统计检验却能够拒绝总体满意率相等的假设。

如何解释这种现象?从以上现象中可以得到什么启示?(提示:试从检验功效的角度予以解释。

)解:取双侧05.0=α,960.12/05.0=Z ,当3021==n n ,6021=+=n n N 时,67.01=p ,77.02=p ,72.02/)(21=+=p p p ,将有关数据代入公式(15-27),得)]1()1([2)1(2||22112/21ππππππππαβ-+----=Z N Z)].(.).(.[).(..|..|77017706701670272017209601260770670-+--⨯--=≈-1.10查表,得检验功效β-1=0.135 7。

此时,检验功效非常低,犯Ⅱ型错误(即假阴性错误)的概率非常大(38640.=β),导致总体参数本来存在的差异未能检测出来,出现非真实的阴性结果。

当调查人数和满意人数均为现在的10倍,即30021==n n ,60021=+=n n N 时,仍取双侧050.=α,960.12/05.0=Z ,保持67.01=p ,77.02=p ,72.02/)(21=+=p p p 不变,将有关数据代入公式(15-27),得)]1()1([2)1(2||22112/21ππππππππαβ-+----=Z N Z)].(.).(.[).(..|..|770177067016702720172096012600770670-+--⨯--=≈0.77查表,得检验功效β-1=0.779 4。

相关文档
最新文档