高一数学必修三《统计》知识点+练习+答案
苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)
![苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)](https://img.taocdn.com/s3/m/01bed8036529647d2628523b.png)
【知识梳理】知识点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N ;在整个抽样过程中各个个体被抽到的概率为nN;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.【解析】由题意可得1011910,5x y ++++=22222(10)(10)(1010)(1110)(910)25x y -+-+-+-+-=,解得12,8.||4x y x y ==-=,故选D .例3. 对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300300~400400~500500~600个 数2030804030(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.【思路点拨】 通过本题可掌握总体分布估计的各种方法和步骤. 【解析】(1)频率分布表如下:寿命(h ) 频 数 频 率 累积频率 100~200 20 0.10 0.10 200~300 30 0.15 0.25 300~400 80 0.40 0.65 400~500 40 0.20 0.85 500~600 30 0.15 1 合 计2001(2)频率分布直方图如下:(3)由累积频率分布图可以看出,寿命在100~400 h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义.举一反三:【变式1】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40.【变式2】某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数 2 5 6)分数段[100,110)[110,120 [120,130)人数8 12 6分数段[130,140)[140,150)人数 4 2那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_______、_______(精确到0.01). 【答案】0.18 0.47【解析】由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47【变式3】为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品为13件,次品4件 (1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计商品为二级品或三级品的概率约是多少? 【解析】(1)样本的频率分布表为产品频数频率 一级品 5 0.17 二级品 8 0.27 三级品 13 0.43 次品40.13(2)样本频率分布的条形图为:(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.例4.甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组类型三:变量的相关性和回归分析例5.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:广告支出x(单位:万元) 1 2 3 4销售收入y(单位:万元)12 28 42 56(1) 画出表中数据的散点图;(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?【解析】(1)作出的散点图如下图所示(2)观测散点图可知各点大致分布在一条直线附近,由此可知散点图大致表现为线性相关.列出下表:序号 x y X 2xy 1 1 12 1 12 2 2 28 4 56 3 3 42 9 126 44 56 16 224 ∑1013830418易得569,22x y ==所以 414222156944184732255304()42i ii ii x y xyb xx ==--⨯⨯===-⨯-∑∑ 697352252a y bx =-=-⨯=- 故y 对x 的回归直线方程为73ˆ25yx =- (3)当x=9时, 73ˆ92129.45y=⨯-= 012 3 4x(万元)Y(万元)1020 30 40 50 60 .. . .08.0423.15=⨯-=-=bx y a .∴线性回归方程为:08.023.1^+=+=x a bx y .(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元.【变式2】一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间有如下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 y 2.25 2.37 2.40 2.55 2.64 2.75 x 1.59 1.68 1.80 1.87 1.98 2.07 y 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月总成本y 与月产量x 之间的回归直线方程. 【解析】(1)画出散点图:(2)设回归直线方程a bx y+=ˆ, 利用计算a ,b ,得b ≈1.215, 974.0ˆ≈-=+=x b y a bx y,从中抽取一个容量为100的样本,较为恰当的抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.以上三种均可3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( ) A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4.下列说法错误的是 ( )A .在统计里,把所需考察对象的全体叫做总体B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大5.要从已编号(160:)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,486. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6 h B.0.9 h C.1.0 h D.1.5 h7.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x ,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )A .0.9,35B .0.9,45C .0.1,35D .0.1,458.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( ) A .48米B .49米C .50米D .51米9.用系统抽样法要从160名学生抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为126,则第一组中抽签方法确定的号码是________.10.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数1231031则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的 %.11.某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为 . 12.甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下甲 6 8 9 9 8乙 10 7 7 7 9则两人射击成绩的稳定程度是__________________.13.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:组别频数频率145.5~149.5 1 0.02149.5~153.5 4 0.08153.5~157.5 20 0.40157.5~161.5 15 0.30161.5~165.5 8 0.16165.5~169.5 m n合计M Nm n M N所表示的数分别是多少?(1)求出表中,,,(2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?14.从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班76 74 82 96 66 76 78 72 52 68乙班86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.15.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?16.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为2150m 时的销售价格.【答案与解析】1.【答案】B 【解析】∵n40=0.125,∴n=320.故选B. 2. 【答案】C 3. 【答案】C 【解析】剔除零头 4. 【答案】B【解析】平均数不大于最大值,不小于最小值 5. 【答案】B 【解析】60106=,间隔应为10 6. 【答案】B 【解析】505.020)5.11(1025⨯++⨯+⨯=0.9.7.【答案】A【解析】由图知,成绩小于17秒的学生人数占全班总人数的频率为0.020.180.360.340.9+++=, 所以0.9x =;成绩大于等于15秒且小于17秒的的频率为0.360.340.7+=,104416461451222222=++++=)(甲s 5627313751222222=++++=)(乙s ∵ 22乙甲乙甲,s s x x >>∴ 甲的平均成绩较好,乙的各门功课发展较平衡16.【解析】(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx , 308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=), 则1962.01570308≈==xx xyl l b 8166.115703081092.23≈⨯-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y )(3)据(2),当2150x m =时,销售价格的估计值为: 2466.318166.11501962.0=+⨯=y )(万元)。
(典型题)高中数学必修三第一章《统计》测试题(答案解析)(1)
![(典型题)高中数学必修三第一章《统计》测试题(答案解析)(1)](https://img.taocdn.com/s3/m/c3a71461e53a580217fcfe9e.png)
一、选择题1.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差2.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .293. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日 4.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .5.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .296.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s7.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④8.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,89.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1310.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.2二、填空题13.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.14.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带租业主户已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x和销售量y之间的一组数据如表所示:月份i789101112销售单价i x(元)99.51010.5118.5销售量i y(元)111086514y x(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本).参考数据:51392i iix y==∑,521502.5iix==∑.参考公式:回归直线方程ˆˆˆy bx a=+,其中1221ˆni iiniix y nx ybx nx==-=-∑∑,ˆˆa y bx=-.22.某企业投资两个新型项目,投资新型项目A的投资额m(单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m=-,投资新型项目B的投资额x(单位:十万元)与纯利润y(单位:万元)的散点图如图所示.(1)求y关于x的线性回归方程;(2)根据(1)中的回归方程,若A,B两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a=+的斜率和截距的最小二乘估计分别为1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.23.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii niix y nx yb xnx==-=-∑∑,ay bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑24.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,②y a =+分别进行拟合,得到相应的回归方程111.2 2.0y x =+,29.8y =,进行残差分析得到如图所示的残差值及一些统计量的值:(1)求上表中空格内的值;(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.(参考公式:i i ie y bx a =--,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-)25.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表: 年份 2014 2015 2016 2017 2018 补贴额x /亿元 9 10 12 11 8 粮食产量y /万亿2526312721(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆˆybx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.参考公式:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-. 26.党的十八大以来,我国精准扶贫已经实施了六年,我国贫困人口从2012年的9899万人,减少到2018年的1660万人,2019年将努力实现减少贫困人口1000万人以上的目标,力争2020年在现行标准下,农村贫困人口全部脱贫,贫困县全部脱贫摘帽.某市为深入分析该市当前扶贫领域存在的突出问题,市扶贫办近三年来,每半年对贫困户(用y 表示,单位:万户)进行取样,统计结果如图所示,从2016年6月底到2019年6月底的共进行了七次统计,统计时间用序号t 表示,例如:2016年12月底(时间序号为2)贫困户为5.2万户.(1)求y 关于t 的线性回归方程y bx a =+,并预测到2020年12月底,该市能否实现贫困户全部脱贫;(2)为尽快打赢脱贫攻坚战,该市扶贫办在2019年6月底时,对全市贫困户随机抽取了100户贫困户,对每个家庭最主要经济收入来源进行抽样调查,统计结果如图.并决定据此选派一批农业技术人员对全市所有贫困户中,家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶,每一名农业技术人员对口帮扶贫困户90户,则该市应分别安排多少农业技术人员对家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶? 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题.2.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.3.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.4.D解析:D 【解析】 【分析】先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.5.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.6.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,()()()2221131653615661...726177s ⎡⎤=-+-++-=⎣⎦, ()()()2222134254625662 (736277)s ⎡⎤=-+-++-=⎣⎦ 则1212,x x s s <<故选C【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.7.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FP时,直线OP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FP时,直线OP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.8.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图9.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论. 【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列, ∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19, 由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25, ∴做问卷C 的人数为25﹣14+1=12, 故选C . 【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.10.C解析:C 【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x ,则1800601200x =,解得40x =, 故选C . 【点睛】本题考查了分层抽样方法的应用问题,属基础题.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.C解析:C 【分析】首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可. 【详解】由题意可得:12345305x x x x x x ++++==,线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==. 本题选择C 选项. 【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11 【分析】根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=,平均数9x =,则其方差()()()()22221210110S x x x x x x =-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==, 故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =14.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题 解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数. 【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户. 【点睛】 本小题主要考查用样本估计总体,考查频率的计算,属于基础题.15.92【解析】【分析】由题可得进而可得再计算出从而得出答案【详解】5个样本成份的平均值为标准差为所以即解得因为所以所以这批中成药的药物功效的平均值药物单位【点睛】本题考查求几个数的平均数解题的关键是求解析:92 【解析】 【分析】由题可得1234540x x x x x ++++=,()()()22212520x x x x x x -+-++-=进而可得222125340x x x +++=,再计算出125y y y +++,从而得出答案.【详解】5个样本12345,,,,x x x x x 成份A 的平均值为8g ,标准差为2g ,所以1234540x x x x x ++++=,()()()22212520x x x x x x -+-++-=,即()22221251252520x x x x x x x x +++-++++=,解得222125340x x x +++=因为2(20)20y x x x x =-=-,所以()()22212512512520460y y y x x x x x x +++=+++-+++=所以这批中成药的药物功效的平均值460925y ==药物单位 【点睛】本题考查求几个数的平均数,解题的关键是求出222125x x x +++,属于一般题.16.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.17.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归解析:16-【解析】 【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值 【详解】 由已知,()12101210330x x x y y y +++=+++=()12101310x x x x ∴=⨯+++= ()12101110y y y y =⨯+++=代入回归直线方程可得:3132b =+ 解得16b =-故答案为16- 【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果. 详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15 解析:15【解析】依次选取两个数字为23,75,93,21,15,04,…… 所以选出来的第3个个体的编号为15.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】(1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b-⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y . 22.(1) 1.60.2y x =+;(2)B 项目的收益更好. 【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好. 【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==,22222212233547585351.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元. 因为9.89.7>,所以可预测B 项目的收益更好.【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 23.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题.24.(1)7.4;(2)选模型①,理由见解析;(3)111y x =+. 【分析】(1)根据i i ie y bx a =--,结合表中所给数据,即可求得空格内的值;(2)分别计算出模型①和模型②的残差值绝对值之和,比较其大小,即可求得应选择哪一个模型;(3)根据所给数据计算出x ,y ,51i ii x y =∑,521ii x=∑,带入1221ni ii nii x y nx yb xnx==-=-∑∑,即可求得答案. 【详解】(1)根据i i ie y bx a =--∴空格处的值为()43311.2 2.07.4-⨯+=(2)应选择模型①模型①的残差值的绝对值之和为0.2 2.47.4 1.83 1.216+++++= 模型②的残差值的绝对值之和为5.48.0 4.0 1.6 1.69.029.6+++++=1629.6<∴模型①的拟合效果好,应该选模型①.(3)剔除异常数据,即剔除3月份的数据后, 得()13.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.211825 3.6 3.617.25i ii i i x y x yb x x==--⨯⨯====-⨯⨯-∑∑,40.611 3.61a y bx =-=-⨯=.所以y 关于x 的回归方程为111y x =+. 【点睛】本题解题关键是掌握残差的定义和回归直线方程的求解步骤,考查了分析能力和计算能力,属于中档题.25.(1)ˆ 2.24yx =+;(2)19.4万亿吨. 【分析】(1)利用最小二乘法公式求回归直线的系()()()51521ˆiii ii x x y y bx x ==--=-∑∑,即可得答案;(2)将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =,即可得答案; 【详解】解:(1)由表中所给数据可得,91012118105x ++++==,2526312721265y ++++==,代入公式()()()51521ˆiii ii x x y y bx x ==--=-∑∑,解得ˆ 2.2b=,所以ˆˆ4a y bx =-=. 故所求的y 关于x 的线性回归直线方程为ˆ 2.24yx =+. (2)由题意,将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =. 所以预测2019年该地区的粮食产量大约为19.4万亿吨. 【点睛】本题考查利用最小二乘法求回归直线方程、回归方程进行预报,考查数据处理能力. 26.(1)0.5 6.3y t =-+,不能;(2)58人和116人. 【分析】(1)由题意求得t 、y 后,代入公式即可得b 、a ,即可得线性回归方程;代入10t =求得 1.3y =即可得解;(2)由统计图计算可得家庭最主要经济收入来源为养殖收入和种植收入的贫困户户数,即可得解. 【详解】 (1)∵123456747t ++++++==,5.9 5.2 4.8 4.4 3.6 3.3 2.9 4.37y ++++++==,()()()()()()3 1.620.910.5010.7213 1.40.59410149b -⨯+-⨯+-⨯++⨯-+⨯-+⨯-==-++++++,()4.30.54 6.3a y bt =-=--⨯=,y 关于t 的线性回归方程0.5 6.3y t =-+.2020年12月底时,10t =,代入知 1.30y =>,不能实现贫困户全部脱贫.(2)2019年6月底时,贫困户共2.9万户,由图知,家庭最主要经济收入来源为养殖收入和种植收入分别占18%和36%,290000.189058⨯÷=,290000.3690116⨯÷=,对家庭最主要经济收入来源为养殖收入和种植收入的贫困户分别安排58人和116人. 【点睛】本题考查了统计的应用,考查了线性回归方程的求解和应用,属于中档题.。
高中数学必修三--统计-含答案解析--zhy365
![高中数学必修三--统计-含答案解析--zhy365](https://img.taocdn.com/s3/m/674fa191aa00b52acfc7cad3.png)
高中数学必修三--统计卷I(选择题)一、选择题(本题共计 12 小题,每题 5 分,共计60分,)1. 下列调查中,适合用全面调查方式的是()A.了解某班学生“50米跑”的成绩B.了解一批灯泡的使用寿命C.了解一批炮弹的杀伤半径D.了解一批袋装食品是否含有防腐剂2. 某单位200名职工中,年龄在50岁以上占20%,40∼50岁占30%,40岁以下占50%;现要从中抽取40名职工作样本.若用系统抽样法,将全体职工随机按1∼200编号,并按编号顺序平均分为40组(1∼5号,6∼10号,…,196∼200号).若第5组抽出的号码为22,则第8组抽出的号码应是①;若用分层抽样方法,则40岁以下年龄段应抽取②人.①②两处应填写的数据分别为()A.82,20B.37,20C.37,4D.37,503. 某学校有教师160人,其中有高级职称的32人,中级职称的56人,初级职称的72人.现抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数应为()A.4B.6C.7D.94. 2013年中国政府提出共建丝绸之路经济带,受到了世界各国的高度重视和积极响应,并提出打造海上丝绸之路的总体规划,被简称为“一带一路”.经调查,沿线某地区自2013年到2019年经过6年的经济新建设,经济收入增加了3倍.为更好地了解该地区经济收入变化情况,统计了该地区建设前后经济收入构成比例,得到如下表格:则2019年与2013年经济收入相比较,下面结论中正确的是( )A.石油出口收入减少B.其他收入增加了三倍以上C.百姓购物收入增加了三倍D.百姓购物收入与教育文化收入的总和超过了经济收入的一半的样本,若采用系统抽样,则分段的间隔k为()A.50B.60C.30D.406. 如图是某社区工会对当地企业工人月收入情况进行一次抽样调查后画出的频率分布直方图,其中第二组月收入在[1.5, 2)千元的频数为300,则此次抽样的样本容量为()A.1000B.2000C.3000D.40007. 一样本的所有数据分组及频数如下:[−0.5, 0.5),C50;[0.5, 1.5),C51;[1.5, 2.5),C52;[2.5, 3.5),C53;[3.5, 4.5),C54;[4.5, 5.5),C55.则在[1.5, 4.5)的频率为()A.5 8B.12C.2532D.15168. 2019年,全国各地区坚持稳重求进工作总基调,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步上升,人民生活福祉持续增进,全年最终消费支出对国内生产总值增长的贡献率为57.8%.下图为2019年居民消费价格月度涨跌幅度:(同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%),下列结论中不正确的是()A.2019年第三季度的居民消费价格一直都在增长B.2018年7月份的居民消费价格比同年8月份要低一些C.2019年全年居民消费价格比2018年涨了2.5%以上D.2019年3月份的居民消费价格全年最低A.数据4、4、6、7、9、6的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数10. 某中学就到校的方式问题对初三年级的所有学生进行了一次调查,并将调查结果制作了扇形统计图,已知步行的人数为60,则初三学生乘公交车的人数为( )A.60B.78C.132D.911. 绘制1000人的寿命直方图时,若组距均为20,60∼80岁范围的纵轴高为0.03,则60∼80岁的人数为()A.300B.500C.600D.80012. 以下两个图表是2019年初的4个月我国四大城市的居民消费价格指数(上一年同月=100)变化图表,给出下列结论:其中正确的是()(注:图表一每个城市的条形图从左到右依次是1、2、3、4月份;图表二每个月份的条形图从左到右四个城市依次是北京、天津,上海、重庆)①3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为平均;②4月份仅有三个城市居民消费价格指数超过102;③仅有天津市从年初开始居民消费价格指数的增长呈上升趋势;④四个月的数据显示北京市的居民消费价格指数增长幅度波动较大.A.①②B.②④C.①②④D.①③④卷II(非选择题)二、填空题(本题共计 6 小题,每题 5 分,共计30分,)13. 某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据,绘制了下面的折线图.已知该市的各月最低气温与最高气温具有较好的线性关系,则根据该折线图,下列结论错误的是_______.①最低气温与最高气温为正相关;②10月的最高气温不低于5月的最高气温;③月温差(最高气温减最低气温)的最大值出现在1月;④最低气温低于0∘C的月份有4个.14. 为了估计鱼塘中鱼的尾数,先从鱼塘中捕出2000尾鱼,并给每条尾鱼做上标记(不影响存活),然后放回鱼塘,经过适当的时机,再从鱼塘中捕出600尾鱼,其中有标记的鱼为40尾,根据上述数据估计该鱼塘中鱼的尾数为________.15. 已知数据:x,y,10,11,9,这组数据的平均值10,方差为2,则|x−y|=________.16. 抽样统计甲,乙两个城市连续5天的空气质量指数(AQI),数据如下:17. 某校从参加高一年级期末考试的学生中抽出60名学生,并统计了他们的数学成绩(成绩均为整数且满分为100分),把其中不低于50分的分成五段[50, 60),[60, 70),[70, 80),[80, 90),[90, 100]然后画出如下图的部分频率分布直方图.观察图形的信息,可知数学成绩低于50分的学生有________人;估计这次考试数学学科的及格率(60分及以上为及格)为________;18. 为了调查某野生动物保护区内某种野生动物的数量,调查人员逮到这种动物1200只作过标记后放回,一星期后,调查人员再次逮到该种动物1000只,其中作过标记的有100只,估算保护区有这种动物________只.三、解答题(本题共计 5 小题,每题 12 分,共计60分,)19. 已知甲、乙、丙三个车间一天内生产的产品分别是150件、130件、120件,为了掌握各车间产品质量情况,从中取出一个容量为40的样本,该用什么抽样方法?简述抽样过程.20. 某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(1)设消费者的年龄为x ,对该款智能家电的评分为y .若根据统计数据,用最小二乘法得到y 关于x 的线性回归方程为y ̂=1.2x +40,且年龄x 的方差为s x 2=14.4,评分y 的方差为s y 2=22.5.求y 与x 的相关系数r ,并据此判断对该款智能家电的评分与年龄的相关性强弱.(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“ 好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.附:线性回归直线y ̂=b ̂x +a ̂的斜率b̂=∑(x i −x ¯)n i=1(y i −y ¯)∑(x i −x ¯)2n i=1相关系数r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1.独立性检验中的K 2=n(ad−bc)2(a+b)(a+c)(b+d)(c+d), 其中n =a +b +c +d .临界值表:21. 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,⋯,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑x i 20i=1=60 ,∑y i 20i=1=1200, ∑(x i −x ¯)220i=1=80, ∑(y i −y ¯)220i=1=9000,∑(x i −x ¯)20i=1(y i −y ¯)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,⋯,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物短盖面积差异很大,为提高样本的代表性以获得附:相关系数: r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1√2≈1.414.22. 某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:i i−1i i−1x i 7i−1y i =3487. (1)求x ¯,y ¯;参考公式:b ̂=∑=n ∑(ni−1x i −x ¯)2∑n ∑x i 2n i−1−nx−2,a ̂=y ¯−b ̂x ¯(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.23. 某网站欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50000份,其中持各种态度的份数如下表所示:为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具代表性,每类中各应抽选出多少份?并且写出具体操作过程.参考答案与试题解析高中数学必修三--统计一、选择题(本题共计 12 小题,每题 5 分,共计60分)1.【解答】A、了解某班学生“50米跑”的成绩,是精确度要求高的调查,适于全面调查;B、C、D了解一批灯泡的使用寿命,了解一批炮弹的杀伤半径,了解一批袋装食品是否含有防腐剂,都是具有破坏性的调查,无法进行普查,故不适于全面调查.2.【解答】解:若用系统抽样,则样本间隔为5,若第5组抽出的号码为22,则第8组抽出的号码应22+15=37,若用分层抽样方法,则40岁以下年龄段应抽取40×50%=20,故选:B.3.【解答】解:∵中级职称的56人,∴抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数为56160=n20,解得n=7,即抽取的中级职称的教师人数应为7人.故选C.4.【解答】解:假设建设前经济收入为a,则建设后经济收入为4a,所以石油出口收入在建设前为0.49a,建设后为4a×0.33=1.32a,石油出口收入较之前增加;其他收入在建设前为0.06a,建设后为0.24a,即其他收入增加了三倍;百姓购物收入建设前为0.3a,建设后为0.38×4a=1.52a,即百姓购物收入增加了四倍以上;教育文化收入建设前为0.1a,建设后为0.15×4a=0.6a,百姓购物收入与教育文化收入的总和为1.52a+0.6a=2.12a>2a,超过了经济收入的一半.故选D.5.【解答】解:由题意知本题是一个系统抽样问题,总体中个体数是3000,样本容量是100,根据系统抽样的步骤,得到分段的间隔k=3000100=30,解:由频率的意义可知,从左到右各个小组的频率之和是1,同时每小组的频率=小组的频数样本容量.∴[1.5, 2)长方形的面积为0.3.第二组月收入在[1.5, 2)千元的频数为300,所以此次统计的样本容量是300÷0.3=1000.故选A.7.【解答】解:由题意知本题共有C50+C51+C52+C53+C54+C55=25个数据,在[1.5, 4.5)的频数是C52+C53+C54∴在[1.5, 4.5)的频率为:C52+C53+C5425=2532,故选C.8.【解答】解:A,从环比看,2019年第三季度的居民消费价格一直都在增长,故A正确;B,从同比看,2018年7月份的居民消费价格比同年8月份要低一些,故B正确;C,从同比看,1.7+1.5+2.3+2.5+2.7+2.7+2.8+2.8+3.0+3.8+4.5+4.512=2.9,所以2019年全年居民消费价格比2018年涨了2.5%以上,故C正确;D,从环比看,2019年1月份的居民消费价格最低,故D错误.故选D.9.【解答】解:数据4、4、6、7、9、6的众数是4和6,故A错误;一组数据的标准差是这组数据的方差的算术平方根,故B错误;∵3,5,7,9的平均数=14(3+5+7+9)=6,∴3,5,7,9的标准差=√14[(3−6)2+(5−6)2+(7−6)2+(9−6)2]=√5.∵6、10、14、18的平均数=14(6+10+14+18)=12,∴6、10、14、18的标准差√14[(6−12)2+(10−12)2+(14−12)2+(18−12)2]= 2√5,∴数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半,故C正确;频率分布直方图中各小长方形的面积等于相应各组的频率,故D错误.故选:C.10.【解答】解:调查的学生总数是:60÷20%=300(人),则乘公交车的人数为:300×(1−20%−33%−3%)=300×44%=132(人).解:因为:组距均为20,60∼80岁范围的纵轴高为0.03,所以;频率为:0.03×20=0.6.∴60∼80岁的人数为:0.6×1000=600.故选:C.12.【解答】解:根据题目所给信息,①,3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为大,不平均,①错误;②,4月份仅有三个城市居民消费价格指数超过102;③,天津市和上海从年初开始居民消费价格指数的增长呈上升趋势,③错误;④,四个月的数据显示北京市的居民消费价格指数增长幅度波动较大,④正确.故正确的有②④.故选B.二、填空题(本题共计 6 小题,每题 5 分,共计30分)13.【解答】解:由该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据的折线图,得:在①中,最低气温与最高气温为正相关,故①正确;在②中,10月的最高气温不低于5月的最高气温,故②正确;在③中,月温差(最高气温减最低气温)的最大值出现在1月,故③正确;在④中,最低气温低于0∘C的月份有3个,故④错误.故答案为:④.14.【解答】解:根据题意,设该鱼塘中鱼的尾数为x,则;x 2000=60040,解得x=30000;∴估计该鱼塘中鱼的尾数为30000.故答案为:30000.15.【解答】解:由平均值10得,x+y+10+11+9=50,则x+y=20,①由方差为2得,2=15[(x−10)2+(y−10)2+0+1+1],即(x−10)2+(y−10)2=8,②设x=10+t,y=10−t,代入②2t2=8,解得t=±2,∴|x−y|=2|t|=4,故答案为:4.16.甲城市连续5天的空气质量指数是109,111,132,118,110;它的极差是132−109=23,且数据的波动性较大些;乙城市连续5天的空气质量指数是110,111,115,132,112;它的极差是132−110=22,且数据的波动性较小些;由此得出,空气质量指数较为稳定(方差较小)的城市是乙.故答案为:乙.17.【解答】解:由图可知,成绩在[50, 60)的频率为0,015×10=0.15,成绩在[60, 70)的频率为0.015×10=0.15,成绩在[70, 80)的频率为0.030×10=0.3,成绩在[80, 90)的频率为0.025×10=0.25,成绩在[90, 100]的频率为0.005×10=0.05,∴成绩不低于50分的频率为0.15+0.15+0.3+0.25+0.05=0.9,成绩不低于60分的频率为0.15+0.3+0.25+0.05=0.75∴成绩低于50分的频率为为1−0.9=0.1∵共有60名学生,∴成绩低于50分的学生数为60×0.1=6,这次考试数学学科的及格率为75%.故答案为6;75%18.【解答】解:设保护区有这种动物有x只,则由题意可得1200x =1001000,求得x=12000,故答案为12000.三、解答题(本题共计 5 小题,每题 12 分,共计60分)19.【解答】解:由于三个车间的产品有差别,故应采用分层抽样的方法,先计算抽样比:k=40150+130+120=110,再计算各车间内抽取样本的件数:甲车间:150×110=15,乙车间:130×110=13,丙车间:120×110=12,再分析使用简单随机抽样的办法在各个车间中抽取样本,最后终成一个样本.20.【解答】解:(1)相关系数r=∑(x−x¯)50(y−y¯)√∑(xi−x)250i=1∑(y i−y)250i=1;=∑(x i−x¯)50i=1(y i−y¯)∑(x i−x¯)250i=1√∑(xi−x¯)250i=1√∑(yi−y)250i=1=b̂⋅√50s x2√50s y =1.2×1215=0.96.故对该款智能家电的评分与年龄的相关性较强.(2)由列联表可得K 2=50×(8×6−20×16)224×26×28×22≈9.624>6.635.故有99%的把握认为对该智能家电的评价与年龄有关.21.【解答】解:(1)由题意可知,1个样区这种野生动物数量的平均数=120020=60,故这种野生动物数量的估计值=60×200=12000;(2)由参考公式得 ,r =∑(x i −x ¯)n i=1(y i −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1=80×9000=62≈0.94 ;(3)由题意可知,各地块间植物短盖面积差异很大,因此在调查时,先确定该地区各地块间植物短盖面积大小并且由小到大排序, 每十个分为一组,采用系统抽样的方法抽取20个地块作为样区进行样本统计. 22.【解答】解:(1)x ¯=17(3+4+5+6+7+8+9)=6, y ¯=17(66+69+73+81+89+90+91)=5597≈79.86;(2)把所给的7对数据写成对应的点的坐标,在坐标系中描出来,得到散点图.(3)∵ 3×66+4×69+5×73+6×81+7×89+8×90+9×91=3487,32+42+52+62+72+82+92=280,∴ b =3487−7×6×5597280−7×36=4.75,a =5597−6×4.75≈51.36,故线性回归方程为y =4.75x +51.36.23.【解答】解:每个个体被抽到的频率是 50050000=1100,10800×1100=108,12400×1100=124,15600×1100=156,11200×1100=112,每类中各应抽选出有效帖子的份数:很满意的108份,满意的124份,一般的156份,不满意的112份.在很满意的有效帖子中采用简单随机抽样的方法随机抽取108份,在满意的有效帖子中采用简单随机抽样的方法随机抽取124份,在一般的有效帖子中采用简单随机抽样的方法随机抽取156份,在不满意的有效帖子中采用简单随机抽样的方法随机抽取112份.。
高中数学必修3(人教B版)第二章统计2.3知识点总结含同步练习题及答案
![高中数学必修3(人教B版)第二章统计2.3知识点总结含同步练习题及答案](https://img.taocdn.com/s3/m/a929d33beefdc8d376ee321f.png)
描述:例题:高中数学必修3(人教B版)知识点总结含同步练习题及答案第二章 统计 2.3 变量的相关性一、学习任务1. 能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2. 了解线性回归的方法,了解用最小二乘法研究两个变量的线性相关问题的思想方法,会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式).二、知识清单变量间的相关关系相关关系 线性相关三、知识讲解1.变量间的相关关系2.相关关系变量与变量之间的关系一类是确定性的函数关系,像正方形的边长 和面积 的关系 .另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,人的身高不能确定体重,但一般说来“身高者,体也重”.我们说身高与体重这两个变量具有相关关系.函数关系与相关关系的异同点相同点:是两者均是指两个变量的关系;不同点:①函数关系是一种确定性的关系,相关关系是一种非确定性的关系.②函数关系式一种因果关系,而相关关系不一定是因果关系,其也可能是伴随关系.a S 给出下列关系:①正方形的边长与面积之间的关系;②水稻产量与施肥量之间的关系;③降雪量与交通事故的发生率之间的关系.其中具有相关关系的是______.解:②③两个变量之间的关系有两种:函数关系与相关关系.①正方形的边长和面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③降雪量与交通事故的发生率具有相关关系.下图中的两个变量是相关关系的是( )描述:3.线性相关两个变量的线性关系对具有相关关系的两个变量进行统计分析的方法叫回归分析.将样本中的个数据点(,,,)描在平面直角坐标系中,就得到了散点图.如果两个变量的散点图中的点散步在左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,我们将这种相关称为正相关.如果两个变量的散点图中的点散步的位置是从左上角到右下角的区域,即一个变量的值由小变大是,另一个变量的值由大变小,我们将这种相关称为负相关.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量具有线性相关关系.回归直线方程“最贴近”已知的数据点的直线方程称之为回归直线方程,简称回归方程,方程为,叫做回归系数.刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,个离差构成的总离差越小越好,总离差通常是用离差的平方和来表示,即作为总离差,并使之达到最小.回归直线就是所有直线中取最小的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.A.①② B.①③ C.②④ D.②③解:D①属于函数关系,因为每个 值对应一个 值,这是确定性的关系;②中散点图中各点分布的区域大致为从左下角到右上角,没有确定的函数关系,但是具有相关关系;③中散点图分布的区域大致在一条曲线附近,对于每个 ,其对应的 呈现出一定的规律性,因此这两个变量具有相关关系;④ 中各点的分布比较均匀,但对于每个 , 的分布没有规律,因此不属于相关关系.x y x y x y n (,)x i y i i =12⋯n =a +bx y ^b −y i y ^i y i n Q =(−a −b ∑i =1ny i x i )2Q(),得散点图2.由这两个散点图可以判断( )(,)u i v i i =12⋯10高考不提分,赔付1万元,关注快乐学了解详情。
高中数学必修3复习-统计的讲义与习题(含答案及详细解答过程)
![高中数学必修3复习-统计的讲义与习题(含答案及详细解答过程)](https://img.taocdn.com/s3/m/1ba134e483d049649a665817.png)
【知识点:统计】一.简单随机抽样1.总体和样本总体:在统计学中 , 把研究对象的全体叫做总体.个体:把每个研究对象叫做个体.总体容量:把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本...其中个体的个数称为样本容量....。
2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二.系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
d(抽样距离)=N(总体规模)/n(样本规模)三.分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
(压轴题)高中数学必修三第一章《统计》测试(有答案解析)
![(压轴题)高中数学必修三第一章《统计》测试(有答案解析)](https://img.taocdn.com/s3/m/354d8b9f5acfa1c7aa00cce1.png)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .23.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④7.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,88.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.19.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
高一数学统计试题答案及解析
![高一数学统计试题答案及解析](https://img.taocdn.com/s3/m/4ed80dc54128915f804d2b160b4e767f5acf80bb.png)
高一数学统计试题答案及解析1.从测量所得数据中取出个,个,个,个组成一个样本,则这个样本的平均数是()A.B.C.D.【答案】C【解析】利用平均数计算公式平均数=,故选C。
【考点】本题考查了平均数的概念及计算.点评:运用求平均数公式:。
2.一位教师出了一份含有3个问题的测验卷,每个问题1分.班级中30%的学生得了3分,50%的学生得了2分,10%的学生得了1分,另外还有10%的学生得0分,则全班的平均分是_________.【答案】2分【解析】=3×30%+2×50%+1×10%+0=2.【考点】本题考查了平均数的概念及计算、频率分布表的意义、加权平均数的求法.点评:运用求平均数公式:。
3.某校在一次学生身体素质调查中,在甲、乙两班中随机抽10名男生测验100m短跑,测得成绩如下(单位:):【答案】甲班男生短跑水平高些【解析】,.,甲班男生短跑水平高些.【考点】本题考查了平均数的概念及计算.点评:运用求平均数公式:,分别计算比较,平均数高者为优秀,数基本题型。
4.如果五个数的平均数是7,那么这五个数的平均数是()A.5B.6C.7D.8【答案】D【解析】利用平均数计算,或利用结论:样本x1,x2, (x)n的平均数为7,∴样本x1+1,x2+1,…,xn+1的平均数=7+1=8,故选D.【考点】本题主要考查平均数的意义及其计算。
点评:基本题型,注意掌握平均数计算公式。
在此基础上推出一般结论更好。
5.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组对应数据:判断它们是否有相关关系.【答案】解:两者之间具有相关关系.【解析】本题只给出了样本数据,对于给定的两个变量是否具有相关关要用散点图来分析,散点图中的点若很集中,则具有相关关系并且集中趋势越强则相关性越强,若很分散,则不具相关关系。
散点图为:可看出样本点都集中在一条直线附近,所以两者之间具有相关关系。
高一数学 (人教版必修3):第三章 统计 Word版含解析
![高一数学 (人教版必修3):第三章 统计 Word版含解析](https://img.taocdn.com/s3/m/66274b9619e8b8f67d1cb91a.png)
重点列表:重点 名称重要指数 重点1 频率分布直方图 ★★★★ 重点2 茎叶图 ★★★ 重点3抛物线★★★★重点详解:用样本的频率分布估计总体分布(1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________估计总体的__________;另一种是用样本的________估计总体的__________.(2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用________________表示.各小长方形的面积总和等于________.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布________.随着样本容量的增加,作图时所分的________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________________,它能够更加精细地反映出____________________________________.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以____________________,而且可以______________,给数据的记录和表示都带来方便.【参考答案】(1)频率分布 分布 数字特征 数字特征 (2)频率组距 各小长方形的面积 1 (3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比 (4)保留所有信息 随时记录重点1:频率分布表、频率分布直方图及其应用 【要点解读】用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.【考向1】根据数据画出频率分布直方图【例题】某市2013年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成下列频率分布表、频率分布直方图;频率分布表分组频数频率41,51)51,61)61,71)71,81)81,91)91,101)101,111)频率分布直方图(2)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解:(1)如图所示:频率分布表分组频数频率41,51) 2 230 51,61) 1 130 61,71) 4 430 71,81) 6 630 81,91) 10 1030 91,101) 5 530 101,111)2230(2)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115,有26天处于良的水平,占当月天数的1315,处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115,污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%,说明该市空气质量有待进一步改善.【评析】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、轻微污染、轻度污染的天数;对于开放性问题的解答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论.本题主要考查运用统计知识解决简单实际问题的能力、数据处理能力和应用意识. 【考向2】频率分布直方图的逆用【例题】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60, [)60,70,[)70,80,[)80,90,[]90,100.(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生的语文成绩在某些分数段的人数(x )与数学成绩在相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数.分数段[)50,60 [)60,70 [)70,80 [)80,90x ∶y1∶12∶13∶44∶5解:(1)由()2a +×10=1, 解得a =0.005.(2)=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段 50,60) 60,70) 70,80) 80,90)x 5 40 30 20 x ∶y 1∶1 2∶1 3∶4 4∶5 y5204025于是数学成绩在50重点2:茎叶图 【要点解读】茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 【考向1】根据茎叶图求方差【例题】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.如果X =8,求乙组同学植树棵数的平均数和方差;注:方差s2=1n(x1-)2+(x2-)2+…+(x n-)2],其中x为x1,x2,…,x n的平均数.解:当X=8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数为=8+8+9+104=354;方差为s2=14⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫9-3542+⎝⎛⎭⎪⎫10-3542]=1116.【考向2】根据茎叶图求平均数【例题】某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.179201 530(1)根据茎叶图计算样本平均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人?难点列表:难点名称难度指数难点1 用样本的数字特征估计总体的数字特征★★★★难点2导数与函数的极值、最值★★★难点详解:用样本的数字特征估计总体的数字特征(1)众数,中位数,平均数众数:在一组数据中,出现次数________的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的________)叫做这组数据的中位数.平均数:样本数据的算术平均数,即=_______.在频率分布直方图中,中位数左边和右边的直方图的面积应该________. (2)样本方差,样本标准差 标准差s =])()()[(122221x x x x x x nn -+⋯+-+-,其中x n 是__________________,n 是________,是________.标准差是反映总体__________的特征数,________是样本标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.【答案】 (1)最多 平均数 1n(x 1+x 2+…+x n ) 相等(2)样本数据的第n 项 样本容量 平均数 波动大小 样本方差难点1:用样本的数字特征估计总体的数字特征 【要点解读】能从一组数据中求出中位数、平均数和众数 【考向1】平均数、中位数【例题】某汽车制造厂分别从A ,B 两种轮胎中各随机抽取了8个进行测试,列出了每一个轮胎行驶的最远里程数(单位:1000 km): 轮胎A 96 11297108100103 86 98轮胎B 108 101 94 105 9693 97 106(1)分别计算A ,B 两种轮胎行驶的最远里程的平均数、中位数; (2)分别计算A ,B 两种轮胎行驶的最远里程的极差、标准差; (3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?(2)A 轮胎行驶的最远里程的极差为:112-86=26, 标准差为:s =8)2()14(308)3(12)4(22222222-+-++++-++-=2212≈7.43; B 轮胎行驶的最远里程的极差为:108-93=15, 标准差为:s =86)3()7()4(5)6(1822222222+-+-+-++-++=1182≈5.43. (3)虽然A 轮胎和B 轮胎的最远行驶里程的平均数相同,但B 轮胎行驶的最远里程的极差和标准差相对于A 轮胎较小,所以B 轮胎性能更加稳定.【评析】在理解平均数、中位数、众数、极差、标准差、方差的统计意义和数学表达式的情况下,不难作出解答. 【考向2】平均数、标准差【例题】某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4. 则(1)平均命中环数为____________; (2)命中环数的标准差为____________.难点2:根据频率分布直方图计算样本的数字特征【要点解读】会从频率分布直方图中求出中位数、平均数和众数【考向1】中位数【例题】如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,可知其中位数为( )A.12.5 B.13C.13.5 D.14【答案】 B【考向2】平均数【例题】某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.组别月用电量频数统计频数频率①0,20)②20,40)正正③40,60)正正正正④60,80)正正正正正⑤80,100)正正正正⑥100,120](1)完成频率分布表并绘制频率分布直方图;(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a. 解] (1)组别月用电量频数统计频数频率①0,20)40.04②20,40)正正120.12③40,60)正正正正240.24④60,80)正正正正正正300.30⑤80,100)正正正正正250.25⑥100,120]正50.05(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:分组0,20)20,40)40,60)60,80)80,100)100,120] 频率0.040.120.240.300.250.05累计频率0.040.160.400.700.95 1.00由此可知临界值a应在区间80,100)内,且频率分布直方图中,在临界值a左侧小矩形的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.【趁热打铁】1.容量为20的样本数据,分组后的频数如下表:分组10,20)20,30) 30,40) 40,50) 50,60) 60,70)频数2 3 4 5 4 2A.0.35 B.0.45C.0.55 D.0.652.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则( )A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<3.某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数4.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2A .30%B .10%C .3%D .不能确定5.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为m 甲,m 乙,则( )甲乙8 6 5 0 8 8 4 0 0 1 0 2 87 5 2 2 0 2 3 3 7 8 0 0 3 1 2 4 4 8 3 1 4 2 3 8A.甲<乙,m 甲>m 乙 B .甲乙甲乙C .甲>乙,m 甲>m 乙 D .甲>乙,m 甲<m 乙6.样本(x 1,x 2,…,x n )的平均数为,样本(y 1,y 2,…,y m )的平均数为y (≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数=α+(1-α) y ,其中0<α<12,则n ,m 的大小关系为( ) A .n <mB .n >mC .n =mD .不能确定7.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下.中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为________和________.甲乙9 8 1 9 7 10 1 3 2 0 2 1 4 2 41 1 5 3 02 08.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5],样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.9.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.10.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.23.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?第三章1解:由频率分布表可知:样本数据落在区间10,40)内的频数为2+3+4=9,样本总数为20,故样本数据落在区间10,40)的频率为920=0.45.故选B.2解:中位数为5.5,众数为5,平均值为17930.故选D.3解:这种抽样方法为简单随机抽样,该班这五名男生成绩的平均数为86+94+88+92+905=90,方差为15(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8;该班这五名女生成绩的平均数为 88+93+93+88+935=91,方差为15(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.故选C.5解:易知甲=21.5625,乙=28.5625,m 甲=20,m 乙=29,∴甲<乙,m 甲<m 乙.故选B. 6解:∵x 1+x 2+…+x n =n ,y 1+y 2+…+y m =m y ,∴x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n ) =(m +n )α+(1-α)y ] =(m +n )α+(m +n )(1-α)y , ∴n +m y =(m +n )α+(m +n )(1-α)y .∴⎩⎪⎨⎪⎧n =(m +n )α,m =(m +n )(1-α). 故n -m =(m +n )α-(1-α)]=(m +n )(2α-1). ∵0<α<12,∴2α-1<0.∴n -m <0,即n <m .故选A.7解:设甲、乙在这10天中日加工零件的平均数分别为a ,b ,则a =20+-1-2+0+1+3+2+0+11+11+1510=24,b =20+-1-3-9+1+4+2+4+10+12+1010=23.故填24;23.8解:平均气温低于22.5℃的城市所占频率为最左边两个矩形面积之和,即0.10×1+0.12×1=0.22,又其频数为11,故总城市数为110.22=50,故样本中平均气温不低于25.5℃的城市共有50×0.18=9(个). 故填9.9解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.10解:(1)计算得A=2.3, B=1.6,从计算结果来看,A药的疗效更好.(2)从以上茎叶图可以看出,A药疗效的试验结果有10的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.。
人教b版数学必修三:第2章《统计》章末复习导学案(含答案)
![人教b版数学必修三:第2章《统计》章末复习导学案(含答案)](https://img.taocdn.com/s3/m/8a69dae05ef7ba0d4b733b0c.png)
章末复习课知识概览对点讲练知识点一三种抽样方法的选择例1选择合适的抽样方法抽样,写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.(3)有甲厂生产的300个篮球,抽取10个.(4)有甲厂生产的300个篮球,抽取30个.点评弄清三种抽样方法的实质和适用范围,是灵活选用抽样方法的前提和基础.若用分层抽样,应先确定各层的抽取个数,然后在各层中用系统抽样或简单随机抽样进行抽取.变式迁移1某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是() A.4 B.5 C.6 D.7知识点二用样本估计总体例2有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比.点评频率分布直方图可直观看出在各个区间内机会的差异,可对总体情况作出估计.变式迁移2为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83例3甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):变式迁移3随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.知识点三回归直线方程及应用例4在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(1)(2)求水稻产量y与施化肥量x之间的回归直线方程;(3)当施化肥50 kg时,对水稻的产量予以估计.点评(1)回归分析是寻找相关关系中非确定性关系的某种确定性;(2)求回归直线方程,关键在于正确地求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时要仔细,避免计算失误.变式迁移4 某个服装店经营某种服装,在某周内获纯利y (元)与该周每天销售这种服装件数x已知:∑7i =1x 2i =280,∑i =1y 2i =45 309,∑i =1x i y i =3 487,且y 与x 有线性相关关系.(1)求x ,y ;(2)求纯利y 与每天销售件数x 之间的回归直线方程.课时作业一、选择题1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,7,13,17,23,27,…,93,97的产品进行检验,则这样的抽样方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .以上都不对2.下列说法:①一组数据不可能有两个众数;②一组数据的方差不可能是负数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的个数有( )A .0B .1C .2D .33.现有60瓶牛奶制品,编号从1至60,若从中抽取6瓶进行检验,用系统抽样方法确定所抽的编号为( )A .3,13,23,33,43,53B .2,14,26,38,42,56C .5,8,31,36,48,54D .5,10,15,20,25,304.数学老师对某同学在参加高考前的5次数学模拟考试成绩进行统计分析,判断该同学的数学成绩是否稳定,于是老师需要知道该同学这5次成绩的( )A .平均数或中位数B .方差或标准差C .众数或频率D .频数或众数5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^,那么下列说法不正确的是( )A .直线y ^ =b ^ x +a ^ 必经过点(x ,y )B .直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线y ^=b ^x +a ^的斜率为∑ni =1x i y i -n x y∑n i =1x 2i -n x 2D .直线y ^=b ^x +a ^和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1[y i -(bx i +a )]2是该坐标平面上所有直线与这些点的偏差中最小的 二、填空题6.某校有教师200人,男学生1 200人,女学生1 000人,现用分层抽样的方法从所有师生中抽取一个容量为n 的样本,已知从女学生中抽取的人数为80人,则n 的值为________.7.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:三、解答题9.对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:甲 27,38,30,37,35,31; 乙 33,29,38,34,28,36.根据以上数据,试判断他们谁更优秀. 10.随机选取15家销售公司,由营业报告中查出其上年度的广告费(占总费用的百分比)及盈利额(1)画出散点图;(2)如果变量x 与y 之间具有线性相关关系,求出回归直线方程; (3)已知某销售公司的广告费为其总费用的1.7%,试估计其盈利额占销售总额的百分比.章末复习课对点讲练例1 解 (1)总体容量较小,用抽签法. ①将30个篮球编号,号码为00,01, (29)②将以上30个编号分别写在一张小纸条上,揉成小球,制成号签; ③把号签放入一个不透明的袋子中,充分搅拌;④从袋子中逐个抽取3个号签,并记录上面的号码; ⑤找出和所得号码对应的篮球.(2)总体由差异明显的两个层次组成,需选用分层抽样法. ①确定抽取个数. 3010=3,所以甲厂生产的应抽取213=7(个), 乙厂生产的应抽取93=3(个);②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.(3)总体容量较大,样本容量较小,宜用随机数表法.①将300个篮球用随机方式编号,编号为000,001,…,299; ②在随机数表中随机的确定一个数作为开始,如第8行第11列的数“2”开始.任选一个方向作为读数方向,比如向右读;③从数“2”开始向右读,每次读三位,凡不在000~299中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大宜用系统抽样法.①将300个篮球用随机方式编号,编号为001,002,003,…,300,并分成30段,其中每一段包含30030=10(个)个体;②在第一段001,002,003,…,010这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;③将编号为002,012,022,…,292的个体抽出,组成样本. 变式迁移1 C [抽取的植物油类种数:1040+10+30+20×20=2,抽取的果蔬类食品种数:2040+10+30+20×20=4,故抽取的植物油类与果蔬类食品种数之和是6.] 例2 解 (1)(2)(3)小于30的数据约占90%.变式迁移2 A [100人分为10组,第1组1人,第2组3人,第三组9人,第四组27人,故a =0.27;后六组共87人,故b =78.]例3 甲解析 方法一 x 甲=15×(9.8+9.9+10.1+10+10.2)=10,x 乙=15×(9.4+10.3+10.8+9.7+9.8)=10,即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为s 2甲=15×(0.04+0.01+0.01+0+0.04)=0.02,s 2乙=15×(0.36+0.09+0.64+0.09+0.04) =0.244,即s 2甲<s 2乙,表明甲种小麦的产量比较稳定.方法二 (通过特殊的数据作出合理的推测)表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.变式迁移3 解 (1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间,因此乙班平均身高高于甲班.(2)x =158+162+163+168+168+170+171+179+179+18210=170.甲班的样本方差s 2=110×[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.例4 解 (1)画出散点图如下图:由图可见是线性相关的.x =30,y ≈399.3,∑i =17x i y i =87 175.∑i =17x 2i =7 000.计算得:b ^=87 175-7×30×399.37 000-7×302≈4.75,a ^ =399.3-4.75×30=256.8.即得回归直线方程y ^=256.8+4.75x.(3)施化肥50 kg 时,可以估计水稻产量约为494.3 kg .变式迁移4 解 (1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917=5597≈79.86.(2)设回归直线方程为y ^=b ^x +a ^,因为∑7i =1x 2i =280,∑7i =1y 2i =45 309,∑7i =1x i y i =3 487,x =6,y =5597,所以b ^=3 487-7×6×5597280-7×36=13328=4.75,a ^=5597-6×4.75≈51.36.所以回归直线方程为y ^=4.75x +51.36. 课时作业 1.B 2.B 3.A 4.B 5.B 6.192解析 801 000=n2 400,n =192.7.甲 甲解析 甲的平均分为x =68+69+70+71+725=70,乙的平均分为y =68;甲的方差为s 21=(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)25=2.乙的方差为s 22=7.2,故甲的平均分高于乙,甲的成绩比乙稳定.8.y ^=14.7+0.132x9.解 x 甲=16×(27+38+30+37+35+31)=1986=33.s 2甲=16×[(27-33)2+(38-33)2+…+(31-33)2] =16×94≈15.7. x 乙=16×(33+29+38+34+28+36)=1986=33,s 2乙=16×[(33-33)2+(29-33)2+…+(36-33)2] =16×76≈12.7 ∴x 甲=x 乙,s 2甲>s 2乙,说明甲乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.10.解 (1)散点图如图所示.(2)回归直线方程是y ^=1.414 68x +0.821 23.(3)当x =1.7时,由回归直线方程得y =3.23,即可估算其盈利额占销售总额的3.23%.。
(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(1)
![(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(1)](https://img.taocdn.com/s3/m/2b43cc5765ce05087732131e.png)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .726.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s9.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,810.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人. 16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.参考数据:7772111y9.24,t39.75,0.53,7 2.646i i ii i iiy=====⋅≈≈∑∑∑(y-y).参考公式:相关系数()()()()()()11112211,ni i n n nii i i i in ni i ii ii it t y yr t t y y t y t yt t y y======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,ni iiniit t y yb a y btt t==⋅--==-⋅-∑∑.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y关于x的回归直线方程ˆˆˆy bx a=+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni iiniix y nx yx naxb y bx====---∑∑)25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:温度(单位:C︒)212324272932死亡数y(单位:株)61120275777经计算:611266iix x===∑,611336iiy y===∑,()()61557i iix x y y=--=∑,()62184iix x=-=∑,()6213930iiy y=-=∑,()621ˆ236.64iiy y=-=∑,8.0653167e≈,其中ix,iy分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i=.(1)若用线性回归模型,求y关于x的回归方程ˆˆˆy bx a=+(结果精确到0.1);(2)若用非线性回归模型求得y关于x的回归方程0.2303ˆ0.06xy e=,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.3.D解析:D由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kx y ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+, 令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.5.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=,【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.9.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】 (1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53iii i t t t y y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑。
高中数学必修三 计数,概率,统计与分布列知识梳理 含答案
![高中数学必修三 计数,概率,统计与分布列知识梳理 含答案](https://img.taocdn.com/s3/m/3bd496f6b9f3f90f76c61bf2.png)
计数,概率,统计与分布列知识梳理10.1分类加法计数原理与分步乘法计数原理1.分类加法计数原理完成一件事,可以有n类办法,在第一类办法中有m1种方法,在第二类办法中有m2种方法,……,在第n类办法中有m n种方法.那么,完成这件事共有_____________种方法.(也称加法原理)2.分步乘法计数原理完成一件事需要经过n个步骤,缺一不可,做第一步有m1种方法,做第二步有m2种方法,……,做第n步有m n种方法.那么,完成这件事共有__________________种方法.(也称乘法原理) 3.分类加法计数原理与分步乘法计数原理,都涉及完成一件事的不同方法的种数.它们的区别在于:分类加法计数原理与分类有关,各种方法相互独立,用其中的任一种方法都可以完成这件事;分步乘法计数原理与分步有关,各个步骤相互依存,只有各个步骤都完成了,这件事才算完成.[方法与技巧]1.分类加法和分步乘法计数原理,都是关于做一件事的不同方法的种数的问题,区别在于:分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中任何一种方法都可以做完这件事;分步乘法计数原理针对“分步”问题,各个步骤相互依存,只有各个步骤都完成了才算完成这件事.2.分类标准要明确,做到不重复不遗漏.3.混合问题一般是先分类再分步.4.要恰当画出示意图或树状图,使问题的分析更直观、清楚,便于探索规律.[失误与防范]1.切实理解“完成一件事”的含义,以确定需要分类还是需要分步进行.2.分类的关键在于要做到“不重不漏”,分步的关键在于要正确设计分步的程序,即合理分类,准确分步.3.确定题目中是否有特殊条件限制.10.2排列与组合1.排列与组合的概念2.(1)排列数的定义:从n个不同元素中取出m(m≤n)个元素的_________的个数叫作从n个不同元素中取出m个元素的排列数,用A m n表示.(2)组合数的定义:从n个不同元素中取出m(m≤n)个元素的_________的个数,叫作从n个不同元素中取出m个元素的组合数,用C m n表示.3.排列数、组合数的公式及性质1.对于有附加条件的排列、组合应用题,通常从三个途径考虑:(1)以元素为主考虑,即先满足特殊元素的要求,再考虑其他元素;(2)以位置为主考虑,即先满足特殊位置的要求,再考虑其他位置;(3)先不考虑附加条件,计算出排列数或组合数,再减去不符合要求的排列数或组合数.2.排列、组合问题的求解方法与技巧:(1)特殊元素优先安排;(2)合理分类与准确分步;(3)排列、组合混合问题先选后排;(4)相邻问题捆绑处理;(5)不相邻问题插空处理;(6)定序问题排除法处理;(7)分排问题直排处理;(8)“小集团”排列问题先整体后局部;(9)构造模型;(10)正难则反,等价条件.[失误与防范]求解排列与组合问题的三个注意点:(1)解排列与组合综合题一般是先选后排,或充分利用元素的性质进行分类、分步,再利用两个原理做最后处理.(2)解受条件限制的组合题,通常用直接法(合理分类)或间接法(排除法)来解决,分类标准应统一,避免出现重复或遗漏.(3)对于选择题要谨慎处理,注意等价答案的不同形式,处理这类选择题可采用排除法分析选项,错误的答案都有重复或遗漏的问题.10.3二项式定理1.二项式定理(1)0≤r≤n时,C r n与C n-r的关系是______n(2)二项式系数先增后减________最大当n为偶数时,第_____项的二项式系数最大,最大值为__;当n为奇数时,第____项和_______项的二项式系数最大,最大值为______和_____(3)各二项式系数和:C0n+C1n+C2n+…+C n n=____,C0n+C2n+C4n+…=C1n+C3n+C5n+…=____【知识拓展】二项展开式形式上的特点(1)项数为______(2)各项的次数都等于二项式的幂指数n,即a与b的指数的和为n.(3)字母a按_____排列,从第一项开始,次数由n逐项减1直到零;字母b按_____排列,从第一项起,次数由零逐项增1直到n.,___(4)二项式的系数从____,C1n,一直到C n-1n[方法与技巧]1.通项T r+1=C r n a n-r b r是(a+b)n的展开式的第r+1项,而不是第r项,这里r=0,1,…,n.2.二项式系数与项的系数是完全不同的两个概念.二项式系数是指C0n,C1n,…,C n n,它只与各项的项数有关,而与a,b的值无关;而项的系数是指该项中除变量外的常数部分,它不仅与各项的项数有关,而且也与a,b的值有关.3.因为二项式定理中的字母可取任意数或式,所以在解题时根据题意,给字母赋值,是求解二项展开式各项系数和的一种重要方法.4.运用通项求展开式的一些特殊项,通常都是由题意列方程求出r,再求所需的某项;有时需先求n,计算时要注意n和r的取值范围及它们之间的大小关系.[失误与防范]1.项的系数与a、b有关,二项式系数只与n有关,大于0.2.求二项式所有系数的和,可采用“赋值法”.3.关于组合式的证明,常采用“构造法”——构造函数或构造同一问题的两种算法.4.展开式中第r+1项的二项式系数与第r+1项的系数一般是不相同的,在具体求各项的系数时,一般先处理符号,对根式和指数的运算要细心,以防出错.11.1随机抽样1.抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行_________,获取数据,并以此对调查对象的某项指标作出_______,这就是抽样调查.(2)总体和样本调查对象的______称为总体,被抽取的_______称为样本.(3)抽样调查与普查相比有很多优点,最突出的有两点:①______________;②节约人力、物力和财力.2.简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率______(2)通常采用的简单随机抽样的方法:__________________3.分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样系统抽样是将总体中的个体进行编号,_______分组,在第一组中按照___________抽取第一个样本,然后按____________ (称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.[方法与技巧]1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.[失误与防范]进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.\11.2统计图表,用样本估计总体1.统计图表统计图表是_____和_____数据的重要工具,常用的统计图表有____________,______________,______________,______________等.2.数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数_____的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在_______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x=________________在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(2)样本方差、标准差标准差s=______________________________其中x n是样本数据的第n项,n是___________,x是________标准差是刻画数据的离散程度的特征数,样本方差是标准差的____.通常用样本方差估计总体方差,当____________________时,样本方差很接近总体方差.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用_____________________________,另一种是用____________________________(2)在频率分布直方图中,纵轴表示______,数据落在各小组内的频率用______________表示,各小长方形的面积总和等于____.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的_____开始,用线段依次连接各个矩形的__________,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且___________,方便表示与比较.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x +b,方差为a2s2.[失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.11.3变量间的相关关系,统计案例1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的_______(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为_______(3)在两个变量x和y的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是__________的,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是___________的.如果所有的点在散点图中没有显示任何关系,则称变量间是__________ 2.线性回归方程(1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是所要求的直线,这种方法称为最小二乘法.(2)线性回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧ b =∑n i =1 (x i -x )(y i -y )∑n i =1 (x i -x )2=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .3.回归分析(1)定义:对具有________的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,________称为样本点的中心.(3)相关系数①r =∑ni =1 (x i -x )(y i -y )∑n i =1 (x i -x )2∑n i =1(y i -y )2=∑ni =1x i y i -n x y(∑n i =1x 2i -n x 2)(∑n i =1y 2i -n y 2);②当r >0时,表明两个变量_______;当r <0时,表明两个变量_________当r =0时,表明两个变量_________.r 的绝对值越接近于1,表明两个变量之间的线性相关程度_______.r 的绝对值越接近于0,表明两个变量之间的线性相关程度越低.4.独立性检验设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1;2×2列联表:构造一个随机变量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B没有关联的;当χ2>2.706时,有90%的把握判定变量A,B有关联;当χ2>3.841时,有95%的把握判定变量A,B有关联;当χ2>6.635时,有99%的把握判定变量A,B有关联.[方法与技巧]1.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.根据χ2的值可以判断两个分类变量有关的可信程度.[失误与防范]1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量χ2的值的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.12.1随机事件的概率1.随机事件和确定事件(1)在条件S下,一定会发生的事件,叫作相对于条件S的_____________(2)在条件S下,一定不会发生的事件,叫作相对于条件S_____________(3)___________________________统称为相对于条件S的确定事件.(4)______________________________的事件,叫作相对于条件S的随机事件.(5)___________和____________统称为事件,一般用大写字母A,B,C…表示.2.频率与概率在相同的条件下,大量重复进行同一试验时,随机事件A发生的频率会在某个常数附近摆动,即随机事件A发生的频率具有_______.这时,我们把_______叫作随机事件A的概率,记作P(A).3.事件的关系与运算互斥事件:在一个随机试验中,我们把一次试验下发生的两个事件A与B称作互斥事件.事件A+B:事件A+B发生是指事件A和事件B______________________对立事件:不会______发生,并且___________发生的事件是相互对立事件.4.概率的几个基本性质(1)概率的取值范围:________________(2)必然事件的概率P(E)=____(3)不可能事件的概率P(F)=____(4)互斥事件概率的加法公式①如果事件A与事件B互斥,则P(A+B)=________________②若事件A与事件A互为对立事件,则P(A)=______________.[知识拓展]互斥事件与对立事件的区别与联系互斥事件与对立事件都是两个事件的关系,互斥事件是不能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生,因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件.[方法与技巧]1.对于给定的随机事件A,由于事件A发生的频率f n(A)随着试验次数的增加稳定于_________, 因此可以用频率f n(A)来估计概率P(A).2.从集合角度理解互斥事件和对立事件从集合的角度看,几个事件彼此互斥,是指由各个事件所含的结果组成的集合彼此的交集为______,事件A的对立事件A所含的结果组成的集合,是全集中由事件A所含的结果组成的集合的_______.[失误与防范]1.正确认识互斥事件与对立事件的关系:对立事件是互斥事件,是互斥事件中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的__________条件.2.需准确理解题意,特别留心“至多……”“至少……”“不少于……”等语句的含义.12.2古典概型1.基本事件的特点(1)任何两个基本事件是_______的;(2)任何事件(除不可能事件)都可以表示成_____________的和.2.古典概型具有以下两个特点的概率模型称为古典的概率模型,简称古典概型.(1)试验的所有可能结果_____________,每次试验只出现其中的一个结果;(2)每一个试验结果出现的可能性__________3.如果一次试验中可能出现的结果有n 个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是 1n;如果某个事件A 包括的结果有m 个,那么事件A 的概率P (A )= ________ .4.古典概型的概率公式P (A )=事件A 包含的可能结果数试验的所有可能结果数. [方法与技巧]1.古典概型计算三步曲第一,本试验是不是等可能的;第二,本试验的基本事件有多少个;第三,事件A 是什么,它包含的基本事件有多少个.2.确定基本事件的方法(1)当基本事件总数较少时,可列举计算;(2)列表法、树状图法.3.较复杂事件的概率可灵活运用互斥事件、对立事件、相互独立事件的概率公式简化运算.[失误与防范]1.古典概型的重要思想是事件发生的等可能性,一定要注意在计算基本事件总数和事件包括的基本事件个数时,它们是不是等可能的.2.概率的一般加法公式:P (A +B )=___________________.公式使用中要注意:(1)公式的作用是求A +B 的概率,当AB =∅时,A 、B 互斥,此时P (AB )=0,所以P (A +B )=P (A )+P (B );(2)要计算P (A +B ),需要求P (A )、P (B ),更重要的是把握事件AB,并求其概率;(3)该公式可以看作一个方程,知三可求一.12.3几何概型1.几何概型向平面上有限区域(集合)G内随机地投掷点M,若点M落在子区域G1G的概率与G1的面积成正比,而与G的形状、位置无关,即P(点M落在G1)=___________,则称这种模型为几何概型.2.几何概型中的G也可以是空间中或直线上的有限区域,相应的概率是_______之比或_________之比.3.借助_________可以估计随机事件发生的概率.[方法与技巧]1.区分古典概型和几何概型最重要的是看__________的个数是有限个还是无限个.2.转化思想的应用对一个具体问题,可以将其几何化,如建立坐标系将试验结果和点对应,然后利用几何概型概率公式.(1)一般地,一个连续变量可建立与_____有关的几何概型,只需把这个变量放在坐标轴上即可;(2)若一个随机事件需要用两个变量来描述,则可用这两个变量的有序实数对来表示它的基本事件,然后利用平面直角坐标系就能顺利地建立与______有关的几何概型;(3)若一个随机事件需要用三个连续变量来描述,则可用这三个变量组成的有序数组来表示基本事件,利用空间直角坐标系建立与_______有关的几何概型.[失误与防范]1.准确把握几何概型的“测度”是解题关键;2.几何概型中,线段的端点、图形的边框是否包含在事件之内_________所求结果.12.4离散型随机变量及其分布列1.离散型随机变量的分布列(1)将随机现象中试验(或观测)的每一个可能的结果都对应于________,这种_______称为一个随机变量.(2)离散型随机变量:随机变量的取值能够______________,这样的随机变量称为离散型随机变量.(3)设离散型随机变量X的取值为a1,a2,…随机变量X取a i的概率为p i(i=1,2,…),记作:_____________ (i=1,2,…),或把上式列表:称为离散型随机变量X(4)性质:①p i___0,i=1,2,…;②p1+p2+…=___.2.超几何分布一般地,设有N件产品,其中有M(M≤N)件次品.从中任取n(n≤N)件产品,用X表示取出的n件产品中次品的件数,那么P(X=k)=______________ (其中k为非负整数).如果一个随机变量的分布列由上式确定,则称X服从参数为N,M,n的超几何分布.[方法与技巧]1.对于随机变量X的研究,需要了解随机变量能取哪些值以及取这些值或取某一个集合内的值的概率,对于离散型随机变量,它的分布正是指出了随机变量X的______以及取这些值的______.2.求离散型随机变量的分布列,首先要根据具体情况确定X的取值情况,然后利用排列、组合与概率知识求出X取各个值的概率.[失误与防范]掌握离散型随机变量的分布列,须注意:(1)分布列的结构为两行,第一行为随机变量X所有可能取得的值;第二行是对应于随机变量X的值的事件发生的概率.看每一列,实际上是上为“事件”,下为“事件发生的概率”,只不过“事件”是用一个反映其结果的实数表示的.每完成一列,就相当于求一个随机事件发生的概率.(2)要会根据分布列的两个性质来检验求得的分布列的正误.12.5二项分布及其应用1.条件概率在已知B发生的条件下,事件A发生的概率叫作B发生时A发生的___________,用符号P(A|B)来表示,其公式为P(A|B)=__________ (P(B)>0).2.相互独立事件(1)一般地,对两个事件A,B,如果有________________,则称A、B相互独立.(2)如果A、B相互独立,则_________________________________也相互独立.(3)如果A1,A2,…,A n相互独立,则有:P(A1A2…A n)=_________________________.3.二项分布进行n次试验,如果满足以下条件:(1)每次试验只有两个相互对立的结果,可以分别称为“成功”和“失败”;(2)每次试验“成功”的概率均为p,“失败”的概率均为1-p;(3)各次试验是___________.用X表示这n次试验中成功的次数,则P(X=k)=_____________ (k=0,1,2,…,n)若一个随机变量X的分布列如上所述,称X服从参数为n,p的二项分布,简记为X~B(n,p).[方法与技巧]1.古典概型中,A发生的条件下B发生的条件概率公式为P(B|A)=____=_____,其中,在实际应用中P(B|A)=n(AB)n(A)是一种重要的求条件概率的方法.2.相互独立事件与互斥事件的区别相互独立事件是指两个事件发生的概率互不影响,计算式为____________.互斥事件是指在同一试验中,两个事件不会同时发生,计算公式为_______________.3.n次独立重复试验中,事件A恰好发生k次可看作是____个互斥事件的和,其中每一个事件都可看作是__个A事件与____个A事件同时发生,只是发生的次序不同,其发生的概率都是_________.因此n次独立重复试验中事件A恰好发生k次的概率为C k n p k(1-p)n-k. [失误与防范]1.运用公式P(AB)=P(A)P(B)时一定要注意公式成立的条件,只有当事件A、B相互独立时,公式才成立.2.独立重复试验中,每一次试验只有两种结果,即某事件要么发生,要么不发生,并且任何一次试验中某事件发生的概率相等.注意“恰好”与“至多(少)”的关系,灵活运用对立事件.12.6离散型随机变量的均值与方差,正态分布1.离散型随机变量的均值与方差若离散型随机变量X的分布列为P(X=a i)=p i(i=1,2,…r).(1)均值EX=________________________,EX刻画的是_____________________(2)方差DX=_______________为随机变量X的方差,它刻画了随机变量X与其均值EX的____________________2.二项分布的均值、方差若X~B(n,p),则EX=_____________,DX=______________3.正态分布(1)X~N(μ,σ2),表示X服从参数为__________的正态分布.(2)正态分布密度函数的性质:①函数图像关于___________对称;②_________________决定函数图像的“胖”“瘦”;③P(μ-σ<X<μ+σ)=__________;P(μ-2σ<X<μ+2σ)=__________;P(μ-3σ<X<μ+3σ)=__________[方法与技巧]1.均值与方差的性质(1)E(aX+b)=__________,D(aX+b)=_______(a,b为常数).(2)若X服从两点分布,则EX=___,DX=_______.(3)若X服从二项分布,即X~B(n,p),则EX=_____,DX=________.2.求离散型随机变量的均值与方差的基本方法(1)已知随机变量的分布列求它的均值、方差,按定义求解.(2)已知随机变量X的均值、方差,求X的线性函数Y=aX+b的均值、方差,可直接用X 的均值、方差的性质求解.(3)如果所给随机变量是服从常用的分布(如两点分布、二项分布等),利用它们的均值、方差公式求解.3.若X服从正态分布,即X~N(μ,σ2),要充分利用正态曲线的对称性和曲线与x轴之间的面积为____.[失误与防范]1.在没有准确判断分布列模型之前不能随便套用公式.2.对于应用问题,必须对实际问题进行具体分析,一般要将问题中的随机变量设出来,再进行分析,求出随机变量的分布列,然后按定义计算出随机变量的均值、方差.计数,概率,统计与分布列知识梳理答案10.1分类加法计数原理与分步乘法计数原理1. N=m1+m2+…+m n 2 .N=m1×m2×…×m n10.2排列与组合1. 一定的顺序2.(1) 所有排列(2) 所有组合3. (1) n(n-1)(n-2)…(n-m+1) ,n!(n-m)!(2) A m nA m m,n(n-1)(n-2)…(n-m+1)m!,n!m!(n-m)!(3) 1 , n!(4) C n-mn , C m n+C m-1n10.3二项式定理1.C0n a n+C1n a n-1b+…+C r n a n-r b r+…+C n n b n, r+12. (1) C r n=C n-rn .(2)中间项,n2+1 ,2Cnn,n+12, n+32,12Cnn-,12Cnn+.(3)2n 2n-1.【知识拓展】(1) n+1. (3) 降幂, 升幂(4) C0n, C n n.11.1随机抽样1.(1) 调查或观测, 推断(2) 全体, 一部分(3)①迅速、及时;2.(1) 相同.(2) 抽签法和随机数法.4. 等距,简单随机抽样, 分组的间隔11.2统计图表,用样本估计总体1.表达, 分析, 条形统计图、扇形统计图、折线统计图、茎叶图2.(1) 最多, 最中间, 1n(x1+x2+…+x n).(2)1n[(x1-x)2+(x2-x)2+…+(x n-x)2],, 样本容量, 平均数, 平方, 样本容量接近总体容量3.(1) 样本的频率分布估计总体的频率分布, 样本的数字特征估计总体的数字特征.(2) 频率组距, 各小长方形的面积, 1 (3)中点, 顶端中点(4) 可以随时记录11.3变量间的相关关系,统计案例1.(1)散点图.(2)曲线拟合.(3)线性相关, 非线性相关, 不相关的.3.(1) 相关关系(2) (x,y) (3)②正相关, 负相关, 线性不相关, 越高12.1随机事件的概率1.(1)必然事件(2)不可能事件(3)必然事件与不可能事件(4)在条件S下可能发生也可能不发生(5)确定事件和随机事件2.稳定性, 这个常数3.不能同时, 至少有一个发生,同时, 一定有一个4.(1)0≤P(A)≤1. (2)1. (3)0. (4)①P(A)+P(B).②1-P(A).[方法与技巧]1. 概率P(A)2. 空集, 补集[失误与防范]1.必要不充分12.2古典概型1.(1)互斥(2)基本事件2.(1)只有有限个,(2)相同3.m n.[失误与防范]2.P(A)+P(B)-P(AB) 12.3几何概型1.G1的面积G的面积2.体积,长度3.模拟方法[方法与技巧]。
高中数学必修3(人教B版)第二章统计2.2知识点总结含同步练习题及答案
![高中数学必修3(人教B版)第二章统计2.2知识点总结含同步练习题及答案](https://img.taocdn.com/s3/m/93d63d83a0116c175f0e481f.png)
4. 某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方 图,其中产品净重的范围是 [96, 106] ,样本数据分组为 [96, 98) , [98, 100) , [100, 102) ,
[102, 104) , [104, 106] ,已知样本中产品净重小于 100 克的个数是 36 ,则样本中净重大于或等于 98 克
并且小于 104 克的产品的个数是 (
).
A.90
答案: A 解析: 产品净重小于
B.75
C.60
D.45
100 克的概率为 (0.050 + 0.100) × 2 = 0.300 , 已知样本中产品净重小于 100 克的个数是 36 ,设样本容量为 n , 36 则 ,所以 n = 120 ,净重大于或等于 98 克并且小于 n 104 克的产品的概率为 (0.100 + 0.150 + 0.125) × 2 = 0.75 ,所以样本 中净重大于或等于 98 克并且小于 104 克的产品的个数是 120 × 0.75 = 90 .
).
A.2, 5
答案: C
B.5, 5
C.5, 8
D.8, 8
3. 样本中共有五个个体,其值分别为 a, 0, 1, 2, 3 ,若该样本的平均值为 1 ,则样本方差为 (
− − 6 A.√ 5
答案: D 解析:
)
B.
6 5
C.√2
D.2
a+0+1+2+3 = 1 ,得 a = −1 . 5 1 所以 s2 = [(−1 − 1)2 + (0 − 1)2 + (1 − 1)2 + (2 − 1)2 + (3 − 1)2 ] = 2 . 5
(易错题)高中数学必修三第一章《统计》测试(含答案解析)(2)
![(易错题)高中数学必修三第一章《统计》测试(含答案解析)(2)](https://img.taocdn.com/s3/m/2cf2cd3276eeaeaad1f330f5.png)
一、选择题1.工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为=50+80x,下列判断不正确的是()A.劳动生产率为1000元时,工资约为130元B.工人月工资与劳动者生产率具有正相关关系C.劳动生产率提高1000元时,则工资约提高130元D.当月工资为210元时,劳动生产率约为2000元2.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C.D.3.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8,,那么这组数据的方差2s 可能的最大值是()A.185B.18 C.36 D.64.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是()A.24 B.48 C.56 D.645.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则5个剩余分数的方差为( )A.1167B.365C.36 D.6756.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为()A.15.5 B.15.6 C.15.7 D.167.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25 C.20 D.158.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755的人数为()A.10 B.11C.12 D.139.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是()A.90.5 B.91.5 C.90 D.9110.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位11.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小;③第三季度空气质量指数相比去年同期变化幅度的方差最小;④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.16.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.已知由样本数据集合(){}11,1,2,3,...,x y i n =,求得的回归直线方程为1.2308ˆ.0y x =+,且ˆ4x =,若去掉两个数据点 (4.1,5.7)和(3.9,4.3)后重新求得的回归直线方程l 的斜率估计值为1.2,则此回归直线l 的方程为_______.19.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________. 20.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表: X 10 11.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x10 11 13 12 8 6 某植物糖积累202430281815指数/y GI下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y关于x的线性回归方程ˆˆˆy bx a=+(2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆy bx a=+的斜率和截距的最小二乘估计()()()211ˆˆˆ,i iininix x y yb a y bxx x==--==--∑∑22.某学校进行体验,现得到所有男生的身高数据,从中随机抽取50人进行统计(已知这50个身高介于155cm到195cm之间),现将抽取结果按如下方式分成八组:第一组[155,160),第二组[160,165),...,第八组[190,195],并按此分组绘制如图所示的频率分布直方图,其中第六组[180,185)和第七组[185,190)还没有绘制完成,已知第一组与第八组人数相同,第六组和第七组人数的比为5:2.(1)补全频率分布直方图;(2)根据频率分布直方图估计这50位男生身高的中位数;(3)用分层抽样的方法在身高为[170,180]内抽取一个容量为5的样本,从样本中任意抽取2位男生,求这两位男生身高都在[175,180]内的概率.23.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下:分组频数频率[50,60)180.30[60,70)240.40[70,80) 9 0.15 [80,90) 6 0.10 [90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.24.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格. 平均温度C i x ︒ 21 23 25 27 29 31 平均产卵数i y 个711212264115(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下: 每次虫害减产损失(元/公顷)10001400用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x y y =--=∑,6214126ii x==∑,61240i i y==∑,()6218816i i y y=-=∑,8.4≈786≈.25.某玻璃工艺品加工厂有2条生产线用于生产其款产品,每条生产线一天能生产200件该产品,该产品市场评级规定:评分在10分及以上的为A 等品,低于10分的为B 等品.厂家将A 等品售价定为2000元/件,B 等品售价定为1200元/件. 下面是检验员在现有生产线上随机抽取的16件产品的评分:经计算得16119.9716i i x x ===∑,()1616222211110.0451616i i i i s x x x x ===-=-=∑∑,其中i x 为抽取的第i 件产品的评分,1,2,,16i =⋅⋅⋅.该厂计划通过增加生产工序来改进生产工艺,已知对一条生产线增加生产工序每年需花费1500万元,改进后该条生产线产能不变,但生产出的每件产品评分均提高0.05.已知该厂现有一笔1500万元的资金.(1)若厂家用这1500万元改进一条生产线,根据随机抽取的16件产品的评分. (i )估计改进后该生产线生产的产品中A 等品所占的比例; (ii )估计改进后该厂生产的所有产品评分的平均数和方差.(2)某金融机构向该厂推销一款年收益率为8.2%的理财产品,请你利用所学知识分析,将这1500万元用于购买该款理财产品所获得的收益,与通过改进一条生产线使产品评分提高所增加的收益相对比,一年后哪种方案的收益更大? (一年按365天计算) 26.某企业广告费支出与销售额(单位:百万元)数据如表所示:销售额y50 40 70 30 60(1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个,[30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.4.B解析:B 【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3,所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.5.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差.【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x +++++= 得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B【点睛】 本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.6.B解析:B【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯= 故选B【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错 7.C解析:C【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.8.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19,由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25,∴做问卷C 的人数为25﹣14+1=12,故选C .【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.A解析:A【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可.【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题. 10.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 11.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案
![高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案](https://img.taocdn.com/s3/m/6e4fe504bb68a98271fefac7.png)
⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N
.
常用的简单随机抽样方法有抽签法和随机数表法.
(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)
![(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)](https://img.taocdn.com/s3/m/0c97536b6c85ec3a86c2c508.png)
三、
⑥控制图
总体特征的估计
中心线——y=μ 上界线——y=μ+3σ 下界线——y=μ-3σ
1、特征数:总体平均数 μ
总体方差 2 总体标准差
样本平均数 x
样本方差 s2 或 s*2
样本标准差
s 或 s*
1 2、有关公式:样本平均数 : x = (x1+x2 +...+xn)
n
样本方差
1 : s2 或 s*2 s 2= n [(x1- x )2+(x2+ x )2+...+(xn- x )2]
样本,则抽取的 m 个个体中带有标记的个数估计为( )
m
A. N·
M
M
B. m·
N
M
C. N·
D. N
m
8.从 60 件产品中抽取 10 件进行检查,写出抽取样本的过程.
9.某车间工人已加工一种轴 100 件,为了了解这种轴的直径,要从中抽出 10 件在同一条件 下测量(轴的直径要求为 20 mm±0.5 mm),如何采用简单随机抽样法抽取上述样本?
当总体由差异 明显的几部分 组成时,常将 总体分成几部 分,然后按照 各部分所占的 比进行抽样, 这样的抽样叫 ∽。其中分成 的各部分叫做 层。
各自
要点
从总 体中 逐个 抽取
总体 均分 成几 部分 按事 先确 定的 规则 在各 部分 抽取 将总 体分 成几 层, 分层 进行 抽取
方法步骤
1、 抽签法: ①编②放③抽
必修三统计知识点
一、
类 别 内 容 名 称
简 单 随 机 抽 样
系 统 抽 样
分 层 抽 样
抽样方法
定义
高一数学必修三之统计
![高一数学必修三之统计](https://img.taocdn.com/s3/m/02ad674df18583d0496459f3.png)
高一数学必修三之统计1、名工人某天生产同一零件,生产的件数是设其平均数为,中位数为,众数为,则有( )A、B、C、D、2、某同学使用计算器求个数据的平均数时,错将其中一个数据输入为,那么由此求出的平均数与实际平均数的差是( ) A、B、C、D、3、要从已编号()的枚最新研制的某型导弹中随机抽取枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是()A、B、C、D、4、容量为的样本数据,按从小到大的顺序分为组,如下表:组号12345678频数1013x141513129第三组的频数和频率分别是 ( )A、和B、和C、和D、和5、一个容量为的样本数据分组后组数与频数如下:[25,25、3),6;[25、3,25、6),4;[25、6,25、9),10;[25、9,26、2),8;[26、2,26、5),8;[26、5,26、8),4;则样本在[25,25、9)上的频率为()A、B、C、D、6、某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样的方法抽一个容量为7的样本,其中30岁以上的员工应抽多少( )A、2人B、4人C、5人D、1人7、把21化为二进制数,则此数为( )A、10011(2)B、10110(2)C、10101(2)D、11001(2)8、在抽取产品的尺寸过程中,将其尺寸分成若干组,是其中一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h,则 ( )A、hmB、C、D、h+m9、现有辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在的汽车大约有()、辆、辆、辆、80辆10、图1是某县参加xx年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为(如表示身高(单位:cm)在内的学生人数)、图2是统计图1中身高在一定范围内学生人数的一个算法流程图、现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是()A、B、C、D、二:填空题11、经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的同学当中有5位“喜欢”摄影的同学、位“不喜欢”摄影的同学和位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多人。
(典型题)高中数学必修三第一章《统计》测试(答案解析)
![(典型题)高中数学必修三第一章《统计》测试(答案解析)](https://img.taocdn.com/s3/m/1440d4a2a8956bec0875e39f.png)
一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2019年1~4月的业务量同比增长率超过50%,在3月最高C.从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.已知x ,y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.137.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .508.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 9.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元10.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤ 12.根据如下样本数据 x 3 4 5 6 7 8 y﹣4.0﹣2.50.5﹣0.52.03.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 14.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人.15.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.16.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.17.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 18.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 19.一组样本数据按从小到大的顺序排列为:1-,0,4,x ,y ,14,已知这组数据的平均数与中位数均为5,则其方差为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:(1)根据所给的5组数据,求出关于的线性回归方程ˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推)(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i i x ==∑.24.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格.(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下:用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700i i i x xy y =--=∑,6214126i i x ==∑,61240i i y ==∑,()6218816i i y y=-=∑,8.4≈786≈.25.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N (μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,下面是样本的尺寸x i (i =1,2,3,…,10,单位:mm ):用样本的平均数x 作为μ的估计值,用样本的标准差s 作为σ的估计值.(1)按照技术标准的要求,若样本尺寸均在(μ﹣3σ,μ+3σ)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了两种销售方案(假设每种方案对销售量没有影响):方案1:每个零件均按70元定价销售;方案2:若零件的实际尺寸在(99.7,100.3)范围内,则该零件为A 级零件,每个零件定价100元,否则为B 级零件,每个零件定价60元. 哪种销售方案的利润更大?请根据数据计算说明.附:1021ii x =∑≈100601.8,样本方差()22221111n n i i i i s x x x nx n n ==⎛⎫=-=- ⎪⎝⎭∑∑.若X ~N (μ,σ2),则P (μ﹣σ<X <μ+σ)=0.6827,P (μ﹣2σ<X <μ+2σ)=0.9545 26.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni i i i x x y y x y nxybay bx x x x nx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可. 【详解】对于选项A : 2018年1~4月的业务量,3月最高,2月最低, 差值为439724111986-=,接近2000万件,所以A 是正确的;对于选项B : 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B 是正确的;对于选项C :2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C 是正确的;对于选项D ,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D 错误. 本题选择D 选项. 【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.7.B解析:B分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .8.D解析:D 【详解】解:对于A ,由图象可知当速度大于40km /h 时,乙车的燃油效率大于5km /L , ∴当速度大于40km /h 时,消耗1升汽油,乙车的行驶距离大于5km ,故A 错误; 对于B ,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B 错误; 对于C ,由图象可知当速度为80km /h 时,甲车的燃油效率为10km /L ,即甲车行驶10km 时,耗油1升,故行驶1小时,路程为80km ,燃油为8升,故C 错误; 对于D ,由图象可知当速度小于80km /h 时,丙车的燃油效率大于乙车的燃油效率, ∴用丙车比用乙车更省油,故D 正确 故选D .考点:1、数学建模能力;2、阅读能力及化归思想.9.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=,【点睛】本题考查了线性回归方程的求法与应用,属于基础题.10.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】 根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.11.B解析:B 【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择. 详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =x d 或y =p +q ln x 较适宜,故选B . 点睛:本题考查散点图以及函数图像,考查识别能力.12.D解析:D 【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb=2317.5=4635>0, ∴ˆa=﹣0.25﹣4635•5.5<0, 故选:D .点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.14.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.15.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数解析:83【解析】 【分析】先求出这9个数据的平均数为5,此时这9个数据的方差为()22183559S ⎡⎤=⨯+-⎣⎦,由此求出结果 【详解】某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为85559⨯+= ∴此时这9个数据的方差为()2218835593S ⎡⎤=⨯+-=⎣⎦故答案为83【点睛】本题主要考查了平均数和方差的计算公式,属于基础题。
(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
![(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)](https://img.taocdn.com/s3/m/08d25bf052d380eb63946d9f.png)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39 B .42C .45D .507.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64 B .96C .144D .1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 14.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________15.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.16.已知一组数据为2,3,4,5,6,则这组数据的方差为______.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X 1011.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: 年份 2014 2015 20162017 2018 2019 编号x 1 2 3 4 5 6 数量y (辆)4196116190218275(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.23.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书APP 抽样调查了非一线城市M 和一线城市N 各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下22⨯列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户 不活跃用户 合计城市M 城市N 合计(2)以频率估计概率,从城市M 中任选2名用户,从城市N 中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望.(3)该读书APP 还统计了2018年4个季度的用户使用时长y (单位:百万小时),发现y 与季度(x )线性相关,得到回归直线为ˆ4ˆyx a =+,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(5x =)该读书APP 用户使用时长约为多少百万小时. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.025 0.010 0.005 0.001 0k5.0246.6357.87910.82824.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:s =(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b cd =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.A解析:A 【解析】利用茎叶图、平均数的性质直接求解. 【详解】由一组数据的茎叶图得: 该组数据的平均数为:1(7581858995)855++++=. 故选:A . 【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x=5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.14.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.15.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.16.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2 【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1 【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果. 详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.56.15=,5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.76.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1.点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n =-+-++-,标准差s =18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280 【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 23.(1)见解析;(2)见解析;(3) 22.3百万小时 【分析】(1)根据频率分布直方图求数据填入对应表格,再根据卡方公式求2K ,最后对照数据作判断,(2)先确定随机变量取法,再判断从M 城市中任选的2名用户中活跃用户数服从二项分布,从N 城市中任选的1名用户中活跃用户数服从两点分布,进而求得对应概率,列表得分布列,最后根据数学期望公式得期望,(3)先求均值,解得ˆa,再估计5x =对应函数值. 【详解】(1)由已知可得以下22⨯列联表:计算()2220060208040200K 9.5247.8791001001406021⨯⨯-⨯==≈>⨯⨯⨯ , 所以有99.5%的把握认为用户是否活跃与所在城市有关. (2)由统计数据可知,城市M 中活跃用户占35,城市N 中活跃用户占45, 设从M 城市中任选的2名用户中活跃用户数为X ,则3~2,5X B ⎛⎫ ⎪⎝⎭设从N 城市中任选的1名用户中活跃用户数为Y ,则Y 服从两点分布,其中()415P Y ==. 故0,1,2,3ξ=,()()()20221400055125P P X P Y C ξ⎛⎫===⋅==⋅=⎪⎝⎭; ()()()()()2012224321*********555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅+⋅⋅⋅=⎪⎝⎭;()()()()()2122223431572112055555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅⋅+⋅⋅=⎪⎝⎭;()()()222343632155125P P X P Y C ξ⎛⎫===⋅==⋅= ⎪⎝⎭. 故所求ξ的分布列为()428573601232125125125125E ξ=⨯+⨯+⨯+⨯=. (3)由已知可得 2.5x =,又12.3y =,可得12.34ˆ2.5a=⨯+,所以ˆ 2.3a =,所以4 2.3ˆy x =+. 以5x =代入可得ˆ22.3y=(百万小时), 即2019年第一季度该读书APP 用户使用时长约为22.3百万小时. 【点睛】本题考查频率分布直方图、回归直线方程以及分布列和数学期望,考查基本分析求解能力,属中档题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为53)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
完整版高一数学必修三《统计》知识点练习答案
![完整版高一数学必修三《统计》知识点练习答案](https://img.taocdn.com/s3/m/c580d61c9b89680202d82511.png)
必修三统计知识点一、抽样方法内各自共合用互相容定方法步同重点点范系名称通逐个抽取从的方法从中抽体中取一个本,逐个且每次抽取抽取随各个个体被抽机取的概率相抽等,的抽称∽将体分成均体衡的几个部均分分,此后依据成几先定出的部分,从每个部按事系分抽去一个先确本,的抽定的抽叫∽在各部分抽取当体由差异将明的几部分体分成,常将成几体分成几部,分分,此后依据分各部分所占的行抽比行抽,抽取的抽叫∽。
此中分成的各部分叫做。
1、抽法:①均体① ②放③抽属于的个2、随机数表法:不放体数① 号② 数③ 数回抽少。
②抽程中每个① 号个体体在② 分段(确立分段隔k=N被抽中的体均或k=N n取的个体分后)概率数的每相等n多一部③ 确立初步号分抽④ 按定抽取本(假如等距抽,初步号1,分采用段隔 k,抽取的本号依次 1 , 1+k , 1+2k,随机1+3k ,⋯ ,1+(n-1)k )抽① 算各抽取的个体数体各② 用随机抽或系抽由差抽异明采的用几部随分机抽成或系抽二、统计初步有关看法和公式:1、频数——落在各个小组的数据的个数叫~。
2、频率——每一个小组频数与数据的比值叫做这一组的~。
3、整体——所要观察对象的全体叫做~。
4、个体——每一个观察对象~。
5、样本——从整体中所抽取的一部分个体叫做整体的一个样本。
6、样本容量——样本中个体的数量叫做~。
7、众数——在一组数据中,出现次数最多的数据叫做这组数据的众数。
8、中位数——将一组数据按从小到大摆列,把处在最中间地点的一个数据(或最中间两个数据的均匀数)叫做这组数据的中位数。
9、整体分布——整体取值的概率分布规律平时称为~。
10、连续型整体——能够在实数区间取值的整体叫~。
11、积累频率——样本数据小于某一数值的频率,叫做~。
计算最大值与最小值的差决定组距与数据列法决定分点列表12、频率分布表试验结果频数频率表的行式分组个数累计频数频率积累频率(有时可省略)(有时可省略)横轴——实验结果纵轴频率条形图用高度表示各取值的频率合用于个体取不同样值较少横轴——产品尺寸纵轴——频率 /组距13、直方图用图形面积的大小表示在各个区间内取值的概率合用于个体在区间内取值横轴——产品尺寸积累频率分布图纵轴——累计频率反响一组数据的分布状况14、整体分布曲线——当样本容量无量增大、分组的组距无缩限小时、频率分布直方图就会无量趋近于一条圆滑曲线 ,这条曲线叫整体密度曲线。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
必修三统计知识点类别内容名称定义各自要点方法步骤共同点适用范围相互联系简单随机抽样通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽取的概率相等,这样的抽样称为∽从总体中逐个抽取1、抽签法:①编②放③抽2、随机数表法:①编号②选数③读数①均属于不放回抽样。
②抽样过程中每个个体被抽取的概率相等总体的个体数较少系统抽样将总体分成均衡的几个部分,然后按照预先定出的规则,从每个部分抽去一个样本,这样的抽样叫∽总体均分成几部分按事先确定的规则在各部分抽取①编号②分段(确定分段间隔k=或k=)③确定起始号④按预定规则抽取样本(若是等距抽样,起始号为1,分段间隔为k,则抽取的样本编号依次为1,1+k,1+2k,1+3k,…,1+(n-1)k)总体中的个体数较多在总体均分后的每一部分抽样时采用简单随机抽样分层抽样当总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这样的抽样叫∽。
其中分成的各部分叫做层。
将总体分成几层,分层进行抽取①计算各层抽取的个体数②用简单随机抽样或系统抽样总体由差异明显的几部分组成各层抽样时采用简单随机抽样或系统抽样二、统计初步有关概念和公式:1、频数——落在各个小组的数据的个数叫~。
2、频率——每一个小组频数与数据的比值叫做这一组的~。
3、总体——所要考察对象的全体叫做~。
4、个体——每一个考察对象~。
5、样本——从总体中所抽取的一部分个体叫做总体的一个样本。
6、样本容量——样本中个体的数目叫做~。
7、众数——在一组数据中,出现次数最多的数据叫做这组数据的众数。
8、中位数——将一组数据按从小到大排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
9、总体分布——总体取值的概率分布规律通常称为~。
10、连续型总体——可以在实数区间取值的总体叫~。
11、累积频率——样本数据小于某一数值的频率,叫做~。
计算最大值与最小值的差决定组距与数据列法决定分点列表12、频率分布表表的行式横轴——实验结果纵轴频率条形图用高度表示各取值的频率适用于个体取不同值较少横轴——产品尺寸纵轴——频率/组距13、直方图用图形面积的大小表示在各个区间内取值的概率适用于个体在区间内取值横轴——产品尺寸累积频率分布图纵轴——累计频率反映一组数据的分布情况14、总体分布曲线——当样本容量无限增大、分组的组距无缩限小时、频率分布直方图就会无限趋近于一条光滑曲线,这条曲线叫总体密度曲线。
以这条曲线为图象的函数叫做总体的概率密度函数。
总体密度函数反映了总体分布,即反映总体在各个范围内取值的概率。
P(a<ξ<b)的值等于直线x=a,x=b与曲线、x轴围成的图形面积。
15、累积分布曲线——当样本容量无限增大、分组的组距无缩限小时,累积频率分布图就会无限趋近于一条光滑曲线,这条曲线叫累积分布曲线。
它反映了总体的累积分布规律,即曲线上任意一点P(a,b)纵坐标b,表示总体取小于a的值的概率。
①正态总体的概率密度函数f(x)=e-,R(其中总体的平均数,总体的标准差,N(μ,σ2)—正态总体,有时记作N(μ,σ2)1)曲线在轴上方,并且关于直线x=对称:②正态曲线的性质 2)曲线在x=μ时处于最高点,由这一点向左、右两边延伸时,曲线逐渐下降:3)曲线的对称轴位置由μ确定:直线的形状由σ确定,σ越大,曲线的形状越“矮胖”反过来曲线越“高瘦”③正态曲线在几个区间上的取值:区间取值概率(μ-σ,μ+σ)68.3%(μ-2σ,μ+2σ)95.44%(μ-3σ,μ+3σ)99.7% 16、质控图④小概率事件——通常指发生的概率小于5%的事件。
注意小概率事件几乎不可能发生是相对于“一次试验”来说的。
1)提出统计假设,例如统计假设的变量服从正态分布;⑤假设检验的基本思想 2)确定一次试验中的取值a是否落入范围(μ-3σ,μ+3σ);3)作出判断:如果a(μ-3σ,μ+3σ)接受统计假设,如果a(μ-3σ,μ+3σ),由于是小概率事件,就拒绝统计假设。
横轴——时间纵轴——零件尺寸⑥控制图中心线——y=μ上界线——y=μ+3σy=μ-3σ三、总体特征的估计1、特征数:总体平均数μ样本平均数总体方差2样本方差 s2或s*2总体标准差样本标准差 s或s*2、有关公式:样本平均数:=(x1+x2 +...+xn)样本方差: s2或s*2 s 2=[(x1-)2+(x2+)2+...+(x n-)2]样本标准差:s*2=[(x1-)2+(x2+)2+...+(x n-)2简单随机抽样1.现从80件产品中随机抽出20件进行质量检验,下列说法正确的是()A. 80件产品是总体B. 20件产品是样本C. 样本容量是80D. 样本容量是202.对于简单随机抽样,每个个体每次被抽到的机会都()A. 相等B. 不相等C. 无法确定D. 没关系3.下列抽样方法是简单随机抽样的是()A. 在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位是2 709的为三等奖B. 某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格C. 某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D. 从10件产品选取3件进行质量检验4. (2010·抚顺高一检测)某学校为了解高一800名新入学同学的数学学习水平,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是( )A. 800名同学是总体B. 100名同学是样本C. 每名同学是个体D. 样本容量是1005.为了了解某班学生会考的合格率,要从该班60名同学中抽取20人进行考查分析,则这次考查中的总体容量是,样本容量是.6. (2010·淮北高一质检)一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为8的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11列开始,向右读取,直到取足样本,则抽取样本的号码是.95 33 95 22 00 18 74 72 00 18 38 79 5869 32 81 76 80 26 92 82 80 84 25 39 9084 60 79 80 24 36 59 87 38 82 07 53 8935 96 35 23 79 18 05 98 90 07 35 46 4062 98 80 54 97 20 56 95 15 74 80 08 3216 46 70 50 80 67 72 16 42 79 20 31 8903 43 38 46 82 68 72 32 14 82 99 70 8060 47 18 97 63 49 30 21 30 71 59 73 0550 08 22 23 71 77 91 01 93 20 49 82 9659 26 94 66 39 67 98 607.某总体容量为M,其中带有标记的有N个,现用简单随机抽样方法从中抽出一个容量为m 的样本,则抽取的m个个体中带有标记的个数估计为( )A. N·B. m·C. N·D. N8.从60件产品中抽取10件进行检查,写出抽取样本的过程.9.某车间工人已加工一种轴100件,为了了解这种轴的直径,要从中抽出10件在同一条件下测量(轴的直径要求为20 mm±0.5 mm),如何采用简单随机抽样法抽取上述样本?10.现有一批零件,其编号为600,601,…,999.利用原有的编号从中抽取一个容量为10的样本进行质量检查.若用随机数法,怎样设计方案?11.(创新题)第九届Channel[V]全球华语榜中榜在上海举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机挑选10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.12. (2010·洛阳高一综测)上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法:选法一将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;选法二将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.试问:这两种选法是否都是抽签法?为什么?这两种选法有何异同?答案1. D2.A3.D4. D5. 60 206. 18,00,38,58,32,26,25,397. A8.解析:第一步,将60件产品编号01,02, (60)第二步,在随机数表中任取一数作为开始,如从第一行第一列03开始;第三步,从03开始向右读,依次选出03,47,43,36,46,33,26,16,45,60共10个对应编号的产品当作样本.9. 解析:100件轴的直径为总体,将这100件轴编号00,01,02,…,99,利用随机数法来抽取.10.解析:第一步,在随机数表中任选一数字作为开始数字,任选一方向作为读数方向.比如,选第7行第6个数“7”,向右读;第二步,从“7”开始向右每次读取三位,凡在600~999中的数保留,否则跳过去不读,依次得753,724,688,770,721,763,676,630,785,916;第三步,以上号码对应的10个零件就是要抽取的对象.11.解析:第一步,先确定艺人:(1)将30名内地艺人从01到30编号,然后用相同的纸条做成30个号签,在每个号签上分别写上编号,然后放入一个小筒中搅匀,从中抽出10个号签,则相应编号的艺人参加演出;(2)运用相同的办法分别从18名香港艺人中抽取6人,从10名台湾艺人中抽取4人.第二步,确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面分别写上1到20这20个数字,代表演出顺序,让每个演员抽一张,各人抽到的号签上的数字就是这位演员的演出顺序,再汇总即可.12.解析:选法一满足抽签法的特征,是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的可能性都相等,均为.。