随机抽样用样本估计总体正态分布

合集下载

抽样分布与参数估计

抽样分布与参数估计

抽样分布与参数估计首先,我们来了解什么是抽样分布。

在统计学中,抽样分布是指从总体中多次抽样得到的样本统计量的分布。

假设我们的总体是指所有感兴趣的个体的集合,而样本是从总体中选取的一部分个体。

抽样分布的形状和性质取决于总体的分布和样本的大小。

通过分析抽样分布,可以得到有关总体参数的有用信息。

例如,我们想要知道一些城市成年人的平均年收入。

在实际情况下,我们无法调查每个人的收入情况,因此我们需要从总体中随机抽取一部分个体作为样本,并计算他们的平均年收入。

如果我们多次从总体中抽取样本并计算平均年收入,然后绘制这些平均值的分布图,我们就可以得到平均年收入的抽样分布。

这个抽样分布将给我们提供有关总体平均年收入的估计和推断。

接下来,我们将讨论参数估计。

参数估计是指使用样本数据来估计总体参数的过程。

总体参数是用于描述总体特征的数值,如总体平均值、总体标准差等。

通过从总体中抽取样本,并计算样本统计量,我们可以利用样本统计量来估计总体参数。

常用的参数估计方法有点估计和区间估计。

点估计是指用单个数值来估计总体参数,例如用样本均值来估计总体均值。

点估计给出了一个单一的值,但不能提供关于估计的精度的信息。

因此,我们常常使用区间估计。

区间估计是指给出一个区间,这个区间内有一定的置信水平使得总体参数落在这个区间内的概率最高。

区间估计能够向我们提供关于估计的精确程度的信息。

区间估计依赖于抽样分布的性质。

中心极限定理是制定抽样分布理论的一个重要原则。

根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将近似于正态分布。

这使得我们可以使用正态分布的性质来计算置信区间。

构建置信区间的一种常用方法是使用样本均值的标准误差。

标准误差是样本均值的标准差,它用来衡量样本均值和总体均值之间的误差。

根据正态分布的性质,当样本容量足够大时,样本均值与总体均值之间的误差可以用标准误差来估计。

通过计算标准误差并结合正态分布的性质,我们可以得到样本均值的置信区间。

抽样方法、正态分布

抽样方法、正态分布

抽样方法、正态分布本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March抽样方法、正态分布重点、难点讲解:1.抽样的三种方法:简单随机抽样、系统抽样、分层抽样。

后两种方法是建立在第一种方法基础上的。

2.了解如何用样本估计总体: 用样本估计总体的主要方法是用样本的频率分布来估计总体分布,主要有总体中的个体取不同数值很少和较多甚至无限两种情况。

3.正态曲线及其性质:N(),其正态分布函数:f(x)=, x∈(-∞,+∞)。

把N(0,1)称为标准正态分布,相应的函数表达式:f(x)=, x∈(-∞,+∞)。

正态图象的性质:①曲线在x轴的上方,与x轴不相交。

②曲线关于直线x=μ对称。

③曲线在x=μ时位于最高点。

④当x<μ时,曲线上升;当x>μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。

⑤当μ一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中。

4.一般正态分布与标准正态分布的转化对于标准正态分布,用表示总体取值小于x0的概率,即=p(x<x0),其几何意义是由正态曲线N(0,1),x轴,直线x=x0所围成的面积。

又根据N(0,1)曲线关于y轴的对称性知,,并且标准正态总体在任一区间(a,b)内取值概率。

任一正态总体N(),其取值小于x的概率F(x)=。

5.了解“小概率事件”和假设检验的思想。

知识应用举例:例1.从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样思路分析:因为总体的个数503,样本的容量50,不能整除,故可采用随机抽样的方法从总体中剔除3个个体,使剩下的个体数500能被样本容量50整除,再用系统抽样方法。

解:第一步:将503名学生随机编号1,2,3,……,503第二步:用抽签法或随机数表法,剔除3个个体,剩下500名学生,然后对这500名学生重新编号。

正态分布-学生用卷

正态分布-学生用卷

正态分布一、选择题(本大题共8小题,共40.0分)1.某地市高三理科学生有30000名,在一次调研测试中,数学成绩,已知,若按分层抽样的方式取200份试卷进行成绩分析,则应从120分以上的试卷中抽取A. 5份B. 10份C. 15份D. 20份2.设两个正态分布和曲线如图所示,则有A. B.C. D.3.设随机变量服从正态分布,若,则a的值为A. B. C. 5 D. 34.已知随机变量,且,,则A. B. C. D.5.已知:,且,,则A. B. C. D.6.已知随机变量服从正态分布,则A. 4B. 6C. 8D. 117.设随机变量服从正态分布,则函数不存在零点的概率A. B. C. D.8.某一部件由三个电子元件按如图所示方式连接而成,元件1或元件2正常工作,则部件正常工作:设三个电子元件的使用寿命单位:小时均服从正态分布,若每个元件使用寿命超过1200小时的概率为,且各个元件能否正常工作相互独立,那么该部件的使用寿命超过800小时的概率为A. B. C. D.二、填空题(本大题共5小题,共25.0分)9.随机变量X服从正态分布,,,则的最小值为______.10.若随机变量,则,已知随机变量,则______.11.若随机变量服从正态分布,,,设,且,在平面直角坐标系xOy中,若圆上有四个点到直线的距离为1,则实数c的取值范围是______12.下列说法中错误的有_________________残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高.两个模型中残差平方和越小的模型拟合的效果越好。

设随机变量X服从正态分布,若则根据下表提供的数据,线性回归方程为,那么表中13.某县10000名学生的某次数学考试成绩X服从正态分布,其密度函数曲线如图,则成绩X位于区间的人数大约是______ .,,.三、解答题(本大题共3小题,共36.0分)14.“过大年,吃水饺”是我国不少地方过春节的一大习俗,2018年春节前夕,A市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标.求所抽取的100包速冻水饺该项质量指标值的样本平均数同一组中的数据用该组区间的中点值作代表;由直方图可以认为,速冻水饺的该项质量指标值Z服从正态分布,利用该正态分布,求Z落在内的概率;将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为X,求X的分布列和数学期望.附:计算得所抽查的这100包速冻水饺的质量指标的标准差为;若,则,.15.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民收入也逐年增加.为了更好的制定2019年关于加快提升农民年收入力争早日脱贫的工作计划,该地扶贫办统计了2018年50位农民的年收入并制成如下频率分布直方图:根据频率分布直方图估计50位农民的年平均收入单位:千元同一组数据用该组数据区间的中点值表示;由频率分布直方图可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得;,利用该正态分布,求:在2019年脱贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元?为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每个农民的年收人相互独立,问:这1000位农民中的年收入不少于千元的人数最有可能是多少?附:参考数据与公式,若,则;;;16.第7届世界军人运动会于2019年10月18日至27日在湖北武汉举行,赛期10天,共设置射击、游泳、田径、篮球等27个大项,329个小项,共有来自100多个国家的近万名现役军人同台竞技.前期为迎接军运会顺利召开,武汉市很多单位和部门都开展了丰富多彩的宣传和教育活动,努力让大家更多的了解军运会的相关知识,并倡议大家做文明公民,武汉市体育局为了解广大民众对军运会知识的知晓情况,在全市开展了网上问卷调查,民众参与度极高,现从大批参与者中随机抽取200名幸运参与者,他们得分满分100分数据,统计结果如下:若此次问卷调查得分总体服从正态分布,用样本估计总体,设,分别为这200人得分的平均值和标准差同一组数据用该区间的中点值作为代表,求,的值的值四舍五入取整数,并计算.在的条件下,为感谢大家参与这次活动,市体育局还对参加问卷调查的幸运市民制定如下奖励方案:得分低于的可以获得1次抽奖机会,得分不低于的可获得2次抽奖机会,在一次抽奖中,抽中价值15元的纪念品A的概率为,抽中价值为30元的纪念品B的概率为现有市民张先生参加了此次问卷调查并成为幸运参与者,记Y为他参加活动获得纪念品的总价值,求Y的分布列和数学期望,并估算此次纪念品所需要的总金额.参考数据:;;。

第53讲 抽样方法、用样本估计总体与正态分布

第53讲 抽样方法、用样本估计总体与正态分布

第53讲 抽样方法、用样品估计总体与正态分布【考点解读】1.了解抽样方法、用样品估计总体的意义。

2.了解正态分布的意义及主要性质.【知识扫描】1.利用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样的方法.(1)一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。

(2)一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

(3)当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫“层”.2.(1)用样本的频率分布估计总体的分布:频率分布表、频率分布直方图、频率折线图、茎叶图 (2)用样本的数字特征估计总体的特征:平均数、中位数、众数、极差、方差、标准差 3.正态分布(1)如果随机变量ξ的概率密度为 φμ,σ(xx ∈(-∞,+∞)其中μ、σ分别表示总体的平均数与标准差,称ξ服从参数为μ、σ的正态分布,记作ξ~N (μ,σ2),函数图象称为正态密度曲线,简称正态曲线.φμ,σ(x )dx ,则称ξ的分一般的,如果对于任何实数a <b ,随机变量ξ满足P (a <ξ≤b )= 布为正态分布(2)标准正态分布在正态分布中,当μ=0,σ=1时,正态总体称为标准正态总体,正态分布N (0,1),称为标准正态分布,记作ξ~N (0,1).(3)正态曲线的性质(ⅰ)曲线在x 轴的上方,与x 轴不相交; (ⅱ)曲线关于直线x =μ对称; (ⅲ)曲线在x =μ时位于最高点;(ⅳ)当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x 轴为渐近线向它无限靠近;(ⅴ)当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.(4)若ξ~N (μ,σ2),则E ξ=μ,D ξ=σ2.(5)若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)=0.6826, P (μ-2σ<X ≤μ+2σ)=0.9544, P (μ-3σ<X ≤μ+3σ)=0.9974.(6)通常认为服从正态分布N (μ,σ2)的随机变量X 只取(μ-3σ,μ+3σ)之间的值 ,并简称之为3σ原则.22()2x μσ--ba⎰【考计点拔】牛刀小试:1.从编号为150 的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )()5,10,15,20,25A ()3,13,23,33B ()1,2,3,4,C ()2,4,6,16,32D 【答案】B2.设随机变量ξ服从正态分布N (2,9),若P (ξ>c +1)=P (ξ<c -1),则c =( )A .1B .2C .3D .4【解析】:选B.∵μ=2,由正态分布的定义知其函数图象关于x =2对称,于是c +1+c -12=2,∴c =2.故选B.3.(2011四川高考)有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 1l [31.5,35.5) 12 [35.5.39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是 (A)16 (B)13 (C)12 (D )23答案:B解析:从31.5到43.5共有22,所以221663P ==。

概率与统计(理科)

概率与统计(理科)

概率与统计(理科)一、高考考试内容离散型随机变量的分布列,离散型随机变量的期望和方差。

抽样方法、总体分布的估计、正态分布、线性回归。

二、考试要求:(1)了解离散型随机变量的意义,会求某些简单的离散型随机变量的分布列。

(2)了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。

(3)会用随机抽样,系统抽样,分层抽样等常用的抽样方法从总体中抽取样本。

(4)会用样本频率分布去估计总体分布。

(5)了解正态分布的意义及主要性质。

(6)了解线性回归的方法和简单应用。

三、应试策略1、正确理解有关概念。

(1)随机试验与随机事件:在一定条件下可能发生也可能不发生的事件叫随机事件;条件每实现一次,叫做一次试验;如果试验结果预先无法确定,这种试验叫做随机试验。

(2)频率与概率:对于一个事件来说概率是一个常数;频率则随着试验次数的变化而变化,试验次数越多,频率就越接近于事件的概率。

(3)互斥事件与对立事件:对立事件一定是互斥事件,但互斥事件不一定是对立事件。

(4)互斥事件与相互独立事件:不可能同时发生的事件叫互斥事件,而相互独立事件则是指两个事件是否发生与否相互之间没有影响。

2、公式的应用(1)常用公式 ①等可能事件的概率:基本事件总数中所含基本事件数A n m A P ==)( ②互斥事件的概率:)()()(B P A P B A P +=+③对立事件的概率:1)()()(____=+=+A P A P A A P④相互独立事件的概率:)()()(B P A P B A P ⋅=⋅⑤n 次独立重复试验中事件A 恰好发生k 次的概率:k n k k n n P P C k P --=)1()((2)注意事项:①每个公式都有成立的条件,若不满足条件,则这些公式将不再成立。

②对于一个概率问题,应首先弄清它的类型,不同的类型采用不同的计算方法,一般题中总有关键语说明其类型,对于复杂问题要善于进行分解,或者运用逆向思考的方法。

统计与概率用样本估计总体

统计与概率用样本估计总体

医学
医生使用统计学和概率来 分析和解释医疗数据,以 便更好地诊断和治疗疾病 。
工程
工程师使用统计学和概率 来设计和优化产品,以满 足特定的性能要求。
02
样本与总体
样本的定义与重要性
定义
样本是指从总体中抽取的一部分个体或数据点的集合。
重要性
通过样本可以推断总体的特征和性质,从而了解整个群体的情况。
样本大小
样本的大小是指样本中包含的个体 数量,一般来说,样本越大,其代 表性也越高,推断的准确性也越高 。
03
用样本估计总体
用样本均值估计总体均值
样本均值的定义
样本均值是样本数据点平 均值的数学期望,它反映 了样本数据的集中趋势。
总体均值的估计
由于总体数据可能未知或 不完整,我们通常使用样 本均值来估计总体均值。
方差分析方法
单因素方差分析
单因素方差分析是一种分析单个因素不同水平下样本均值差异的方法,通过比较各组均值与总均值之 间的差异来评估不同水平对总体参数的影响。
多因素方差分析
多因素方差分析是一种分析多个因素不同水平下样本均值差异的方法,通过分离各因素对总体参数的 影响并比较其贡献大小来评估不同因素对总体参数的影响。
假设检验方法
单侧检验
单侧检验是一种根据样本数据对总体参数进行假设检验 的方法,通过计算检验统计量并比较其值与临界值的大 小来判断假设是否成立。
双侧检验
双侧检验是一种根据样本数据对总体参数进行假设检验 的方法,通过计算双尾概率并比较其值与显著性水平的 大小来判断假设是否成立。
方差分析
方差分析是一种分析多个样本均值差异的方法,通过分 离组间误差和组内误差来评估样本数据对总体参数的影 响。

正态总体的常用抽样分布

正态总体的常用抽样分布

特点
卡方分布在正态分布两侧有更多的面 积,即其尾部比正态分布更重。随着 自由度n的增加,卡方分布趋近于正 态分布。
04
抽样分布的应用
参数估计
1 2
参数估计
通过抽样分布,我们可以估计总体参数,如均值 和方差。常用的估计方法有矩估计和最大似然估 计。
置信区间
基于抽样分布,我们可以构建总体参数的置信区 间,从而对总体参数进行区间估计。
03
样本方差的数学期望等于总体方差,其方差随 着样本量的增加而减小。
样本偏度与峰度
样本偏度是总体偏度的无偏估计,用于衡量数据的对称性。 样本峰度是总体峰度的无偏估计,用于衡量数据分布的尖锐程度。 在正态分布中,偏度和峰度均为0,但在非正态分布中,偏度和峰度可能不为0。
03
其他常用抽样分布
t分布
中心极限定理
中心极限定理的基本思想
中心极限定理表明,无论总体分布是什么类型,只要样本量足够大,从该总体中随机抽取的样本均值将趋近于正 态分布。这意味着我们可以利用正态分布的性质来分析和推断样本均值。
中心极限定理的应用
中心极限定理在统计学中具有广泛的应用价值。例如,在制定置信区间、假设检验和回归分析等统计方法时,都 需要利用中心极限定理来处理样本数据和推断总体参数。因此,正确理解和应用中心极限定理对于统计推断的准 确性和可靠性至关重要。
THANKS
样本量大小的影响
样本量大小
样本量的大小对抽样分布的形状和稳 定性有显著影响。随着样本量增加, 抽样分布的形状逐渐接近正态分布, 且分布的离散程度逐渐减小。
样本量与精度
样本量越大,估计的精度越高,即估 计的参数值越接近真实值。因此,在 制定抽样计划时,应充分考虑样本量 的大小,以确保估计的精度满足要求。

随机抽样用样本估计总体正态分布.ppt

随机抽样用样本估计总体正态分布.ppt

各自特点
从总体中逐个 抽取
将总体分成几 层进行抽取
将总体均分成 几部分,按事 先确定的规则 在各部分抽取
相互联 系
最基本 的抽样 方法
各层抽 样时采 用简单 随机抽

在起始 部分抽 样时采 用简单 随机抽

23
适用范 围
总体中 的个体 数较少
总体由 差异明 显的几 部分组

总体中 的个体 数较多
2.频率分布直方图会使样本的一些数字特征更明显,
9
(2)依题意,ξ 的可能取值为 0,1,2,3,则 P(ξ=0)=CC31382=1545,P(ξ=1)=CC14C31228=2585, P(ξ=2)=CC24C31218=1525,P(ξ=3)=CC31342=515. 因此,ξ 的分布列如下:
所以 Eξ=0×1545+1×2585+2×1525+3×515=1.
体的方差最小,0
21
1.统计的基本思想方法是用样本估计总体,即用局 部推断整体,这就要求样本应具有很好的代表性, 而样本良好客观的代表性,完全依赖抽样方法. 三种抽样方法的比较:
22
类别 简单随机抽样
分层抽样
系统抽样
共同点
①抽样过程中 每个个体被抽 取的概率是相 等的;②均属 于不放回抽样
在区间(68,75)中的概率.
7
素材1
设矩形的长为 a,宽为 b,其比满足 b∶a=
5-1 2
≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩
形常应用于工艺品设计中.下面是某工艺品厂随机抽取
两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639

随机抽样、用样本估计总体、正态分布

随机抽样、用样本估计总体、正态分布

11.6 随机抽样 用样本估计总体 正态分布教材细梳理—-知识点 一.随机抽样 1.简单随机抽样(1).定义:一个总体含有N 个个体,从中逐个①_____地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会_②_____,就把这种抽样方法叫做简单随机抽样.(2). 最常用的简单随机抽样方法有两种___③__法和_④_________法. (3). 适用于 ⑤ 的情况. 2.系统抽样(1).定义:将总体分成 ⑥ 的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样 . (2).系统抽样步骤:假设要从容量为N 的总体中抽取容量为n 的样本. a. 先将总体的N 个个体⑧ .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(编号的位数要一样) b. 确定⑨ ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n;c. 在第1段用_⑩_________确定第一个个体编号l (l ≤k );d. 按照一定的规则抽取样本.通常是将l ⑪ 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ) 依次进行下去,直到获取整个样本. (3).系统抽样适用于⑫ 的情况. 3.分层抽样(1).定义:当总体由⑬ 组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占⑭ 进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2).分层抽样适用于总体由差别明显的几部分组成的情况. 二.样本估计总体有关概念和知识点1.通常我们对总体作出的估计一般分成两种.一种是用样本的①__________估计总体的分布.另一种是用样本的② 估计总体的数字特征. 2.频率分布直方图画法(1).求极差(最大值-最小值=极差). (2).决定组距与组数.(3).确定分点,将数据分组.5.茎叶图以数据的高位为茎,放中间,低位为叶放两边,它的优点是: (1)保留了原始数据,没有损失样本信息.(2)数据可以随时记录、添加或修改. (n x x ++-2(n x x ++-受极值影响较大。

人教A版高中数学必修3《二章统计2.2用样本估计总体阅读与思考生产过程中的质量控制图》优质课教案_4

人教A版高中数学必修3《二章统计2.2用样本估计总体阅读与思考生产过程中的质量控制图》优质课教案_4

阅读与思考:生产过程中的质量控制图》教学设计阅读与思考:生产过程中的质量控制图——正态分布[ 教材分析]本节课选自人教A 版必修3第二章“统计”第2.2节“用样本估计总体”课后的“阅读与思考”部分。

在第2.1节通过抽样收集数据之后,第2.2节给出了两种用样本估计总体的方式,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、标准差等)估计总体的数字特征。

本节课是在这基础上,结合前面所学的总体密度曲线、平均数和标准差的概念,通过生产过程中的产品质量控制图引出正态分布,利用具体的生活应用介绍正态分布密度曲线的特点以及期望、标准差对整个正态分布的影响。

正态分布无论是在理论上还是应用上都是极其重要的一个分布,将正态分布的这些特点应用到质量控制中,可使学生进一步加强对标准差的认识。

由于正态分布的随机变量是连续型随机变量,这也让学生对随机变量由离散型到连续型有一个初步的认识。

从教材编排上来看,“阅读与思考”内容是对频率分布直方图、标准差认识的深化,是统计知识体系的一种承接和完善,也是后续选修2-3 中第2.4“正态分布”一课的铺垫。

[学情分析]学生在之前章节的学习中,已经掌握如何通过抽样来收集数据,能够画出所收集数据的频率分布直方图、折线图,会根据图表初步分析数据的分布规律,会计算平均数与标准差,这为本节课的探究学习打下了坚实的基础。

但学生仍存在一些知识短板和理解缺口。

其一,本节课学习的正态分布的随机变量是连续型随机变量的分布问题,学生一直以来接触的都是离散型随机变量,这在概念接受与理解上会有一定困难,可以通过信息技术辅助理解;其二,由于学生在此之前还未学习过定积分、随机事件的概率以及二项分布,只在初中接触过简单的概率定义,因而对本节课正态分布的本质理解会显得生涩;其三,正态分布的密度曲线函数较为复杂,学生对抽象且陌生的公式会存在惧怕心理,需要通过一些函数模型及实际应用帮助学生体会其参数的作用。

正态总体下的抽样分布

正态总体下的抽样分布
中心极限定理
中心极限定理是抽样分布的理论基础, 它表明无论总体分布是什么,只要样 本量足够大,样本均值的分布近似正 态分布。
样本均值的性质
无偏性
样本均值的数学期望等于总体均值, 即$text{E}(bar{x}) = mu$。
最小方差性
在所有可能的样本统计量中,样本均 值具有最小的方差,即 $text{Var}(bar{x}) = frac{sigma^2}{n}$。
数学表达式
正态分布的数学表达式为$f(x) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}$,其中$mu$是均值, $sigma$是标准差。
抽样分布的概念
抽样分布
抽样分布描述的是从某一总体中随机 抽取一定数量的样本后,这些样本统 计量(如均值、方差等)的分布情况。
大样本下样本方差的分布
卡方分布
在大样本下,样本方差通常呈现卡方分布。
方差的无偏估计
在大样本下,样本方差是总体方差的无偏估计。
方差的同方差性
在大样本下,来自不同总体的样本方差通常具有同方差性,即它们具有相同的 方差。
04
小样本下的抽样分布
小样本的定义
小样本是指从总体中随机抽取的样本 量较小,通常在30个样本以下。
THANKS
感谢观看
正态分布的性质
Байду номын сангаас01
02
03
集中性
正态分布的曲线关于均值 所在直线对称,数据值主 要集中在均值附近。
均匀性
正态分布的曲线在均值两 侧均匀下降,且下降速度 逐渐减缓。
平坦性
正态分布的曲线在均值的 两侧逐渐接近水平线,表 现出平坦的趋势。

正态分布规律

正态分布规律

正态分布规律正态分布规律表明,当n的值为整数时,并不是随机事件每次都落在一条横坐标轴上,而是落在各个位置上的可能性相等。

只有当n 的取值为奇数时,才是每次落在同一条横坐标轴上。

若样本中出现的频率都小于或等于1,则样本平均数就接近于正态分布曲线的横坐标,这个随机变量就服从正态分布。

从这个角度看,它们又可称为正态随机变量。

在抽样调查中,我们经常要用到这个概念。

正态分布曲线上有5个区间:两头小中间大,即≤95%、 95%- 99%、≥100%、≥100%+95%、 100%+95%。

-正态分布是在正态总体内,用样本统计量来估计总体参数,所以需要将总体分成许多互不相等的部分,对每一个小部分,依据总体分布形态建立适当的样本统计量,以样本统计量估计总体参数,然后根据样本统计量对总体参数进行估计。

---抽样误差正态分布的基本概念,除了与样本数据有关外,还和抽样方法有密切联系,所以我们应该了解一下常用的抽样方法:随机抽样,是从研究总体n个单位中随机抽取n个单位,根据随机原则来安排样本,使得样本具有代表性。

(一)等距抽样也称机械抽样,它的特点是对每个单位在相邻的样本单位之间保持固定的间隔,抽取任意大小的样本单位。

(二)系统抽样它是先把总体按照一定的标志分类,然后再抽取各类中的一部分,组成样本,使总体中各类别单位数目相等,构成样本空间,故又称为类型样本。

---什么是抽样误差抽样误差:是指总体的平均数与其算术平均数之差。

(1)离散型误差:是指实际的抽样平均数与样本算术平均数之差;(2)连续型误差:是指实际的抽样平均数与总体算术平均数之差。

---样本的容量sample size:是指从研究的总体中随机抽取容量为n的样本所需要的全部观察单位的数目。

容量为n的样本:由n个观察单位组成的容量为n的样本;如果在样本中,每个观察单位的个数恰好等于总体的个数N,那么就称这种样本为等概率样本,记作SS=N(N)。

第三章 正态分布与抽样分布

第三章  正态分布与抽样分布

图3-5 正态分布的概率
关于正态分布,有几个概率应记住: 关于正态分布,有几个概率应记住: 一般正态分布: 一般正态分布:
P(µ-1.96σ≤x<µ+1.96σ)=0.95 1.96σ≤x<µ+1.96σ)= )=0.95 P(µ-2.58σ≤x<µ+2.58σ)=0.99 2.58σ≤x<µ+2.58σ)= )=0.99 P(µ-σ≤x<µ+σ)=0.6826 σ≤x<µ+σ)= )=0.6826 P(µ-2σ≤x<µ+2σ)=0.9545 2σ≤x<µ+2σ)= )=0.9545 P(µ-3σ≤x<µ+3σ)=0.9973 3σ≤x<µ+3σ)= )=0.9973
对于大样本资料,常将样本标准差S 对于大样本资料,常将样本标准差S 与样本均数配合使用,记为 X ± S ,用 与样本均数配合使用, 以说明所考察性状或指标的优良性与稳 定性。对于小样本资料, 定性。对于小样本资料,常将样本标准 误 SX 与样本均数 X 配合使用,记 配合使用, 为 X ± S ,用以表示所考察性状或指 标的优良性与抽样误差的大小。 标的优良性与抽样误差的大小。
学上已证明 总体的两个参数与x总体的两 总体的两个参数与x 个参数有如下关系: 个参数有如下关系:
µx = µ
σx =
σ
n
表 X 的抽样分布形式与原总体X分布形式的关系 的抽样分布形式与原总体X
2.2 均数标准误
均数标准误 σx = 的大小反映样本均数 X n 抽样误差的大小 标准误大, 的大小。 的抽样误差的大小。标准误大,说明各样本均 间差异程度大;反之,亦然。 数 X 间差异程度大;反之,亦然。 在实际工作中,总体标准差σ往往是未知的, 在实际工作中,总体标准差σ往往是未知的, σx 此时,可用样本标准差S 因而无法求得 。此时,可用样本标准差S估 S 于是, 计σ 。于是,以 估计 n 。记σx 为 n, S SX 称作样本标准误或均数标准误。 称作样本标准误或均数标准误。 是均数抽样 SX 误差的估计值。 误差的估计值。

概率统计中的样本均值与总体均值的关系

概率统计中的样本均值与总体均值的关系

概率统计中的样本均值与总体均值的关系概率统计是一门研究随机现象的数学学科,其中样本均值和总体均值是两个重要的概念。

样本均值是指从总体中抽取的样本数据的平均值,而总体均值则是指整个总体的平均值。

在概率统计中,样本均值与总体均值之间存在着一定的关系,下面将对这一关系进行探讨。

1. 样本均值的定义与计算方法样本均值是指从总体中抽取的一组样本数据的平均值。

假设我们从总体中抽取了n个样本数据,分别为x1, x2, ..., xn,那么样本均值可以通过以下公式计算得出:样本均值 = (x1 + x2 + ... + xn) / n2. 总体均值的定义与计算方法总体均值是指整个总体的平均值,它是所有样本数据的平均值的期望。

总体均值可以通过以下公式计算得出:总体均值 = (x1 + x2 + ... + xn) / N其中,N表示总体中的数据个数。

3. 样本均值与总体均值的关系样本均值与总体均值之间存在着一定的关系。

根据大数定律,当样本容量足够大时,样本均值会趋近于总体均值。

也就是说,当我们从总体中抽取的样本数量足够多时,样本均值将会接近于总体均值。

这一关系可以通过数学推导来证明。

假设总体中的数据服从某种概率分布,且总体均值为μ,样本容量为n。

根据中心极限定理,当样本容量足够大时,样本均值的分布会接近于正态分布。

而根据正态分布的性质,样本均值的期望值等于总体均值,方差等于总体方差除以样本容量。

因此,当样本容量足够大时,样本均值的期望值将会接近于总体均值。

4. 样本均值的应用样本均值在概率统计中有着广泛的应用。

首先,样本均值可以用来估计总体均值。

当我们无法获取总体的所有数据时,可以通过抽取样本并计算样本均值来估计总体均值。

这种估计方法被广泛应用于调查研究、市场调研等领域。

此外,样本均值还可以用来进行假设检验。

假设检验是一种常用的统计方法,用于判断总体参数是否符合某种假设。

在假设检验中,我们通常会计算样本均值,并与某个假设值进行比较,从而得出结论。

简单随机抽样的抽样估计

简单随机抽样的抽样估计
若 置 信 度 为 (1-)=90% ,求 总 体 优 质 品 率 的 置 信 区
间 及 优 质 产 品 的 数 量 ?
15
总体方差的区间估计
大样本情况下,样本标准差S的分布近似于正 态分布:
其均值为总体标准差,其标准差为 ,
2n
所以标准标准差置信度1的置信区间为:
(SZ2
S 2n,SZ2
S) 2n
18
抽样数目的确定 (大样本)
必要的抽样数目:指为了使抽样误差不超过 给定的允许范围至少应抽取的样本单位数 目。 一般根据抽样极限误差与抽样数目关系来 确定必要的抽样数目。
19
采用重复抽样,则抽样极限误差为
x Z 2x Z 2( n)
若规定在一定概率保证程度下允许误差为 , x
则由 x
Z
2x
Z
651(件)
不重复抽样:
n
Z2 2 P(1 P)N
2 p
N
Z2
2 P (1
P)
32 0.93 0.07 5000 0.032 5000 32 0.93 0.07
576(件)
25
确定抽样单位数目应注意的问题
1. 以上四个计算公式只适用于简单随机抽样。 2. 在同样条件下,不重复抽样比重复抽样要求 的抽样单位数目少。 3. 同一总体往往同时需要计算抽样平均数和抽 样成数,由于它们的方差和允许误差要求不同, 因此,对于抽样单位数目多少的要求也不一样, 为了防止抽样单位数目的不足,而扩大抽样误 差,在实际工作中,往往根据抽样单位数目比 较大的一个数目进行抽样,以满足共同要求。
9
设待估计的总体参数为,L,U为样本 确定的两个统计量,对于给定的(0 1),
有:
P(L U ) 1 则称(L,U )为参数的置信度(1)的置信 区间.该区间的两个端点L,U分别称为置 信下限和置信上限,统称为置信限.为显 著性水平,(1)为置信度.

概率统计中的正态分布的参数估计

概率统计中的正态分布的参数估计

概率统计中的正态分布的参数估计正态分布(Normal Distribution)是概率统计中最常见的一种分布,也被广泛应用于各个领域。

正态分布由两个参数来描述,即均值μ和标准差σ。

在实际应用中,我们常常需要通过样本数据来估计正态分布的参数,从而对总体进行推断。

本文将介绍概率统计中的正态分布的参数估计方法。

一、最大似然估计法最大似然估计法是一种常用的参数估计方法,通过寻找最大化样本观测出现的概率来确定参数的值。

在正态分布中,最大似然估计法可以用来估计均值μ和标准差σ。

对于给定的样本数据X1, X2, ..., Xn,我们假设这些数据是从一个正态分布N(μ, σ^2)中独立地随机抽取得到的。

那么样本的似然函数可以表示为:L(μ, σ^2) = Π(1/√(2πσ^2)) * exp(-(xi-μ)^2/(2σ^2))其中,Π表示连乘符号,xi表示第i个观测值。

为了简化计算,我们通常对似然函数的对数取负值,得到对数似然函数:l(μ, σ^2) = -n/2 * log(2πσ^2) - Σ(xi-μ)^2/(2σ^2)最大似然估计法的目标是找到使对数似然函数取得最大值的参数值。

对于均值μ,我们可以通过求导等于0的方式得到:∂l/∂μ = Σ(xi-μ)/σ^2 = 0解得:Σ(xi-μ) = 0即样本观测值与均值的偏差之和为0。

这意味着最大似然估计下的均值估计值等于样本的平均值。

对于标准差σ,我们可以通过求导等于0的方式得到:∂l/∂σ^2 = -n/(2σ^2) + Σ(xi-μ)^2/(2σ^4) = 0解得:σ^2 = Σ(xi-μ)^2/n即最大似然估计下的标准差估计值等于样本偏差平方和的均值。

二、置信区间估计法在实际应用中,我们通常还需要给出参数估计的不确定性范围。

置信区间估计法可以用来估计参数的置信区间,即参数真值落在某个区间内的概率。

对于均值μ的置信区间估计,假设样本数据X1, X2, ..., Xn满足正态分布N(μ, σ^2),我们可以使用样本均值的抽样分布来构建置信区间。

第54讲随机抽样正态分布

第54讲随机抽样正态分布

点评求此概率需将问题化为正态随机变
题型三 频率分布表与频率分布直方图
( 表示纤维粗细的一种量 ) 共有100 个数据, 数据分组如下表
分 组 [1.30, [1.34 [1.38 [1.42 [1.46 [1.50 合计 , , , , , 1.34) 1.38 1.42 1.46 1.50 1.54 ) ) ) ) ) 4 25 30 29 10 2 100
点评1. 解答本题时,第 (1) 问首先需计
题型三 样本的数字特征估计总体
行了6次测试,测得他们的最大速度(m/s)的数据 如下表:
甲 乙 27 33 38 29 30 38 37 34 35 28 31 36
例3 对甲、乙两名自行车赛手在相同条件下进
(1)画出茎叶图,由茎叶图你能获得哪些信息? (2) 分别求出甲、乙两名自行车赛手最大速 度 (m/s) 数据的平均数、中位数、标准差,并判 断选谁参加比赛更合适.
(3)正态曲线的性质
(ⅰ)曲线在x轴的上方,与x轴不相交;
(ⅱ)曲线关于直线x=μ对称;
(ⅲ)曲线在x=μ时位于最高点;
( ⅳ )当 x<μ 时,曲线上升;当 x>μ 时 , 曲线下降 , 并且当曲线向左、右两边无限延 伸时,以x轴为渐近线向它无限靠近;
(ⅴ)当μ一定时,曲线的形状由σ确定, σ 越大,曲线越“矮胖”,表示总体的分布 越分散; σ 越小,曲线越“瘦高”,表示总 体的分布越集中.
因为Eη=0,Dη=1,Eξ=-5,Dξ=4,
而Eη=E(aξ+b)=aEξ+b,Dη=D(aξ+b)=a2Dξ. 又a>0,所以 所以η=
1 ξ+ 2
-5a+b=0 4a2=1

从总体中随机抽取了n=200的样本,调查后按不同属性归类

从总体中随机抽取了n=200的样本,调查后按不同属性归类

竭诚为您提供优质文档/双击可除从总体中随机抽取了n=200的样本,调查后按不同属性归类篇一:统计学(1)(1)1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。

2、收集的属于不同时间上的数据称为【时间序列】数据。

5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为1080,中位数为1080。

7、设总体x~n(,)2,为样本均值,s为样本标准差。

当未知,且为小样本时,则sn服从自由度为n-1的___t__分布。

1、数据分析所用的方法分为描述统计方法和推断统计方法。

2、数据的基本类型有分类数据、顺序数据和数值型数据。

3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是1153.3,中位数是1020。

其他(a,b)内取值,且x服从均匀分布,其概率密度函数4、设连续型随机变量x在有限区间(a 0f(x)1baab(ba)2则x的期望值为,方差为212。

1、收集数据的基本方法是自填式、面访式和电话式。

2、依据统计数据的收集方法不同,可将其分为观测数据和实验数据。

3、分类数据、顺序数据和数值型数据都可以用饼图、条形图等图形来显示。

5、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有方差、离散系数。

5、原假设h0为真时却被我们拒绝,称为弃真错误。

7、对回归方程线性关系的检验,通常采用的是F检验。

2、如果我们要研究某班学生的学习状况,则总体是,总体单位是__。

4、利用估计的回归方程进行区间估计有两种类型,一是置信区间估计,二是预测区间估计。

8、在参数估计时,评价估计量的主要有三个指标是无偏性、性。

健康管理专业《3-2如何根据样本率估计总体率》

健康管理专业《3-2如何根据样本率估计总体率》

如何根据样本率估计总体率?
总体率的估计有点(值)估计和区间估计两种。

1点(值)估计:是直接把样本率看作总体率,例如从某社区居民抽样算得乙肝病毒表面抗原阳性样本率为%,则可认为该社区居民乙肝病毒表面抗原阳性总体率也是%。

2区间估计:是按照一定的概率估计总体率可能所在的范围。

根据样本含量n 和样本率p 的大小不同,可选用下列两种方法。

(1)正态近似法:当样本含量n 足够大(如n >50),且样本率p 和1-p 均不太小,如np ≥5及()p n -1≥5时,样本率的分布近似正态分布,可根据正态分布的规律估计总体率的可信区间。

计算公式为:
总体率95%的可信区间 (p p s .p ,s .p 961961+-)
总体率99%的可信区间 (p p s .p ,s .p 582582+-)
例如,某地随机抽取了社区居民500人,乙肝病毒表面抗原阳性人数23人,阳性率为%,求该地社区居民乙肝病毒表面抗原阳性95%的可信区间。

本例已知500=n , 60.4=p %。

np >5及()p n -1>5,可用正态近似法求可信区间。

下限:%.%..%.s .p p 762940961604961=⨯-=-
上限:%.%..%.s .p p 446940961604961=⨯+=+
估计该地社区居民乙肝病毒表面抗原阳性95%的可信区间为(%~%)。

(2)查表法:当样本含量n 较小(如n ≤50)时,特别是p 接近于0或1时,样本率的分布近似于二项公布,可根据二项分布的原理计算可信区间。

因其计算较复杂,统计学家编制了百分率的可信区间表,可直接查表得总体率的可信区间(详见有关统计学参考书)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

11.6 随机抽样 用样本估计总体 正态分布教材细梳理—-知识点 一.随机抽样 1.简单随机抽样(1).定义:一个总体含有N 个个体,从中逐个①_____地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会_②_____,就把这种抽样方法叫做简单随机抽样.(2). 最常用的简单随机抽样方法有两种___③__法和_④_________法. (3). 适用于 ⑤ 的情况. 2.系统抽样(1).定义:将总体分成 ⑥ 的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样 . (2).系统抽样步骤:假设要从容量为N 的总体中抽取容量为n 的样本. a. 先将总体的N 个个体⑧ .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(编号的位数要一样) b. 确定⑨ ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n;c. 在第1段用_⑩_________确定第一个个体编号l (l ≤k );d. 按照一定的规则抽取样本.通常是将l ⑪ 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ) 依次进行下去,直到获取整个样本. (3).系统抽样适用于⑫ 的情况. 3.分层抽样(1).定义:当总体由⑬ 组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占⑭ 进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2).分层抽样适用于总体由差别明显的几部分组成的情况. 二.样本估计总体有关概念和知识点1.通常我们对总体作出的估计一般分成两种.一种是用样本的①__________估计总体的分布.另一种是用样本的② 估计总体的数字特征. 2.频率分布直方图画法(1).求极差(最大值-最小值=极差). (2).决定组距与组数.(3).确定分点,将数据分组.5.茎叶图以数据的高位为茎,放中间,低位为叶放两边,它的优点是: (1)保留了原始数据,没有损失样本信息.(2)数据可以随时记录、添加或修改. (n x x ++-(n x x ++-若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则: ①x 1+b ,x 2+b ,…,x n +b 的平均数是x +b ,方差是s 2; ②ax 1,ax 2,…,ax n 的平均数是a x ,方差是22a s ;③ax 1+b ,ax 2+b ,…,ax n +b 的平均数是a x +b ,方差是 22a s .三 、正态分布有关概念及知识点 1.正态曲线定义定义:像总体密度曲线那样,具有① 的特征的函数近似表示为,),(+∞-∞∈x , 其中实数μ和σ)0(>σ为参数,它的图象称为正态分布密度曲线,简称② . 2.正态曲线的特点.(1)曲线在x 轴的_③____,与x 轴不相交. (2)曲线关于直线x =_④_ 对称.(3)曲线在X=μ处达到峰值1σ2π.(4)曲线与x 轴间的面积为⑤ .(5)当X <μ时,曲线上升(增函数);当X >μ时,曲线下降(减函数).并且当曲 线向左、右两边无限延伸时,以X 轴为渐近线,向它无限靠近.(6)当σ一定时,曲线的位置由μ确定,曲线随着X=μ的变化而沿x 轴平移. (7)μ一定时,曲线的形状由σ确定σ越大,曲线越⑥ ,总体分布越分散; σ越小,曲线越⑦ .总体分布越集中.3.正态分布定义及表示(1)定义:对于任何实数a b <,随机变量X 满足⎰=≤<badx x b X a P )()(,σμϕ,则称随机变量 X 服从正态分布.记作⑧ ,其中参数μ是总体的⑨ , 参数 σ是总体的⑩ . 4. 3σ原则(1)定义:如果2~(,)X N μσ,通常认为随机变量 X 的取值落在区间(),μσμσ-+内称之为3σ原则 (2)三个特殊区件概率=+≤<-)(σμσμX P ⑪ ;=+≤<-)22(σμσμX P ⑫ ; =+≤<-)33(σμσμX P ⑬ .教材细梳理答案一:①不放回;②相同;③抽签法;④随机数表法;⑤总体个数较少 ⑥均衡;⑦系统抽样;⑧编号;⑨分段间隔k;⑩简单随机抽样;⑪加上间隔k;⑫总体中的个体数较多;⑬瘦高;⑭比例 二:①频率分布;②数字特征;③频率组距;④面积;⑤1;⑥中点;⑦组距;⑧最多; ⑨中间;⑩12....nx x n+++;⑪中点;⑫面积;⑬面积;⑭中点横坐标;三:①两头低、中间高、左右对称;②正态曲线;③上方;④μ;⑤1;⑥矮胖;⑦瘦高; ⑧2~(,)X N μσ;⑨期望;⑩标准差;⑪0.6826;⑫0.9544;⑬0.9974;考点精解析—-方法 问题一:随机抽样问题例1.[2014·湖南卷] 对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3 点拨与解析: 随机抽样中,每个个体被抽到的机会是均等的.解:不管是简单随机抽样、系统抽样还是分层抽样,它们都是等概率抽样,每个个体被抽中的概率均为n N.所以选D.例2.[2014·天津卷] 某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.点拨与解析:由于总体各部分差别比较明显,所以采取分层抽样即按比例抽取. 解:由分层抽样的方法可得,从一年级本科生中抽取学生人数为300×44+5+5+6=60.例3..已知某商场新进3 000袋奶粉,为检查某维生素是否达标,现采用系统抽样的方法从中抽取150袋检查,若第1组抽出的号码是11,则第61组抽出的号码为__________. 点拨与解析:系统抽样是抽多少个个体,把总体均分成多少组,每组抽取一个,间隔相等解:∵3 000150=20,∴需把3 000袋奶粉按0,1,2,3,…,2 999编号,然后分成150组,每组20个号码.∴第61组抽出的号码为11+(61-1)×20=1 211. 答案:1 211 思维方法小结:1、三种抽样方法中,每个个体被抽到的概率是相同的.2.简单随机抽样是系统抽样和分层抽样的基础,是一种等可能的抽样,由定义应抓住以下特点:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回抽样. 3.系统抽样又称等距抽样,号码序列一确定,样本即确定了,第一组的抽取的个体必须是随机抽取的,分段间隔必须为整数,当分段间隔不是整数,应先从整体中随机剔除几个个体.4、分层抽样又称按比例抽取.按照每层在总体中占有的比例抽取个体数.5.抽样方法经常交叉使用,比如系统抽样中的第一均衡部分,可采用简单随机抽样.分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样.进行分层抽样时,每层抽样应采用简单随机抽样或系统抽样的方法进行抽样. 问题2:频率分布直方图的计算问题例4.[2014·山东卷] 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图11.6­1 是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )图11.6­1A. 6B. 8C. 12D. 18点拨与解析:所有小长方形的面积之和为1.在各组之间,小长方形面积比=高比=频率比=频数比解: 因为第一组与第二组一共有20人,并且根据图像知第一组与第二组的人数比是0.24∶0.16=3∶2,所以第一组有20×35=12.又因为第一组与第三组的人数比是0.24∶0.36=2∶3 ,所以第三组一共有12÷23=18.因为第三组中没有疗效的有6人,所以第三组中有疗效的人数是18-6=12.思维方法小结:有关频率分布直方图计算问题处理方法. 处理有关频率分布直方图计算问题,关键掌握正确理解图表中各个量的意义. 主要掌握以下几点.(1). =每组频数频率样本容量,表示各组数据在总体中所占的比例 .(2).每个个小长方形的面积等于样本数据落在对应组的频率. (3).所有小长方形的面积之和为1.(4).在各组之间,小长方形面积比=高比=频率比=频数比问题3:样本的数字特征估计总体的特征例5.[2014·陕西卷] 设样本数据1,2,…,10的均值和方差分别为1和4,若i =i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a ,4 B .1+a ,4+a C .1,4 D .1,4+a点拨与解析:利用方差和平均数的推论 解:由题意可知x 1+x 2+x 3+…+x 1010=1,故y -=(x 1+x 2+x 3+…+x 10)+10a 10=1+a .数据x 1,x 2,…,x 10同时增加一个定值,方差不变.故选A.例6.甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图11.6-2所示,若甲、乙两人的平均成绩分别是x 甲,x 乙,则下列叙述正确的是 ( )A .x 甲>x 乙;乙比甲成绩稳定B .x 甲>x 乙;甲比乙成绩稳定C .x 甲<x 乙;乙比甲成绩稳定D .x 甲<x 乙;甲比乙成绩稳定图11.6-2点拨与解析: 直接利用平均数方差公式 或者观察茎叶图茎的大小比较平均数,叶的分散、集中情况,比较方差点拨1:利用 由12....n x x x n+++=, 和222212()()()n x x x x x x s n -+-++-=分别计算甲、乙的的平均数和方差解:由题意可知,x 甲=15×(72+77+78+86+92)=81,x 乙=15×(78+88+88+91+90)=87.又由方差公式可得s 2甲=15×[(81-72)2+(81-77)2+(81-78)2+(81-86)2+(81-92)2]=50.4,s 2乙=15×[(87-78)2+(87-88)2+(87-88)2+(87-91)2+(87-90)2]=21.6,因为s 2乙<s 2甲,故乙的成绩波动较小,乙的成绩比甲稳定.故选C.点拨2: 通过茎叶图的数据分布、集中、分散情况来估计解:从茎叶图上可以看出,甲数据的大部分茎比较小,数据比较分散,而乙数据的茎大部分比较大,并且数据比较集中,所以,甲的平均成绩小于乙的平均数, 并且乙比甲成绩稳定, 故选C.例7.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图11.6-3. 由于一些数据丢失,试利用频率分布直方图求:图11.6-3(1)这50名学生成绩的众数与中位数; (2)这50名学生的平均成绩.点拨与解析:利用频率分布直方图中,众数、中位数、平均数的计算方法解:(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小矩形框的中间值的横坐标即为所求,所以众数应为75.在频率分布直方图中,中位数的左右两边频数应相等,即频率也相等,从而小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.3, ∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5, ∴中位数应位于第四个小矩形内,设其底边为x ,高为0.03,∴令0.03x =0.2,得x ≈6.7, 故中位数应为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.综上,(1)众数是75,中位数约为76.7;(2)平均成绩为76思维方法小结:解决样本的数字特征估计总体的特征的问题常用以下方法 1.利用平均数和方差的推论(1)12....n x x x n+++= 222212()()()n x x x x x x s n -+-++-=(2)若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则:①x 1+b ,x 2+b ,…,x n +b 的平均数是x +b ,方差是s 2; ②ax 1,ax 2,…,ax n 的平均数是a x ,方差是22a s ;③ax 1+b ,ax 2+b ,…,ax n +b 的平均数是a x +b ,方差是 22a s .2.利用茎叶图的茎大大小比较平均数,利用数据分散、集中比较方差.3.利用用频率分布直方图估计众数、中位数、平均数. (1)众数:取最高小长方形底边中点的横坐标作为众数. (2)中位数:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x 轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 考点精解析——方法问题1: 正态分布下的概率计算及3σ原则实际应用例8.(2010山东卷理 )已知随机变量ξ服从正态分布N (0, 2σ),若P (ξ>2)=0.023。

相关文档
最新文档