随机抽样及抽样分布

合集下载

统计学之抽样与抽样分布

统计学之抽样与抽样分布

申请者编号
No. 744 No. 436 No. 865 No. 790 No. 835 超过 900 No. 190 已经出现过
etc.
No. 随机数
1 744
2 436
3 865
4 790
5 835
.
.
30 685
申请人 小强 小丽 阿花 小伟 大雄
. 阿健
考试成绩
1025 950 1090 1120 1015 . 965
抽样方法
End of Chapter 7
课堂练习
1. 样本统计量所有可能值的概率分布称为: a. 样本统计量 b. 总体参数 c. 简单随机抽样 d. 抽样分布
正确答案: d. 抽样分布
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法

9抽样理论及总体参数估计

9抽样理论及总体参数估计
12
(2)总体标准差未知的小样本,用 代替总体标 准差 ,由于此时样本平均数的抽样分布为t分布,所以某 一置信度下总体平均数的区间估计要依据t分布来进行, 此时,总体平均数的置信度为 的置信区间为
例:某小学三年级学生阅读能力服从正态分布,现 从中随机抽取12名学生,其阅读能力的得分为28、32、 36、22、34、30、33、25、31、33、29、26,试估计该 校三年级阅读能力总体平均数95%和99%的置信区间。 练习:从某区小学五年级学生的数学推理测试成绩 中随机抽取26个,求得其平均数为86分,标准差为7分。 已知全区五年级学生的成绩服从正态分布,请在0.05显著 水平上估计该区五年级学生数学推理测试成绩的置信区 间。
19
当置信度为95%时, 即
10
当置信度为99%时,
即其置信区间为
例:某小学10岁全体女童的身高呈正态分布,其标 准差为6.25厘米,现从该校随机抽取27名10岁女童,测得 平均身高为134.2厘米,试估计该校10岁全体女童平均身 高的95%和99%的置信区间。 练习:从某正态总体中随机抽取一个样本容量为25 的样本,其平均数为42,已知总体的标准差为6,试估计 总体平均数的置信度为95%和99%的置信区间。
四、样本容量的确定
(一)确定样本大小的基本原则
在尽量节省人力、经费和时间的条件下,确保用样本 推断总体达到预定的可靠度及准确性。

数理统计中的随机抽样和抽样分布——概率论知识要点

数理统计中的随机抽样和抽样分布——概率论知识要点

数理统计中的随机抽样和抽样分布——概率

论知识要点

概率论作为数理统计的基础,是研究随机现象及其规律的数学分支。在数理统计中,随机抽样和抽样分布是非常重要的概念,本文将对这两个概念进行详细介绍和解释。

一、随机抽样

随机抽样是指从总体中以随机的方式选择样本的过程。在进行随机抽样时,每个个体被选中的概率应该是相等的,这样才能保证样本的代表性和可靠性。随机抽样的方法有很多种,常用的包括简单随机抽样、分层抽样和系统抽样等。

1. 简单随机抽样

简单随机抽样是最基本的抽样方法,它的特点是每个个体被选中的概率相等且相互独立。简单随机抽样可以通过随机数表、随机数发生器等工具来实现。在实际应用中,简单随机抽样常用于总体规模较小的情况。

2. 分层抽样

分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。这种抽样方法可以保证不同层次的个体在样本中的比例与总体中的比例相同,从而提高样本的代表性。

3. 系统抽样

系统抽样是按照一定的规则从总体中选取样本的方法。例如,可以按照一定的间隔从总体中选择样本,这个间隔称为抽样间隔。系统抽样的优点是操作简便,但也存在可能引入系统误差的风险。

二、抽样分布

抽样分布是指在随机抽样的基础上,通过大量重复抽样得到的统计量的分布情况。在数理统计中,常用的抽样分布包括正态分布、t分布和F分布等。

1. 正态分布

正态分布是一种重要的抽样分布,它具有对称、单峰和钟形曲线的特点。在大

样本情况下,根据中心极限定理,样本均值的分布接近于正态分布。正态分布在数理统计中的应用非常广泛,例如用于估计总体均值和总体方差等。

《统计学》第9章 抽样与抽样分布

《统计学》第9章 抽样与抽样分布
⚫ 解:首先列出总体分布,见表9-1
第二节 抽样分布
一、抽样分布的概念
⚫ 例9-1. 从数值分别为1,2,3,4的总体中,随机抽取样本容
量为2的简单随机样本。要求列出样本均值 x 的分布
第二节 抽样分布
一、抽样分布的概念
⚫ 例9-1. 从数值分别为1,2,3,4的总体中,随机抽取样本容
量为2的简单随机样本。要求列出样本均值 x 的分布
第一节 抽样和抽样方法
三、抽样方法
⚫ 分层抽样 ⚫ 最适宜于总体情况比较复杂,各层次或类型之间的差异较 大,而总体单位数又比较多的情形。 ⚫ 根据每一层所抽取的样本数的决定方法不同,又可以分为 ⚫ 等数分层抽样法 ⚫ 等比例分层抽样法 ⚫ 最优分配的分层抽样法
第一节 抽样和抽样方法
三、抽样方法
⚫ 分层抽样 ⚫ 最优分配的分层抽样法 ⚫ 各层所抽取的样本数在样本总数中的比例为
⚫ 在许多情况下人们没有必要对所有对象都进行研究、 试验或考察。比如,工业产品完工后需要进行入库检 验。
第一节 抽样和抽样方法
一、抽样的含义、特点及适用范围
⚫ 抽样的特点 ⚫ 按随机原则抽取样本单位; ⚫ 抽样目的是推断总体的数量特征; ⚫ 抽样推断的结果具有一定ຫໍສະໝຸດ Baidu可靠程度,抽样误差可以 事先计算并加以控制。
第一节 抽样和抽样方法
一、抽样的含义、特点及适用范围

随机样本与抽样分布

随机样本与抽样分布

随机样本与抽样分布

一、引言

随机样本和抽样分布是统计学中非常重要的概念,它们在统计推断和假设检验中起着核心作用。本文将从理论和实践两个方面来探讨随机样本和抽样分布的相关知识,帮助读者更好地理解和应用这些概念。

二、随机样本

1. 随机样本的定义

随机样本是指从总体中以随机的方式抽取出来的样本。在实际调查和研究中,通常需要根据一定的规则和方法来获取样本,而随机样本则是保证了每个总体单位有相同被选入样本的机会,从而能够更好地代表总体特征。

2. 随机样本的特点

随机样本具有以下特点: - 代表性:通过随机抽样得到的样本能够较好地代表总体特征。 - 可比性:不同的随机样本之间可以进行比较分析,结果具有一定的可靠性。 - 独立性:各个个体之间的选取是相互独立的,不会受到其他因素的影响。

三、抽样分布

1. 抽样分布的概念

抽样分布是指统计量由一个个样本算出来时所得到的概率分布。

在统计推断中,我们通常需要根据样本来对总体参数进行估计或进行

假设检验,而抽样分布则是帮助我们推断出总体参数的分布情况。

2. 常见的抽样分布

(1) 正态分布

当总体服从正态分布时,根据中心极限定理可知,样本均值的抽

样分布也会趋近于正态分布,而且当样本量大于30时,可以认为近似

服从正态分布。

(2) t 分布

在总体标准差未知且根据小样本得到的数据时,往往使用t分布

来进行统计推断。t分布相较于正态分布,在小样本情况下具有更大的尾部面积,更符合对总体参数进行估计时对抽样误差可能带来的影响。

(3) 卡方分布

卡方分布是一种重要的统计分布,在统计学中有着广泛的应用。

抽样和抽样分布

抽样和抽样分布

抽样和抽样分布

5.抽样和抽样分布

5.1 抽样及抽样中的⼏个基本概念

1.抽样的基本概念

抽样就是从所研究的对象中随机地抽取出其中的⼀部分来观察,由此⽽获得有关总体的信息。

在对总体进⾏研究时,进⾏抽样研究是⾮常重要的。尤其是对于许多实际⼯作来说,要研究的总体很⼤,我们不可能对总体逐⼀进⾏研究,或者既便我们能这样做,但由于试验是具有破坏性的,我们也就没有可能这样做了。再者,在许多情况下我们也没有必要对所有对象都进⾏研究、试验、或考察。⽐如,对灯泡这类产品质量的研究。因此,我们只有进⾏抽样研究。

抽样的特点:

1)遵守随机原则。

2)推断被调查对象的总体的特征。

3)计算推断的准确性和可靠性。

由于抽样具有这样的特点,因此它可以⽤在这样⼀些场合:

1)不可能进⾏全⾯调查;

2)没有必要全⾯调查;

3)进⾏假设检验;

4)产品质量控制;

5)作为全⾯调查的补充。

2.样本统计量与总体统计量

3.随机抽样和判断抽样

这两种⽅法虽然都是从总体中抽取出样本的⽅法,但是它们两者之间存在本质上的区别。随机抽样是按概率规律抽取样本,在总体中所有单位被抽中的概率是相等的。⽽判断抽样不是⼀种随机抽样,它是根据个⼈或集体的设想或经验从总体中有⽬的地抽取样本,采⽤这种⽅法主要是由于⼈⼒、物⼒、财⼒、时间或其他因素有所限制⽽采取的。当然,要想使判断抽样也获得⽐较好的效果,条件是抽样⼈具有丰富的关于特定总体的专业知识。

由于判断抽样是凭主观设想和判断⽽抽取样本的,因此抽样的结果就不能⽤概率的⽅法来加以分析。这是随机抽样和判断抽样的根本区别。我们这⾥只讨论随机抽样问题。

第3章 随机抽样和抽样分布

第3章 随机抽样和抽样分布

例 开胸顺气丸崩解时间X~N(μ,σ2).随机抽取5丸 崩解时间为:36,40,32,41,36(min),求样本均值与样 本方差 解
xi 2 xi
36 40 32 41 36 x 37 5
36 40 32 41 36
1296 1600 1024 1681 1296
2 5
2 x i 6897 i 1
记为 F ~ F (n1 , n2 ).
其中 n1 称为第一自由度,n2 称为第二自由度。
F (n1 , n2 )分布的概率密度为 n
1 n1 2 1 n n n 1 2 1 2 y 2 n2 , y0 n1 n2 ( y) n1 n2 n1 y 2 1 2 2 n2 其它 0,
n x 1 1 2 2 x e n 2 n f ( x ) 2 ( ) 2 0 概率密度曲线图
分布的概率密度函数为
2
x0 其它
n越小,曲线越偏向 左侧,当n充分大时, 2 分布近似于正态 分布。
2、独立 若 ~ 则
2 1
变量的可加性
2
2
n1 ,2


则它们的的线性组合仍服从正态分布, 即
n n 2 2 ki X i ~ N ki i , ki i i 1 i 1 i 1 n

抽样及抽样分布

抽样及抽样分布

2 x
1 n
1 N
i
k
1
N
i
2 i
通常情况下,分层抽样的抽样平均误差小于简 单随机抽样的平均误差)。
方法: 1、比例分配法; 考虑每层中的总体单位数,按比例在每层中抽 出相同比例的样本,即
n n1 nk 常数
N N1
Nk
N1 N2 Nk N
每层的样本容量
ni
n
Ni N
2、奈曼最佳分配法;
NEXT
第三节 抽样的组织方式
简单随机抽样 分层抽样 等距抽样 整群抽样
多阶段抽样
简单随机抽样:简单随机抽样又称纯随机抽样, 是直接从总体中按随机的原则抽容量为 n 的样本, 每一个总体单位有相同的可能性被抽中。
特点:在差异较大的总体中,简单随机抽样的 样本不一定能保证样本的代表性。
NEXT
,则样本的成数为p n1
n

例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件,则不合格品所占
的成P数 1% 。若从中按随机的原则抽100件,其中
有3件不合格品,则样本的成数为p 3% 。
NEXT
样本成数的分布
用途:推断或估计总体的成数。例如某项改革 方案工人的支持率,产品的正品率等。
成数的概念 若总体单位的某种标志只有两种表现,

随机样本与抽样分布

随机样本与抽样分布

随机样本与抽样分布

随机样本是指从总体中按照一定的概率分布规律随机选择的样本。在统计学中,随机样本是进行统计推断的基础,通过对随机样本的分

析可以得出对总体的推断。而抽样分布则是指在多次独立重复抽取同

样大小的随机样本,并计算所得样本统计量的分布情况。本文将从随

机样本的概念、抽样方法、抽样误差以及抽样分布的特点等方面进行

探讨。

一、随机样本的概念

随机样本是指从总体中按照一定的概率分布规律随机选择的样本。在

进行统计推断时,我们往往无法对整个总体进行调查,而是通过对随

机样本的研究来推断总体的特征。随机样本的选择要具有代表性和随

机性,确保样本能够准确反映总体的特征。通过对随机样本的分析,

可以得出对总体的推断,从而进行决策和预测。

二、抽样方法

抽样是指从总体中选择样本的过程,其目的是获取代表性的样本以进

行统计推断。常见的抽样方法包括简单随机抽样、分层抽样、整群抽

样和系统抽样等。简单随机抽样是指从总体中随机选择若干个体作为

样本,每个个体被选中的概率相等且相互独立。分层抽样是将总体按

照某种特征分成若干层,然后从每一层中分别进行简单随机抽样。整

群抽样是将总体分成若干群,然后随机选择若干群作为样本。系统抽

样是按照一定的规律从总体中选择样本,如每隔若干个单位选择一个

单位作为样本。

三、抽样误差

抽样误差是指由于样本选择不足以代表总体而导致的误差。抽样误差

的大小受到多种因素的影响,包括样本容量、抽样方法、总体的特征等。通常情况下,样本容量越大、抽样方法越科学、总体的特征越均匀,抽样误差就越小。在进行统计推断时,需要对抽样误差进行估计,并考虑其对推断结果的影响。

数据的抽样与抽样分布

数据的抽样与抽样分布

抽样分布概念
▪ 对于一个总体容量为N的总体,无论是有限 总体或无限总体,只要所要求的抽样的样本 容量n小于总体容量,即n<N,那么可能抽取 的样本就不止一个。在一般情况下,从同一 总体中抽取的不同样本,其统计量的值也是 不同的。若我们把从某个总体中抽取样本容 量为n的所有样本的样本统计量作为一组随机 变量的话,则这一组随机变量的概率分布叫 做“抽样分布”。
第一节 统计抽样与抽样误差
▪ 无论是总体数据还是样本数据,其统计特征都是可 以用平均数、中位数以及标准差等指标来描述。当 我们对样本数据计算统计特征的指标时,所得到的 结果就叫做“样本统计量”,如果用总体的数据计 算平均数或标准差,由于它们描述的是总体的数字 特征,我们就称这些指标为“总体参数”。
▪ 一般来说,参数指的是描述总体分布特征或反映总 体模型的统计指标;统计量是指样本分布的特征指 标。
抽样误差
▪ 统计抽样的目的在于根据样本统计量推断总 体参数。
▪ 在计算样本统计量时,样本不同,统计量之 间会存在一定的差异,这是随机抽样自身固 有的差异,即不论按什么方法组织抽样,不 同样本的平均数、标准差,必定存在一定的 差异。统计上,某个样本统计量与另一个样 本统计量之间的差异,及某个样本的统计量 与总体参数之间的差异,就称为抽样误差。
▪ 整群抽样:是把总体分为许多群,然后在这些群中 随机地抽取某些“群”作为样本。

概率与统计中的随机抽样与抽样分布知识点

概率与统计中的随机抽样与抽样分布知识点

概率与统计中的随机抽样与抽样分布知识点概率与统计是数学中重要的分支之一,它研究了随机事件和随机现

象的规律。在概率与统计的领域中,随机抽样与抽样分布是基础而重

要的概念。在本文中,我们将深入探讨随机抽样与抽样分布的相关知

识点,包括其定义、性质以及在实际应用中的重要性。

1. 随机抽样的定义与性质

随机抽样是指从整体中以一定的概率选择出一部分样本的过程,

以便对整体的某些特征进行推断。随机抽样应具备以下几个基本性质:

a. 独立性:每个样本在抽取过程中的选中与否应该是彼此独立的,不受前一个样本的影响。

b. 随机性:每个样本在被选中的概率应该是相等且随机的,确保

对整体进行推断时具有普遍性。

c. 大样本量:所抽取的样本数量足够大,可以保证对整体的推断

具有较高的精确度。

2. 抽样分布的定义与性质

抽样分布是指针对不同样本规模的抽样所得到的某个统计量的分布。常见的抽样分布包括正态分布、t分布和F分布等。

a. 正态分布:当样本量趋于无穷大时,根据中心极限定理,样本

均值的分布逼近于正态分布。正态分布在统计分析中经常应用,具备

对称性和稳定性等特点,受到广泛的关注和应用。

b. t分布:在样本量较小的情况下,当总体近似于正态分布时,使用t分布来进行推断更加准确。t分布相较于正态分布而言,具有更宽

的尾部,样本量较小时可提供更精确的结果。

c. F分布:F分布是一种比值分布,常用于方差分析以及回归分析等。它是基于正态分布的样本方差比值构成的。

3. 随机抽样与抽样分布在实际应用中的重要性

随机抽样与抽样分布在各个领域的实际应用中具有重要意义,例如:

抽样及抽样分布

抽样及抽样分布

抽样及抽样分布

引言

在统计学中,抽样是从总体中选择一局部个体进行研究的过程。通过抽样可以获得总体的估计值,从而对总体进行推断。抽样是统计学的根底,也是进行统计推断的前提。

本文将介绍抽样的根本概念和方法,以及抽样分布的概念和特性。

抽样方法

进行抽样时,需要选择适宜的抽样方法。常见的抽样方法包括简单随机抽样、系统抽样、分层抽样和群组抽样等。

简单随机抽样

简单随机抽样是最根本的抽样方法,每个个体被随机地选入样本,且每个个体被选入样本的概率相等。这种方法可以确保样本具有代表性。

系统抽样

系统抽样是按照一定的规那么从总体中选取样本,例如每隔一定间隔选取一个个体。这种方法简单实用,但需要注意规那么的选择是否会引入偏差。

分层抽样

分层抽样是将总体分成假设干层,然后从每层中随机选取个体组成样本。这种方法可以保证每个层次都有足够的代表性。

群组抽样

群组抽样是将总体划分为假设干群组,然后随机选取假设干群组作为样本。这种方法适用于总体中包含多个群组,但群组内个体相似的情况。

抽样分布

抽样分布是指抽样统计量的分布。统计量可以是样本均值、样本方差、样本相关系数等。

样本均值的抽样分布

假设总体服从正态分布,样本均值的抽样分布也会服从正态分布。根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将变得更加接近正态分布。

样本方差的抽样分布

样本方差的抽样分布是以总体方差为参数的分布,通常服从卡方分布。样本容量的大小将影响样本方差的抽样分布形状。

样本相关系数的抽样分布

样本相关系数的抽样分布通常是以总体相关系数为参数的分布。样本容量的增加会使样本相关系数的抽样分布趋向于正态分布。

样本及抽样分布教案

样本及抽样分布教案

样本及抽样分布教案

教案标题:样本及抽样分布教案

教案目标:

1. 理解样本和抽样分布的概念。

2. 学习如何进行简单随机抽样。

3. 掌握样本统计量的计算方法。

4. 理解抽样分布的特征和应用。

教案步骤:

步骤一:引入(5分钟)

1. 引导学生回顾总体和样本的概念。

2. 提出问题:为什么我们需要使用样本进行统计推断?

3. 解释抽样分布的概念,并强调其在统计推断中的重要性。步骤二:样本抽取方法(10分钟)

1. 介绍简单随机抽样的概念和步骤。

2. 解释如何使用随机数表或随机数生成器进行简单随机抽样。

3. 提供示例和练习,让学生实际操作并抽取样本。

步骤三:样本统计量的计算(15分钟)

1. 介绍样本均值和样本比例的概念。

2. 解释如何计算样本均值和样本比例。

3. 提供示例和练习,让学生计算样本统计量。

步骤四:抽样分布的特征(15分钟)

1. 解释抽样分布的概念和特征。

2. 引导学生理解中心极限定理的作用。

3. 通过示例和图表展示不同样本大小下的抽样分布特征。

步骤五:抽样分布的应用(10分钟)

1. 解释抽样分布在统计推断中的应用。

2. 引导学生理解如何使用抽样分布进行区间估计和假设检验。

3. 提供实际应用案例,让学生运用抽样分布进行推断分析。

步骤六:总结与评价(5分钟)

1. 总结样本及抽样分布的重要概念和方法。

2. 提醒学生练习和巩固所学知识。

3. 鼓励学生提出问题和分享观点。

教案评估:

1. 练习题:提供一些样本抽取和样本统计量计算的练习题,检查学生对所学内容的理解和应用能力。

2. 课堂讨论:引导学生参与课堂讨论,评估他们对抽样分布应用的理解和思考能力。

统计学之抽样与抽样分布

统计学之抽样与抽样分布

考察所有900个申请者
• 考试成绩
• 总体平均成绩
xi 990
900
• 总体标准差
(xi )2 80 900
考察所有900个申请者
• 无相同工作经验的申请者比例
• 总体比例
p 648 .72 900
使用随机数表随机选择30个申请者作为样本进行研 究,从书上随机数表第三列开始
a. Bayes’ 定理 b. Chebyshev 定理 c. 中心极限定理 d. 以上都不是
正确答案: c. 中心极限定理
6. 如果一个点估计值的期望值等于总体参数,则称这个点估
a. 一致性 b. 稳定性 c. 无偏性 d. 以上都不是
正确答案: c. 无偏性
7. 当下面哪个条件成立时,需要在计算标准误时考虑有限总
9. 总体平均值为75,标准差为10。从中抽取一个容量为20的 本平均值的期望值等于多少?
a. 2.236 b. 10 c. 75 d. 无法判断
正确答案: c. 75
10.总体平均值为75,标准差为10。从中抽取一个容量为20的 本平均值的标准差等于多少?
a. 2.236 b. 10 c. 75 d. 无法判断.
6
5
1127

=RAND()
7
6
1015

=RAND()
8
7

随机样本及抽样分布

随机样本及抽样分布

2
(n)
(2)若P{X>λ}= ,则
12 (n)
1
2 (n)
X
2
例6.3.4.设X~ (10),P{X>λ1}=0.025, P{X<λ2}=0.05,求λ1,
解:
1
2 0.975
(10)
查表得: 1 20.483
λ2.
2
2 0.05
(10)
查表得: 2 3.940
五、t 分布及其性质
Yi ~ N(0,1) 3

Y
9
(Yi )2 1 39
9
Yi 2 ~ 2 (9)
i 1
i 1
X 与Y 独立,
所以
U X ~ t(9) Y /9
六、F 分布及其性质
1.定义 设随机变量 U ~ 2(n1 ), 随机变量V ~ 2(n2 ), 且
F 它们相互独立,则称随机变量
U / n1 V / n2
i1
[6] 2X1X2 ...Xn
常用统计量:
① 样本均值
X
1 n
n i1
Xi
② 样本方差 ③ 样本标准差
S2
1 n1
n i1
(Xi
X)2
S
1 n
1
n i1
(Xi
X)2
④ 样本k阶原点矩 ⑤ 样本k阶中心矩

抽样与抽样分布

抽样与抽样分布

系统抽样(systematic sampling)
将总体各单位按某种顺序排列,并按某种规则确 定一个随机起点,然后,每隔一定的间隔抽取一 个单位,直至抽取n个单wk.baidu.com形成一个样本。
整群抽样(cluster sampling)
在总体中以群(或组)为单位,将简单或系统抽 样方式,抽取若干群(或)组,然后对所有抽中 的各群(或各组)中的全部单位一一进行调查。
抽样分布(sampling distribution)
从一个给定的总体中抽取容量为n的所有可能样 本,对于每一个样本,计算出某个统计量(如样 本均值或标准差)的值,不同的样本得到的该统 计量的值不一样的,由此得到这个统计量的概率 分布,称之为抽样分布。
抽样分布
构造抽样分布的步骤
样本统计量全部 可能的数值对应 的概率分布,即 抽样分布。
抽样中的泰坦尼克事件
实际选举结果正好相反, 最后罗斯福在选举中获胜. 具体数据如下:
候选人 罗斯福 兰顿 预测结果% 43 57 选举结果% 62 38
简单随机抽样(simple random sampling)
1. 重复抽样 2. 不重复抽样
简单随机抽样
假设我们从总体N个单位中抽取n个单位作为样本 重复抽样:当我们从总体中抽取1个单位后,要 把这个单位放回到总体中再抽取第2个单位。 不重复抽样:n个单位从总体中一一抽取出来, 并且当一个单位被抽中后不再放回总体中。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t X Y n
服从自由度为n的t分布,记作 t~t(n)。
《医药数理统计方法》
§4.3
注:1)t(n)分布的概率密度为
f(x ) (n 2 1 )(1 x2) n 2 1, ( x ) n (n 2) n
2)当n→∞时,t分布的极限分布为标 准正态分布。
(Xi
)2
2(X
n
)
i1
(Xi
)
n
(X
i1
)2]

1 n 1
E[
n i1
(Xi

)2

n(X

)2 ]

1{ n 1
n i1
E[( X i

)2]
nE[( X

)2 ]}

n
1
1
[
n i1
V
(
X
i
)

nV
(
X
)]

1 (n 2
i1
i1
这里ci是不全为零的常数。
《医药数理统计方法》
§4.3
2、Th4.3 设X1,X2,…,Xn是正态总体N(μ,σ2)的一个样本,

X ~ N(, 2 )
n
从而
X

~
N (0,1)
n
《医药数理统计方法》
§4.3
二、 2 分布 1、定义 设相互独立随机变量 X1,X2,…,Xn, 均服从标准正态分布N(0,1),则称
《医药数理统计方法》
§4.3
§4.3 抽样分布
一、 X 的分布 二、 分2 布 三、t分布 四、F分布
《医药数理统计方法》
§4.3
一、X 的分布
1、正态随机变量的性质 1)随机变量X~N(μ,σ2)的线性函数
Y=aX+b仍服从正态分布,且 Y~N(aμ+b,a2σ2),
这里a,b均为常数,且a0。
《医药数理统计方法》
§4.3
2、Th4.4 设 2~2(n),则E(2)=n,V(2)=2n
3、Th4.6 设X1,X2,…,Xn是正态总体N(μ,σ2)的一个样本,

(1)
(n 1)S2
2
~
2(n 1)
(2) X 与S2 相互独立
《医药数理统计方法》
§4.3
三、t分布 1、定义 设随机变量X~N(0,1),Y~2(n), 且X与Y相互独立,则称随机变量
②α 较大时,利用公式
1 F1(n1,n2)F(n2,n1)
《医药数理统计方法》
§4.3
3)X~2(n1),Y~2(n2),且X与Y相互独立,则
X n1 Y n2
F(n1,n2)
P(Y Xnn21F1(n1,n2))
P(Xn1 1 )
Yn2 F(n2,n1)
Y n2 X n1
F(n2,n1)
P(Yn2 Xn1
F(n2,n1))
F分布的左侧小概率 ,可以转化为另一个分布的右侧小概率
《医药数理统计方法》
§4ቤተ መጻሕፍቲ ባይዱ3
2、Th4.9 设X1,X2,…,Xn1和Y1,Y2,…,Yn2分别为取自正态
总体 N(1,12) 和 N(2,22)的样本,且它们 相互独立,则有
《医药数理统计方法》
§4.1
3、样本方差 S2 n11in1(Xi X)2
注:1)简算公式
S2

1 n1
n i1
(Xi
X)2

1 n1
n i1
[Xi2
2Xi
X
(X)2]

1[ n1
n i1
Xi2
2X
n i1
Xi

n i1
(X)2]

1[ n1
总体 N(1,2) 和 N(2,2)的样本,且它们相 互独立,则有
(XY)(12)
S
11 n1 n2
~t
(n1
n2
2)
其中
S
(n11)S12(n21)S22 n1n22
《医药数理统计方法》
§4.3
四、F分布 1、定义 设随机变量 X~2(n1),Y~2(n2), 且X 与Y相互独立,则称随机变量 F X n1 Y n2 服从自由度为n1,n2的F分布, 记作 F~F(n1,n2)。
f
(x)

n 22
1 (n2)
x e n21 2x
,
x

0

0
,x0
其中Gamma函数 (s) xs 1exdx,(s0) 0
《医药数理统计方法》
§4.3
4)查表 ① n≤30,查P276附表6
P(2 2)
② n>30,利用公式
2(n)1 2(u 2n1)2
2 X 1 2 X 2 2 X n 2
服从自由度为n的2分布,记作 2~2(n)。
《医药数理统计方法》
§4.3
注:1)自由度(degree of freedom)--统计量 中独立变量的个数,记为df。
2)定义中的n可取1,即 X~N(0,1),则X2~2(1)
3)2(n)分布的概率密度为
S12 S22
2 1
2 2
~F(n11,n21)
《医药数理统计方法》
Ch3
内容小结
1.抽样的基本概念 (总体X、个体、样本、统计量等) 2.样本推断总体的理论依据 (连续型-样本频率分布密度,样本分 布函数) 3.抽样分布
X的分布,χ2分布,t分布,F分布
的分布函数,这样的样本称为简单随机样本, 简称样本。
注:1)特性:随机性、独立性、代表性; 2)在实际问题中,总体个数N较大,抽
取的样本容量n较小时,可近似地认为放 回与否不影响抽样的独立性,而采用无放 回抽样,减少工作量。
《医药数理统计方法》
§4.1
三、统计量 1、定义 设X1,X2,…,Xn为总体X的一个样本, g(X1,X2,…,Xn)是一个连续函数,且g中不包 含任何未知参数,则称g为一个统计量。
《医药数理统计方法》
§4.3
注:1)F(n1,n2)分布的概率密度为
(n1n2) 2
(n1)(n1
x)n211(1n1
x)n12n2,x0
f(x) (n1)(n2) n2 n2
n2
22
0
,x0
《医药数理统计方法》
§4.3
2)查表 ①α 较小时,查P278附表8
P (FF )
n 1
n
1 2)
n
2
《医药数理统计方法》
§4.2
§4.2 样本分布图
连续型随机变量的概率密度或分布函数全面刻 画了总体的分布规律,我们用样本推断总体的 理论依据:
1、样本容量n越大且组距充分小时,样本的 频率分布密度越接近于总体的概率密度函数。 (P86)
2、样本容量n充分大时(n>50),样本的分布 函数近似等于总体的分布函数。(P88)
《医药数理统计方法》
§4.3
3)查表 ① n≤30,查P277附表7
P(T t)
2
② n>30,利用公式
t u
2
2
《医药数理统计方法》
§4.3
2、Th4.7 设X1,X2,…,Xn是正态总体N(μ,σ2)的一个样
本,则
X
S

~
t(n
1)
n
《医药数理统计方法》
§4.3
3、Th4.8 设X1,X2,…,Xn1和Y1,Y2,…,Yn2分别为取自正态
注:E(Y)=E(aX+b)= aE(X)+b=aμ+b V(Y)=V(aX+b)= a2V(X)=a2σ2
《医药数理统计方法》
§4.3
2) n个相互独立的随机变量
Xi~N(μi,σi2),(i=1,2,…,n)的线性组合
n
X ci X i 仍然服从分态分布,且
i 1
n
n
X~N( cii, ci2i2)
注:样本X1,X2,…,Xn是随机变量,而统计量 是随机变量的函数,因此统计量是一个随机 变量。
《医药数理统计方法》
§4.1
2、样本均数
1n X n i1 X i
1n
1n
E (X ) E (ni 1X i)ni 1E (X i) E (X )
1n
1n
1
V (X ) V (ni 1X i) n 2i 1 V (X i) n V (X )
n i1
Xi2
n(X)2]
《医药数理统计方法》
§4.1
2) E(S2)=σ2 (P97例5.1)
设总体均数μ 总体方差σ2
E(S 2 )

E[ 1 n 1
n i1
(Xi

X
)2 ]

n
1
1
E{
n i1
[(
X
i

)
(X

)]2 }

1
n
E[
n 1 i1
《医药数理统计方法》
§4.1
2、抽样 在一个总体X中抽取n个个体X1,X2,…,Xn,
称为抽样; 这n个个体称为总体X的一个样本; n称为样本容量; 随机变量X1,X2,…,Xn的具体观察值
x1,x2,…,xn称为样本观察值,简称样本值。
《医药数理统计方法》
§4.1
3、(简单随机)样本 样本X1,X2,…,Xn相互独立且与总体有相同
随机抽样及抽样分布
《医药数理统计方法》
§4.1
§4.1 抽样的基本概念和方法
一、总体与个体 二、样本 三、统计量
《医药数理统计方法》
§4.1
二、样本
1、了解总 体
全面的观察统计 抽取部分观察统计
对总体X进行n次观察 第一轮 x1 ,x2 ,…,xn 第二轮 x21,x22,…,x2n ……
每一轮的第一次观察值,看成 X1 的一次取值
相关文档
最新文档