天津大学研究生应用统计学第一章第二节课内容
天津大学研究生培养方案课程设置样本(硕士)
![天津大学研究生培养方案课程设置样本(硕士)](https://img.taocdn.com/s3/m/019dfcbdd1f34693daef3e8f.png)
专业:机械设计及理论编号:S20102
一、研究方向
1、机构学
2、机械动力学
3、啮合理论及应用
4、机械传动
二、课程设置
课程
类别
课程编号
课程名称
学时
学分
备注
学位课
S131G001
马克思主义理论课
90
3
第一外国语
60
2
选1门
S131GA01
应用泛函分析
40
2
S131GA02
矩阵论
32
2
选1门
S131GA03
32
2
必修课
S201R001
学术报告
1S201R002实来自技能1公共必修课Ⅰ
32
2
跨门类
选1门
公共必修课Ⅱ
32
2
跨一级学科选1门
选修课
S201E003
机构分析与综合
24
1.5
不少于6学分(至少1门跨一级学科选课)
S201E004
机械动力学
24
1.5
S201E005
齿轮啮合理论
24
1.5
S201G021
现代设计方法
24
1.5
分委会主席(签字):
年月日
工程与科学计算
32
2
S131GA04
随机过程基础
32
2
S131GA05
数理方程
32
2
S131GA06
应用统计学
32
2
S131GA07
最优化方法
32
2
S201G001
工程测试理论与方法
32
应用统计学PPT课件
![应用统计学PPT课件](https://img.taocdn.com/s3/m/a29e0c00192e45361066f5d9.png)
2018/11/22
一、统计涵义
Statistics: (1)Numeric data, when used as plural of statistic. (2)A scientific procedure used in the study and evaluation of numeric data.
19
经 济 统 计
社 会 统 计
教 育 统 计
统
计
学
物 理 统 计
生 物 统 计
医 药 统 计
2018/11/22
2 统计学对象方法
对象:实质性学科与方法论学科
理论统计学与应用统计学
方法:特殊方法论与通用方法论
描述统计学与推断统计学
大量观察,平均分析,归纳推断
2018/11/22
20
统计学家与数学家的对话
数据→信息→知识→智慧
2018/11/22 15
四、统计科学 1 统计学发展简史 2 统计学对象方法 3 统计学基本概念
2018/11/22
16
1 统计学发展简史
英国(1690),威廉· 配第,政治算术 德国(1749),阿亨瓦尔,国势学 比利时(19世纪中),凯特勒,数理统计 德国(19世纪中),恩格尔,社会统计
2018/11/22 32
第三章 统计整理
一、整理程序 二、统计分组
三、频数分布 四、统计图表
格 罗 夫 纳
数 字 不 会 说 谎 , 但 说 谎 的 人 会 想 出 办 法 。
33
2018/11/22
一、整理程序
审核:计算审核,逻辑审核 分组:分类,分组 汇总:手工汇总,电子汇总 表现:列表,图示
天津大学研究生应用统计学第2章部分课件0929完整版
![天津大学研究生应用统计学第2章部分课件0929完整版](https://img.taocdn.com/s3/m/fa24b81deff9aef8941e062b.png)
n
X i 是的相合估计量。 i
1
n
结论:样本k阶原点矩是总体k阶原点矩的相合估计量
证明相合估计的方法
• Rao-Cramer 不等式 • 有效估计量
Rao-Cramer正则分布族
• C-R下界不是整个无偏估计类的下界,而是正规无偏 估计类的下界 • 指数型分布族, 不但能满足定理条件, 对g(θ)的任何 无偏估计成立,还能使不等式中“=”成立的唯一 的一个分布族
优点: 直观、简便,特别对总体期望和方差进行 估计时不需要知道总体的分布.
不足:①要求总体原点矩存在,而有些随机变量 的原点矩不存在,就不能用此法进行参数估计;
② 矩估计量有时不唯一; ③ 没有利用总体分布函数所提供的信息, 难保证有优良的性质.
2、极大似然估计法
极大似然思想 有两个射手,一个人的命中率为0.9,而另一 个人的命中率为0.1,现有一个人向目标射击了一 次,结果命中了,估计是谁射击的? 一般地,事件A发生的概率与参数有关,取值 不同,则P(A)也不同。认为此时的值应是在中使 P(A) 达到最大的那一个。 即一次试验就出现的 事件有较大的概率 . ----这就是 极大似然思想
2 ( x ) i exp 2 2 2
1
1 1 exp 2 2 ( 2 ) n
( xi ) i 1
n 2
对数似然函数为
n n n 1 ln L ln(2 ) ln 2 2 ( xi )2 2 2 2 i 1
例4 设在罐中放有许多白球和黑球,已知两种球的数
目之比为1:3, 但不知哪种颜色的球多, 若采用有放 回方式从罐中取3个球,发现有一只黑球,问在此情况 下应估计哪种颜色的球多? 解:设 p=白球所占比例 则 p=1/4或 p=3/4 若X表示取3个球中白球的个数,则 X B 3, p .
天津大学应用统计学研究生课程简介
![天津大学应用统计学研究生课程简介](https://img.taocdn.com/s3/m/589e286de418964bcf84b9d528ea81c758f52ecd.png)
天津大学应用统计学研究生课程简介1 / 15【育明教育】中国考研考博专业课辅导第一品牌官方网站:1育明教育专注于天津大学考研专业课辅导始于2006,八年辅导经验育明教育徐老师赠言:你若盛开,清风自来天津大学2014年硕士生入学考试初试进入复试基本分数要求Ⅰ学术型2 / 15【育明教育】中国考研考博专业课辅导第一品牌官方网站:2Ⅱ全日制专业学位3 / 15【育明教育】中国考研考博专业课辅导第一品牌官方网站:3Ⅲ援藏计划、少数民族高层次骨干人才计划、单独考试附注:1、参加复试的考生需符合天津大学复试分数基本要求,但能否参加复试,还须根据所报学院学科(专业)的情况确定。
实行差额复试,由学院(部)组织,相关复试录取细则(或工作方案)也会陆续公布在我校研究生招生网和学院网页上。
2、对于进入复试名单的考生,参加复试前及时网上缴纳复试费,缴纳成功后可自行下载打印《资格审查合格单》。
我校研究生院将统一进行资格审查,时间:2014年3月20日下午、4 / 15【育明教育】中国考研考博专业课辅导第一品牌官方网站:43月21日全天,地点:25教学楼A 区一层大厅,缴费开通时间及资格审查安排近期公布。
复试时间:2014年3月22日至3月25日,具体复试方案由各学院安排。
3、所有参加复试的考生以及本校推免生需到我校校医院进行体检。
体检标准参照教育部、卫生部、中国残疾人联合会修订的《普通高等学校招生体检工作指导意见》,不参加体检或体检不合格者不予录取。
体检时间为3月19日—21日,具体安排另行通知。
4、符合教育部认可或备案“大学生志愿服务西部计划”、“三支一扶计划”、“农村义务教育阶段学校教师特设岗位计划”、“赴外汉语教师志愿者”、“选聘高校毕业生到村任职”等项目加分政策的考生,以及目前工作单位在民族区域自治地方范围,为原单位定向培养的少数民族在职人员考生(不含单考生、MBA 考生、MPA 考生、MEM 考生),在国家政策允许的范围内对符合基本培养条件的考生适当照顾。
研究生统计学讲义第1讲第一章绪论-PPT文档资料
![研究生统计学讲义第1讲第一章绪论-PPT文档资料](https://img.taocdn.com/s3/m/393ab1cd6294dd88d1d26b0a.png)
意义
1.利用概率论与数理统计进行统计设计,搜集和整理 资料,对分析结果进行恰当的解释,作出科学结论。 2.保证分组具有可比性,保证有合适的样本容量. 3.控制实验误差,是否在科学上具有可重复性. 4.在撰写论文或报告时,将大量原始数据归纳整理为 正确的统计指标,按照规范列出统计表(图). 5.能够读懂国内外医学文献中的统计资料,判断其 可靠程度和局限性,吸收和借鉴.
3.概率与频率 概率(probability)和频率(frequency) 都是反映某一随机事件发生可能性大小的度量。 若随机事件A在n次独立重复试验中发生了m次,则称 m为频数(counts)。称比值m/ n为事件A在n次试验中出 现的频率或相对频数(relative frequency) ,0≤m/ n≤1, 即事件A发生的频率为m/ n。 试 验 者 De Morgan Buffon Pearson Pearson 掷币数n 2048 4040 12000 24000 正面数m 1061 2048 6019 12019 正频率fn 0.5181 0.5069 0.5016 0.5005
2.总体、个体与样本 研究对象的全体称为总体 (population)。构成总体的每个成员称为个体,亦称 样品或观察单位。总体是根据研究目的所确定的性 质相同的所有个体的研究指标值的集合。 个体(individual)即观察单位(study unit)。总 体的性质特征由其各个个体的性质而定,要研究总 体的性质或特征,须对它的个体进行观测。 从总体中随机抽取部分个体的过程称为抽样 (sampling),从总体中随机抽取的代表总体的部分个 体的观察值集合称为样本(sample)。样本中所包含的 个体数目,即样本例数,称为样本含量(sample size) 。总体中有很多个体,究竟哪些个体在抽样中被抽 到,要依机会而定。因此,样本是随机变量;
天津大学《概率论与数理统计》课件-第一章随机事件与概率
![天津大学《概率论与数理统计》课件-第一章随机事件与概率](https://img.taocdn.com/s3/m/7d89d9efb04e852458fb770bf78a6529647d35c6.png)
基本事件
复合事件
必然事件
不可能事件
子集
随机事件
互为对立事件
要点2: 事件的关系、运算和运算法则
四种关系:包含、相等、对立、互不相容
四种运算:和、积、差、逆
四个运算法则:交换律、结合律、分配律、对偶律
事件与集合的关系及运算对照
记号
概率论
集合论
A B
包含:事件A发生导致B也发生
A是B的子集
即:
若P(A) > 0,则P(AB)=P(A)P(B|A)
(1)
同理,若P(B) > 0,则P(AB)=P(B)P(A|B)
(2)
(1)和(2)式都称为乘法公式,利用条件概率
求积事件的概率.
推广
3个事件: 若P( AB) 0,
P( ABC ) P( AB) P(C | AB) P( A) P( B | A) P(C | AB)
Nn
注:事件B与事件A的区别:B中各含一球的n个格
子没有指定。
例3 生日问题
若不考虑闰年,假定一个人在一年内每一天出生
的可能性相同,求任意n个人生日各不相同的概
率。
思路:
365 天 365 个格子; n个人 n个球;
生日互不相同 每格至多一球
解:A {n个人生日各不相同}
n
365
T
o
故所求的概率为
y
y xt
x yt
•
•
t
T
阴影部分面积
p
正方形面积
T 2 (T t )2
2
T
t 2
1 (1 ) .
T
应用统计方法第一章数理统计基本概念
![应用统计方法第一章数理统计基本概念](https://img.taocdn.com/s3/m/153a5f07fe4733687e21aa6b.png)
2020/4/16
27
一、 直方图(Histogram) 设 X1, X 2 , , X n 是总体 X 的一个样本,又设总体具有
概率密度 f ,如何用样本来推断 f ?注意到现在的样本 是一组实数,因此,一个直观的办法是将实轴划分为若 干小区间,记下诸观察值 X i 落在每个小区间中的个数, 根据大数定律中频率近似概率的原理,从这些个数来推 断总体在每一小区间上的密度。
i
1, 若X i 0, 若X i
(t j1, t j (t j1, t j
] ]
,
i
1,
2,L
,n
则 i 是独立同分布于两点分布: P{i x} p x (1 p)1x , x 0或1
其中 p P{X (t j1, t j )} ,
2020/4/16
32
由柯尔莫哥洛夫强大数定律,我们有
2020/4/16
17
(ⅰ)无放回时:
P{ X 1
1,
X2
1,
X3
1}
5 10000
4 9999
3 9998
(ⅱ)有放回时:
P{X 1
1,
X2
1,
X3
1}
555 10000 10000 10000
5
3
10000
2020/4/16
18
显然(ⅰ)中的抽样方式不是独立的,每次抽样的结果都 将影响下一次抽样的分布,这种抽样不是我们通常研究的 抽样。而(ⅱ)中的抽样,则是多次独立的抽样,它们是 同分布的,即我们通常称为的随机抽样(Random sample)。 这样得到的数据,即是我们常研究的简单随机样本(Simple random sample),或就直接称为样本。
工科研究生“应用数理统计”课程的教学大纲及教学日历
![工科研究生“应用数理统计”课程的教学大纲及教学日历](https://img.taocdn.com/s3/m/cf9aeace48649b6648d7c1c708a1284ac850056c.png)
工科研究生“应用数理统计”课程的教学大纲及教学日历“应用数理统计”课程教学大纲(B)序号:课程编号:课程名称:应用数理统计/ Mathematical Statistics with Application学时:40学分:2责任教师:适用专业:材料物理与化学、材料科学与工程、材料学、材料加工工程、建筑技术科学、化学工程与技术、生物学、药剂学、采矿工程、矿物加工工程、安全技术及工程、资源综合利用工程、安全管理工程、环境科学与工程等.先修课程:高等数学(二)、线性代数.课程教材:杨虎,刘琼荪,钟波. 数理统计[M]. 北京: 高等教育出版社,2004年10月.参考资料:1. 孙荣恒. 应用数理统计[M]. 北京: 科学出版社, 2003年.2. Irwin Miller, Marylees Miller. 数理统计与应用[M]. 北京: 清华大学出版社(影印版), 2005年1月.3. 吴喜之. 统计学——从数据到结论(第二版)[M]. 北京:中国统计出版社,2006年10月.4. 杨虎, 刘琼荪, 钟波. 概率论和数理统计[M]. 重庆: 重庆大学出版社,2007年6月.一、课程的性质、目的和任务统计方法是现代工程、信息、社会和经济问题研究的基本方法,学习统计思想和运用统计方法已成为时代的要求。
数理统计是工科研究生的公共基础课,本课程的教学目标是使学生在掌握概率统计的基本理论知识和基本方法的基础上,随机性思维和统计数据分析能力得到培养,最终能理论联系实际,提高运用数理统计分析工具理解专业领域知识、从事深层次专业研究与应用的能力。
二、课程的教学内容和基本要求1.概率论基本知识(10学时)(1)明确概率论的研究对象、研究内容;(2)理解样本点、样本空间、随机事件、随机变量、概率分布的概念,理解这些概念在研究随机现象及其统计规律中的作用;(3)掌握一元随机变量分布的性质和计算方法;(4)理解多元随机变量的联合分布与边缘分布的概念,掌握边缘分布计算方法,在独立条件下会利用边缘分布求多元随机变量的联合分布;(5)理解随机变量数字特征的含义,掌握数字特征的基本性质,会计算数字特征;(6)掌握常见分布及其性质和数字特征,掌握正态分布的性质和计算方法。
应用统计学电子课件
![应用统计学电子课件](https://img.taocdn.com/s3/m/17761ef8fab069dc5022011f.png)
(三) 统计学与其他学科的关系
统计学和数学的关系 统计学中具有方法论性质的数理统计学是应用 数学的一个分支,因此统计学与数学的关系十分 密切,且与其他的应用数学有一定的共性。如和 数学中的有关定理一样,统计中的一些分布也是 客观现象数量特征的一种抽象。 统计学与其他的数学分支相比又有其特殊性。 (1) 处理的数据不同。 (2) 处理的方法不同。
客观 事物
统计研究的特点
总体性 统计研究就是总的、综合的数量研究。一般 理解的总体是指统计总体,是由同类个体组成的 集合体,如人口总体、企业总体、商品总体等等, 这时统计研究的目的不是计量个体的特征表现, 而是对个体的特征表现进行统计整理和统计分析, 得到总体的综合的数量特征。
统计研究的特点
二、标志与变量 (二)变量
1.概念:可变的数量标志和指标。数量标志的具体 表现称变量值。 2.种类: ①按变量值是否连续分:
离散型变量:变量值只能取整数; 连续型变量:变量值能取小数。
②按影响变量因素不同分:
• 确定性变量:由确定性因素影响; • 随机性变量:由随机性因素影响;
三、统计指标与统计指标体系
理论统计学
数理统计学 数理统计学是应用数学的一个分支,在这里作为统计 学的一个分支,它以概率论等数学理论为基础,研究随机 现象的数量规律,是一门纯方法论的科学,为其它学科提 供数学分析和推断的方法与技术。
统计学原理 统计学原理是在统计实践的基础上,对统计理论方法 的最一般概括,内容包括统计的对象和任务,统计的理论 基础和方法论基础,以及关于统计活动各个环节的理论和 方法。统计学原理中结合了数学、概率论和数理统计学的 知识,又是统计实践经验的高度总结,是指导统计实践活 动的科学依据。一般所说的统计学就是指统计学原理。
应用统计方法第一章数理统计基本概念PPT课件
![应用统计方法第一章数理统计基本概念PPT课件](https://img.taocdn.com/s3/m/c69c2cbf9f3143323968011ca300a6c30d22f167.png)
多元线性回归模型建立与求解
模型建立
多元线性回归模型描述多个自变量与因变量之间的线性关 系,形式为y=β0+β1x1+β2x2+⋯+βpxp+ε。
01
最小二乘法
与一元线性回归类似,通过最小化残差 平方和来估计参数β0,β1,…,βp。
选择检验统计量
根据问题的性质,选择合适的检验统计量 ,并确定其分布。
计算检验统计量的值
根据样本数据,计算检验统计量的值。
确定显著性水平
根据问题的要求,选择合适的显著性水平 $alpha$。
单侧检验和双侧检验选择依据
单侧检验
当备择假设具有方向性时,即只关心参数变 化的方向而不关心变化的大小,应选择单侧 检验。例如,比较两种药物的疗效,只关心 新药是否比旧药好。
双侧检验
当备择假设不具有方向性时,即关心参数变 化的大小而不关心变化的方向,应选择双侧 检验。例如,检验某批次产品的质量是否合 格。
假设检验在实际问题中应用举例
01
医学领域
比较两种药物的疗效、评价某种治 疗方法的效果等。
农业领域
比较不同品种农作物的产量、评估 某种肥料的效果等。
03
02
工业领域
检验某批次产品的质量是否合格、 评估生产过程的稳定性等。
研究对象的全体个体组成的集合。
总体分类
根据研究目的和范围,总体可分为有限总体和无限总体。
样本概念及选取方法
样本定义
从总体中随机抽取的一部分个体组成的集合。
样本选取方法
简单随机抽样、分层抽样、系统抽样等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体p分位数
分位数
设p满足0 p 1,若x p 使P{ X x p } F ( x p ) p,则 1 称x p 为该分布的p分位数。当p 时,x 1 称为中位数。 2 2
样本p分位数与总体p分位数的关系
定理: 设总体X具有密度函数f ( x),x p 为p分位数(0 p 1), 若f ( x)在x x p处连续且不为零,则样 本p分位数x 渐
数理统计的应用
• 数理统计是应用性很强的学科。在工农业 生产、医药卫生、生物、环境、经济、管 理、金融、保险等领域发挥着重大作用。 • 软件: • Matlab、SPSS、 SAS、 • R软件 /bin/windows/base/
教学参考书
5
10
15
20
25
Cochran 分解定理 设X 1 , X 2 , , X n是独立同分布的随机变 量,X i 服从N(0, 1),i 1, 2, n,Qi(i 1, 2, k ) 是X 1 , X 2 , , X n的二次型,其秩为 ni . 如果Q1 Q2 Qn
当给定次序统计量的观测值 x(1) x(2) ... x(n) 时, 对任意实数x,
0, x x(1) , k Fn ( x) , x( k ) x x( k 1) , n 1, x( n ) x;
n ( x) 个数,则称 Fn ( x ) 为经验分布函数。 n
Rnn X ( n ) X (1)为极差. 称D
注 : X (1 ), X ( 2 ), , X ( n )不 独 立
2.经验分布函数 定义6.1.4 设 X1 ,, X n 是取自总体X的样本
用 n ( x ) 表示 ( X 1 , X 2 , , X n )中不超过 x Байду номын сангаас观测值的
* p
p ( 1 p ) . 近服从正态分布 N xp , 2 nf ( x ) p
极值分布
统计中常用的分布族
Gamma分布族
- 函数 ( ) x 1e x d x
0
1 ( ) ; (1) 1; (n 1) n(n); 2
1 , 0 x ; 解 总体X 的概率密度为f ( x; ) 0, 其他. 因为服从均匀分布,根据最小
次序统计量与最大次序统计量 之间的概率密度函数与分布函 数的关系知:
0, x 0; x X 的分布函数为F ( x; ) , 0 x ; 分布函数与概率密度之间存在 求导的关系,对概率密度函数 1, x. 进行积分得到分布函数
均值 中位数 众数 均值=中位数 = 众数 众数 中位数 均值
左偏分布
对称分布
右偏分布
众数、中位数和均值的特点和应用
1. 众数
– – – 不受极端值影响 具有不唯一性 数据分布偏斜程度较大时应用
2. 中位数
– – –
– – –
不受极端值影响 各变量值与中位数的离差绝对值之和最小 数据分布偏斜程度较大时应用
所以, X (1)的概率密度为 n x n 1 1 , 0 x ; f X (1) ( x; ) 0, 其他.
X ( n )的概率密度为 n n 1 n x , 0 x ; f X ( n ) ( x; ) 其他. 0,
解 将样本值由小到大排序得28<29<30<32=32<35<65,则
0, x 28, 1 , 28 x 7 2 , 29 x 7 3 Fn ( x ) , 30 x 7 5 7 , 32 x 6 , 35 x 7 1, 65 x; 29, 30, 32, 35, 65,
n 2
2. 若X服从 2(n) ,则 E( X ) n,Var( X ) 2n
3. 若X 1服从 2(n1 ) ,X 2服从 2(n2 ) ,且X 1和X 2相互独立, 则 X 1 X 2服从 2(n1 n2 )
0.4
n=2
0.3
n=3
0.2 0.1
n=5 n = 10 n = 15
i 1 n
常用统计量的期望和方差
常用统计量的期望和方差
样本矩的以上性质,不论总体F(x)是什么 形式,均普遍成立。
三、次序统计量与经验分布函数
1.次序统计量
设 X 1 , X 2 , , X n 为来自总体X 的样本, ( x1 , x2 , , xn ) 是样本观测值,将它们由小到大排序为 x x x ,当 X 1 , X 2 , , X n 取值
例 1 从总体中抽取容量为7的样本,其观测值为: 32,65,28,32,35,30,29. 试求X的经验分布函数. LR: 将数按从小到大的顺序排列 为28,29,30,32,32,35,65
得到其经验分布函数为 FX(n)= 0 , x<28 1/7,28≤x<29 2/7,29≤x<30 3/7,30≤x<32 5/7,32≤x<35 6/7,35≤x<68 1 ,65≤x
易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用
3. 均值
整理数据的方法
• 用图、表等将数据表达成直观的形式
频率直方图、茎叶图、箱线图
• 构造样本的某种函数
该函数应汇集样本中与总体有关的主要信息,舍 弃无关的次要部分,且不包含未知参数
统计量
6. 统计量 不含有任何未知参数的样本的函数g X 1 ,, X n 称为统计量.
分 布 函 数 为 F(1 )( x ) 1 1 F( x )
(2) 最大次序统计量X ( n )的概率密度为 f X ( n ) ( x; ) n[ F ( x; )]n1 f ( x; )
n
n
分 布 函 数 为 F( n )( x ) F( x )
例 : 设总体X服从(0, ) 上的均匀分布,( X 1 , X n )是 来自X的样本. 分别求最小次序统计量X(1)和最大次序 统计量X( n )的概率密度函数。
用 n ( x ) 表 示 ( X 1 , X 2 , , X n )中 不 超 过 x 的 观 测 值 的
个数,则第i个次序统计量的
分布函数为 F( i )( x ) P{ X( i ) x} P{ n( x ) i}
第i个到第n个的概率和
( X 1, X 2 , X 3 , X 4 )
2
常用统计量 1 n k 样本k阶原点矩;Ak X i n
1 k B ( X X ) 样本k阶中心矩; k i n i 1 B4 A1 X bk 2 3 B2 峰度 n 1 2 2 ~ (与标准正态分布比较); B2 S S n B 偏度; b 3 s 3/2 B2 n 1 2 2 2 S ( X i nX ) 变异系数; V S / X n 1 i 1
n
经验分布函数与分布函数的关系
LR: 将vn(x)看成次数,F(X)表示概率,n为总次数
经验分布函数与分布函数的关系
sup在泛函中表示求上界
经验分布函数以概率1收敛于分布函数。
次序统计量的分布
(1) 最小次序统计量X (1)的概率密度为 f X (1) ( x; ) n[1 F ( x; )]n1 f ( x; )
• 《应用数理统计(第2版)》,关静、张玉环、 史道济主编,天津大学出版社。 • 《R统计建模与R软件》,薛毅,陈立萍编著, 清华大学出版社。
第二节 数理统计的基本概念
总体和样本
• 总体;个体
• 样本;样本观测值 • 样本二重性
既有数的属性,又有随机变量的属性
简单随机样本
• 为使样本尽可能反映总体的特征使数据分 析具有较好的性质,对抽样方法提出一定 的要求。
这个图错了
经验分布函数的性质:
(1) Fn ( x)满足分布函数的特征, 是一个分布函数.
0 Fn( x) 1 ; Fn( x)单调不减;右连续; 1 Fn( x)在x x( k )有间断点,在每个间断 点上有跃度 n
经验分布函数与分布函数的关系
(2) Fn ( x)依概率收敛于F ( x).即 lim P{| Fn ( x) F ( x) | } 1 ( 0)
简单随机样本的联合分布
设随机变量X的分布函数为F ( X ),则简单随机 样本( X 1 , X 2 , X n )的联合分布函数为 F ( X i ),
n i 1
联合密度函数为 in1 f ( xi )
例3 有放回抽样和无放回抽样
• 有放回抽样:每次抽样在完全相同的条件 下进行,且相互独立。所得样本是简单随 机样本。 • 无放回抽样:每次取后不放回。前一次抽 样的结果会影响下一次抽样的概率。不是 简单随机样本。 • 实际的抽样常常是无放回抽样。 • 当产品总数N很大,而样本数n相对不大时, 可以将无放回抽样所得到的样本近似的看 成简单随机样本。
数据分析—频率直方图
一组数据经过分组整理后,用直方图画出来, 我们对该组数据的变化规律就有了直观的了解。
频 数 30 25
(天) 20 15 10
5
140 150 160 170 180 190 200 210 220 230 240 按销售量分组(台)
某电脑公司销售量分布的直方图
频率直方图
• 总体分布未知,根据观测结果估计总体的 分布(概率密度) • 找出样本观测值的最大值和最小值,得区 间 • 确定组数、组距 • 数出组频数、计算组频率 • 分组整理表 • 作矩形
* 1 * 2 * n
为 x1 , x2 , , xn 时,定义随机变量