概率论与统计学基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率
随机实验某一结果发生的可能性,或 随机变量取某一数值的可能性 古典定义:假设随机实验每一基本结果 发生的可能性都相同(丢硬币,抽王8) 频率定义:频数除以事件发生的总数 (班级成绩十档划分)
0≤p≤1
总体与样本
总体对应的随机变量(Y)
英语 期末成绩
85分
总体与样本
总体和抽样 随机样本 个体,样本容量 随机样本对应的随机变量:独立同分布随机 变量的集合 一个样本:一组观察值
离散型随机变量
连续型随机变量
概率密度函数
标准正态分布
期望值
期望值:随机变量集中趋势的度量 以概率为权数的加权平均值 定义:离散型随机变量数学期望
变量X的取值 x1 x2 …… xn 相应概率P p1 p2 …… pn
期望值
期望值:随机变量的集中趋势 以概率为权数的加权平均值 定义:离散型随机变量数学期望
离散型随机变量
概率函数
X-正面朝上的次数,0(1/4),1(1/2),2(1/4) -----------一个硬币扔两次
商A0731班第四学期英语期末成绩
实验:随机抽一位同学 问题: 你被抽中的概率是多少? 用随机变量Y代表被抽中同学的成绩 1、Y的取值范围: A0731班第四学期英语期末成绩 2、Y的概率函数
协方差为正:同方向变动 协方差为负:反方向变动
(线性)相关系数
-1< 相关系数 < 0 0 < 相关系数 < 1
相关与独立
相关系数为零,则不相关 不相关,不一定相互独立 相互独立,则一定不相关,相关系数为零
样本与总体
总体:随机变量Y 例如:全班同学上学期的英语成绩 随机样本,样本容量 例如,五个成绩,即五个随机变量 Y1,Y2,Y3,Y4,Y5 1、样本的随机变量和总体的随机变量同 分布 2、样本的随机变量相互独立
Var(x+y)=Var(x)+Var(y)=Var(x-y) (5)Var(a+bx)=b 2 Var(x) (6)Var(x)=E(x2)-(E(x))2
连续型随机变量的趋期势望与方差
协方差
一种特殊的期望值,度量两个随机变量 同时变动的方向
协方差
一种特殊的期望值,度量两个随机变量 同时变动的方向
E(X×Y)=E(X) ×E(Y)
条件期望
E(Y | X) :给定X的取值,Y的期望值 性质1: 如果E(Y | X) = E(Y) =a,则X与Y不相关 性质2: 如果E(Y | X) = f(X),则X与Y相关
方差
方差:随机变量离散程度的度量
平均值
实际值
方差
方差:随机变量平均离散程度的度量
无偏性
有效性
总体某个参数θ的无偏估计量往往不只一 个,而且无偏性仅仅表明估计量的所有 可能的取值按概率平均(均值)等于θ, 它的可能取值可能大部分与θ相差很大。 为保证估计量的取值能集中于θ附近,必 须要求估计量的方差越小越好。所以, 提出有效性标准。
有效性
有效性
正态分布
正态分布的概率密度函数
实验
计算: (Y1+Y2+Y3+Y4+Y5)/5 总体均值: 72.28
估计量
估计总体的公式 总体方差的估计量:样本方差
估计量
估计总体的公式 总体方差的估计量:样本方差
估计量的选择标准
可以设计很多种估计量。 衡量估计量优良性的重要标准: 无偏性,有效性
无偏性
无偏性的直观意义: 根据样本推得的总体参数的估计值和总 体参数的真值一般不会相同 但是,无数个样本估计值的均值可以和 总体参数的真值相同 “平均来说,我的估计方法是准确的” 特别提醒:无偏性是估计量的性质,不 是估计值的性质。
第一部分
概率论与统计学基础
基本符号
基本符号
基本符号
基本符号
基本符号
基本符号
基本符号
基本符号
随机实验
至少有两个可能结果,但不确定哪个结 果会出现的实验。 例如: 约会请求
总体
随机实验所有可能结果的集合
随机变量
将实验的每一结果量化,就可以用随机 变量来刻划总体 随机变量:取值由随机实验结果决定的 变量(如:大头朝上的个数1、2、0)
若随机变量X的数学期望E(X)存在,称 [X-E(X)]为随机变量X的离差。
随机变量离差平方的数学期望,叫随机
变量的方差,记作Var(x)
方差的算术平方根叫标准差。
方差
随机变量离差平方的数学期望,叫随机 变量的方差,记作Var(x) 方差的算术平方根叫标准差。
方差的性质
(1)Var(c)=0 (2)Var(c+x)=Var(x) (3)Var(cx)=c 2 Var(x) (4)如果x,y为相互独立的随机变量,则
变量X的取值 x1 x2 …… xn 相应概率P p1 p2 …… pn
期望值
期望值
连续型随机变量:
数学期望的性质
1. 若a、b为常数,则E(aX+b)=aE(X)+b 2. 若X、Y为两个随机变量,则
E(X+Y)=E(X)+E(Y) 3. 若g(x)和f(x)分别为X的两个函数,则
E[g(X)+f(X)]=E[g(X)]+E[f(X)] 4.若X、Y是两个独立的随机变量,
估计量(估计公式)
用样本估计总体参数的公式 例如代表上学期英语成绩的随机变量Y的 均值 随机样本:Y1,Y2,Y3,Y4,Y5 问题: 如何估计Y的均值(期望值)? 加总39个同学的成绩再除以39??? 样本均值:(Y1+Y2+Y3+Y4+Y5)/5
估计Βιβλιοθήκη Baidu与估计值
估计量是随机变量 随机样本:无数个样本(575757) 一个具体的样本: 1、样本中每个随机变量都取定一个观察 值 2、根据估计量的公式计算估计值
正态分布
小概率事件
如果随机变量X服从正态分布,方差为σ 那么|X| > 2σ的概率是5% 在实践中,人们普遍认为小概率事件是 不可能发生的 反证法:如果根据某一假设进行推理, 得到的结果是一个小概率事件, 那么可以认为上述假设是错误的
标准正态分布
正态分布的性质
中心极限定理
随数量的增加,独立同分布随机变量的 和趋向于服从正态分布 或者说 无论总体服从什么类型的分布,当样本 容量不断增大时,样本均值趋向于服从 正态分布
均值:n,n为自由度 方差:2n,n为自由度
t分布
t分布
t分布的均值为0 t分布的方差为n/(n-2); n=30, 1.07
F分布
F分布