数理统计中的疑难问题
统计分析常见问题与解决方法
统计图表与可视化
05
常见统计图表类型
柱状图(Bar Chart)
用于比较不同类别数据的大小,可直观展示各类别之间的差异。
折线图(Line Chart)
用于展示数据随时间或其他连续变量的变化趋势。
散点图(Scatter Plot)
用于展示两个变量之间的关系,可判断变量间是否存在相关性。
探究自变量与因变量之间的线性 或非线性关系,建立回归模型进 行预测和解释
03
方差分析与回归分 析应用
实验设计、市场调研、经济预测 等领域
置信区间与预测区间
置信区间概念
用于估计参数真值所在范围的区间,具有一定置信水平
预测区间概念
用于预测未来观测值所在范围的区间,具有一定置信水平
置信区间与预测区间计算方法及注意事项
提供灵活的编程接口和丰富的可视化效果,可实现复杂的数据可视化 需求。
数据清洗与预处理
在进行数据可视化前,需要对数据进行清洗和预处理,以保证数据的 准确性和可靠性。
图表解读与误区提示
准确理解图表信息
避免误导性图表
在解读图表时,需要注意图表的标题、坐 标轴标签、图例等关键信息,以确保准确 理解图表所表达的内容。
有些图表可能会通过调整坐标轴比例、使 用不恰当的颜色等方式误导读者,因此需 要保持警惕并具备批判性思维。
注意数据异常值
结合实际情境分析
异常值可能会对图表的整体趋势产生显著 影响,因此在解读图表时需要注意异常值 的处理方式和影响。
不同的数据集和情境可能需要使用不同的 图表类型和可视化方式,因此需要根据实 际情况进行分析和选择。
统计软件与应用
07
当前公安应用数理统计中应注意的问题
当前公安应用数理统计中应注意的问题0 引言随着公安科技的迅速发展,数理统计方法在公安应用中日益频繁。
无论是对社会治安状况的分析,还是物证技术的检验,无不体现了数理统计的原理及方法。
有的甚至还借助于对公安管理中的某些数量资料的搜集、整理和分析,从量上揭示出社会现象(刑事案件、治安、交通等)在一定时间、地点和条件下的规模、类型以及发展变化的规律。
我们知道,数理统计方法只是一种归纳式的分析方法,它只能正确估量以及减轻偶然因素的影响,而不能完全消除这种影响。
不言而喻,用数理统计方法分析得出的结论只能作为参考而不能据以定案。
然而值得注意的是,目前有些同志盲目利用这种方法,在指导思想、研究目标不明确的情况下,将各种统计资料拼凑起来,胡乱地计算各因素之间的联系,一旦发现有某种数字关系时,就“创造”一种新理论来生硬地解释它,并以自己的计算结果作为这种理论的“科学根据”;更有甚者还着意追求标新立异,越不容易解释越好,越出人意料越好。
于是在公安应用数理统计方法的诸领域中形成了误区。
针对上述情况,本文拟从以下几个方面,谈谈自己的看法。
1 公安应用数理统计分析必须要坚持科学方法论的原则目前,数理统计方法在公安应用中主要用来探测(收集数据等)、描述(整理数据等)、解释(分析数据等)社会现象(刑事案件、治安、交通等)之间的关系,从而找出它们的规律性,为侦破案件、管理治安和交通等提供切实可靠的量化依据。
比如,用数理统计方法对现场数据进行科学分析,可以在一定程度上排除随机因素的干扰,提取出有用的信息,这对于缩小侦查目标,以迅捷的途径获得证据一致提出一定的设想,都是有意义的。
然而数理统计方法的应用并不是无懈可击、一成不变的,它不仅需要一定的条件,而且它的完成也必须要通过参数估计和假设检验来实现。
因此在应用数理统计方法时,我们必须要坚持科学方法论的原则。
当数理统计方法被用来作探测(即收集数据等)时,这是考察问题的初级阶段,也是感性认识的必经阶段,是我们处在对研究的客体知之不多的阶段。
概率论与数理统计各章疑难解答
第二章疑难分析1、随机变量与普通函数随机变量是定义在随机试验的样本空间上,对试验的每一个可能结果,都有唯一的实数与之对应.从定义可知:普通函数的取值是按一定法则给定的,而随机变量的取值是由统计规律性给出的,具有随机性;又普通函数的定义域是一个区间,而随机变量的定义域是样本空间.2、分布函数的连续性定义左连续或右连续只是一种习惯.有的书籍定义分布函数左连续,但大多数书籍定义分布函数为右连续. 左连续与右连续的区别在于计算时,点的概率是否计算在内.对于连续型随机变量,由于,故定义左连续或右连续没有什么区别;对于离散型随机变量,由于,则定义左连续或右连续时值就不相同,这时,就要注意对定义左连续还是右连续.第三章疑难分析1、事件表示事件与的积事件,为什么不一定等于?如同仅当事件相互独立时,才有一样,这里依乘法原理.只有事件与相互独立时,才有,因为.2、二维随机变量的联合分布、边缘分布及条件分布之间存在什么样的关系?由边缘分布与条件分布的定义与公式知,联合分布唯一确定边缘分布,因而也唯一确定条件分布.反之,边缘分布与条件分布都不能唯一确定联合分布.但由知,一个条件分布和它对应的边缘分布,能唯一确定联合分布.但是,如果相互独立,则,即.说明当独立时,边缘分布也唯一确定联合分布,从而条件分布也唯一确定联合分布.3、两个随机变量相互独立的概念与两个事件相互独立是否相同?为什么?两个随机变量相互独立,是指组成二维随机变量的两个分量中一个分量的取值不受另一个分量取值的影响,满足.而两个事件的独立性,是指一个事件的发生不受另一个事件发生的影响,故有.两者可以说不是一个问题.但是,组成二维随机变量的两个分量是同一试验的样本空间上的两个一维随机变量,而也是一个试验的样本空间的两个事件.因此,若把“”、“”看作两个事件,那么两者的意义近乎一致,从而独立性的定义几乎是相同的.第四章疑难分析1、随机变量的数字特征在概率论中有什么意义?知道一个随机变量的分布函数,就掌握了这个随机变量的统计规律性.但求得一个随机变量的分布函数是不容易的,而且往往也没有这个必要.随机变量的数字特征则比较简单易求,也能满足我们研究分析具体问题的需要,所以在概率论中很多的应用,同时也刻画了随机变量的某些特征,有重要的实际意义.例如,数学期望反映了随机变量取值的平均值,表现为具体问题中的平均长度、平均时间、平均成绩、期望利润、期望成本等;方差反映了随机变量取值的波动程度;偏态系数、峰态系数则反映了随机变量取值的对称性和集中性.因此,在不同的问题上考察不同的数字特征,可以简单而切实地解决我们面临的实际问题.2、在数学期望定义中为什么要求级数和广义积分绝对收敛?首先,数学期望是一个有限值;其次,数学期望反映随机变量取值的平均值.因此,对级数和广义积分来说,绝对收敛保证了值的存在,且对级数来说,又与项的次序无关,从而更便于运算求值.而由于连续型随机变量可以离散化,从而广义积分与无穷级数有同样的意义.要求级数和广义积分绝对收敛是为了保证数学期望的存在与求出.3、相关系数反映了随机变量和Y之间的什么关系?相关系数是用随机变量和Y的协方差和标准差来定义的,它反映了随机变量和Y之间的相关程度.当时,称与Y依概率1线性相关;当时,称与Y不相关;当时,又分为强相关与弱相关.4、两个随机变量与Y相互独立和不相关是一种什么样的关系?(1)若、Y相互独立,则、Y不相关.因为、Y独立,则,故,从而,所以、Y不相关.(2)若、Y不相关,则、Y不一定独立.如:因为,,知、Y不相关.但,,,知、Y不独立.(3)若、Y相关,则、Y一定不独立.可由反证法说明.(4)若、Y不相关,则、Y不一定不独立.因为、Y不独立,,但若时,可以有,从而可以有、Y不相关.但是,也有特殊情况,如服从二维正态分布时,、Y不相关与、Y独立是等价的.。
考研数学概率论与数理统计难点分析
考研数学概率论与数理统计难点分析一直以来概率论与数理统计都是考研数学中的一大难点,考生们的问题也是多种多样。
考研专家通过对历年真题的分析与考生们的反馈。
整理出了以下几大难点及常考的几大提醒。
如果您有任何关于考研数学的相关问题可以点击咨询我们的在线老师。
概率论与数理统计初步主要考查考生对研究随机现象规律性的基本概念、基本理论和基本方法的理解,以及运用概率统计方法分析和解决实际问题的能力。
一、随机事件与概率重点难点:重点:概率的定义与性质,条件概率与概率的乘法公式,事件之间的关系与运算,全概率公式与贝叶斯公式难点:随机事件的概率,乘法公式、全概率公式、Bayes公式以及对贝努利概型的事件的概率的计算常考题型:(1)事件关系与概率的性质(2)古典概型与几何概型(3)乘法公式和条件概率公式(4)全概率公式和Bayes公式(5)事件的独立性(6)贝努利概型二、随机变量及其分布重点难点重点:离散型随机变量概率分布及其性质,连续型随机变量概率密度及其性质,随机变量分布函数及其性质,常见分布,随机变量函数的分布难点:不同类型的随机变量用适当的概率方式的描述,随机变量函数的分布常考题型(1)分布函数的概念及其性质(2)求随机变量的分布律、分布函数(3)利用常见分布计算概率(4)常见分布的逆问题(5)随机变量函数的分布三、多维随机变量及其分布重点难点重点:二维随机变量联合分布及其性质,二维随机变量联合分布函数及其性质,二维随机变量的边缘分布和条件分布,随机变量的独立性,个随机变量的简单函数的分布难点:多维随机变量的描述方法、两个随机变量函数的分布的求解常考题型(1)二维离散型随机变量的联合分布、边缘分布和条件分布(2)二维离散型随机变量的联合分布、边缘分布和条件分布(3)二维随机变量函数的分布(4)二维随机变量取值的概率计算(5)随机变量的独立性四、随机变量的数字特征重点难点重点:随机变量的数学期望、方差的概念与性质,随机变量矩、协方差和相关系数难点:各种数字特征的概念及算法常考题型(1)数学期望与方差的计算(2)一维随机变量函数的期望与方差(3)二维随机变量函数的期望与方差(4)协方差与相关系数的计算(5)随机变量的独立性与不相关性五、大数定律和中心极限定理重点难点重点:中心极限定理难点:切比雪夫不等式、依概率收敛的概念。
概率论与数理统计各章难点
独立同分布,其期望 、方差 2 > 0 存在,则有
l i m P { k 1
X
n
k
n x } ( x ) .
n
n
或者
1 n Xk n l i m P { k 1 x } ( x ) . n / n
定理 ( 棣莫弗- 拉普拉斯定理 ) 若 Xn ~ b (n , p ) , 则有
n
n xi
n
0,
所以, p 的最大似然估计量为
第六章 参数估计
点估计的常用方法
最大似然估计 由总体X的概率密度 f (x) (或分布律P {X= xi } ) 建立似然函数
L( ) L( x1 , x 2 , , x n ; )
f ( x , )
i
n
或
L( ) L( x1 , x 2 ,, x n ; )
P{ X x }
0
dy
y
2e
2( x y )
1 dx . 3
y G0
O
x
例2 已知 X 、Y 的联合密度函数为: 6 ,x2≤y≤x;
1
y
y=x2
f ( x,y ) =
0 ,
其它 . G
计算 X、Y 的边缘概率密度. 解 fX (x) = f (x, y) dy =
x x2
fY ( y )= fX ( g 1 ( y )) [g 1 ( y )].
两端求导数
例1 已知 X 具有密度函数 x , 0<x<4, 8 f X (x) = 0 , 其 它.
求 Y = 2X + 8 的密度函数. 解 y–8 2 ).
概率论与数理统计常见问题解答
概率论与数理统计常见问题解答1.概率论研究的对象是什么?现实生活中有两类现象。
必然现象:一定条件下,结果是肯定的。
如:一定大气压下,水加温到100℃:沸腾随机现象:一定条件下,结果不肯定的。
如:实弹射击,打一发子弹:可能中或不中概率论是研究随机现象规律性的一门学科。
2.随机现象有规律性吗?有。
例如:两人打枪。
甲是神枪手,乙是普通射手。
如果打一发子弹,甲可能打中也可能打不中,乙也可能打中也可能打不中,看不出什么规律。
如果两人比赛,各打10组,每组100发子弹,结果是:我们可以看出规律性:甲可说几乎每发必中,乙只有大约一半的可能性打中。
这种规律性称为统计规律性。
在大量试验中才显示出来,不是个别试验显示的特性。
3.随机现象的规律性如何指导实践?例如:农业生产上选择品种,如果当地发生旱灾的可能性大,水灾的可能性小,就应选择耐旱的品种,反之则应选择耐涝的品种。
在统计学中,以“小概率事件”判断原理来进行假设检验,例如:厂方声称,产品的废品率为5%,随机检查,发现“5个产品有2个次品”。
这时,应当拒绝“废品率为5%” 。
为什么?因为“5个产品有2个次品”是小概率事件(用概率的方法可计算),在一次试验中一般不可能发生,现在居然发生了,应怀疑原假设。
可能性小的事并不等于不发生例如:地震。
某地某日发生大地震的可能性是非常小的,但就整个地球来说,一年总要发生几次大地震。
例1:甲、乙两位棋手棋艺相当。
他们在一项奖金为1000元的比赛相遇。
比赛为五局三胜制。
已经进行了三局的比赛,结果为甲二胜一负。
现因故要停止比赛,问应该如何分配这1000元比赛奖金才算公平?奖金分配方法:平均分,对甲欠公平,按一定的比例分配,甲拿大头,乙拿小头,甲拿2/3,乙拿1/3,合理吗?例2:在第43届世界乒乓球锦标赛中,中国队与瑞典队争夺冠亚军,当时瑞典队上场队员只有瓦尔德内尔、佩尔松和卡尔松,其中卡尔松怕削球手,于是中国队排出了以下阵容:王涛马文革丁松马文革王涛决策时已经估计到瑞典队有两种可能的选择:或以卡尔松打第三单打去碰削球手丁松或以佩尔森打第三单打,以便卡尔松避开丁松最后,中国队战胜瑞典队(3:2),夺回了阔别六年之久的斯韦思林杯。
《概率论与数理统计》疑难解析
《概率论与数理统计》疑难解析《概率论与数理统计》疑难解析·内容提要/ ·疑难分析/ ·例题解析目录第一章随机事件及其概率 (1)第二章随机变量及其分布 (7)第三章多维随机变量及其分布 (13)第四章随机变量的数字特征 (19)第五章大数定律和中心极限定理 (24)第六章数理统计的基本概念 (26)第七章参数估计 (29)第八章假设检验 (33)第九章方差分析和回归分析 (35)第一章随机事件及其概率内容提要1、随机试验、样本空间与随机事件(1)随机试验:具有以下三个特点的试验称为随机试验,记为E。
1)试验可在相同的条件下重复进行;2)每次试验的结果具有多种可能性,但试验之前可确知试验的所有可能结果;3)每次试验前不能确定哪一个结果会出现。
(2)样本空间:随机试验E的所有可能结果组成的集合称为E 的样本空间,记为Ω;试验的每一个可能结果,即Ω中的元素,称为样本点,记为e。
(3)随机事件:在一次试验中可能出现也可能不出现的事件称为随机事件,简称事件,常用A、B、C 等大写字母表示;可表述为样本空间中样本点的某个集合,分为复合事件和简单事件,还有必然事件(记为Ω)和不可能事件(记为Φ)。
2、事件的关系与运算(1)包含关系与相等:“事件A发生必导致B发生”,记为或;且(2)和事件(并):“事件A与B至少有一个发生”,记为。
(3)积事件(交):“ 事件A与B同时发生”,记为或AB 。
(4)差事件、对立事件(余事件):“事件A发生而B不发生”,记为A-B称为A与B的差事件;称为B的对立事件;易知:。
(5)互不相容性:AB=ф;A、B互为对立事件且。
(6)事件的运算法则:1) 交换律:;2) 结合律:;3) 分配律:;4) 对偶(De Morgan) 律:,,可推广。
3、频率与概率(1)频率的定义:事件A在n次重复试验中出现次,则比值称为事件A在n次重复试验中出现的频率,记为,即。
数理统计方法题解4-2
4.11 设锰的熔化点(单位:︒C )服从正态分布。
进行5次试验,测得锰的熔化点如下:1269 ,1271 ,1256 ,1265 ,1254 。
是否可以认为锰的熔化点显著高于1250︒C ?(显著水平05.0=α)解 设锰的熔化点ξ~),(2σμN ,问题相当于要检验0H :1250≤μ(1H :1250>μ )。
5=n ,1263=X ,64853.7*=S ,8006.3564853.712501263*=-=-=n S X T μ。
对05.0=α,查 t 分布表,可得 1318.2)4()1(95.01==--t n t α 。
因为 1318.28006.3>=T ,所以拒绝 0H :1250≤μ ,接受 1H :1250>μ 。
可认为锰的熔化点显著高于1250︒C 。
4.12 某种导线的电阻(单位:Ω)服从正态分布,按照规定,电阻的标准差不得超过0.005 。
今在一批导线中任取9根,测得修正样本标准差 =*S 0.007 ,这批导线的电阻的标准差,比起规定的电阻的标准差来,是否显著地偏大?(显著水平05.0=α)解 设导线电阻ξ~),(2σμN ,问题相当于要检验0H :005.0≤σ(1H :005.0>σ )。
222*)1(σχS n -=68.15005.0007.0)19(22=⨯-=。
对05.0=α,查 2χ 分布表,可得507.15)8()1(295.021==--χχαn 。
因为507.1568.152>=χ,所以拒绝 0H :005.0≤σ ,接受1H :005.0>σ 。
这批导线的电阻的标准差,比起规定的电阻的标准差来,显著地偏大。
4.13 某厂从用旧工艺和新工艺生产的灯泡中,各取10只进行寿命试验,测得旧工艺生产的灯泡寿命的样本均值为2460小时,修正样本标准差为56小时;新工艺生产的灯泡寿命的样本均值为2550小时,修正样本标准差为48小时。
概率论与数理统计考试知识点汇总及疑难解析
疑难解析系统(概率论与数理统计中的疑难问题)目录第一章事件与概率………………………………………………3-4第二章条件概率与独立性………………………………………5-6第三章随机变量及其分布………………………………………7-8第四章多维随机变量及其分布…………………………………9-10第五章数字特征…………………………………………………11-14第六章数理统计的基本概念……………………………………15-17第七章参数估计…………………………………………………18-21第八章假设检验…………………………………………………22-23第一章 概率论基本概念1.什么是统计规律性?什么是随机现象?答 在一定条件下发生,其结果是多样的,因而在现象发生前不能预知确切结果的不确定现象,其结果在大量重复试验中呈现出一种规律性. 由于这种规律是根据统计数据分析出来的,因而称为统计规律性。
在一次试验或观察中结果不能预先确定,而在大量重复试验中结果具有统计规律性的现象称为随机现象. 随机现象是概率论与数理统计的主要研究对象.2.如何理解互逆事件与互斥事件?答 如果两个事件A 与B 必有一个发生,且至多有一个发生,则、A B 为互逆事件. B A =.如果两个事件A 与B 不能同时发生,则、A B 为互斥事件.如考试及格与不及格是互逆也是互斥的,但考试70分和80分互斥却不互逆. 区别互逆与互斥的关键是,当样本空间只有两个事件时,两事件才可能互逆. 而互斥适用于多个事件的情形. 互斥事件的特征是,在一次试验中两者可以都不发生,而互逆事件必发生一个且至多发生一个.3.如何用已知事件来表达与其有关的其它事件?答 首先要了解所讨论试验中事件的构成,所需表达事件与已知事件的关系,然后运用这些关系与运算法则将事件表达出来.例如,设S 为事件05x ≤≤,A 为事件12x ≤≤,B 为事件02x ≤≤,则 02x ≤≤为事件B 或A B U ,12x ≤≤为事件A 或BA ,25x <≤为事件S B -或B ,01x ≤<为B A -.4.样本空间与必然事件之间有什么关系?答 样本空间是随机试验E 的所有可能结果的集合,而必然事件是指随机试验中一定会出现的结果. 虽然在一次试验中只有样本空间的一个元素发生,但在把样本空间视作一个整体时,我们说它在每次试验中都发生了. 因此,可以说样本空间是必然事件.5.在什么情况下,随机事件A 的频率可以作为它的概率的近似值? 答 随机事件A 的频率()n f A 反映事件A 在多次重复试验中发生的频繁程度. 当n 增大时,频率在概率()P A 附近摆动. 因此,每一个从独立重复试验中测得的频率,都可以作为概率()P A 的近似值. 而且,一般n 越大,近似程度越好.事实上,当n 增大时,频率大量集中于包含()P A 的一个小区间. 任选区间中一值作为概率的近似值,称为统计概率. 在解题时,当n 较大时,可取统计概率为()/A P A n n ≈.6.概率是否可以看做频率的极限?答 这样理解是不恰当的. 因为如上题所述,当n →∞时,()n f A 在()P A 附近摆动,与高等数学中极限的N ε-概念是不同的. 由于概率是随机现象的可能性的赋值,对于任给的0ε>,存在偶然的因素,可能找不到()N ε,从而得不到|()()|n f A P A ε-<.7.怎样理解古典概型的等可能假设?答 等可能性是古典概型的两大假设之一,有了这两个假设,给直接计算概率带来了很大的方便. 但在事实上,所讨论问题是否符合等可能假设,一般不是通过实际验证,而往往是根据人们长期形成的“对称性经验”作出的. 例如,骰子是正六面形,当质量均匀分布时,投掷一次,每面朝上的可能性都相等;装在袋中的小球,颜色可以不同,只要大小和形状相同,摸出其中任一个的可能性都相等. 因此,等可能假设不是人为的,而是人们根据对事物的认识——对称性特征而确认的.8.概率为0的事件是否为不可能事件?概率为1的事件是否为必然事件?答 有关概念:不可能事件φ的概率为0,即()0P φ=,但其逆不真;同样,必然事件Ω的概率()1P Ω=,但其逆也不真。
数理统计中的疑难问题
第六章 数理统计的基本概念1.什么是简单随机样本?怎样抽样可以得到简单随机样本?答 设12,,,n X X X 是来自总体X 的样本,如果满足 (1)12,,,n X X X 与X 同分布; (2)12,,,n X X X 相互独立,则称为简单随机样本. 此时,样本分布与总体分布的联系为121(,,,)()nn n ii F x x x F x ==∏ ,其中n F 是样本分布函数,F 是总体分布函数。
对总体进行随机地独立的重复观测即可得到简单随机样本. 随机性是指总体的每一个个体有相同的机会被抽到,因而样本对总体更具代表性. 独立性是指每次抽样的结果不受其它次抽样结果的影响。
2.为什么要引进统计量?为什么统计量中不能含有未知参数?答 引进统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易揭示问题实质,从而解决问题。
如果统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,因而失去利用统计量估计未知参数的意义,这是违背我们引进统计量的初衷的。
3.什么叫大样本与小样本?它们是以什么区分的? 答 在样本容量固定条件下,进行的统计推断、分析问题称为小样本问题。
因为样本容量固定,如果能得到有关统计量或样本函数的精确分布,就能较精确和较满意地讨论和分析各种统计问题。
在样本容量趋于无穷条件下,进行的统计推断、分析问题称为大样本问题。
此时若能求出有关统计量或样本函数的极限分布,也可以利用极限分布作为近似分布来作统计推断。
所以,大样本与小样本不是以样本容量的大小来区分的,而是以得到统计量或样本函数的方式来区分的。
事实上,小样本问题有时要求的样本容量也很大,而大样本问题有时要求的样本容量并不大。
4.经验分布函数是否就是分布函数? 答 经验分布函数是顺序统计量***12n X X X ≤≤≤的函数*1***1*0, ()/, , 1,2,,1,1, n k k n x X F x k n x x X k n x X +⎧<⎪=≤<=-⎨⎪≥⎩它既是实数x 的函数,又是顺序统计量***12,,,n X X X 的函数。
(完整版)研究生数理统计问答题答案
(完整版)研究生数理统计问答题答案201311。
检验的显著性水平:在假设检验中,若小概率事件的概率不超过α,则称α为检验水平或显著性水平.检验的P 值:拒绝原假设的最小显著水平称为假设检验中的P 值。
2。
参数估计的类型:① 点估计;② 区间估计;参数的点估计的方法:① 矩估计法 基本思想:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛于总体矩。
因此,只要总体X 的k 阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。
② 极大似然估计法 基本思想:设总体分布的函数形式已知,但有未知参数θ,θ可以取很多值,有θ的一切可能取值中选一个使样本观察值出现的概率为最大的值作为θ的估计值,记作 ∧θ ,并称为θ的极大似然估计值.这种求估计值的方法称为极大似然估计法。
参数的点估计的评价方法:错误!无偏性;错误!有效性;错误!一致性。
3.假设检验的思想:先假设总体具有某种特征,然后再通过对样本的加工,即构造统计量推断出假设的结论是否合理。
假设检验是带有概率性质的反证法.推理依据:第一,假设检验所采用的逻辑推理方法是反证法.第二,合理与否,所依据的是“小概率事件实际不可能发生的原理”。
参数假设检验步骤:错误!提出原假设和备择假设;错误!选择适当的统计量,并确定其分布形式;错误!选择显著性水平α ,确定临界值;错误!作出结论。
5。
正交试验数据分析方法:○,1直接对比法就是对试验结果进行简单的直接对比。
错误!直观分析法是通过对每一因素的平均极差来分析问题。
所谓极差就是平均效果中最大值和最小值的差。
有了极差,就可以找到影响指标的主要因素,并可以帮助我们找到最佳因素水平组合。
4。
方差分析的目的:方差分析的目的是通过分析,判定某一因子是否显著,当因子显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。
方差分析是对多个总体均值是否相等这一假设进行检验。
考研数学概率论与数理统计重难点分析
考研数学概率论与数理统计重难点分析概率论与数理统计是考研数学中的重要组成部分,也是相对较难的部分,考研生需要认真复习和理解。
本文将通过分析考研概率论与数理统计的重难点,帮助考生更好地复习这一部分内容。
一、概率的基础知识考研概率论的基础知识主要包括样本空间、事件、概率、条件概率、随机变量及其分布、数理期望、方差、协方差和相关系数等概念。
在这些基础知识中,样本空间和事件的概念是考研数学中最基础和最重要的概念。
1.1 样本空间样本空间是一个随机试验所有可能结果组成的集合。
例如,掷一枚骰子,样本空间为 {1, 2, 3, 4, 5, 6}。
考研中常见的样本空间还有组合问题中的选数问题,如从五个数中选三个数的样本空间为 {1, 2, 3}、{1, 2, 4}、{1, 2, 5}、{1, 2, 6}、{1, 3, 4}、{1, 3, 5}等15种情况。
1.2 事件事件是指样本空间的子集,即指随机事件发生的某些结果。
例如在掷一枚骰子的样本空间中,假设事件A表示掷得奇数,则事件A为 {1, 3, 5}。
在考研中,事件的概念常常和条件概率一起出现。
1.3 概率概率是指一个事件在样本空间中占据的比重。
在样本空间中,每个事件的概率都应该在0到1之间,即0≤P(A)≤1。
1.4 条件概率条件概率是指事件A在事件B已经发生的情况下发生的概率。
其中,条件概率的计算方法为P(A|B) = P(A∩B) / P(B)。
在考研中,条件概率经常用于证明一些定理和公式。
二、随机变量和概率分布随机变量是指取值具有不确定性的变量。
在考研中,常见的随机变量有离散随机变量和连续随机变量。
2.1 离散随机变量离散随机变量是指取值不连续的随机变量,如扔掷一个骰子出现的点数、抛一次硬币出现正面的次数等。
离散随机变量最重要的是概率质量函数,即这些随机变量取值的概率分布。
2.2 连续随机变量连续随机变量是指取值连续的随机变量,如测量一个人身高、身体重量等。
概率论与数理统计疑难解答
第一章 概率论基本概念1.什么是统计规律性?什么是随机现象?答 在一定条件下发生,其结果是多样的,因而在现象发生前不能预知确切结果的不确定现象,其结果在大量重复试验中呈现出一种规律性. 由于这种规律是根据统计数据分析出来的,因而称为统计规律性。
在一次试验或观察中结果不能预先确定,而在大量重复试验中结果具有统计规律性的现象称为随机现象. 随机现象是概率论与数理统计的主要研究对象.2.如何理解互逆事件与互斥事件? 答 如果两个事件A 与B 必有一个发生,且至多有一个发生,则、A B 为互逆事件. B A =.如果两个事件A 与B 不能同时发生,则、A B 为互斥事件.如考试及格与不及格是互逆也是互斥的,但考试70分和80分互斥却不互逆.区别互逆与互斥的关键是,当样本空间只有两个事件时,两事件才可能互逆. 而互斥适用于多个事件的情形. 互斥事件的特征是,在一次试验中两者可以都不发生,而互逆事件必发生一个且至多发生一个. 3.如何用已知事件来表达与其有关的其它事件?答 首先要了解所讨论试验中事件的构成,所需表达事件与已知事件的关系,然后运用这些关系与运算法则将事件表达出来.例如,设S 为事件05x ≤≤,A 为事件12x ≤≤,B 为事件02x ≤≤,则02x ≤≤为事件B 或A B , 12x ≤≤为事件A 或BA , 25x <≤为事件S B -或B ,01x ≤<为B A -.4.样本空间与必然事件之间有什么关系?答 样本空间是随机试验E 的所有可能结果的集合,而必然事件是指随机试验中一定会出现的结果. 虽然在一次试验中只有样本空间的一个元素发生,但在把样本空间视作一个整体时,我们说它在每次试验中都发生了. 因此,可以说样本空间是必然事件.5.在什么情况下,随机事件A 的频率可以作为它的概率的近似值?答 随机事件A 的频率()n f A 反映事件A 在多次重复试验中发生的频繁程度. 当n 增大时,频率在概率()P A 附近摆动. 因此,每一个从独立重复试验中测得的频率,都可以作为概率()P A 的近似值. 而且,一般n 越大,近似程度越好.事实上,当n 增大时,频率大量集中于包含()P A 的一个小区间. 任选区间中一值作为概率的近似值,称为统计概率. 在解题时,当n 较大时,可取统计概率为()/A P A n n ≈. 6.概率是否可以看做频率的极限?答 这样理解是不恰当的. 因为如上题所述,当n →∞时,()n f A 在()P A 附近摆动,与高等数学中极限的N ε-概念是不同的. 由于概率是随机现象的可能性的赋值,对于任给的0ε>,存在偶然的因素,可能找不到()N ε,从而得不到|()()|n f A P A ε-<.7.怎样理解古典概型的等可能假设?答 等可能性是古典概型的两大假设之一,有了这两个假设,给直接计算概率带来了很大的方便. 但在事实上,所讨论问题是否符合等可能假设,一般不是通过实际验证,而往往是根据人们长期形成的“对称性经验”作出的. 例如,骰子是正六面形,当质量均匀分布时,投掷一次,每面朝上的可能性都相等;装在袋中的小球,颜色可以不同,只要大小和形状相同,摸出其中任一个的可能性都相等. 因此,等可能假设不是人为的,而是人们根据对事物的认识——对称性特征而确认的. 8.概率为0的事件是否为不可能事件?概率为1的事件是否为必然事件? 答 有关概念:不可能事件φ的概率为0,即()0P φ=,但其逆不真;同样,必然事件Ω的概率()1P Ω=,但其逆也不真。
最新-概率论与数理统计教学的问题及对策 精品
概率论与数理统计教学的问题及对策摘要随着应用型本科院校近年来不断扩大招生规模,在一定程度上影响了生源质量。
与此同时,普通高等院校在精简课程方面也做了较大调整。
在此新形势下,作为一名的教师,针对普通高等院校概率论与数理统计课程的教学改革提出相关见解,认为目前普通高等院校,尤其是一些偏应用型的工科院校,在概率论与数理统计课程的教学中,不应该死守教师满堂讲解的教学模式,而是应该提供给学生应用的机会,设立教学实验课;教学中应突出实际应用,与数学建模相揉合,以达到更好的教学以及学习效果。
关键词概率论;数理统计;数学建模教学研究概率论和数理统计是教育领域中的两个不可或缺的学科,而这两者都有着较为抽象的特征,这就意味着学生在学习时难免会遇到这样或那样的困难。
倘若无法正确认识相关概念,那么在今后的深入学习中便会遇到更多的难题。
在很多情况下,日常练习与考试中出现的大部分错误主要就是因为学生未对概念有正确的认识,更不用说知识拓展了。
这就要求教师在包括课前、课上以及课后的教学过程中考虑怎样设置教学才可以使学生愿学,好学以及学好。
笔者将从以下几个方面分析概率论与数理统计教学优化的对策。
1以课程发展历史切入,激发学生兴趣数学学科中涉及到的理论、思想以及思维等都是社会得以进步的关键,同时还是衡量人类发展水平的标尺。
不管是学习个体,还是全人类,其发展均离不开数学的辅助。
数学并不单单是一门课程,同时还是一类文化。
不仅如此,它还是人们得以进步的重要手段与思想理念。
数学中蕴含的意义不受时间和空间的限制,它存在于人们发展的各个时期。
西方数学家早已明确提出,多种学科,包括心理学,语言学等,都和数学之间有着千丝万缕的联系。
所以,在教学过程中,教师可以向学生讲述概率论与数理统计和其他学科间的关系及其发展历史,以此来激发学生的学习兴趣。
只要学生对学习产生了兴趣与热情,那么概率论与数理统计教学质量必将会得到有效提升。
2弥补传统教学中的不足从整体上看,《概率论与数理统计学》课本本身十分重视与概率论有关的理论知识。
数理统计的问题引例
引例 某工厂生产大批电子元件,假定元件的寿命服从指数分布,在实际应用中,可能提出以下问题: ① 元件的平均寿命如何?
② 如果使用单位要求平均寿命能达到某个指定的数
X ,例如5000小时,问这批元件可否被接受? 统计模型:“元件寿命服从指数分布”
①:若参数λ已知,则平均寿命为1/λ;实际上,λ是未知的。
一般地:从这批元件中随机抽出若干,测出其寿命:n x x x ,,,21 。
问题一:这n 个元件如何抽取?
有了n x x x ,,,21 以后,自然而然想用
n x x i ∑=去估计1/λ;
问题二:估计的误差可能有多大?
问题三:产生指定大小的误差的机会有多大?
为了使这概率降到指定的限度,抽出的元件数n 应达
到多少? ②:若l x ≥,则接受这批产品;否则,不接受。
实
际中往往根据需要进行一定的调整,即将接受的准则改为:1l x ≥;
检验更宽检验更严格
::11l l l l <>
这种在两个决定(接受或拒绝这批产品)中选择一个的问题,即为假设检验问题。
药学-数理统计-难点分析
学习目标--(正态总体参数的假设检验)1、了解假设检验的基本概念2、理解假设检验的一般步骤3、掌握单正态总体均值的假设检验4、掌握单正态总体方差的假设检验5、了解两个正态总体均值差、方差比的假设检验参数的假设检验简介在实际工作中,在总体是服从正态分布(或近似正态分布)的情况下,对该分布的某些参数进行某种假设(持怀疑态度),然后通过抽样的样本数据,对这种假设做出是否拒绝的回答. 然而,考虑到样本的随机性,假设的决策常有一定的错误.一、假设基本概念1. 原假设与备择假设2. 检验统计量3. 拒绝域4. 显著水平5. 双侧检验与单侧检验6. 两类错误(弃真,取伪)二、假设检验一般步骤step1 建立原假设. 依实际情况而定step2 确定检验统计量及其分布(重中之重)step3 在给定的显著水平下,给出拒绝域step4 代入数据,并给出相应的结论三、单正态总体均值的假设检验单正态总体均值的假设检验是非常重要的,在理论和实际中,都有着重要的地位. (依赖样本均值)(1)单正态总体,方差已知00:.H μμ=0{||}.X P n μασ-≥= 如果真如原假设所言,根据样本均值是总体均值的无偏估计,考虑到随机性带来的偏差,样本均值与原假设的均值差异应该不会太大,如果太大将拒绝原假设. 0/2||.X Z z nαμσ-=≥三、单正态总体均值的假设检验例:正常生产情况下,某厂生产的肥皂厚度为正态分布,其中均值为1.27cm,标准差为0.1cm. 为检验某日生产线是否正常,随机抽样10个进行观测,样本均值为1.3cm. 在显著水平为0.05下,进行检验生产线是否正常.求解(求解步骤)step3 给出拒绝域形式(绝对差过分大,拒绝)step1 检验均值,做出原假设 00: 1.27H μμ==/2||.Z z α>step4 代入数值,给出决策0.0251.3 1.270.948 1.96.0.110z z -==<=step2 选择检验统计量及其分布0~(0,1).X Z N nμσ-=不同原假设的拒绝形式00:H μμ=/2||.Z z α>0~(0,1).X Z N nμσ-=绝对差过分大,拒绝(双边) 00:H μμ≥/2.Z z α<-过分小,拒绝 00:H μμ≤/2.Z z α>过分大,拒绝三、单正态总体均值的假设检验(2)单正态总体,方差未知方差已知的假设在理论中解决一类重要的问题,然而在实际工作中,一般都假设方差未知.解决方案--用样本方差代替总体方差理论依据--样本方差是总体方差无偏估计量带来的新问题--样本方差是随机变量三、单正态总体均值的假设检验(2)单正态总体,方差未知2~(,).X N μσ~(0,1)N n σ00:.H μμ=0/2||(1).X T t n S nαμ-=≥-222(1)~(1)n S n χσ--~(1)X t n S n μ--0{||}.X P S n μα-≥=拒绝域:三、均值假设检验--单正态总体,方差未知例:设总体X服从正态分布,方差均未知,随机抽查9个样本,其观测值为:21,19,21,20,22,20,21,24,21检验均值是否为20. 显著水平为0.05)求解(求解步骤)step3 给出拒绝域形式(绝对差过分大,拒绝)step1 检验均值,做出原假设 00:20H μμ==/2||(1).T t n α>-step4 代入数值,给出决策0.02521200.9786 2.306(8).1.773z t -==<=step2 选择检验统计量及其分布0~(1).X T t n S nμ-=-三、均值区间估计--单正态总体,方差未知例:设高血压患者舒张压服从正态分布,均值为15.1,方差未知,为评价中医青木香治疗法的有效性,随机抽查10个采用改法治疗的患者,其观测值为:12, 15.5, 13.5, 14.7, 11.7, 12.3, 15.2, 11.5, 11.7, 14.9 问通过此法治疗舒张压是否显著降低. 取显著水平0.05求解(求解步骤)step3 给出拒绝域形式(过分小,拒绝)step1 检验均值,做出原假设 00:15.1H μμ≥=/2(1).T t n α<--step4 代入数值,给出决策0.0513.115.1 3.868 1.8595(8).1.63510t t -==-<-=-step2 选择检验统计量及其分布0~(1).X T t n S nμ-=-四、单正态总体方差的假设检验单正态总体方差的假设检验也是非常重要的,在实际中表现为总体稳定性是否因为某因素的改变而改变. (依赖样本方差)22220(1)~(1)n S n χχσ-=-/21/22222(1)(1)(0,)(,).(1)(1)n S n S n n ααχχ---+∞--220(1){}1.n S P ασ-≤≤=-2200:H σσ=过分小,过分大,拒绝五、两个正态总体均值差的检验两个正态总体均值差的检验,是有效评价总体均值变化的重要依据(假设方差已知)012:0.H μμ-=2211221211~(,),~(,).X N Y N n n μσμσ12221212~(0,1).11X Y Z N n n σσ=+/2||Z z α>绝对差过分大,拒绝五、两个正态总体均值差的区间估计例:探讨硫酸氧钒降糖实验. 假设糖尿病组日进食量服从正态分布,方差为6,糖尿病加钒组日进食量服从正态分布,方差为4.两组分别进行抽样(抽样容量均为10个),数据如下:糖尿病组:46.7, 47.2, 42.4, 47.7, 40.7, 41.1,44.8, 43.5, 44.5, 44.4糖尿病加钒组:26.5, 24.2, 28.7, 23.7, 24.5,24.2, 28.1,23.7,26.1,24.3求加钒是否使日进食量显著降低17.求解(求解步骤)step3 step1 检验均值,做出原假设 021:17H μμ-≤-.Z z α>step4 代入数值,给出决策0.0518.917 1.9 1.645.461010z z -+==-<=+step2 选择检验统计量及其分布12221212~(0,1).11X Y Z N n n σσ=+求解(求解步骤(另法)) step3 step1 检验均值,做出原假设 021:17H μμ-≥-.Z z α<-step4 代入数值,给出决策0.0518.917 1.9 1.645.461010z z -+==-<-=-+step2 选择检验统计量及其分布12221212~(0,1).11X Y Z N n n σσ=+五、两个正态总体成对比较均值的假设检验 成对比较往往发生在同个体,在某种干预下,其结果发生改变的量的刻画. 假设前后的差服从正态分布. 10.D X X =-2~(,).D N μσ~(1).D t n S nμ--干预后与之前的差(随机变量) 差的分布(认为均值和方差均未知) 采用样本(差)方差代替总体方差 012:0.H μμ-=0~(1).D T t n S n-=-/2||(1).T t n α>-五、两个正态总体成对比较均值的区间估计例:某中医用中医青木香治疗高血压患者,治疗前后的舒张压观测数据如下(抽样容量均为10个)疗前:14.7, 17.7, 17.7, 16.8, 14.4, 14.7,18.7, 13.9, 16, 16.疗后:12, 15.5, 13.5, 14.7, 11.7, 12.3,16.8, 11.5, 11.7, 14.9.问该疗法是否使舒张压显著降低?求解(求解步骤)step3 选择检验统计量及其分布 step1 做差,疗后减去疗前的值step4 给出拒绝域形式 2.6||8.8 2.2622.0.98/10t -==>-2.7,-2.2,-4.2,-2.1,-2.7,-2.4,-1.9,-2.4,-4.3,-1.1 step2 提出原假设0~(1).D T t n S n-=-021:0H μμ-=step5 代入数值,给出结果 /2||(1).T t n α>-。
数理统计理论学习中存在的问题
数理统计理论学习中存在的问题发布时间:2021-10-20T07:27:26.408Z 来源:《中国教工》2021年第9期作者:卢方芳[导读] 通过应用数理统计课程的考核,分析学生在学习经典统计学模型中出现的问题。
在基础理论学习后,大部分同学对模型基本假定概念模糊卢方芳湖北文理学院数学与统计学院,湖北襄阳 441053)摘要:通过应用数理统计课程的考核,分析学生在学习经典统计学模型中出现的问题。
在基础理论学习后,大部分同学对模型基本假定概念模糊,在使用过程中也未能结合实际情况对已学知识进行理解升级。
本文主要针对回归分析、方差分析、t检验,卡方检验四类模型在实用过程中出现的问题进行总结分析,并根据结果指导后续课程。
关键词:定性变量;定量变量;连续型 Problems in learning mathematical statistics theory, Lu Fangfang (Hubei University of Arts and sciences, School of Mathematics and Statistics, Hubei, Xiangyang 441053) abstract: through the examination of applied mathematical statistics course, to analyze the problems in learning classical statistical models. After the basic theory study, most of the students on the model basic assumptions of the concept of the mold, in the process of use also failed to integrate the actual situation of the knowledge learned to upgrade. This article mainly aims at the regression analysis, variance analysis, t-test, chi-square test four kinds of models in the practical process to analyze the problems, and based on the results to guide the follow-up courses. Key words: qualitative variable; quantitative variable; continuous type理论知识的学习最终都是希望走向运用及实践阶段,不论是自然科学还是社会科学知识,虽然研究方法不同,在不同学科中的交叉应用也不同,但是基本都需要经历下面的阶段,一是充分理解现有的结构,对于相关背景等理论知识都需要有正确的认识;二是对已有的应用过程通过观察、模拟体验等方式进行进一步的学习。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 数理统计的基本概念1.什么是简单随机样本?怎样抽样可以得到简单随机样本?答 设12,,,n X X X 是来自总体X 的样本,如果满足 (1)12,,,n X X X 与X 同分布; (2)12,,,n X X X 相互独立,则称为简单随机样本. 此时,样本分布与总体分布的联系为121(,,,)()nn n ii F x x x F x ==∏ ,其中n F 是样本分布函数,F 是总体分布函数。
对总体进行随机地独立的重复观测即可得到简单随机样本. 随机性是指总体的每一个个体有相同的机会被抽到,因而样本对总体更具代表性. 独立性是指每次抽样的结果不受其它次抽样结果的影响。
2.为什么要引进统计量?为什么统计量中不能含有未知参数?答 引进统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易揭示问题实质,从而解决问题。
如果统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,因而失去利用统计量估计未知参数的意义,这是违背我们引进统计量的初衷的。
3.什么叫大样本与小样本?它们是以什么区分的? 答 在样本容量固定条件下,进行的统计推断、分析问题称为小样本问题。
因为样本容量固定,如果能得到有关统计量或样本函数的精确分布,就能较精确和较满意地讨论和分析各种统计问题。
在样本容量趋于无穷条件下,进行的统计推断、分析问题称为大样本问题。
此时若能求出有关统计量或样本函数的极限分布,也可以利用极限分布作为近似分布来作统计推断。
所以,大样本与小样本不是以样本容量的大小来区分的,而是以得到统计量或样本函数的方式来区分的。
事实上,小样本问题有时要求的样本容量也很大,而大样本问题有时要求的样本容量并不大。
4.经验分布函数是否就是分布函数? 答 经验分布函数是顺序统计量***12n X X X ≤≤≤的函数*1***1*0, ()/, , 1,2,,1,1, n k k n x X F x k n x x X k n x X +⎧<⎪=≤<=-⎨⎪≥⎩它既是实数x 的函数,又是顺序统计量***12,,,n X X X 的函数。
当样本取定一组样本组时,它是一个分布函数,满足分布函数的所有性质。
当x 取定后,*()n F x 的值依赖于抽样结果,即是样本的函数。
事实上,经验分布函数在取定一组样本值时,可视为一个概率分布为{}*1/, 1,2,,k P X n k n ζ===的离散型随机变量ζ的分布函数。
当样本容量充分大时,可以用经验分布函数*()n F x 代替总体分布函数。
格里文科(Glivenko )定理给出{}*lim sup |()()|01n n x P F x F x →∞-∞<<+∞-==。
一般50n ≥,最好100n ≥。
5.什么是自由度?如何计算自由度?答 所谓自由度,通常是指不受任何约束,可以自由变动的变量的个数。
在数理统计中,自由度是对随机变量的二次型(可称为二次统计量)而言的。
因为一个含有n 个变量的二次型11(,,1,2,,)nniji j ij ji i j aX X a a i j n ====∑∑的秩是指对称矩阵()ij n n A a ⨯=的秩,它的大小反映n 个变量中能自由变动的无约束变量的多少。
我们所说的自由度,就是二次型的秩。
计算自由度有两种方法,举例说明如下: 例1 求统计量21()nii XX =-∑的自由度。
解 2222211111()()nnnni iii i i i i X X Xn X XX n====-=-=-∑∑∑∑211(11/)()niij i i jn XXX n =≠=-+-∑∑'=X A X , 其中1211/1/1/1/11/1/, 1/1/11/n X n n n X n n nX A n nn X ---⎡⎤⎡⎤⎢⎥⎢⎥---⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥---⎢⎥⎣⎦⎣⎦可以通过初等变换求得A 的秩为1n -,所以统计量21()ni i X X =-∑的自由度为1n -。
例2 设有pq 个独立随机变量,1,,,1,,ijXi p j q== 。
又令.111/,1/q pi j ij ij j i X q X X p X ===⋅=⋅∑∑,111/pqiji j X pq X===⋅∑∑,求统计量2..11()pqi jEiji j SXXXX ===--+∑∑的自由度。
解 二次型E S 有pq 个变量,但有线性约束条件:....1()0, 1,,pi jjjiji XXXX p Xp X p Xp X j q =--+=--+==∑ ;....1()0, 1,,qi ji i ijj XXXX q Xq Xq X q X i p =--+=--+==∑ 。
共有p q +个约束条件,这些条件间又有关系..11()0pqi jiji j XXXX ==--+=∑∑,所以E S 的自由度为(1)(1)(1)pq p q p q -+-=--。
6.设12,,,n X X X 是来自总体X 的简单随机样本,11nnii YX n==∑是否服从正态分布。
答 当n 充分大时,由中心极限定理对x ∀,有22lim n ti x n X n P x dt μ--∞→∞⎧⎫-⎪⎪⎪≤=⋅⎬⎪⎪⎪⎩⎭∑⎰当n 有限时,若总体2~(,)X N μσ,则2~(,)X N nσμ。
第七章 参数估计1.矩估计法的基本思想是什么?矩估计量是否唯一? 答 当样本容量n →∞时,经验分布函数*()n F x 均匀收敛于总体分布函数()F x 。
所以在大样本下,可以用*()n F n 代替()F x 研究统计推断问题。
由于总体的原点矩()kk x dF x μ+∞-∞=⎰,当()F x 由*()n F x 代替时,得到的总体原点矩的估计*1ˆ()1/nkkk ni i i x dF x n X A μ+∞-∞===⋅=∑⎰,恰好就是样本的同阶原点矩。
因此,用样本原点矩代替总体原点矩是可行的,这是矩估计法的基本思想。
但在一般情况下,矩估计不是唯一的。
如~(),X πλλ是未知参数,可以用()E X λ=,即样本一阶原点矩代替总体原点矩;也可以用()D X λ=,即样本二阶中心矩代替总体二阶中心矩。
顺便指出,矩法也可以用样本中心矩代替总体相应中心矩而求得未知参数的。
2.什么是最大似然估计?其基本思想是什么? 答 最大似然估计是利用总体X 的概率密度或概密函数及样本所提供的信息所建立的求未知参数估计量的一种方法。
它建立在这样一种直观想法的基础上:假定一个随机试验E 有若干个可能结果12,,,n A A A ,如果只进行了一次试验,而结果i A 出现了,那么我们有理由认为试验的条件对“结果i A 出现”有利,即试验中“出现i A ”的概率最大。
因此,极大似然估计法的基本思想是,根据从总体X 得到的样本12,,,n X X X ,取得联合分布律1(;)ni i P x θ=∏或联合概率密度1(;)ni i f x θ=∏,构造样本似然函数()L θ。
然后适当选取 θ,使()L θ的值达到最大,也就是使试验得出结果1122,,,n n X x X x X x === 的概率为最大。
3.利用微分法求最大似然估计有哪些步骤?在一般情况下,为什么要先对似然函数取对数?答 求最大似然估计的步骤为 ①写出似然函数12(;,,,)n L x x x θ 或1212(,,,;,,,)m n L x x x θθθ 。
②取对数12ln (;,,,)n L x x x θ 或1212ln (,,,;,,,)m n L x x x θθθ 。
③求导数,建立对数似然方程ln /0d L d θ=或求偏导数ln /0,1,2,,i L i m θ∂∂== 。
④解对数似然方程或方程组。
由于似然函数()L θ通常是一些含θ函数的连乘积形式,直接求导一般比较困难。
如果先取对数,可以化积为和,使求导更为简便,同时又不影响结果。
这是因为ln L 是L 的单调增函数,ln L 与L 有相同极值点,所以由似然方程和对数似然方程得到的最大点也是相同的。
4.对于未知参数的估计量为什么希望它具有无偏性和最小方差性(优效性)?答 无偏性是指对估计量 θ,有 (),E θθθ=∈Θ,即希望系统偏差不存在。
这时,用大量重复估计结果的算术平均值代替待估未知参数的真值才是可信的。
由于无偏估计不是唯一的,在众多无偏估计中选择哪一个呢?衡量优劣的标准也有许多个,如使||E T θ-最小,或使2()E T θ-最小等等。
而使 ()D θ为最小,无疑是最为简便的。
事实上,若 θ为θ的估计,则其均方误差为 22()[()()]E E E E θθθθθθ-=-+- 2()[()]D E θθθ=+-。
显然, ()D θ最小时,均方误差为最小。
所以选 ()D θ小的无偏估计量为有效(优效)估计量。
5.样本方差2S 与样本二阶中心矩*2S 去估计2σ有何异同?答 仅考虑无偏性时,用样本方差2S 去估计2σ比样本二阶中心矩*2S 估计2σ更好。
因为22ES σ=,2S 是2σ的无偏估计;而*221 n E S n nσ-=→∞时,*2S 是2σ的渐近无偏估计。
考虑相合性时,样本方差2S 和样本二阶中心矩*2S 都是2σ的相合估计。
然而仅考虑估计方差的大小,当总体2~(,)X N μσ时,*2S 去估计2σ又比2S 估计2σ更好。
因为 2*2*22()()nSD S D n σσ=⋅422422222(1)(1)2(1)()()1(1)n n Sn D S D nn n σσσσ---=≤=⋅=--6.无偏估计是不是相合估计?答 无偏估计和相合估计没有一定的关系。
即估计量具有无偏性未必具有相合性,反之,亦然。
例如:~[0,]X U θ即10()0 x f x θθ⎧<≤⎪=⎨⎪⎩其它,1n X X 为抽取的简单随机样本。
12111m ax(),2n n X X X nθθ+== 都是θ 的无偏估计。
因为1(m ax ())1i i nn E X n θ≤≤=+,221(m ax ())(2)(1)i i nn D X n n θ≤≤=++由切比雪夫不等式有112()[||]D P θθθεε-≥≤,则 1211(m ax ())1|m ax ()|i i n i i n n D X n nP X n θεε≤≤≤≤+⋅+⎧⎫-≥≤⎨⎬⎩⎭2222222(1)0(2)(1)(2)n n nn n n n θθεε+=⋅=→+++。
n →∞时,故 1P θθ−−→。