第二章数学基础

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 统计学基础 第二节 线性代数基础 第三节 回归与分析
一、平均数、标准差与变异系数 二、显著性检验 三、方差分析 四、协方差分析
(一)平均数:算术平均数是指资料中各观测值的总和除以观测值个数所得的商,
简称平均数或均数,记为 或加权法计算。
。算术平x 均数可根据样本大小及分组情况而采用直接法
相应的总体参数叫总体方差,记为σ2。对于有限总体而言, 2 (x )2 / N
统计学上把样本方差S2的平方根叫做样本标准差,记为S :
S
(x x)2
x2
( x)2
n
n 1
n 1
相应的总体参数叫总体标准差,记为σ 。在统计学中,常用样本标准 差S估计总体标准差σ。
在样本服从正态分布的条件下,资料中约有68.26%的观测值在平均数 左右一倍标准差(±S)范围内;约有95.43%的观测值在平均数左右 两倍标准差(±2S)范围内;约有99.73%的观测值在平均数左右三倍 标准差(±3S)范围内。也就是说全距近似地等于6倍标准差
5、调和平均数(harmonic mean):各观测值倒数的算术平均数的倒 数,称为调和平均数,记为H。
平均值只能反映效应的平均高低,而变异程度是另一个衡量效应的重 要指标。
极差和离均差不能全面反映变异程度,后者有正负号,离均差之和为 0。
离均差平方和除以自由度得到均方(mean square缩写为MS),又称样 本方差,记为S2。S2= (x x)2 / n 1
当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数 的无偏估计量。统计学中常用样本平均数作为总体平均数(μ)的估计量,并已 证明样本平均数 是总体平均数μ的无偏估计量。
1、算术平均数(arithmetic mean):
直接求算法和加权平均值法
2、中位数(median):将资料内所有观测值从小到大依次排列,位于中间的那个 观测值,称为中位数,记为Md。当观测值的个数是偶数时,则以中间两个观测值
的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时,中
位数的代表性优于算术平均数。
3、众数(mode):出现次数最多的那个观测值或次数最多一组的组 中值,称为众数,记为M0。
4、几何平均数(geometric mean): n个观测值相乘之积开n次方所 得的方根,称为几何平均数,记为G。
(2)
假设检验的依据——小概率原理:小概率事件在一
次试验中实际上不会发生。
(3) 假设检验的思路是概率性质的反证法。即首先假设 成立,然后根据一次抽样所得的样本值得信息,若导致小概
率事件发生,则拒绝原假设,否则接受原假设。
1、假设检验程序 ⑴ 根据题意提出零假设H0(或相应备选假设H1)。 ⑵构造样本统计量并确定其分布;
(一)t-检验的基本步骤: 1)首先对试验样本所在的总体作假设,无效假设(null
h设yp,ot通he过si检s)验,可记能作被H接0:受,1也2可或能被1-否2定=。0。否无定效时假可设提是出被备检择验假的设假 (alternative hypothesis),记作HA:1≠2或1-2≠0; 2)在无效假设成立的前提下,构造合适的统计量,并研究试验所得 统计量的抽样分布,计算无效假设正确的概率,继而查表找出其概率。
Fra Baidu bibliotek
S x1x2
(x1 x1 )2 (x2 x2 )2 ( 1 1 )
(n1 1) (n2 1)
n1 n2
在t-检验中,备择假设 包括了 1 > 或 < 2两种可能。
双侧t-检验:在 水平上否定域为 ,t 和 t ,, 对称地分配在t分
布曲线的两侧尾部,每侧的概率为 /2,这种利用两尾概率进行 的检验叫双侧检验(two-sided test),也叫双尾检验(two-tailed test), 为双侧检验的临界t值。 单侧t-检验:这种利用一侧概率进行的检验叫单侧检验(onesided test)也叫单尾检验(one-tailed test)。此时 为单侧检验的 临界t值。显然,单侧检验的t =双侧检验的 t2 。
变异系数可以消除单位和(或)平均数不同对两个或多个 资料变异程度比较的影响。
变异系数的计算公式为:
C V S 100% x
对总体分布或分布中的某些参数作出假设,然后利用样本的 观测值所提供的信息,检验这种假设是否成立,这一统计推 断过程,称为假设检验。
(1)待检验假设或零假设记为H0,正在被检验的与相对立的 假设H1称为备选假设或对立假设。
变异系数:变异系数是衡量资料中各观测值变异程度的另 一个统计量。当进行两个或多个资料变异程度的比较时, 如果度量单位与平均数相同,可以直接利用标准差来比较。 如果单位和(或)平均数不同时,比较其变异程度就不能 采用标准差,而需采用标准差与平均数的比值(相对值)
来比较。标准差与平均数的比值称为变异系数,记为CV。
⑶给定显著性水平,查表确定临界值,从而得出接受域 和拒绝域;
⑷由样本观测值计算出统计量的值; ⑸作出判断:若统计量的值落入拒绝域则拒绝H0,若统计
量的值落入接受域则接受H0。 2、假设检验的主要方法有: Z检验法、t检验法、c2检验法、F检验法。
以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样 本所属总体平均数是否相同是有其依据的。
3)根据“小概率事件实际不可能性原理”否定或接受无效假设,根 据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以 认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而 否定原先所作的无效假设 : 1=2 ,接受备择假设 :1 ≠2 ,即认 为:试验的处理效应是存在的。
t x1 x2 S x1x2
平均数的基本性质:(1)样本各观测值与平均数之差的和为零,即离均差之和等于 零。(2)样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。
<
n
n
(xi x)2
(x i - )
i 1
i 1
对于总体而言,通常用μ表示总体平均数,有限总体的平均数为:
n
xi N
i 1
式中,N表示总体所包含的个体数。
相关文档
最新文档