第二章数学基础

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一节统计学基础第二节线性代数基础第三节回归与分析
一、平均数、标准差与变异系数二、显著性检验三、方差分析四、协方差分析
（一）平均数：算术平均数是指资料中各观测值的总和除以观测值个数所得的商，
简称平均数或均数，记为或加权法计算。
。算术平x 均数可根据样本大小及分组情况而采用直接法
相应的总体参数叫总体方差，记为σ2。对于有限总体而言， 2 (x )2 / N
统计学上把样本方差S2的平方根叫做样本标准差，记为S ：
S
(x x)2
x2
( x)2
n
n 1
n 1
相应的总体参数叫总体标准差，记为σ 。在统计学中，常用样本标准差S估计总体标准差σ。
在样本服从正态分布的条件下，资料中约有68.26%的观测值在平均数左右一倍标准差（±S）范围内；约有95.43%的观测值在平均数左右两倍标准差（±2S）范围内；约有99.73%的观测值在平均数左右三倍标准差（±3S）范围内。也就是说全距近似地等于6倍标准差
5、调和平均数（harmonic mean）：各观测值倒数的算术平均数的倒数，称为调和平均数，记为H。
平均值只能反映效应的平均高低，而变异程度是另一个衡量效应的重要指标。
极差和离均差不能全面反映变异程度，后者有正负号，离均差之和为 0。
离均差平方和除以自由度得到均方（mean square缩写为MS）,又称样本方差，记为S2。S2= (x x)2 / n 1
当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数作为总体平均数（μ）的估计量，并已证明样本平均数是总体平均数μ的无偏估计量。
1、算术平均数（arithmetic mean）：
直接求算法和加权平均值法
2、中位数（median）:将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为Md。当观测值的个数是偶数时，则以中间两个观测值
的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时，中
位数的代表性优于算术平均数。
3、众数（mode）：出现次数最多的那个观测值或次数最多一组的组中值，称为众数，记为M0。
4、几何平均数（geometric mean）： n个观测值相乘之积开n次方所得的方根，称为几何平均数，记为G。
（2）
假设检验的依据——小概率原理：小概率事件在一
次试验中实际上不会发生。
（3）假设检验的思路是概率性质的反证法。即首先假设成立，然后根据一次抽样所得的样本值得信息，若导致小概
率事件发生，则拒绝原假设，否则接受原假设。
1、假设检验程序 ⑴ 根据题意提出零假设H0（或相应备选假设H1）。 ⑵构造样本统计量并确定其分布；
（一）t-检验的基本步骤： 1）首先对试验样本所在的总体作假设，无效假设（null
h设yp，ot通he过si检s）验,可记能作被H接0：受，1也2可或能被1-否2定=。0。否无定效时假可设提是出被备检择验假的设假（alternative hypothesis）,记作HA：1≠2或1-2≠0； 2）在无效假设成立的前提下，构造合适的统计量，并研究试验所得统计量的抽样分布，计算无效假设正确的概率，继而查表找出其概率。
Fra Baidu bibliotek
S x1x2
(x1 x1 )2 (x2 x2 )2 ( 1 1 )
(n1 1) (n2 1)
n1 n2
在t-检验中，备择假设包括了 1 > 或 < 2两种可能。
双侧t-检验：在水平上否定域为 ,t 和 t ,，对称地分配在t分
布曲线的两侧尾部，每侧的概率为 /2，这种利用两尾概率进行的检验叫双侧检验（two-sided test），也叫双尾检验（two-tailed test）, 为双侧检验的临界t值。单侧t-检验：这种利用一侧概率进行的检验叫单侧检验（onesided test）也叫单尾检验（one-tailed test）。此时为单侧检验的临界t值。显然，单侧检验的t =双侧检验的 t2 。
变异系数可以消除单位和（或）平均数不同对两个或多个资料变异程度比较的影响。
变异系数的计算公式为：
C V S 100% x
对总体分布或分布中的某些参数作出假设，然后利用样本的观测值所提供的信息，检验这种假设是否成立，这一统计推断过程，称为假设检验。
（1）待检验假设或零假设记为H0，正在被检验的与相对立的假设H1称为备选假设或对立假设。
变异系数：变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时，如果度量单位与平均数相同，可以直接利用标准差来比较。如果单位和（或）平均数不同时，比较其变异程度就不能采用标准差，而需采用标准差与平均数的比值（相对值）
来比较。标准差与平均数的比值称为变异系数，记为CV。
⑶给定显著性水平，查表确定临界值，从而得出接受域和拒绝域；
⑷由样本观测值计算出统计量的值； ⑸作出判断：若统计量的值落入拒绝域则拒绝H0，若统计
量的值落入接受域则接受H0。 2、假设检验的主要方法有： Z检验法、t检验法、c2检验法、F检验法。
以样本平均数作为检验对象，由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。
3）根据“小概率事件实际不可能性原理”否定或接受无效假设，根据这一原理，当试验的表面效应是试验误差的概率小于0.05时，可以认为在一次试验中试验表面效应是试验误差实际上是不可能的，因而否定原先所作的无效假设： 1=2 ，接受备择假设：1 ≠2 ，即认为：试验的处理效应是存在的。
t x1 x2 S x1x2
平均数的基本性质:(1)样本各观测值与平均数之差的和为零，即离均差之和等于零。(2)样本各观测值与平均数之差的平方和为最小，即离均差平方和为最小。
<
n
n
(xi x)2
(x i - )
i 1
i 1
对于总体而言，通常用μ表示总体平均数，有限总体的平均数为：
n
xi N
i 1
式中，N表示总体所包含的个体数。