勒让德发明最小二乘法
最小2乘法公式
最小2乘法公式
最小二乘法是一种数学方法,可以用来解决线性回归问题。
线性回归问题是指在给定一堆数据的情况下,寻找一个函数,使得这个函数能够最好地拟合这堆数据。
最小二乘法的目标是使得这个函数的预测值与实际值之间的误差平方和最小。
最小二乘法最早由法国数学家勒让德在19世纪提出,被广泛应用于科学、工程和金融等领域。
通常,最小二乘法的公式可以用矩阵与向量的乘积来表示。
在这个公式中,我们需要用到一些符号:Y:实际值的向量(n行1列)
X:预测值的矩阵(n行p列)
b:回归系数的向量(p行1列)
e:误差的向量(n行1列)
其中,n表示数据的数量,p表示回归系数的数量。
最小二乘法的公式是:
b = (X^TX)^(-1)X^TY
在这个公式中,^T表示转置,^(-1)表示矩阵求逆。
这个公式的核心是矩阵求逆。
如果矩阵没有逆矩阵,我们就无法使用最小二乘法来解决线性回归问题。
此外,如果数据量很大,矩阵
的求逆操作也会变得非常耗时。
因此,在实际应用中,我们需要采用一些基于最小二乘法的变种算法来加速计算。
总体而言,最小二乘法是一个非常有用的数学工具,可以帮助我们解决许多实际问题。
当然,在使用最小二乘法的时候,我们需要注意数据的质量和数量,以及算法的适用范围和参数调整等问题,才能取得最好的效果。
用最小二乘法估计模型参数
用最小二乘法估计模型参数最小二乘法是一种参数估计方法,常用于拟合线性回归模型。
该方法通过最小化观测值与模型预测值之间的差异来确定模型的参数。
本文将详细介绍最小二乘法的原理、应用领域以及具体操作步骤,以期为读者提供有关该方法的生动、全面且有实际指导意义的文章。
一、最小二乘法原理最小二乘法最初由法国数学家勒让德于18世纪提出,其核心思想是选择能够最小化观测值与模型预测值之间残差的参数。
残差是观测值与模型预测值之间的差异,这些差异可用来评估模型的拟合程度。
最小二乘法的目标是找到使残差平方和最小化的参数,从而得到最佳拟合效果。
二、最小二乘法的应用领域最小二乘法广泛应用于各个领域,尤其是数理统计学、经济学、工程学和社会科学等领域。
在这些领域,研究人员经常需要通过观测数据来拟合数学模型,并利用最小二乘法来估计模型的参数。
例如,在经济学中,研究人员可以利用最小二乘法来估计市场需求曲线和供应曲线的参数,从而预测市场价格和销售量的变化。
三、最小二乘法的具体操作步骤1. 收集观测数据:首先,需要收集一组相关的观测数据,这些数据是建立数学模型的基础。
2. 选择模型:根据实际问题的需要,选择适当的数学模型来描述观测数据之间的关系。
常见的模型包括线性模型、多项式模型和指数模型等。
3. 确定目标函数:目标函数是最小二乘法的核心,其定义为观测值与模型预测值之间残差的平方和。
通过最小化目标函数,可以找到最佳拟合效果的参数。
4. 求解参数:利用数学方法,对目标函数进行求解,求得最小化目标函数的模型参数。
常用的求解方法包括求导、矩阵运算和数值优化算法等。
5. 模型评估:为了评估拟合效果,需要对模型进行验证。
常用的方法有计算残差平方和、拟合优度和假设检验等。
6. 参数解释和预测:最后,根据所得到的模型参数,解释模型的物理含义,并利用模型进行预测和推断。
通过上述步骤,我们可以利用最小二乘法对观测数据进行拟合,并估计模型的参数。
最小二乘法不仅在理论研究中有重要应用,而且在实际问题的解决中也扮演着重要的角色。
最小二乘法的发展历史
最小二乘法的发展历史最小二乘法是数学中的一种方法,是用来解决方程组的,通俗地可以理解为“最小化误差”。
它在数据处理、工程、统计学等领域得到了广泛的应用。
下面,我们将会简单地介绍一下最小二乘法的发展历程。
首先,我们需要了解一下最小二乘法的基本思想:通过寻找一个最小的误差平方和,来确定各项系数的值,使方程组成立。
这个思想其实早在17世纪就有人想到了,但是真正用于实际应用的时间却比较晚。
到了18世纪,高斯提出了正态分布和标准误差等概念,为发展最小二乘法打下了基础。
19世纪初,高等代数中出现的矩阵理论,更加严谨地推动了最小二乘法的发展。
1870年左右,德国数学家高斯、佩林和赫尔姆霍兹等人,开始将最小二乘法应用于天文学和导航上。
随后,英国物理学家爱德华·阿德金斯和法国数学家勒让德分别提出了关于最小二乘法的重要理论。
20世纪初,统计学家费歇尔提出了关于回归分析的最小二乘法模型,并在实际应用中取得了一定的成果。
此后,最小二乘法在统计学和数学中的应用更加广泛。
除了最小二乘法本身的理论不断完善之外,人们还提出了各种改进方案。
例如,使用非线性的最小二乘法可以更好地解决数据拟合问题;而广义最小二乘法则可以应用于时间序列分析等领域。
总的来说,最小二乘法的发展历程可以概括为:17世纪“最小化误差”的基本思想出现;18-19世纪逐步形成理论基础,应用于天文学和导航;20世纪则进一步推广至回归分析和数据拟合,随着计算机技术的进步,最小二乘法在实际应用中的地位更加重要。
总之,最小二乘法的发展历程表明了人类不断探索的精神和对于数学思想的不懈追求。
同时,也证明了最小二乘法的实用性和重要性。
未来,我们相信最小二乘法还将继续得到发展和应用,为人类的科学探索和日常工作提供更加完善的支持。
最小二乘估计
回归方程的精度和相关系数
为了估计回归方程的精度,进一步计算数据点 xi, yi 偏 离最佳直线y=a+bx的大小,所以计算剩余标准差 s , 它反映着回归方程与各数据点的拟合程度。
s
vi n2
2
(1R ) syy n2
2
其中:
( yi ) 2 syy yi n
一元线性回归
首先,求偏差平方和,得: 2 n n φ= vi 2 yi a bxi
i 1 i 1 φ是a, b的函数。按最小二乘法,当a, b选择合适,能使 φ为最小时,y=a+bx才是最佳曲线。 对a和b分别求出偏导数。得:
vi i 1 a n vi 2 i 1 b
在多元回归中残差向量为:
残差平方和为:
多元线性回归
多元回归系数的估计表达式:
多元回归模型残差的样本方差:
也可得到多元判定系数R2:
原理-非线性回归
设由实验获得了两个变量x,y的一组数据(xi, yi),且由数据点 在x,y坐标中的分布规律可以判断出两个变量间成非线性 关系。用一条曲线(数学关系式)最佳地代替数据点的分 布规律方法: (1)根据数据点的分布尽可能准确地绘出一条曲线,并和 已有确切数学表示式的曲线相比较,寻找合适的数学关系 式。 (2)进行变量替换,将 化,在 使非线性关系线性
原理-一元线性回归
已知函数为线性关系,其形式为: y=a+bx (1) 式中a, b为要用实验数据确定的常数。此类方程叫线性 回归方程,方程中的待定常数a, b叫线性回归系数。 由实验测得的数据是 x= x1, x2,………. xn 时, 对应的y值是y= y1,y2,…….yn
最小二乘法:勒让德与高斯
最 小二 乘 法 : 让德 与高 斯 勒
方 程 的方 程 组 , 中 a b 厂 … 是 已 知 系数 , 其 ,, , 它
f 1 =
要 找 出最有 希望 的误 差 函数 应使 L( ) z 达极 大 , 高 斯 认 为 -就 是 - z z的估 计 值 , 使 L( ) 得 极 大 并 z取
值 。对 上式 两端 取对 数得
( ) 果舍 弃或 增加 观测 值 , 3如 则修 改所 得方 程
组 即可 。
勒让 德 的成功 在于他 从 一个 新 的角度 来看 待 这 个 问题 , 不像 其 前 辈 那 样致 力 于 找 出几 个 方 程
最 常用 的是利 用最小 二 乘法 准 则 , 即求 出 口 , b 使得 ( , 1 ,z , 2 , ,z , 各点 沿 Y轴 , IY ) ( 2Y ) … ( Y ) 到直线 Y= n+ b 的 偏 差 的平 方 之 和最 小 , = = x 即
n
现 的 , 小二乘 法就是 一个 典型 实例 。 最
口 ( 一 1, … , 。 z 2, m)
3 高斯 与 最 小二 乘 法
德 国慕 尼黑 博物 馆 的高斯 ( . . a s ,7 7 C F G us17
—
寻找“ 最佳 ” 似解 , 近 以使 所有 E 都变 小 。勒 , 让 德认 为 :赋 予误 差 的平 方 和 为 极 小 , 意 味 着 “ 则
最小 二乘法 最 早 出 现在 勒 让 德 1 0 8 5年 发表
高中生都能看懂的最小二乘法原理
高中生都能看懂的最小二乘法原理在简单线性回归等曲线拟合中提到的最多的最小二乘法,那么下面引用《正态分布的前世今生》里的内容稍微简单阐述下。
一、最小二乘法的历史1801年,意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。
经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。
随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。
时年24岁的高斯也计算了谷神星的轨道。
奥地利天文学家海因里希·奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。
高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。
法国科学家勒让德于1806年独立发明“最小二乘法”,但因不为世人所知而默默无闻。
勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。
1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,因此被称为高斯-马尔可夫定理。
(来自于wikipedia)二、原理我们口头中经常说:一般来说,平均来说。
如平均来说,不吸烟的健康优于吸烟者,之所以要加“平均”二字,是因为凡事皆有例外,总存在某个特别的人他吸烟但由于经常锻炼所以他的健康状况可能会优于他身边不吸烟的朋友。
而最小二乘法的一个最简单的例子便是算术平均。
最小二乘法(又称最小平方法)是一种数学优化技术。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
用函数表示为:使误差「所谓误差,当然是观察值与实际真实值的差量」平方和达到最小以寻求估计值的方法,就叫做最小二乘法,用最小二乘法得到的估计,叫做最小二乘估计。
当然,取平方和作为目标函数只是众多可取的方法之一。
最小二乘法的一般形式可表示为:有效的最小二乘法是勒让德在1805 年发表的,基本思想就是认为测量中有误差,所以所有方程的累积误差为我们求解出导致累积误差最小的参数即可:勒让德在论文中对最小二乘法的优良性做了几点说明:•最小二乘使得误差平方和最小,并在各个方程的误差之间建立了一种平衡,从而防止某一个极端误差取得支配地位•计算中只要求偏导后求解线性方程组,计算过程明确便捷•最小二乘可以导出算术平均值作为估计值对于最后一点,从统计学的角度来看是很重要的一个性质。
【文献综述】最小二乘法的原理和应用
文献综述数学与应用数学最小二乘法的原理和应用一、国内外状况天文学自古代至18世纪是应用数学中最发达的领域。
观测和数学天文学给出了建立数学模型及数据拟合的最初例子,在此种意义下,天文学家就是最初的数理统计学家。
天文学的问题逐渐引导到算术平均,以及参数模型中的种种估计方法,以最小二乘法为顶峰。
1801年,意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。
经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。
随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。
时年24岁的高斯也计算了谷神星的轨道。
奥地利天文学家海因里希·奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。
高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。
勒让德是法国军事学校的教授,曾任多界政府委员,后来成了多科工艺学校的总监,直至1833年逝世。
有记载最小二乘法最早出现在勒让德1805年发表的论著《计算彗星轨道的新方法》附录中。
他在该书中描述了最小二乘法的思想、具体做法及其优点。
勒让德的成功在于它从一个新的角度来看待这个问题,不像其前辈那样致力于找出几个方程(个数等于未知数的个数)再去求解,而是考虑误差在整体上的平衡。
从某种意义讲,最小二乘法是一个处理观测值的纯粹代数方法。
要将其应用于统计推断问题就需要考虑观测值的误差,确定误差分布的函数形式。
勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。
1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,因此被称为高斯-莫卡夫定理。
最小二乘法是提供“观测组合”的主要工具之一,它依据对某事件的大量观测而获得“最佳”结果或“最可能”表现形式。
如已知两变量为线性关系y=a+dx,对其进行n(n>2)次观测而获得n对数据,若将这n对数据代入方程求解a 、b 之值则无确定解。
最小二乘法
最小二乘法1:最小二乘法的原理与要解决的问题最小二乘法是由勒让德在19世纪发现的,形式如下式:标函数 = \sum(观测值-理论值)^2\\观测值就是我们的多组样本,理论值就是我们的假设拟合函数。
目标函数也就是在机器学习中常说的损失函数,我们的目标是得到使目标函数最小化时候的拟合函数的模型。
举一个最简单的线性回归的简单例子,比如我们有 m 个只有一个特征的样本: (x_i, y_i)(i=1, 2, 3...,m)样本采用一般的 h_{\theta}(x) 为 n 次的多项式拟合,h_{\theta}(x)=\theta_0+\theta_1x+\theta_2x^2+...\theta _nx^n,\theta(\theta_0,\theta_1,\theta_2,...,\theta_n) 为参数最小二乘法就是要找到一组\theta(\theta_0,\theta_1,\theta_2,...,\theta_n) 使得\sum_{i=1}^n(h_{\theta}(x_i)-y_i)^2 (残差平方和) 最小,即,求 min\sum_{i=1}^n(h_{\theta}(x_i)-y_i)^22 :最小二乘法的矩阵法解法最小二乘法的代数法解法就是对 \theta_i 求偏导数,令偏导数为0,再解方程组,得到 \theta_i 。
矩阵法比代数法要简洁,下面主要讲解下矩阵法解法,这里用多元线性回归例子来描:假设函数h_{\theta}(x_1,x_2,...x_n)=\theta_0+\theta_1x_1+...+\t heta_nx_n 的矩阵表达方式为:h_{\theta}(\mathbf{x})=\mathbf{X}\theta\\其中,假设函数 h_{\theta}(\mathbf{x})=\mathbf{X}\theta 为 m\times1 的向量, \theta 为 n\times1 的向量,里面有 n 个代数法的模型参数。
最小二乘法的创立及其思想方法
最小二乘法的创立及其思想方法一、本文概述1、介绍最小二乘法的历史背景及其在统计学和数据分析中的重要性。
最小二乘法,这一数学分析方法的历史可以追溯到19世纪初的欧洲。
当时,天文学家、数学家和统计学家们正面临着如何从有限的观测数据中提取最大信息的问题。
最小二乘法的出现,为这一难题提供了有效的解决方案,并迅速在统计学、数据分析以及众多科学领域中得到广泛应用。
最小二乘法最初由法国数学家阿德里安-马里·勒让德在1805年提出,他尝试使用这一方法来预测行星轨道。
随后,在1809年和1810年,意大利天文学家朱塞普·皮亚齐分别独立地发表了最小二乘法在天文学领域的应用。
到了19世纪中叶,英国统计学家卡尔·弗里德里希·高斯重新发现了这一方法,并详细阐述了其在测量误差分析中的优势,进一步推动了最小二乘法在统计学中的普及。
随着计算机技术的飞速发展,最小二乘法在数据分析领域的应用也日益广泛。
它不仅被用于线性回归分析,还扩展到了非线性回归、时间序列分析、信号处理等多个领域。
通过最小二乘法,研究者可以从数据中提取出隐藏在背后的规律,为科学研究和决策提供有力支持。
因此,最小二乘法在统计学和数据分析中的重要性不言而喻。
它不仅是一种有效的数学工具,更是一种科学的思维方法,帮助我们更好地理解和分析现实世界中的复杂数据。
2、阐述本文的目的和结构,为读者提供文章的整体框架。
本文的主要目的是对最小二乘法的创立过程及其背后的思想方法进行深入的探讨和阐述。
最小二乘法作为一种数学优化技术,广泛应用于回归分析、数据拟合、预测分析等多个领域,具有极高的实用价值。
通过揭示最小二乘法的创立背景、发展脉络和思想内涵,本文旨在为读者提供一个全面、系统的理解框架,以便读者能够更好地掌握和应用这一重要的数学工具。
在结构上,本文首先将对最小二乘法的历史背景进行简要回顾,介绍其创立的时代背景和数学基础。
接着,本文将详细阐述最小二乘法的数学原理,包括其基本假设、求解方法以及与其他数学方法的联系和区别。
用最小二乘法求解参数估计问题
用最小二乘法求解参数估计问题在数学和统计学领域中,我们经常需要利用样本数据来推断总体参数的值。
这种推断过程被称为参数估计。
例如,当我们要推断一个总体的平均值、方差或者回归模型的系数时,我们需要利用采样数据来计算估计值。
常用的参数估计方法有极大似然估计、贝叶斯估计和最小二乘估计。
其中,最小二乘法是由法国数学家阿道夫·勒让德于19世纪末提出的一种线性回归分析方法。
它的基本思想是寻找使得样本观测值的平方差最小的估计值,从而得出总体参数的最佳估计值。
最小二乘法是一种经典的参数估计方法,它不仅理论基础牢固,而且在各个领域中都有广泛的应用。
例如,在工业中,它可以用于控制过程质量和优化生产流程;在金融领域中,它可以用于投资组合管理和风险控制;在医学研究中,它可以用于寻找疾病与风险因素之间的关系。
最小二乘法的基本原理最小二乘法的核心思想是找到一个可以最好地拟合样本数据的模型,以此来推断总体的参数值。
如果我们想要估计一个线性回归模型的系数,假设模型为:y = β_0 + β_1*x_1 + β_2*x_2 + ... + β_k*x_k + ε其中,y是响应变量(因变量),x_1, x_2, ..., x_k是自变量,β_0, β_1, β_2, ..., β_k是回归系数,ε是误差项。
在最小二乘法中,我们的目标是使所有样本点到回归直线的距离的平方和最小,即最小化残差平方和(RSS):RSS = Σ(y_i - β_0 - β_1*x_i1 - β_2*x_i2 - ... - β_k*x_ik)^2通过求导,我们可以得到使RSS最小的回归系数的估计值:β = (X^T*X)^-1*X^T*y其中,β是系数的估计值,y是样本的响应变量,X是自变量的样本数据矩阵(第一列全是1,剩下的列是自变量),(X^T*X)^-1是X^T*X的逆矩阵。
最小二乘法应用案例假设我们有一组由100个样本组成的数据集,其中包含两个变量x和y。
最小二乘法的创立及其思想方法
最小二乘法的创立及其思想方法最小二乘法是一种数学统计方法,广泛应用于各种领域,如线性回归、曲线拟合、数据拟合等。
它的创立可以追溯到18世纪末,法国数学家勒让德在其著作《解析力学》中首次提出。
从那时起,最小二乘法逐渐成为数学、统计学和经济学等领域的重要工具。
最小二乘法的基本概念是:找到一个函数或模型,使得它与给定数据之间的平方误差之和最小。
这个函数或模型可以是一次线性、二次曲线或者其他更为复杂的模型。
最小二乘法具有广泛的应用范围,例如在机器学习中的线性回归、时间序列分析中的自回归模型、金融中的资本资产定价模型等。
收集数据:从总体中抽取样本数据,这些数据通常包括自变量和因变量。
建立模型:根据数据的特征和问题的实际情况,选择一个合适的函数或模型作为预测模型。
计算平方误差:将实际观测值与模型预测值之间的差距平方,计算出平方误差。
最小化误差:通过最小化平方误差之和,找到一个最优的模型参数,使得预测值与实际观测值之间的差距尽可能小。
求解最优参数:通常使用代数方法或迭代方法来求解最小二乘问题,例如线性回归中的正规方程法或梯度下降法。
评估模型:使用诸如R-squared等统计指标来评估模型的拟合优度,并检查是否存在过拟合或欠拟合。
最小二乘法在各个领域都有广泛的应用实例。
例如,在机器学习中,我们可以使用最小二乘法来训练线性回归模型,预测连续型变量的值;在经济学中,最小二乘法可以用于估计资产价格受各种因素影响的关系;在测量学中,最小二乘法可以用于拟合实验数据,得到更加精确的测量结果。
最小二乘法是一种非常实用的数学方法,它通过最小化平方误差之和来找到最佳的模型参数,从而提高了模型的拟合优度和预测准确性。
在实际应用中,我们需要根据具体的领域和数据特征来选择合适的函数或模型,并根据实际数据情况进行参数调整和优化。
在统计学和数据分析领域,最小二乘法是一种常用的参数估计方法,用于拟合线性模型并预测数据。
然而,在某些情况下,经典最小二乘法可能无法提供完全准确的结果,这时需要使用全最小二乘法。
最小二乘法
最小二乘法是处理各种观测数据进行测量平差的一种基本方法。
如果以不同精度多次观测一个或多个未知量,为了求定各未知量的最可靠值,各观测量必须加改正数,使其各改正数的平方乘以观测值的权数的总和为最小。
因此称最小二乘法。
所谓“权”就是表示观测结果质量相对可靠程度的一种权衡值。
法国数学家勒让德于1806年首次发表最小二乘理论。
事实上,德国的高斯于1794年已经应用这一理论推算了谷神星的轨道,但迟至1809年才正式发表。
此后他又提出平差三角网的理论,拟定了解法方程式的方法等。
为利用最小二乘法测量平差奠定了基础。
最小二乘法也是数理统计中一种常用的方法,在工业技术和其他科学研究中有广泛应用。
首先从数学的角度阐述平差中产生的方程式数量、未知数数量问题,进而说明天然的平差模型无法得到唯一解这个结论,从而启发学生知道应该引入一定条件解决此问题,顺理成章引入最小二乘原理,并说明其含义及应用方法。
教学内容:一、平差函数模型的方程式数量与未知数数量及解方程存在的问题1.平差函数模型的方程式数量与未知数数量通过前面的论述可知,如果只对几何模型中的必要元素进行观测,而没有多余观测,则在观测值之间不可能产生任何函数关系式,也不存在平差问题。
只有在有了多余观测的情况下,才会产生平差问题。
例如为确定一个三角形的大小和形状,必要观测数为t=3,如果实际观测了一边三角(n=4),则存在一个多余观测(r=n-t=1)。
现以一边和其中任意两个角作为一个组合来确定三角形的大小和形状,则有三种组合,由于观测值不可避免地含有偶然误差,三种组合所计算的结果将出现微小差别,这说明在具有多余观测的情况下,将无法唯一的确定模型的解。
从函数模型来考虑,由于存在一个多余观测,三个内角真值之间就存在一个条件方程,即:考虑到,代入上式得(2-4-1)式中(2-4-2)称为条件方程的闭合差或常数项,它是可以根据观测值计算出来的。
由于观测值的真值不知道,所以真误差是未知量。
10 勒让德发明最小二乘法
勒让德发明最小二乘法勒让德是法国大数学家,在数学的许多领域,包括椭圆积分,数论和几何等方面,都有重大的贡献。
最小二乘法最先出现在他于1805年发表的一本题为《计算彗星轨道的新方法》著作的附录中,该附录占据了这本长80页著作的最后9页。
勒让德在这本书前面几十页关于彗星轨道计算的讨论中没有使用最小二乘法,可见在他刚开始写作时,这一方法尚未在他头脑中成形。
历史资料还表明,勒让德在参加量测过巴黎子午线长这项工作很久以后还未发现这个方法。
考虑到此书发表于1805年且该法出现在书尾的附录中,可以推测他发现这个方法当在1805年或之前不久的某个时间。
勒让德在该书72~75页描述了最小二乘法的思想、具体作法及方法的优点。
他提到:使误差平方和达到最小,在各方程的误差之间建立了一种平衡,从而防止了某一极端误差(对决定参数的估计值)取得支配地位,而这有助于揭示系统的更接近真实的状态。
的确,考察勒让德之前一些学者的做法,都是把立足点放在解出一个线性方程组上。
这种做法对于误差在各方程之间的分布的影响如何,是不清楚的。
在方法的具体操作上,勒让德指出,为实现20111()ni i ki k i xx x θθ=+++=∑ 最小而对各i θ求偏导数所形成的线性方程组⎪⎪⎩⎪⎪⎨⎧=====+∑∑==.,,1,,,1,0,,,,1,0110k j k r x x s k j s ni ji ri rj kr j r rj θθ (13)只涉及简单的加、乘运算,至于解线性方程组,这是当时已知的其他方法也不免的。
现今我们把(13)叫做正则方程组,这是后来高斯引进的称呼。
关于最小二乘法的优点,勒让德指出了以下几条。
一是通常的算术平均值是其一特例。
第二,如果观察值全部严格符合某一线性方程,则这个方程必是最小二乘法的解。
第三,如果在事后打算弃置某些观察值不用或增加了新的观察值,对正则方程的修改易于完成。
从现在的观点看,这方法只涉及解线性方程组是其最重要的优点之一(其他的重要优点包括此法在统计推断上的一些优良性质,以及其广泛的适用性)。
【文献综述】最小二乘法及其应用
文献综述信息与计算科学最小二乘法及其应用计算方法是应用数学的重要专业基础课,它讨论的是如何运用现代计算工具高效求解科学与工程中的数值计算问题。
今天,科学与实验、理论分析一起成为当今科学活动的主要方式。
在物理、化学、力学、材料科学、环境科学、信息科学和生物科学等领域,计算方法和技术已经成为被广泛接受的科学研究手段。
现在,计算在科学研究和工程设计中几乎无所不在,对科技的发展起到举足轻重的作用。
[1]最小二乘法作为计算方法中一个重要的数学方法,得到了广泛的研究与应用。
发现最小二乘法的动因是天文学和测地学中处理数据的需要。
陈希孺先生所著《数理统计学简史》中记载了这样一段历史。
在18世纪,天文学和测地学中的一些数据分析问题可以描述如下:有(m+1)个可以测量的量x0,x1,…,xm,和m个未知的参数β1,β2,…,βm。
按照某种理论,它们之间应有线性关系。
⑴但是由于实际工作中对x0,x1,…,xm的测量存在误差,而且⑴式只是理论上的近似而非严格成立。
也就是说,⑴式左边的表达式实际上不等于0,其真实值与测量有关,可视为一种误差。
若进行了n次测量,在实际问题中,n总是大于甚至是远远大于m,目的是多提供一些信息,以便对参数β1,β2,…,βm作出较精确的估计。
设在第i次测量中,x0,x1,…,xm分别取值x0i,x1i,…,xmi,则按照⑴式,应有(i=1,2,…,n)⑵若⑵式严格成立,则只要从上述n个方程中任意挑出m个就可以解出β1,β2,…,βm的值。
但⑵式并非严格成立,于是需要设计合适的算法来估计参数的值。
1750年,天文学家梅耶发表了一种方法,他在研究海上航行船只的定位问题时,得到了一个包含3个未知参数的形如⑴式的关系式以及27组观测数据。
梅耶把这27个方程分成3组,然后把每组中的9个方程相加,共得到3个方程,这样可以解出3个未知参数。
至于分组的方法,梅耶以其中一个系数为准,按各方程中此系数的大小分组:最大的9个,最小的9个和剩下的9个各成一组。
最小二乘法
最小二乘法概念阐述最小二乘法最早出现在勒让德1805年发表的论著《计算彗星轨道的新方法》附录中。
在此之前,前人多设法构造k个方程去求解,而勒让德没有因袭前人思想。
他认为:“赋予误差的平方和为极小,则意味着在这些误差间建立了一种均衡性,它阻止了极端情形所施加的过分影响。
这非常好地适用于揭示最接近真实情形的系统状态。
”该附录占据了这本80页小册子的最后9页,在前面关于卫星轨道计算的讨论中没有涉及最小二乘法,可以推测他当时感到这一方法尚不成熟。
最小二乘法主要用于解决函数模型最优解问题,是测量工作及其他科学工程领域中,应用最早也是最广泛的算法。
在生产实践中,经常会遇到利用一组观测数据来估计某些未知参数的问题。
历史发展关于最小二乘法,高斯宣称自1795年以来他一直使用这个原理。
这立刻引起了勒让德的强烈反击,他提醒说科学发现的优先权只能以出版物确定,并严斥高斯剽窃了他人的发明他们间的争执延续了多年。
因而,这两位数学家之间关于优先权的争论,在数学史上的知名度仅次于牛顿和莱布尼兹之间关于微积分发明权的争论。
现在一般认为,二人各自独立地发明了最小二乘法,尽管早在10年前,高斯就使用这个原理,但第一个用文字形式发表的是勒让德。
勒让德和高斯发现最小二乘法是从不同的角度入手的:一个是为解线性方程组,一个是寻找误差函数;一个用的是整体思维,考虑方程组的均衡性,一个用的是逆向思维,首先接受经验事实;一个是纯代数方法,一个致力于应用。
1809年,高斯发表论著《天体运动理论》。
在该书末尾,他写了一节有关“数据结合”的问题,以极其简单的手法导出误差分布——正态分布(描述偶然误差通常用正态分布,其特性:在一定观测条件下,误差的绝对值有一定的限制,或者说,超出一定限制的误差,其出现的概率为零;绝对值较小的误差比绝对值较大的误差出现的概率大;绝对值相等的正负误差出现的概率相同;偶然误差的数学期望为零),并用最小二乘法加以验证。
最小二乘法是最早提出的吗
最小二乘法是最早提出的吗
1801年,意大利天文学家朱赛普,皮亚齐发现了第一颗小行星
谷神星。
经过40天的跟踪观测后,由于谷神星运行至太阳背后,使
得皮亚齐失去了谷神星的位置。
随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。
时年24岁的高斯也计算了谷神星的轨道。
奥地利天文
学家海因里希,奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。
高斯使用的最小二乘法的方法发表于1809年他的著作《天体运
动论》中。
法国科学家勒让德于1806年独立发明“最小二乘法”,但因不
为世人所知而默默无闻。
勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。
1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,因此被称为高斯,马尔可夫定理。
计算最小二乘法
计算最小二乘法最小二乘法是一种数学方法,广泛应用于数理统计学和回归分析中。
其本质是通过最小化观测值与估计值的差距,寻找最优的参数估计。
最小二乘法最早由高斯提出,后来由勒让德进行了推广。
它的基本思想是假设观测值与理论值之间存在误差,在这些误差服从正态分布的假设下,通过优化估计参数,使得观测值与理论值之间的差距最小化。
最小二乘法的数学表达式可由以下公式表示:Y = aX + b其中,Y为观测值,X为自变量,a和b为待求参数。
通过最小化残差平方和来确定参数a和b的值。
残差即观测值与估计值之间的差异量,可以用公式表示为:Residuals = Y - (aX + b)最小二乘法的计算步骤如下:1.收集样本数据,并绘制散点图,观察数据的分布情况。
2.根据观测值的模型假设,建立数学关系表达式。
3.计算残差。
将观测值带入模型表达式,并计算观测值与估计值之间的差异量。
4.计算残差平方和。
将所有观测值的残差平方求和。
5.对参数进行优化。
最小化残差平方和,找到使得残差最小的参数值组合。
6.通过最小二乘法的公式计算估计参数的值。
对于线性模型来说,可直接计算出斜率和截距。
最小二乘法的优势在于能够通过数学方法确定最佳参数估计,从而得到最优的模型拟合效果。
并且,最小二乘法对于数据中的异常值具有一定的抗干扰能力。
最小二乘法的应用十分广泛。
在数理统计学中,最小二乘法可用来进行参数估计。
在回归分析中,最小二乘法可用来拟合线性模型。
此外,在信号处理、图像处理、经济学、物理学等领域,最小二乘法也得到了广泛应用。
需要注意的是,最小二乘法仅适用于线性模型,并且对数据分布的假设有一定要求。
在应用最小二乘法时,需要进行模型诊断,验证所假设的模型是否合理。
总而言之,最小二乘法是一种重要的数学方法,通过最小化观测值与估计值之间的差异,确定最优的参数估计。
它在统计学和回归分析中有着广泛的应用,能够提供准确的模型拟合结果,并为解决实际问题提供重要的参考依据。
最小二乘法概述
最小二乘法一、简介最小二乘法,又称最小平方法,是一种数学技术。
它通过最小误差的平方和寻找数据函数的最佳匹配。
最小二乘法是提供“观测组合”的主要工具之一,它依据对某事件的大量观测而获得“最佳”结果或“最可能”表现形式。
如已知两变量为线性关系bx a y +=,对其进行)2(>n n 次观测而获得n 对数据。
若将这n 对数据代入方程求解a ,b 之值则无确定解。
最小二乘法提供了一个求解方法,其基本思想就是寻找“最接近”这n 个观测点的直线。
最小二乘法不仅是19世纪最重要的统计方法,而且还可以称为数理统计学之灵魂。
相关回归分析、方差分析和线性模型理论等数理统计学的几大分支都以最小二乘法为理论基础。
作为其进一步发展或纠正其不足而采取的对策,不少近现代的数理统计学分支也是在最小二乘法基础上衍生出来的。
最小二乘法之于数理统计学,有如微积分之于数学,这并非夸张之辞。
统计学应用的几个分支如相关分析、回归分析、方差分析和线性模型理论等,其关键都在于最小二乘法的应用不少现代的统计学研究是在此法的基础上衍生出来,作为其进一步发展或纠正其不足之处而采取的对策,如回归分析中一系列修正最小二乘法而产生的估计方法等就是最好的例子。
二、创立思想勒让德在先驱者解线性方程组的基础上,以整体的思想方法创立了最小二乘法;高斯由寻找随机误差函数为突破,以独特的概率思想导出了正态分布,详尽地阐述了最小二乘法的理论依据。
最小二乘法(OLSE)的思想就是要使得观测点和估计点的距离平方和达到最小,在各方程的误差之间建立一种平衡,从而防止某一极端误差,对决定参数的估计值取得支配地位,有助于揭示系统的更接近真实的状态。
这里的“二乘”指的是用平方来度量观测点与估计点的远近,“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小。
三、原理设一组数据(,)i i x y (1,2,,)i n = ,现用近似曲线)(x y ϕ=拟合这组数据,“拟合得最好”的标准是所选择的()x ϕ在i x 处的函数值()i x ϕ(1,2,,)i n = 与i y (1,2,,)i n = 相差很小,即偏差(也称残差)()i i x y ϕ-(1,2,,)i n = 都很小.一种方法是使偏差之和()1ni i i x y ϕ=⎡⎤⎣⎦∑-很小来保证每个偏差都很小.但偏差有正有负,在求和的时候可能相互抵消.为了避免这种情况,还可使偏差的绝对值之和()1||ni i i x y ϕ=-∑为最小.但这个式子中有绝对值符号,不便于分析讨论.由于任何实数的平方都是正数或零,因而我们可选择使“偏差平方和21ni i i x y ϕ=-∑[()]最小”的原则来保证每个偏差的绝对值都很小,从而得到最佳拟合曲线y =()x ϕ.这种“偏差平方和最小”的原则称为最小二乘原则,而按最小二乘法原则拟合曲线的方法称为最小二乘法或称最小二乘曲线拟合法.一般而言,所求得的拟合函数可以使不同的函数类,拟合曲线()x ϕ都是由m 个线性无关函数()1x ϕ,()2x ϕ ,…, ()m x ϕ的线性组合而成,即()()()()1122m m x a x a x a x ϕϕϕϕ=+++…)1(-<n m ,其中1a ,2a ,…,m a 为待定系数.线性无关函数()1x ϕ,()2x ϕ ,…()m x ϕ,称为基函数,常用的基函数有: 多项式:1,x , 2x ,…,m x ;三角函数: sin x ,sin 2x ,…,sin mx ;指数函数:x x x m e e e λλλ,,,21 ,x λ2e,…,x λme.最小二乘法又称曲线拟合,所谓“ 拟合” ,即不要求所作的曲线完全通过所有的数据点,只要求所得的近似曲线能反映数据的基本趋势,它的实质是离散情况下的最小平方逼近.四、运用曲线拟合做最小二乘法 1 一元线性拟合已知实测到的一组数据(,)i i x y (1,2,,)i n = ,求作这组数据所成的一元线性关系式.设线性关系式为y a bx =+,求出a 和b 即可.法一:即要满足则)(令,0,0,,12=∂∂=∂∂--=∑=bsa sb a bx a y s ni i i ,则,a b 要满足s a ∂∂=0,sb∂∂=0.即 11()()ni i i n i i ii sy a bx a s y a bx x b==∂⎧--⎪⎪∂⎨∂⎪--⎪∂⎩∑∑=-2=0=-2=0化简得112111n n i i i i nn ni i i i i i i b a x y n n a x b x x y =====⎧⎪⎪⎨⎪⎪⎩∑∑∑∑∑1+=+= 从中解出1112211111n n n i i i ii i i n n i i i i n n i ii i n x y x yb n x x b a y x n n =======⎧⎪⎪⎪⎛⎫ ⎪⎨⎝⎭⎪⎪⎪⎩∑∑∑∑∑∑∑-=-=- (1) 法二:将i x ,i y 代入y a bx =+得矛盾方程组1122n y a bx y a bx y a bx n=+⎧⎪=+⎪⎨⎪⎪=+⎩ (2) 令A =12111n x x x ⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭ ,B =12n y y y ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭,则(2)式可写成b B A a ⎛=⎫⎪⎝⎭,则对应的正规方程组为TTa b A B A A ⎛=⎫ ⎪⎝⎭,所以a b ⎛⎫ ⎪⎝⎭=1()T TA A AB -,其中A 称为结构矩阵,B 称为数据矩阵,T A A 称为信息矩阵,TA B 称为常数矩阵.2 多元线性拟合设变量y 与n 个变量1x ,2x ,…,n x (1n ≥)内在联系是线性的,即有如下关系式∑=+=nj j j x a a y 10,设j x 的第i 次测量值为ij x ,对应的函数值为i y (1,2,,)i m = ,则偏差平方和为s ='220111()()mm ni i i i ij i i j y y y a a x ===-=--∑∑∑,为了使s 取最小值得正规方程组011001111011202020m n i j ij i j m n i j ij i i j m n i j ij in i j ns y a a x a s y a a x x a s y a a x x a ======⎧∂⎛⎫=---=⎪ ⎪∂⎝⎭⎪⎪∂⎛⎫=---=⎪⎪∂⎨⎝⎭⎪⎪⎪∂⎛⎫=---=⎪ ⎪∂⎝⎭⎩∑∑∑∑∑∑ (3) 即011101111n m mij j i j i i mn m mik ij ik jik i i j i i ma x a y x a x x a x y =======⎧⎛⎫+= ⎪⎪⎝⎭⎪⎨⎛⎫⎪+= ⎪⎪⎝⎭⎩∑∑∑∑∑∑∑1,2,,k n = . (4) 将实验数据(,)i i x y 代入(4)式,即得m a a a ,,,10 .3 指数函数拟合科学实验得到一组数据(,)i i x y (1,2,,)i n = 时,还可以考虑用指数函数为基函数来拟合,此时设拟合函数具有形式bxy ae =(,a b 为待定系数).对上式两端取自然对数可得:ln ln y a bx =+ (9)令Y =ln y ,0ln b a =,则(9)式可转化为一元线性函数形式0Y b bx =+,此时将指数函数拟合转化成了一元线性拟合,利用一元线性拟合中的两种方法均可求出0b 和b ,继而根据0b a e =可求出a ,从而得出因变量y 与自变量x 之间的函数关系式0b bx bx y ae e +==4 对数函数拟合科学实验得到一组数据(,)i i x y (1,2,,)i n = 时,还可以考虑用对数函数为基函数来拟合,此时设拟合函数具有形式ln y a b x =+(0)x >(,a b 为待定系数).0b >时,y 随x 增大而增大,先快后慢;0b <时,y 随x 增大而减小,先快后慢.当以y 和ln x 绘制的散点图呈直线趋势时,可考虑采用对数函数描述y 与x 之间的非线性关系,式中的b 和a 分别为斜率和截距.这时令X =ln x ,就可以利用一元线性拟合的方法来求解.更一般的对数函数还可设为y =()ln a b x k ++,式中k 为一常量.五 举例例1 使电流通过2Ω的电阻,用伏特表测量电阻两端的电压V .测得数据如下表:t I /A1 2 4 6 8 10 t V /V1.83.78.212.015.820.2试用最小二乘法建立I 与V 之间的一元经验公式(有效数字保留到小数点后第3位). 解:可取一次线性关系式V a bI =+作为I 与V 之间的一元经验公式. 将数据代入得矛盾方程组1.82 3.748.2612.0815.81020.2a b a b a b a b a b a b +=⎧⎪+=⎪⎪+=⎨+=⎪⎪+=⎪+=⎩ 令1112141618110A ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭, 1.83.78.212.015.820.2B ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭,则上述矛盾方程组可写成矩阵形式0a A B b ⎛⎫-= ⎪⎝⎭由此得出其正规方程组0T T a A A A B b ⎛⎫-= ⎪⎝⎭,将数据代入即得63161.7031221442.4a b ⎛⎫⎛⎫⎛⎫-= ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭,解之得0.212.032a b =-⎧⎨=⎩,故所求经验公式为0.2152.V I =-+. 例 2 在在开发一种抗过敏性的新药时,要对不同剂量的药效进行实验.10名患者各服用了该新药的一个特定的剂量.药物消失时立即纪录.观测值列于下表中.x 是剂量,y 是症状消除持续的日数.用7个不同的剂量, 其中3个剂量重复给两名患者.试给出y 与x 之间的一元经验公式(保留3位有效数字).1 2 3 4 5 6 7 8 9 10 ∑ /i x mg334566788959/i y d9 5 12 9 14 16 22 18 24 22 1512i x 9 9 16 25 36 36 49 64 64 81 389i i x y271548458496154144192198 1003解:可设y 与x 之间的经验公式为y a bx =+. 由上表可知,101i i x =∑59=,101i i y =∑151=,101i i i x y =∑1003=,1021i i x =∑389=,2101i i x =⎛⎫ ⎪⎝⎭∑3481= 再由(1)式可求得,1010101112101021110101003591512.7410389348110i i i ii i i i i i i x y x y b x x =====-⨯-⨯===⨯-⎛⎫- ⎪⎝⎭∑∑∑∑∑10101111 2.7415159 1.0710101010i i i i b a y x ===-=⨯-⨯=-∑∑所以y 与x 之间的经验公式为 1.07 2.74y x =-+.最小二乘法能将从实验中得出的一大堆看上去杂乱无章的数据中找出一定的规律,拟合成一条曲线来反映所给数据特点。
最小二乘法的创立及其思想方法_贾小勇
。
m
为了确定误差平方的最小值 , 勒让德运用了微 积分工具 。 即为使平方和 得如下线性方程组
m m ji m
∑E
i =1
2 i
=E 1 + E2 + … Em 在
2
22Biblioteka xi 变动时有最小值 , 则它对 xi 的偏导数必为 0。 由此
∑a
j =1 m j =1
aj0 + x1 ∑ aji a j1 +… + xi
DO I 牶 牨 牥 牣 牨 牰 牨 牭 牪 牤 j牣 cnki 牣 xdxbzr牣 牪 牥 牥 牰 牣 牥 牫 牣 牥 牬 牥 西北大学学报 ( 自然科学版 ) 2006 年 6 月 , 第 36 卷第 3 期 , Jun . , 2006, V o . l 36, N o . 3 Journal o fN o rthwe st U niversity (N a tural Science Edition)
2 2 2
2 勒让德创立最小二乘法
勒让德 ( A. M. Legendre, 1752— 1833) 是法国军 事学校的教授 , 曾任多届政府委员 , 后来成了多科工 艺学校的总监 , 直至 1833 年逝世 。 他一直保持热情 而有规律的数学研究工作 , 由于解决了许多类型的 的问题 , 其名字常存于许多定理之中 。 数学史家克 莱因 ( M. K line , 1908 — 1992 ) 认 为勒让德 之所以名 列拉格 朗日 ( J . L. Lag range, 1736— 1813 )、拉 普拉 斯、 蒙日 (G. M onge, 1746— 1818 ) 之后 , 是因为其工 作不如这三人深刻 。 尽管勒让德的工作引起许多重 要理论的产生 , 但这只是在他的研究成果被更强有 力的思想接受后才实现的 。 最小二乘法就是一个典
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
勒让德发明最小二乘法
勒让德是法国大数学家,在数学的许多领域,包括椭圆积分,数论和几何等方面,都有重大的贡献。
最小二乘法最先出现在他于1805年发表的一本题为《计算彗星轨道的新方法》著作的附录中,该附录占据了这本长80页著作的最后9页。
勒让德在这本书前面几十页关于彗星轨道计算的讨论中没有使用最小二乘法,可见在他刚开始写作时,这一方法尚未在他头脑中成形。
历史资料还表明,勒让德在参加量测过巴黎子午线长这项工作很久以后还未发现这个方法。
考虑到此书发表于1805年且该法出现在书尾的附录中,可以推测他发现这个方法当在1805年或之前不久的某个时间。
勒让德在该书72~75页描述了最小二乘法的思想、具体作法及方法的优点。
他提到:使误差平方和达到最小,在各方程的误差之间建立了一种平衡,从而防止了某一极端误差(对决定参数的估计值)取得支配地位,而这有助于揭示系统的更接近真实的状态。
的确,考察勒让德之前一些学者的做法,都是把立足点放在解出一个线性方程组上。
这种做法对于误差在各方程之间的分布的影响如何,是不清楚的。
在方法的具体操作上,勒让德指出,为实现
20111()n i i ki k i x
x x θθ=+++=∑ 最小
而对各i θ求偏导数所形成的线性方程组
⎪⎪⎩⎪⎪⎨⎧=====+∑∑==.,,1,,,1,0,,,,1,0110k j k r x x s k j s n i ji ri rj k
r j r rj θθ (13)
只涉及简单的加、乘运算,至于解线性方程组,这是当时已知的其他方法也不免的。
现今我们把(13)叫做正则方程组,这是后来高斯引进的称呼。
关于最小二乘法的优点,勒让德指出了以下几条。
一是通常的算术平均值是其一特例。
第二,如果观察值全部严格符合某一线性方程,则这个方程必是最小二乘法的解。
第三,如果在事后打算弃置某些观察值不用或增加了新的观察值,对正则方程的修改易于完成。
从现在的观点看,这方法只涉及解线性方程组是其最重要的优点之一(其他的重要优点包括此法在统计推断上的一些优良性质,以及其广泛的适用性)。
近年发展起来的,从最小二乘法衍生出的其它一些方法,尽管在理论上有其优点,可是由于计算上的困难而影响了其应用。
最小二乘法在19世纪初发明后,很快得到欧洲一些国家的天文和测地学工作者的广泛使用。
据不完全统计,自1805年至1864年的60年期间,有关这一方法的研究论文约250篇,一些百科全书,包括1837年出版的不列颠百科全书第7版,都收进了有关这个方法的介绍。
在研究论文中,有一些是关于最小二乘估计的计算,这涉及解线性方程组。
高斯也注
意了这个问题,给出了正则方程的命名并发展了解方程的消去法。
但是,在电子计算机出现以前,当参数个数(即(13)式中的k)较大时,计算任务很繁重。
1858年,英国为绘制本国地图作了一次大型的survey,其数据处理用最小二乘法涉及模型(13)中k=920,n=1554。
用两组人员独立计算,花了两年半的时间才完成。
1958年我国某研究所计算一个炼钢方面的课题,涉及用最小二乘法解13个自变量的线性回归,30余人用电动计算机算,夜以继日花了一个多月的时间。
勒让德的工作没有涉及最小二乘法的误差分析问题。
这一点由高斯在1809年发表的正态误差理论加以补足,详细介绍见后面故事(高斯的正态误差理论)。
高斯的这个理论对于最小二乘法之用于数理统计有极重要意义。
这一点在20世纪哥色特、费歇尔等人发展了正态小样本理论后,尤其看得明显。
正因为高斯这一重大贡献,以及他声称自1799年以来一直使用这个方法,所以人们多把这一方法的发明优先权归之于高斯。
当时在这两位大数学家之间曾为此发生优先权之争,其知名度仅次于牛顿和莱布尼兹之间关于微积分发明的优先权之争。
近年来还有学者根据有关的文献研究这个问题,也作不出判然的结论。
这个公案大概也只能以“两人同时独立做出”来了结。
但无论如何,第一个在书面上发表的是勒让德,他有理由占先一些。
我们已指出,最小二乘法是针对适合形如
1
1
=
+
+
+
k
k
x
x
xθ
θ 的线性关系的观
测数据而作出的,现在统计学上把这叫做线性(统计)模型——当然,其含义比最初所赋予它的要广得多。
最小二乘法在数理统计学中的显赫地位,大部分来自它与这个模型的联系。
另一个原因是它有简单的线性表达式。
这不仅使它易于计算,更重要的是,在正态误差的假定下,它有较完善的小样本理论,使基于它的统计推断易于操作且有关的概率计算不难进行。
其他的方法虽也可能具有某种优点,但由于缺乏最小二乘法所具备的上述特性,故仍不可能取代最小二乘法的位置,这就是此法得以长盛不衰的原因。