第一性原理--密度泛函--交换相关能
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一性原理:
第一说法,第一性原理来源于“第一推动力”这个宗教词汇。
第一推动力是牛顿创立的,因为牛顿第一定律说明了物质在不受外力的作用下保持静止或匀速直线运动。
如果宇宙诞生之初万事万物应该是静止的,后来却都在运动,是怎么动起来的呢?牛顿相信这是由于上帝推了一把,并且牛顿晚年致力于神学研究。
现代科学认为宇宙起源于大爆炸,那么大爆炸也是有原因的吧。
所有这些说不清的东西,都归结为宇宙“第一推动力”问题。
科学不相信上帝,我们不清楚“第一推动力”问题只是因为我们科学知识不完善。
第一推动一定由某种原理决定。
这个可以成为“第一原理”。
爱因斯坦晚年致力与“大统一场理论”研究,也是希望找到统概一切物理定律的“第一原理”,可惜,这是当时科学水平所不能及的。
现在也远没有答案。
现在提及的第一性原理有两种说法,一种是基于量子力学,求解指薛定谔方程说法。
其源头可追溯于20世纪初量子力学的诞生。
量子力学的理论框架是由下列五个假设构成的:
1.微观体系的运动状态由相应的归一化波函数描述;
2.微观体系的运动状态波函数随时间变化的规律遵从薛定谔方程的解;
3.任何可测量力学量由相应的线性厄米算符表示;
4.力学量算符之间存在对易关系,称为量子条件;坐标算符的三个直角坐标系分量与动量算符的三个直角坐标系分量之间的对应关系称为基本量子条件;力学量算符由其相应的量子条件确定;
5.全同的多粒子体系的波函数对于任意一对粒子交换而言具有对称性:玻色子的波函数具有交换对称性,费米子的波函数具有交换反对称性。
量子力学建立以后,同样按照统计物理原理,位置的微观状态确定了,体系的宏观性质都确定了。
和经典物理的差别在于,体系的微观状态如何表述呢?经典物理中,体系微观状态用粒子的位置和动量就能表述,然而量子力学的框架里表述方式变了。
因为量子力学中,粒子的位置和动量不能同时测准。
怎么办呢?用波函数表示,波函数的平方代表粒子出现的几率,这就是波函数的统计诠释,是波恩做出的。
那么波函数如何获得呢?这要通过求解体系的薛定谔方程。
然而,薛定谔方程的求解极其困难,除了氢原子等少数体系之外,都难以求得解析解。
此后,为了应用量子力学原理,Hartree和Fock提出了自洽场方法,也就是SCF方法,即Self Consistant Field,这里的场其实是一个平均场,也就是把粒子所在的势场用一个平均势场替代,这里面包含一个单电子近似。
自洽场方法是啥?这不属于科普了,有兴趣的话看看谢希德的固体能带理论。
一般,把基于Hartree-Fock自洽场的方法叫做第一性原理方法,这是第一性原理方法这个称号的第一个来源,也叫从头算方法。
为啥叫从头算方法呢?因为,根据量子力学原理发展起来的这种方法只需要七个物理常数-光速,普朗克常数,原子精细结构常数,电子质量,电子电量,原子核质量,原子核电量,即可算出材料在基态下的几乎一切性质,因为不依赖与实验,所以叫从头算方法。
另一种第一性原理的称号是来源于Kohn-Sham方法。
因为波函数的平方等价于电子出现的概率,那么用电子的概率密度作为变量就带来了很大的方便。
因为,用波函数作为变量,对于一个N粒子体系,变量为3N个,因为每个粒子有xyz坐标,3个自由度,N个粒子变量就有3N个了,N一般是阿伏伽德罗常数量级。
难以求解!
然而,若采取电子密度作为变量,只要指出空间各处电子的密度即可,这实际上是3变量的,即ρ(x,y,z),ρ为电子密度。
用电子密度做变量行吗?把一个3N维的变量用3维的变量替代会不会丢失信息呢?霍亨伯格和柯洪证明了两个定理,是基于密度泛函的第一性
原理中著名的霍亨伯格-柯洪定理。
有兴趣的去网站查查怎么证明的。
定理大意如下:一是非简并基态波函数是电子密度的唯一函数;二是电子密度确定了体系基态性质就唯一确定了。
此后,柯洪和沈吕九(中国人)发展了这种方法,相关理论叫做密度泛函理论,柯洪为此获得诺贝尔化学奖。
注意:物理学家获诺贝尔化学奖,貌似另一个我知道的化学奖的物理学家是卢瑟福,20世纪最伟大的实验物理学家。
综上,第一性原理是对基于密度泛函理论的从头算方法的称谓,或者是对基于Hartree -Fock 自洽场的从头算方法的称谓。
密度泛函理论
简短而言,密度指电子数密度;泛函是说能量是电子密度的函数,而电子密度又是空间坐标的函数;函数的函数,是为泛函(Functional )。
密度泛函理论是一种通过电子密度研究多电子体系电子结构的方法。
具体到操作中,密度泛函理论通过各种各样的近似,把难以解决的包含电子-电子相互作用的问题简化成无相互作用的问题,再将所有误差单独放进一项中(XC Potential ),之后再对这个误差进行分析。
具体而言:
量子力学中波函数的概念很诱人:“简洁”如(),p t ψ的波函数中,包含了一个系统在某一个态下所有的信息。
()
(),ˆ,p t i H p t t ψψ∂=∂,其中i /2h π=,h 普朗克常量。
若ˆH
与时间无关(这也是我们常讨论的),定态Schrödinger (薛定谔方程)()()ˆ,,H r R E r R ψψ=。
这个为我们对任意体系的模拟提供了原理上的可能。
然而在理想和现实之间是计算能力的鸿沟。
➢ 要准确描述一个体系,就必须通过求解薛定谔方程来得到波函数ψ
➢ 薛定谔方程能够准确的求解出仅含一个电子的H 原子的波函数以及H 的基态能量。
➢ 但是,如果要处理多电子的复杂体系时,求解薛定谔方程就显得尤为复杂!
原子核质量远大于电子质量,一般要大3-4个数量级,因而在同样的相互作用下,根据动量守恒,原子核运动比电子运动慢得多。
因此,通常在研究某一瞬间电子结构时可以忽略原子核的速度,假定它和原子核长期固定在某位置时的电子结构一样。
1927年波恩和奥本海默提出电子的运动问题可以以原子核坐标为参考系(近似认为原子核几乎静止),这被称为波恩-奥本海默绝热近似(Born -Oppenheimer approximation ),这就是BO 近似。
()()()()ˆH
R r E R r ψψ= 其核心思想是:
把核的运动和电子的运动分开处理;
处理电子运动时,认为核是固定不动的;
处理核运动时,认为快速运动的电子建立一个平均化了的负电荷分布,核在电子的负电荷平均场中运动
1930年,哈特里和他的学生福克认为:具有周期性结构的晶体中不同晶胞同一位置上的原子同一能态的电子波函数仅有相位上的差别,而这种相位差别在多体问题中可以忽略,这样某能态电子多体问题原薛定谔方程的解可以简化为单电子波函数的乘积,这被称为哈特里-福克自洽场近似(Hatree-Fock self consistant field method),HF理论
HF理论采用单行列式多体波函数,它假定一个电子在由原子核和其它电子形成的平均势场中独立运动,没有考虑电子间的瞬时相关作用,也就是电子关联。
但是,HF理论中采用的Slater行列式波函数满足Pauli不相容原理,所以它在一定程度上包含了同自旋电子的关联作用,这部分电子关联被单独命名为交换相互作用。
所以,通常所说电子关联能是指精确的基态能量与HF能量之差。
关联能一般只占体系电子总能量的0.3~2%,但是它可以与化学反应的反应热或者活化能相当甚至更大。
一般说来,化学反应途径上电子关联程度不同。
所以,在考虑化学反应和电子激发等问题时电子关联十分重要。
由电子瞬时作用产生的电子关联称为动态关联。
此外,还有非动态关联,它指体系几个对称性相同的电子组态函数(单行列式)接近简并时导致HF方法给出很大的误差。
常用的电子关联计算方法有:
组态相互作用(CI):Configuration Interaction
耦合簇方法(CC):Coupled‐cluster method
多体微扰理论(MPx):Moller‐Plesset perturbation theory
1927年,Thomas和Fermi提出了建立在均匀电子气模型上的ThomasFermi模型。
在均匀电子气模型中,电子不受任何外力,彼此没有相互作用。
此时,描述电子运动的薛定谔方程就被简化为波动方程。
Thomas-Fermi模型是一个很粗糙的模型,它是以均匀电子气的密度得到动能的表达式,同时忽略了电子间的交换相关作用,直接使用比较困难。
Thomas-Fermi模型存在的问题:虽然提出了可以密度为处理变量简化薛定谔方程,但是基于均匀电子气,这样子是不合理的。
1964年,Hohenberg和Kohn以这个模型为基础(HK理论),同时打破其能量泛函形式的束缚,创立了严格的密度泛函理论。
于是,现代密度泛函理论解开序幕:
HK第一定理证明了体系的基态能量只与电荷密度有关,是电荷密度的泛函。
HK-I使得我们描述系统所需的自由度从3N减少到3
HK第二定理证明了以基态密度为变量,将体系能量最小化之后就得到了基态能量。
HK-I可以看作的变分原理,并且可以通过薛定谔方程的变分原理导出。
HK 虽然许诺了一个美好的前景,但关于[]E ρ长什么样没有说。
科恩和他的学生沈吕九在1965年前后指出:材料中的能量分为原子核动能、原子核间相互作用能、电子动能、电子间相互作用能、电子-原子核相互作用能这五个部分,在此基础上逐一分析并吸纳上述近似,写下著名的科恩-沈吕九方程KS (Kohn -Sham equation )。
此方程中体系的哈密顿算子仅包含原子周期性势函数、电子动能算符和由于上述近似带来的偏差——相互交换能与相互关联能(exchange & correlation energy )。
这是第一性原理发展史上重要的一步,为后来所有的第一性原理分析提供了解决问题的框架,被认为是标志着第一性原理的诞生。
科恩也因此获得了1998年诺贝尔化学奖(主要是因为此理论在计算化学依然有巨大的用武之地并且科恩本人在化学领域的贡献)。
为了得到它的具体形式,一般作如下分解:
[][][][]ee ext E T V V ρρρρ=++
分别对应:1、[]T ρ电子动能,2、[]ee V ρ电子-电子(ee )相互作用能和 3、[]ext V ρ电
子在外场(ext )中的能量。
现在分别讨论每一项: 一、[]T ρ电子动能:
为什么对动能的描述如此重要?因为动能和总能量是一个数量级的。
所以动能有一点小的相对误差,对体系总能量估计的偏误就不可容忍了。
精确的电子动能的形式我们是知道的,也即波函数那套理论: ˆ
[]T T
ρψψ= 但这并没什么用。
因为这不是ρ的泛函而是ψ的泛函。
而前面说了,一旦牵扯到波函数ψ,DFT 在“自由度少”这一点上的优势就不太能体现出来了。
为了把动能写成ρ的泛函,很多人做了尝试,我说一下比较主流的发展过程:
1,Thomas -Fermi (TF ) model:
均匀电子气出发可以导出
你可以想象这泛函算起来很快(因为形式简单到爆炸),但很不幸的是实际体系并不能看作均匀电子气,尤其是有限体系(如分子或cluster ),所以对它们的描述并不好。
用它来计算分子甚至不能成键。
2,Thomas -Fermi -Dirac (TFD ) model:
和TF 几乎相同,只是增加了交换项(电子是全同费米子):要是我,我肯定赌TFD 比TF 更好,原因很简单——它包含了更多的物理。
最早写下这个model 的人绝壁也是这么想的。
可惜打脸的是,分子体系计算得到的结果TFD 更差。
这类情况的原因一般都是:新加入的(有更多物理意义的)项破坏了原来模型的“误差抵消”作用,所以更差了。
3,Thomas -Fermi -Dirac -Weizsacker (TFDW ) model:
你应该已经看出规律了:每次加个人名,泛函里就多一项,所以:TFDW 相比前两个更复杂了——不仅有密度本身,还有密度的梯度(()r ρ∇),因此相比于TFD ,它更能描述实际系统中电子密度的非均匀性。
λ是常数,理论上可证明为1/9,但数值结果发现1/5效果最好(理由:误差抵消。
)。
这是某种“Taylor 展开”得到的。
这里新加入的是这个expansion 的二阶项(TF 是零阶)。
可以证明,所有奇数阶都为零,所以下一个非零贡献是四阶,之后是六阶,etc.
按理说有多阶方程该话题本应完结(只要一直计算到更高阶的项,总可以达到理想的准确度)。
但事实是残酷的:一方面,从四阶开始公式变得很复杂,而且对能量的修正非常小。
另一方面,也是更加让人绝望的是,从六阶开始,后面的项对分子体系都是发散的!
说出来你可能不信,TFDW model 是上世纪30年代人们就得到了的。
彼时量子力学建立还只有十多年,离HK 的文章发出来还有三十来年。
可见人们对“用电子密度来描述体系”的信念是多么早就有了的。
归根结底,上面的方法在早期没有应用,就是这些动能泛函都不够好。
在DFT 的发展中,对动能泛函的寻找一直是个大问题。
Kohn -Sham 定理( KS ):
Kohn 和Sham 提出另一种思路:实际体系动能的主要部分可以用无相互作用体系的动能来描述。
其中动能的误差部分和相互作用能与库伦作用能之差归入交换相关泛函。
若交换相关泛函严格精确,则无相互作用体系的基态密度将严格地等价于真实体系的基态密度,也将得到精确的基态能量。
事实上,寻找越来越精确和普适的交换相关泛函代表了现代密度泛函方法发展的主线。
动能项
对于动能项,我们忽略电子间相互作用,认为电子存在于一个个单电子轨道中,那么动能项可以写为:
()()()()23212N
s i i
i T n T n d r r r m φφ*
=≈=-∇∑⎰ 其中()i r φ是第i 个单电子轨道,()s T n 则是所有这些无相互作用的单电子轨道的动能的和。
外势能项
根据波恩-奥本海默近似,不难得出外势能的表达形式:
()()()V n V r n r dr =⎰
相互作用项
对于电子-电子相互作用,我们可以使用托马斯-费米模型来得出一个很符合直觉的近似(注:托马斯-费米模型的提出并不是直觉的)
不难看出,()
U n的形式非常接近经典的库伦相互作用表达式。
H
以上三项相加,得到能量近似值
我们将其误差称为交换-关联能(exchange-correlation energy)
体系的准确的总能量为
以上即是密度泛函理论的框架。
交换-关联泛函
DFT的核心思想其实很简单:通过近似得出一个容易计算但是不准确的结果,并将所有误差单独收进一项中留待分析。
下面介绍一下用于计算交换-关联能量的各种近似方法。
1. 局域密度近似(Local Density Approximation, LDA)
LDA是最简明的交换-关联泛函,并且提出得很早——几乎是和DFT一起提出的。
注意,LDA 本身不是一个泛函的名称,而是一种近似方法;LDA包含很多泛函。
LDA的思想从其名称就可以看出来:我们可以近似认为空间各点处的
E只和该点的(局域)电子密度有关。
那么,
xc
LDA的通用表达式可以写作
我们可以把
E的交换部分(X项)和关联部分(C项)分开讨论。
xc
1)对于局域密度近似的交换部分,通常使用同质/均匀电子云近似(Homogeneous/Uniform Electron Gas, HEG/UEG),即:一个原子/分子在空间某点处的交换能,与在该点具有同样电子密度的均匀电子云相同。
UEG的交换能可以由狄拉克泛函给出:
2)对于关联部分,高密度和低密度的UEG有不同的近似。
高密度条件下,空间某点处的关联能可以写为
其中s r 是魏格纳-塞兹半径(Wigner -Seitz radius ),;0s a r 则是在UEG 中包含电荷数为1e 的一个球体的半径。
式中的A ≈0.0311,C ≈-0.048。
低密度条件下,空间某点处关联能可以写为
除了UEG 之外,表现比较好的泛函还有Carpley-Alder (CA ),Vosko-Wilk-Nusair (VWN ),Perdew-Zunger (PZ ),Perdew-Wang (PW )等等。
LDA 提出得很早,在材料学研究中使用的很广泛了。
总得来说,LDA 是比较准确的,一般能对结构和弹性性质给出不错的估计;但是有以下几个缺点:高估结合能、低估反应活化能、过分倾向于高自旋结构、错估相稳定性等等。
实际上,LDA 倾向于低估交换能x E 而高估关联能c E ;然而这两项的误差一定程度上地互相抵消了。
这可能是LDA 对一些性质能给出正确估计的原因。
2. 广义梯度近似(Generalized Gradient Approximation, GGA )
总的来说,LDA 在电子密度改变较快的体系中表现不佳,那么比较容易想到的改进方法就是将()n r 的一阶梯度包含进来。
这样我们就得到了广义梯度近似,GGA 。
GGA 的通用表达式可以写成
绝大多数GGA 泛函是基于一些LDA 泛函的修正,其引入的一阶梯度可以被解释成电子云演化的“速度”(或者更直觉地说,电子的移动速度)。
比较成功的GGA 泛函包括Becke, Lee-Yang-Parr (BLYP ), Perdew-Berke-Ernzerhof (PBE ); Hamperecht-Tozer-Cohen-Handy (HTCH ) 等等。
相比于LDA ,GGA 有以下几个优点:更准确的原子和分子能量、纠正了overbinding 、更准确的反应活化能(不过通常还是过低)。
然而GGA 并不总是优于LDA 。
GGA 泛函通常会给出偏低的键能以及偏高的晶格参数。
3. 含动能密度的广义梯度近似(meta-GGA )
如果我们对GGA 再使用一次之前的方法——将二阶梯度(Laplacian )包含在近似中,我们就得到了meta-GGA 。
类似地,meta-GGA 的通用表达式可以写作:
其中的拉普拉斯2n ∇可以被认为是电子云演化所产生的动能。
实际上,在具体的meta -GGA
泛函中,通常不使用拉普拉斯,而直接使用动能项
那么meta -GGA 的通式实际上可以写作
4. 杂化泛函 (Hybrid Functionals )
我个人觉得,杂化泛函是DFT中最tricky的一部分(笑)。
杂化泛函的思路是这样的:既然有的泛函会高估能量、有的泛函会低估能量,那么我们把两种泛函结合在一起,不久能得出准确的能量了吗?虽然这个方法听起来比较随意,不过其给出的结果往往非常准确。
在具体操作中,通常将一小部分Hartree-Fock能量包含进去
那么,杂化泛函的通用表达式可以写作
杂化泛函的研究最近几年非常热,每年都有很多种新的泛函被提出来。
下面仅举一个使用最广泛的Becke's 3 parameters & Lee-Yang-Parr(B3LYP)为例
其中a=0.20,b=0.72,c=0.81。
后来,Handy和Cohen又在B3LYP的基础上改进,得到了O3LYP
其中a=0.1161, b=0.9261, c=0.8133。
交换-关联泛函的表现对比
有一张著名的雅各布天梯图(Jacob's Ladder)解释了各近似方法之间的关系(注1):
天梯从下往上复杂度递增、表现也递增。
下表中是某一体系中各种泛函得出的结果对比(注2)
不难看出,各阶泛函的表现总体来说是符合天梯图的。
尽管有些问题中,低阶泛函可以得出比部分高阶泛函更好的表现;但是只要根据问题选择合适的高阶泛函,雅各布天梯还是成立的。