一维谐振子定态 Schrödinger 方程的数值解法

前几天整理电脑的时候发现了本科上量子力学讨论班时做的一个 Slide,觉得挺有意思的。花了点时间整理成这篇博客。

一维谐振子

一个质量为 mm 的粒子,在一维势场 V(x)=12mω2x2V(x) = \dfrac12m\omega^2x^2 中运动。其哈密顿算符为

H^=p^22m+12mω2x^2\hat H = \frac{\hat p^2}{2m} + \frac12m\omega^2\hat x^2

其中 x^\hat x 为位置算符,p^=iddx\hat p = -i\hbar\dfrac{\mathrm d}{\mathrm dx} 为动量算符。我们需要求解该体系的定态 Schrödinger 方程:

H^ψ>=Eψ>\hat H\left|\psi\right> = E\left|\psi\right>

一维谐振子是除了氢原子之外,为数不多的可以解析求解的体系。那么我们为什么要费劲求它的数值解呢?正因为绝大多数的量子体系都无法解析求解,数值方法才显得尤为重要。

有限差分法

回忆一下泰勒公式

f(a+h)=f(a)+f(a)1!h+f(a)2!h2+o(h3)f(a+h) = f(a) + \frac{f'(a)}{1!}h+\frac{f''(a)}{2!}h^2+o(h^3)

h=hh=-h,有

f(ah)=f(a)f(a)1!h+f(a)2!h2+o(h3)f(a-h) = f(a) - \frac{f'(a)}{1!}h+\frac{f''(a)}{2!}h^2+o(h^3)

两式相加,可得

f(a)=f(ah)+f(a+h)2f(a)h2+o(h3)f(ah)+f(a+h)2f(a)h2\begin{aligned} f''(a) &= \frac{f(a-h)+f(a+h)-2f(a)}{h^2} + o(h^3)\\ &\approx \frac{f(a-h)+f(a+h)-2f(a)}{h^2} \end{aligned}

ψ(x)\psi(x)x[r,r]x\in[-r, r] 区间离散化为

ϕiψ(xi)=ψ(iΔxr),i=0,1,2,,N\phi_i \equiv \psi(x_i) = \psi(i\Delta x - r),\quad i=0, 1, 2, \cdots, N

其中 N=2r/ΔxN=2r/\Delta x,则 Schrödinger 方程差分化为

22mϕi1+ϕi+12ϕiΔx2+12mω2xi2ϕi=Eϕi-\frac{\hbar^2}{2m}\frac{\phi_{i-1}+\phi_{i+1}-2\phi_i}{\Delta x^2}+\frac12m\omega^2x_i^2\phi_i = E\phi_i

在这里,我们假设 x<rx<-rx>rx>rψ(x)0\psi(x)\to 0。这对能量较低的态是成立的。

将差分方程写成矩阵的形式为

[mω2x022+2mΔx222mΔx20022mΔx2mω2x122+2mΔx222mΔx20022mΔx2mω2x222+2mΔx20000mω2xN22+2mΔx2][ϕ0ϕ1ϕ2ϕN]=E[ϕ0ϕ1ϕ2ϕN]\left[ \begin{matrix} \frac{m\omega^2x_0^2}2+\frac{\hbar^2}{m\Delta x^2} & -\frac{\hbar^2}{2m\Delta x^2} & 0 & \cdots & 0\\ -\frac{\hbar^2}{2m\Delta x^2} & \frac{m\omega^2x_1^2}2+\frac{\hbar^2}{m\Delta x^2} & -\frac{\hbar^2}{2m\Delta x^2} & \cdots & 0\\ 0 & -\frac{\hbar^2}{2m\Delta x^2} & \frac{m\omega^2x_2^2}2+\frac{\hbar^2}{m\Delta x^2} & \cdots & 0\\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \frac{m\omega^2x_N^2}2+\frac{\hbar^2}{m\Delta x^2} \end{matrix} \right] \left[ \begin{matrix} \phi_0\\ \phi_1\\ \phi_2\\ \vdots\\ \phi_N \end{matrix} \right]= E \left[ \begin{matrix} \phi_0\\ \phi_1\\ \phi_2\\ \vdots\\ \phi_N \end{matrix} \right]

这样一来,问题就转化为求差分矩阵的特征值和特征向量。

QR 算法

QR 算法是一种常见的特征值算法。它利用了矩阵的 QR 分解,即将矩阵 AA 分解为一个正交矩阵 QQ 和一个上三角矩阵 RR 的乘积:

A=QRA=QR

为什么可以这么分解呢?我们回忆一下 Gram-Schmidt 正交化,将矩阵 AA 的列向量看作一组基,则可以通过一系列初等列变换获得一组标准正交基。反过来看,对这组标准正交基所组成的矩阵 QQ 作初等列变换也可以得到矩阵 AA。我们知道,对矩阵作初等列变换相当于右乘初等矩阵,且由于 Gram-Schmidt 正交化不涉及列交换,这里用到的初等矩阵均为上三角矩阵。因此,矩阵 AA 可以由正交矩阵 QQ 右乘一个上三角矩阵 RR 得到。在实际应用中,除了 Gram-Schmidt 正交化,还可以用 Householder 变换Givens 旋转 等方法实现 QR 分解。

那么如何利用 QR 分解求解矩阵的特征值呢?

A0:=AA_0:=A,对 k=0,1,2,k=0, 1, 2, \cdots

Ak=QkRkAk+1:=RkQk\begin{aligned} A_k &= Q_kR_k\\ A_{k+1} &:= R_kQ_k \end{aligned}

即在每一步,对 AkA_k 进行 QR 分解,再由分解后得到对 QkQ_kRkR_k 计算 Ak+1A_{k+1},如此迭代。

注意到 QkQ_k 是正交矩阵,有 Qk1=QkQ_k^{-1}=Q_k^\top,故

Ak+1=RkQk=Qk1QkRkQk=Qk1AkQk=QkAkQk\begin{aligned} A_{k+1} &= R_kQ_k\\ &= Q_k^{-1}Q_kR_kQ_k\\ &= Q_k^{-1}A_kQ_k\\ &= Q_k^\top A_kQ_k \end{aligned}

也就是说,Ak+1A_{k+1} 相似于 AkA_k。根据递推关系,A0,A1,,Ak,A_0, A_1, \cdots, A_k, \cdots 全都是相似的,这意味着所有的 AkA_k 都有相同的特征值。在一定条件下,AkA_k 会收敛为一个三角矩阵,特征值为其主对角元。

特别地,如果 AA 是一个实对称正定矩阵(我们所要求解的差分矩阵刚好是这种情况),AkA_k 将会收敛为一个对角矩阵 Λ=diag{λ0,λ1,,λN}\Lambda=diag\{\lambda_0,\lambda_1,\cdots,\lambda_N\},且 [λ0,λ1,,λN][\lambda_0,\lambda_1,\cdots,\lambda_N] 依次递减。考虑到

A=A0=Q0A1Q0=(Q0Q1Qk1)Ak(Qk1Q1Q0)=(Q0Q1Qk1)Ak(Q0Q1Qk1)=SkAkSk\begin{aligned} A=A_0 &= Q_0A_1Q_0^\top\\ &=(Q_0Q_1\cdots Q_{k-1})A_k(Q_{k-1}^\top\cdots Q_1^\top Q_0^\top)\\ &=(Q_0Q_1\cdots Q_{k-1})A_k(Q_0Q_1\cdots Q_{k-1})^\top\\ &=S_kA_kS_k^\top \end{aligned}

AkA_k 收敛时,SkS_k 的列向量即为属于相应特征值的特征向量。

综上,对于实对称正定矩阵 AA,我们令 A0=A,S0=IA_0=A, S_0=I,对 k=0,1,2,k=0, 1, 2, \cdots

Ak=QkRkAk+1:=RkQkSk+1:=SkQk\begin{aligned} A_k &= Q_kR_k\\ A_{k+1} &:= R_kQ_k\\ S_{k+1} &:= S_kQ_k \end{aligned}

AkA_k 收敛时,就同时求得 AA 的特征值和特征向量。

Code

当年的我是一个彻头彻尾的门外汉,连调包都不会,QR 分解是用 C++ 手写的。然而那份如此有纪念意义的代码竟然被我弄丢了,真是痛惜不已。

如今的我已经误打误撞地成为了一名算法调包工程师,知道可以直接调用 numpy.linalg.qr 作 QR 分解,可是却再也……再也想不出如何在这里编一段煽情的文字。

少废话,先看东西。

首先是 QR 算法:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
import numpy as np

def qr_eig(A, iters=200, tol=1e-6):
"""
使用 QR 算法求解实对称矩阵的特征值和特征向量

Parameters
----------
A : Array-like
二维数组,表示待求解的实对称矩阵
iters : int
最大迭代次数
tol : float
提前退出循环的判断标准

Returns
-------
(numpy.ndarray, numpy.ndarray)
一维数组表示的特征值,二维数组表示的特征向量
"""
A = np.asarray(A)
S = np.eye(A.shape[0])
for _ in range(iters):
Q, R = np.linalg.qr(A)
newA = np.dot(R, Q)
newS = np.dot(S, Q)
if np.abs(max(np.diag(newA)) - max(np.diag(A))) < tol:
break
A = newA
S = newS
return np.diag(A), S

接下来就可以求解一维谐振子了。为了方便起见,我们令 =m=ω=1\hbar=m=\omega=1

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
# 取 [-5, 5] 的区间,离散化为 N 个点
N = 101
r = 5
dx = 2 * r / (N - 1)
x = np.linspace(-r, r, N, endpoint=True)

# 初始化差分矩阵
A = np.diag(0.5*x**2 + 1/dx**2)
for i in range(N -1 ):
A[i][i+1] = -0.5/dx**2
A[i+1][i] = -0.5/dx**2

# 求解差分矩阵的特征值和特征向量
Lambda, S = qr_eig(A)

# 结果展示
# 打印最低的 5 个能级
print(Lambda[-1:-8:-1])
# 画出能量最低的三个态的波函数
plt.plot(x, S[:,-1], label=f'n=0, E={Lambda[-1]:.4f}')
plt.plot(x, S[:,-2], label=f'n=1, E={Lambda[-2]:.4f}')
plt.plot(x, S[:,-3], label=f'n=2, E={Lambda[-3]:.4f}')
plt.xlabel('x')
plt.ylabel('psi(x)')
plt.legend()
1
>>> [0.4996873  1.49843574 2.49593067 3.49217016 4.48715598]

与解析解的对比

一维谐振子的本征能量为:

En=(n+12)ω,n=0,1,2,E_n = \left(n+\frac12\right)\hbar\omega,\qquad n=0, 1, 2,\cdots

对应的本征态为:

ψn(x)=12nn!(mωπ)1/4emωx2/2Hn(mωx)\psi_n(x) = \frac{1}{\sqrt{2^n n!}}\cdot\left(\frac{m\omega}{\pi\hbar}\right)^{1/4}\cdot\mathrm{e}^{-m\omega x^2/2\hbar}\cdot H_n\left(\sqrt{\frac{m\omega}{\hbar}}x\right)

其中

Hn(z)=()nez2dndzn(ez2)H_n(z) = (-)^n\mathrm{e}^{z^2}\frac{\mathrm d^n}{\mathrm dz^n}\left(\mathrm{e}^{-z^2}\right)

为 Hermite 多项式。前三个 Hermite 多项式为:

H0(z)=1H1(z)=2zH2(z)=4z22\begin{aligned} H_0(z) &= 1\\ H_1(z) &= 2z\\ H_2(z) &= 4z^2 - 2 \end{aligned}

我们同样令 =m=ω=1\hbar=m=\omega=1,则

E0=12,ψ0(x)=1π1/4ex2/2E1=32,ψ1(x)=121π1/4ex2/22xE2=52,ψ2(x)=121π1/4ex2/2(2x21)\begin{aligned} E_0&=\frac12, \qquad \psi_0(x) = \frac{1}{\pi^{1/4}}\cdot\mathrm{e}^{-x^2/2}\\ E_1&=\frac32, \qquad \psi_1(x) = \frac{1}{\sqrt 2}\cdot \frac{1}{\pi^{1/4}}\cdot\mathrm{e}^{-x^2/2}\cdot 2x\\ E_2&=\frac52, \qquad \psi_2(x) = \frac{1}{\sqrt 2}\cdot \frac{1}{\pi^{1/4}}\cdot\mathrm{e}^{-x^2/2}\cdot (2x^2-1) \end{aligned}

画出来看看

八九不离十吧。低能级的误差主要来自截断误差和舍入误差。此外,高能级需要有更大的 rr 来保证 x<rx<-rx>rx>rψ(x)0\psi(x)\to 0 的假设,因此能级越高,误差越大。

参考文献

  1. Quantum harmonic oscillator - Wikipedia
  2. Finite difference method - Wikipedia
  3. QR algorithm - Wikipedia
  4. Notes on orthogonal bases and the workings of the QR algorithm
  5. QR decomposition - Wikipedia
  6. Gram–Schmidt process - Wikipedia