偏微分方程(Partial Differential Equation,简称 PDE)是描述多元函数及其偏导数之间关系的方程。与常微分方程(ODE)不同,PDE 的未知函数依赖于两个或更多独立变量,因此其解是一个函数场而非单一曲线。PDE 是数学物理、工程科学、金融数学等领域最核心的工具之一,几乎所有连续介质的物理规律都可以用 PDE 来描述。
自然界和工程中的绝大多数现象都无法仅用常微分方程描述。温度在空间中的分布、流体的运动、电磁波的传播、量子粒子的行为——这些过程都涉及多个自变量(时间 + 一个或多个空间维度),其数学模型自然导出偏微分方程。
PDE 理论的核心目标是:给定一个方程和适当的定解条件,解是否存在、是否唯一、以及解对数据的依赖是否连续。这三个问题构成了 PDE 理论的适定性 (well-posedness)框架,由法国数学家 Hadamard 在 20 世纪初奠定,至今仍是 PDE 研究的基石。适定问题的三个条件是:解存在、解唯一、解连续依赖于数据(稳定性)。如果任一条件不满足,问题被称为不适定(ill-posed)。逆问题——如从最终温度反推初始温度——通常是不适定的,需要引入正则化方法(如 Tikhonov 正则化)来获得有意义的近似解。
PDE 理论的发展历经数百年。18 世纪,d'Alembert 导出了弦振动方程并给出了通解公式;19 世纪,Fourier 用级数方法求解热传导方程,Laplace 和 Poisson 研究了势理论;20 世纪,Sobolev 建立了函数空间理论,Schwartz 创立了分布论,为 PDE 的弱解理论奠定了严格的数学基础。
PDE 的阶数 定义为方程中出现的最高阶偏导数的阶数。例如:
一阶 PDE :u t + u x = 0 u_t + u_x = 0u t + u x = 0 (输运方程),u t + u u x = 0 u_t + u u_x = 0u t + u u x = 0 (Burgers 方程)
二阶 PDE :u t t − c 2 u x x = 0 u_{tt} - c^2 u_{xx} = 0u t t − c 2 u x x = 0 (波动方程),u t = α u x x u_t = \alpha u_{xx}u t = α u x x (热传导方程)
四阶 PDE :u x x x x + 2 u x x y y + u y y y y = 0 u_{xxxx} + 2u_{xxyy} + u_{yyyy} = 0u x x x x + 2 u x x y y + u y y y y = 0 (双调和方程),常见于弹性力学中的板弯曲问题
方程中最高阶偏导数的项构成方程的主部 (principal part)。主部的结构决定了 PDE 的基本类型和性质。
根据方程对未知函数及其导数的依赖方式,PDE 可分为四个层次:
类型
一般形式
示例
求解难度
线性
L u = f Lu = fL u = f ,L LL 为线性算子
热传导方程 u t = α u x x u_t = \alpha u_{xx}u t = α u x x
有较完整理论
半线性
L u = f ( u , ∇ u ) Lu = f(u, \nabla u)L u = f ( u , ∇ u ) ,主部线性
u t − Δ u = u 2 u_t - \Delta u = u^2u t − Δ u = u 2
可用线性理论为基础
拟线性
最高阶导数线性,系数依赖低阶解
u t + u u x = 0 u_t + u u_x = 0u t + u u x = 0 (Burgers)
需弱解理论
完全非线性
最高阶导数以非线性方式出现
u t + ∣ ∇ u ∣ 2 = 0 u_t + |\nabla u|^2 = 0u t + ∣ ∇ u ∣ 2 = 0 (Hamilton-Jacobi)
需粘性解理论
线性 PDE 满足叠加原理:如果 u 1 u_1u 1 和 u 2 u_2u 2 是齐次方程 L u = 0 Lu=0L u = 0 的解,则任意线性组合 c 1 u 1 + c 2 u 2 c_1 u_1 + c_2 u_2c 1 u 1 + c 2 u 2 也是解。叠加原理是大多数解析方法(如分离变量法、格林函数法)的根基。
非线性 PDE 通常不满足叠加原理,非线性效应会导致丰富的物理现象——激波(间断解的形成)、孤立子(粒子般的波包)、斑图形成(Turing 模式)等。这些现象在线性理论中完全不存在,是非线性 PDE 研究的核心魅力所在。
PDE 通常有无穷多个解,需要附加条件来确定唯一解:
初始条件(Initial Conditions) :给定初始时刻(通常是 t = 0 t=0t = 0 )的函数值,适用于含时间的方程。对于波动方程等二阶时间方程,还需要给定初始速度 u t ( x , 0 ) u_t(x,0)u t ( x , 0 ) 。
边界条件(Boundary Conditions) :给定空间边界上的函数行为,常见三类:
Dirichlet 条件(第一类边界条件) :给定边界上的函数值 u ∣ ∂ Ω = g u|_{\partial\Omega} = gu ∣ ∂ Ω = g 。例如固定温度的边界。
Neumann 条件(第二类边界条件) :给定边界上的法向导数值 ∂ u ∂ n ∣ ∂ Ω = g \left.\frac{\partial u}{\partial n}\right|_{\partial\Omega} = g∂ n ∂ u ∣ ∣ ∣ ∂ Ω = g 。例如绝热边界(热流为零)。
Robin 条件(第三类边界条件) :混合形式 α u + β ∂ u ∂ n ∣ ∂ Ω = g \left.\alpha u + \beta \frac{\partial u}{\partial n}\right|_{\partial\Omega} = gα u + β ∂ n ∂ u ∣ ∣ ∣ ∂ Ω = g 。例如牛顿冷却定律(表面对流换热)。
Cauchy 问题 :给定初始时刻所有必要信息(在超平面上),求解 PDE。以波动方程的初值问题为代表,d'Alembert 公式给出了其经典解。
初边值问题(IBVP) :同时给定初始条件和边界条件,通常出现在有界区域上的含时 PDE 求解中。
Hadamard 提出一个问题被称为适定 的条件:
解存在 (Existence)——数学建模的基本要求
解唯一 (Uniqueness)——物理过程的确定性
解连续依赖于数据 (Stability)——小误差不会导致解的剧烈变化
不满足上述任一条件的问题称为不适定 (ill-posed)。Hadamard 曾认为不适定问题"在物理上没有意义",但后来发现许多重要的实际应用(如地震反演、医学图像重建)恰恰是不适定的,需要特殊的处理方法。Tikhonov 正则化是处理不适定问题最经典的工具:将原问题修改为 u ∥ A u − f ∥ 2 + λ ∥ u ∥ 2 \min_u \|Au - f\|^2 + \lambda \|u\|^2min u ∥ A u − f ∥ 2 + λ ∥ u ∥ 2 ,其中 λ \lambdaλ 是正则化参数,在解的保真度和光滑性之间取得平衡。
二阶线性 PDE 是 PDE 理论的核心。根据主部的代数分类,它们分为三种基本类型。
标准形式 :Laplace 方程 Δ u = 0 \Delta u = 0Δ u = 0 和 Poisson 方程 − Δ u = f -\Delta u = f− Δ u = f
定义 :如果方程主部的系数矩阵 A \mathbf{A}A 的所有特征值同号(全正或全负),则方程为椭圆型。即矩阵 A \mathbf{A}A 是正定或负定的。
物理背景 :
静电场中的电势分布(Gauss 定律)
稳态温度分布(Fourier 定律)
不可压缩无旋流体的速度势
弹性力学中的平衡方程
渗透流(Darcy 定律)
核心性质 :
最大值原理 :在无源区域内,调和函数的最大值和最小值必在边界上达到。这意味着解的内部值被边界值所控制——这正是"椭圆型问题本质上是边值问题"的数学表达。
光滑性 :如果方程系数和右端项光滑,则解在区域内无穷可微。这一正则性结果是椭圆型 PDE 理论最深刻的成果之一,基于 Schauder 估计和 L p L^pL p 估计(Calderón-Zygmund 理论)。
Liouville 定理 :全空间上有界的调和函数必为常数。
平均性质 :调和函数在任意球面上的平均值等于球心的函数值。反之,满足平均性质的函数必为调和函数。
椭圆正则性理论 是 PDE 理论中最完美的组成部分之一。其主要结论是:
如果 f ∈ C ∞ f \in C^\inftyf ∈ C ∞ 且系数光滑,则 u ∈ C ∞ u \in C^\inftyu ∈ C ∞
如果 f ∈ H k f \in H^kf ∈ H k (Sobolev 空间),则 u ∈ H k + 2 u \in H^{k+2}u ∈ H k + 2
解析系数下,解具有解析性
Dirichlet 原理 :Poisson 方程的解 − Δ u = f -\Delta u = f− Δ u = f 实际上是能量泛函 E [ u ] = ∫ Ω ( 1 2 ∣ ∇ u ∣ 2 − f u ) d x E[u] = \int_\Omega \left(\frac{1}{2}|\nabla u|^2 - f u\right) dxE [ u ] = ∫ Ω ( 2 1 ∣ ∇ u ∣ 2 − f u ) d x 的极小元。这一变分观点是有限元法的理论基础,也是连接 PDE 理论与变分法的关键桥梁。
标准形式 :热传导方程 u t = α Δ u u_t = \alpha \Delta uu t = α Δ u
定义 :抛物型 PDE 在时间方向上是一阶的(一阶时间导数),在空间方向上是二阶的(二阶空间导数),且空间部分的算子为椭圆型。
物理背景 :
热传导与扩散过程(Fick 定律、Fourier 定律)
Black-Scholes 方程(金融期权定价)
反应-扩散系统(Turing 模式形成、生物学中的形态发生)
多孔介质中的渗流
核心性质 :
最大值原理 :解的最大值出现在初始时刻或边界上。这保证了温度不会超过初始最大值——物理直觉的数学表达。
光滑化效应 :对于任意 t > 0 t > 0t > 0 ,即使初始条件不连续或仅有 L 1 L^1L 1 正则性,解也变得无穷光滑。这一性质是抛物型 PDE 独有的——热传导方程"抹平"了初始数据的奇性。
无穷传播速度 :热核 G ( x , t ) = 1 4 π α t e − x 2 / ( 4 α t ) G(x,t) = \frac{1}{\sqrt{4\pi\alpha t}} e^{-x^2/(4\alpha t)}G ( x , t ) = 4 π α t 1 e − x 2 / ( 4 α t ) 对任意 x ≠ 0 x \neq 0x = 0 在 t > 0 t > 0t > 0 时都大于零——这意味着热扰动瞬间传递到无穷远处。这在物理上是一个近似(实际上是声子扩散的宏观平均),但在宏观尺度上与实验完全吻合。
长时间行为 :当 t → ∞ t \to \inftyt → ∞ 时,解指数收敛到对应椭圆型方程的稳态解。收敛率的特征值 λ 1 \lambda_1λ 1 由区域形状决定——这解释了为什么小物体的温度更快均衡(λ 1 ∝ 1 / L 2 \lambda_1 \propto 1/L^2λ 1 ∝ 1 / L 2 )。
热核与 Brown 运动 :热核 G ( x , t ) G(x,t)G ( x , t ) 恰好是 Brown 运动的转移概率密度函数。这一深刻联系通过 Feynman-Kac 公式形式化:u ( x , t ) = E [ f ( X t ) ] u(x,t) = \mathbb{E}[f(X_t)]u ( x , t ) = E [ f ( X t ) ] ,其中 X t X_tX t 是从 x xx 出发的 Brown 运动。这为 PDE 的 Monte Carlo 求解提供了理论基础,也是随机 PDE 研究的出发点。
标准形式 :波动方程 u t t − c 2 Δ u = 0 u_{tt} - c^2 \Delta u = 0u t t − c 2 Δ u = 0
定义 :方程主部的系数矩阵具有不同符号的特征值(一个正、其余负或反之)。在二维 ( x , t ) (x,t)( x , t ) 情形下,特征线方程为 d x / d t = ± c dx/dt = \pm cd x / d t = ± c 。
物理背景 :
声波、光波、地震波(弹性波传播)
弦振动、膜振动
电磁波传播(Maxwell 方程导出)
浅水波方程(Saint-Venant 方程组)
核心性质 :
有限传播速度 :扰动以有限速度 c cc 传播。初始扰动的影响区域由特征锥 { ∣ x − y ∣ ≤ c t } \{ |x-y| \leq ct \}{ ∣ x − y ∣ ≤ c t } 限定——这遵循狭义相对论的因果律。双曲型 PDE 的这一性质与抛物型 PDE 的无穷传播速度形成鲜明对比。
Huygens 原理 :在奇数维空间(n = 1 , 3 , 5 , … n=1,3,5,\ldotsn = 1 , 3 , 5 , … )中,波动方程的初值问题具有清晰的波前——扰动到达某点后经过有限时间即完全消失。在三维空间中推开一扇门发出的声音会清晰消失;在二维空间中投入石子的水波会在扰动后持续荡漾。这一差异是为什么声音在三维空间中"听起来"清晰,而池塘中的涟漪会"持续"的原因。
能量守恒 :在无阻尼时,总机械能(动能 u t 2 / 2 u_t^2/2u t 2 / 2 + 势能 c 2 ∣ ∇ u ∣ 2 / 2 c^2|\nabla u|^2/2c 2 ∣ ∇ u ∣ 2 / 2 )守恒。这是物理能量守恒律的 PDE 表达,也是分析双曲型方程稳定性的重要工具。
奇性保持 :与抛物型方程相反,双曲型方程的解不具光滑化效应——初始数据的奇性(间断、尖点等)沿特征线传播,并不消失。
d'Alembert 公式 (一维波动方程):
u ( x , t ) = 1 2 [ f ( x − c t ) + f ( x + c t ) ] + 1 2 c ∫ x − c t x + c t g ( ξ ) d ξ u(x,t) = \frac{1}{2}[f(x-ct) + f(x+ct)] + \frac{1}{2c}\int_{x-ct}^{x+ct} g(\xi)\,d\xi
u ( x , t ) = 2 1 [ f ( x − c t ) + f ( x + c t ) ] + 2 c 1 ∫ x − c t x + c t g ( ξ ) d ξ
这个公式堪称 PDE 中最优美的显式解之一。它清晰地揭示了解的三层结构:第一项描述了初始位移 f ff 以速度 c cc 向左右两个方向传播,第二项描述了初始速度 g gg 在区间 [ x − c t , x + c t ] [x-ct, x+ct][ x − c t , x + c t ] 上的平均效应乘上时间 t tt 。解的依赖区间 [ x − c t , x + c t ] [x-ct, x+ct][ x − c t , x + c t ] 正是特征线的投影,体现了有限传播速度的物理本质。
特性
椭圆型
抛物型
双曲型
典型方程
Δ u = 0 \Delta u = 0Δ u = 0
u t = Δ u u_t = \Delta uu t = Δ u
u t t = Δ u u_{tt} = \Delta uu t t = Δ u
信息传播
全局耦合(平衡态)
无限速度(扩散)
有限速度(波动)
解的正则性
无穷光滑
对任何 t > 0 t>0t > 0 光滑
保持初始奇性
时间箭头
无时间维度
单向不可逆(熵增)
双向可逆
典型问题类型
边值问题(BVP)
初边值问题(IBVP)
初值问题(IVP)
能量特征
极小值原理
指数耗散
能量守恒
特征值
全同号
一个零,其余同号
一正一负(其余同号)
分离变量法(Separation of Variables)是求解有界区域上线性 PDE 最经典的解析方法。其核心思想是假设解可以写成空间部分和时间部分的乘积,将 PDE 转化为若干常微分方程(ODE)和一个特征值问题。
标准步骤 :
假设分离形式 :u ( x , t ) = X ( x ) T ( t ) u(x,t) = X(x)T(t)u ( x , t ) = X ( x ) T ( t )
代入方程,分离变量 :得到两个独立的 ODE,并由边界条件导出特征值问题
求解特征值问题 :得到一系列特征值 λ n \lambda_nλ n 和特征函数 X n ( x ) X_n(x)X n ( x )
叠加与特定系数 :u ( x , t ) = ∑ n = 1 ∞ c n T n ( t ) X n ( x ) u(x,t) = \sum_{n=1}^\infty c_n T_n(t) X_n(x)u ( x , t ) = ∑ n = 1 ∞ c n T n ( t ) X n ( x ) ,利用初始条件通过 Fourier 级数确定系数
经典例子——一维热传导方程 :
u t = α u x x , x ∈ [ 0 , L ] , t > 0 u_t = \alpha u_{xx}, \quad x \in [0,L], \quad t > 0
u t = α u x x , x ∈ [ 0 , L ] , t > 0
零边界条件 u ( 0 , t ) = u ( L , t ) = 0 u(0,t) = u(L,t) = 0u ( 0 , t ) = u ( L , t ) = 0 ,初始条件 u ( x , 0 ) = f ( x ) u(x,0) = f(x)u ( x , 0 ) = f ( x ) 。
解为:
u ( x , t ) = ∑ n = 1 ∞ b n e − α ( n π / L ) 2 t sin n π x L u(x,t) = \sum_{n=1}^\infty b_n e^{-\alpha (n\pi/L)^2 t} \sin\frac{n\pi x}{L}
u ( x , t ) = n = 1 ∑ ∞ b n e − α ( n π / L ) 2 t sin L n π x
其中系数 b n b_nb n 由初始条件确定:
b n = 2 L ∫ 0 L f ( x ) sin n π x L d x b_n = \frac{2}{L} \int_0^L f(x) \sin\frac{n\pi x}{L} \, dx
b n = L 2 ∫ 0 L f ( x ) sin L n π x d x
这个解的重要洞察:高频成分(大 n nn )衰减极快——这就是为什么粗糙的初始温度分布很快变得光滑。特征值 λ n = ( n π / L ) 2 \lambda_n = (n\pi/L)^2λ n = ( n π / L ) 2 决定了各模式的衰减率,最小的非零特征值 λ 1 \lambda_1λ 1 决定了系统的特征响应时间 τ = 1 / ( α λ 1 ) \tau = 1/(\alpha \lambda_1)τ = 1 / ( α λ 1 ) 。
适用条件 :分离变量法适用于空间区域为简单几何(矩形、球体、圆柱、圆盘)且具有齐次边界条件的问题。对于复杂区域或非齐次边界条件,需要先做齐次化处理(引入特解将非齐次边界转化为齐次)。
特征线法(Method of Characteristics)主要用于一阶 PDE 和二阶双曲型方程。其基本思想是沿特定的曲线(特征线)将 PDE 转化为 ODE。
一阶拟线性 PDE :
a ( x , t , u ) u x + b ( x , t , u ) u t = c ( x , t , u ) a(x,t,u)u_x + b(x,t,u)u_t = c(x,t,u)
a ( x , t , u ) u x + b ( x , t , u ) u t = c ( x , t , u )
沿特征线 d x d s = a \frac{dx}{ds} = ad s d x = a ,d t d s = b \frac{dt}{ds} = bd s d t = b ,有 d u d s = c \frac{du}{ds} = cd s d u = c 。从几何角度看,解曲面 ( x , t , u ) (x,t,u)( x , t , u ) 由特征曲线编织而成——特征线就是解曲面上与 PDE 算子相切的曲线。
波动方程的特征线 :u t t = c 2 u x x u_{tt} = c^2 u_{xx}u t t = c 2 u x x 的特征线为 x ± c t = const x \pm ct = \text{const}x ± c t = const 。沿这些直线,d'Alembert 公式将 PDE 简化为 ODE:
d d t ( u t ± c u x ) = 0 沿 x ∓ c t = const \frac{d}{dt}(u_t \pm cu_x) = 0 \quad \text{沿} \quad x \mp ct = \text{const}
d t d ( u t ± c u x ) = 0 沿 x ∓ c t = const
这意味着 Riemann 不变量 u t ± c u x u_t \pm cu_xu t ± c u x 沿特征线守恒。
非线性效应 :对于拟线性 Burgers 方程 u t + u u x = 0 u_t + u u_x = 0u t + u u x = 0 ,特征线方程为 d x / d t = u dx/dt = ud x / d t = u 。由于特征速度 u uu 本身就是解的一部分,特征线之间可能相交——在相交时刻,解的取值产生矛盾,对应物理上激波(shock)的形成。这一现象仅在非线性情形下出现,是 PDE 线性理论与非线性理论的分水岭。
格林函数法(Green's Function Method)通过构造点源的单位脉冲响应(基本解),利用叠加原理获得任意源项的解。
基本思想 :对于含源项的问题 L u = f Lu = fL u = f ,先求解点源问题 L G = δ ( x − y ) LG = \delta(x-y)L G = δ ( x − y ) ,则 u ( x ) = ∫ G ( x , y ) f ( y ) d y u(x) = \int G(x,y) f(y) \, dyu ( x ) = ∫ G ( x , y ) f ( y ) d y 。
常用基本解 :
三维 Laplace 方程:G ( x , y ) = 1 4 π ∣ x − y ∣ G(x,y) = \frac{1}{4\pi|x-y|}G ( x , y ) = 4 π ∣ x − y ∣ 1
二维 Laplace 方程:G ( x , y ) = 1 2 π ln 1 ∣ x − y ∣ G(x,y) = \frac{1}{2\pi} \ln\frac{1}{|x-y|}G ( x , y ) = 2 π 1 ln ∣ x − y ∣ 1
一维热传导方程(无界区域):G ( x , t ) = 1 4 π α t e − x 2 / ( 4 α t ) G(x,t) = \frac{1}{\sqrt{4\pi\alpha t}} e^{-x^2/(4\alpha t)}G ( x , t ) = 4 π α t 1 e − x 2 / ( 4 α t )
三维波动方程:G ( x , t ) = δ ( t − ∣ x ∣ / c ) 4 π ∣ x ∣ G(x,t) = \frac{\delta(t - |x|/c)}{4\pi|x|}G ( x , t ) = 4 π ∣ x ∣ δ ( t − ∣ x ∣ / c )
构造方法 :对于有界区域,格林函数需附加修正项以满足边界条件。以 Dirichlet 边界条件为例:
G ( x , y ) = Φ ( x − y ) − h ( x , y ) G(x,y) = \Phi(x-y) - h(x,y)
G ( x , y ) = Φ ( x − y ) − h ( x , y )
其中 Φ \PhiΦ 是基本解,h hh 是某个修正函数(满足 Δ x h = 0 \Delta_x h = 0Δ x h = 0 且 h ∣ ∂ Ω = Φ ∣ ∂ Ω h|_{\partial\Omega} = \Phi|_{\partial\Omega}h ∣ ∂ Ω = Φ ∣ ∂ Ω )。这一修正过程在数学上等价于从基本解中减去其在边界上的"像"——这就是镜像法(Method of Images)的根本原理。
格林函数法在理论上极其优美,但在实践中通常只能用于简单几何区域(球、半空间、圆盘等)。对于一般区域,必须借助数值方法(如边界元法 BEM)。
对于无界区域上的线性 PDE,傅里叶变换(Fourier Transform)可以将 PDE 转化为代数方程或 ODE。
标准步骤 :
对空间变量做傅里叶变换 F \mathcal{F}F ,将偏导转化为代数乘法:F ( u x ) = i k u ^ \mathcal{F}(u_x) = ik\hat{u}F ( u x ) = i k u ^
将 PDE 变为关于 u ^ ( k , t ) \hat{u}(k,t)u ^ ( k , t ) 的 ODE
解 ODE,得到 u ^ \hat{u}u ^ 的显式表达式
对 u ^ \hat{u}u ^ 做逆傅里叶变换得到 u uu
热传导方程示例 :
u ^ t ( k , t ) = − α k 2 u ^ ( k , t ) ⇒ u ^ ( k , t ) = f ^ ( k ) e − α k 2 t \hat{u}_t(k,t) = -\alpha k^2 \hat{u}(k,t) \quad \Rightarrow \quad \hat{u}(k,t) = \hat{f}(k) e^{-\alpha k^2 t}
u ^ t ( k , t ) = − α k 2 u ^ ( k , t ) ⇒ u ^ ( k , t ) = f ^ ( k ) e − α k 2 t
逆变换给出:
u ( x , t ) = 1 4 π α t ∫ − ∞ ∞ f ( ξ ) e − ( x − ξ ) 2 / ( 4 α t ) d ξ = ∫ − ∞ ∞ G ( x − ξ , t ) f ( ξ ) d ξ u(x,t) = \frac{1}{\sqrt{4\pi\alpha t}} \int_{-\infty}^\infty f(\xi) e^{-(x-\xi)^2 / (4\alpha t)} \, d\xi = \int_{-\infty}^\infty G(x-\xi, t) f(\xi) \, d\xi
u ( x , t ) = 4 π α t 1 ∫ − ∞ ∞ f ( ξ ) e − ( x − ξ ) 2 / ( 4 α t ) d ξ = ∫ − ∞ ∞ G ( x − ξ , t ) f ( ξ ) d ξ
这就是热核(Heat Kernel)的卷积表示。从频域角度看,高频成分(大 ∣ k ∣ |k|∣ k ∣ )在 e − α k 2 t e^{-\alpha k^2 t}e − α k 2 t 的指数衰减下快速消失,对应了实空间中的光滑化效应。
用途 :傅里叶变换法最大优势在于处理无界区域上的常系数 PDE。对于变系数 PDE 或有界区域,需要借助 Fourier 级数或更一般的积分变换(如 Hankel 变换、Laplace 变换等)。
对于实际工程问题,解析解往往不可得,必须借助数值方法。
有限差分法是最直观的数值方法:将连续区域离散化为网格,用差商近似偏导数。
常见差分格式 :
前向差分:u x ≈ ( u i + 1 − u i ) / Δ x u_x \approx (u_{i+1} - u_i)/\Delta xu x ≈ ( u i + 1 − u i ) / Δ x (一阶精度)
中心差分:u x ≈ ( u i + 1 − u i − 1 ) / ( 2 Δ x ) u_x \approx (u_{i+1} - u_{i-1})/(2\Delta x)u x ≈ ( u i + 1 − u i − 1 ) / ( 2 Δ x ) (二阶精度)
二阶中心差分:u x x ≈ ( u i + 1 − 2 u i + u i − 1 ) / Δ x 2 u_{xx} \approx (u_{i+1} - 2u_i + u_{i-1})/\Delta x^2u x x ≈ ( u i + 1 − 2 u i + u i − 1 ) / Δ x 2 (二阶精度)
热传导方程的隐式格式(Crank-Nicolson) :
u i n + 1 − u i n Δ t = α 2 Δ x 2 [ ( u i + 1 n + 1 − 2 u i n + 1 + u i − 1 n + 1 ) + ( u i + 1 n − 2 u i n + u i − 1 n ) ] \frac{u_i^{n+1} - u_i^n}{\Delta t} = \frac{\alpha}{2\Delta x^2} \left[(u_{i+1}^{n+1} - 2u_i^{n+1} + u_{i-1}^{n+1}) + (u_{i+1}^n - 2u_i^n + u_{i-1}^n)\right]
Δ t u i n + 1 − u i n = 2 Δ x 2 α [ ( u i + 1 n + 1 − 2 u i n + 1 + u i − 1 n + 1 ) + ( u i + 1 n − 2 u i n + u i − 1 n ) ]
Crank-Nicolson 格式无条件稳定 且具有二阶时空精度,是抛物型 PDE 数值求解的工业标准。
CFL 条件 (Courant-Friedrichs-Lewy):对于双曲型 PDE 的显式格式,时间步长需要满足 c Δ t Δ x ≤ 1 \frac{c\Delta t}{\Delta x} \leq 1Δ x c Δ t ≤ 1 。这一条件的物理解释是:数值依赖区域必须包含真实依赖区域。隐式格式虽不受 CFL 条件限制,但需要求解大型线性系统。
有限元法将求解域划分为有限个小单元(三角形、四边形、四面体等),在每个单元上构造局部基函数,通过变分原理(Galerkin 方法)得到全局离散系统。
FEM 的优势:
处理复杂几何区域(相比 FDM 的规则网格更灵活)
本质处理自然边界条件(Neumann 条件天然包含在变分形式中)
有成熟的数学理论支持(Céa 引理、Strang 引理保证了收敛性)
自适应网格加密的误差控制
变分形式 :对于 Poisson 方程 − Δ u = f -\Delta u = f− Δ u = f ,乘以测试函数 v vv 并分部积分,得到 ∫ Ω ∇ u ⋅ ∇ v d x = ∫ Ω f v d x \int_\Omega \nabla u \cdot \nabla v \, dx = \int_\Omega f v \, dx∫ Ω ∇ u ⋅ ∇ v d x = ∫ Ω f v d x 。在有限维子空间 V h V_hV h 中找 u h u_hu h 使方程对所有 v h ∈ V h v_h \in V_hv h ∈ V h 成立——这就是 Galerkin 方法。
谱方法使用全局基函数(如 Fourier 级数、Chebyshev 多项式、Legendre 多项式)逼近解。对于光滑问题,谱方法可以达到指数级收敛速度 (spectral accuracy),远快于有限差分或有限元的代数收敛速度。
谱方法适用于规则区域上的光滑问题。对于含间断的激波问题,谱方法会出现 Gibbs 现象,需要引入滤波或谱元法(Spectral Element Method, SEM)来克服。
不可压缩 Navier-Stokes 方程描述黏性流体的运动:
∂ u ∂ t + ( u ⋅ ∇ ) u − ν Δ u = − ∇ p + f \frac{\partial \mathbf{u}}{\partial t} + (\mathbf{u} \cdot \nabla)\mathbf{u} - \nu \Delta \mathbf{u} = -\nabla p + \mathbf{f}
∂ t ∂ u + ( u ⋅ ∇ ) u − ν Δ u = − ∇ p + f
∇ ⋅ u = 0 \nabla \cdot \mathbf{u} = 0
∇ ⋅ u = 0
这是 PDE 领域最著名的未解决问题之一。三维 N-S 方程解的光滑性问题是 Clay 研究所公布的七个千禧年大奖难题 之一(悬赏 100 万美元)。
工程常用简化 :
Stokes 方程 :忽略惯性项,适用于低雷诺数流动(如微流体、尘埃颗粒沉降)
Euler 方程 :忽略黏性项,适用于高速气流初步分析
势流理论 :进一步假设无旋,退化为 Laplace 方程,可解性大幅提升
Maxwell 方程组统一了电学和磁学的四个方程:
∇ × E = − ∂ B ∂ t , ∇ × H = J + ∂ D ∂ t \nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t}, \quad \nabla \times \mathbf{H} = \mathbf{J} + \frac{\partial \mathbf{D}}{\partial t}
∇ × E = − ∂ t ∂ B , ∇ × H = J + ∂ t ∂ D
∇ ⋅ D = ρ , ∇ ⋅ B = 0 \nabla \cdot \mathbf{D} = \rho, \quad \nabla \cdot \mathbf{B} = 0
∇ ⋅ D = ρ , ∇ ⋅ B = 0
从 Maxwell 方程可推导出电场和磁场的波动方程:
Δ E − μ ϵ ∂ 2 E ∂ t 2 = 0 \Delta \mathbf{E} - \mu\epsilon\frac{\partial^2 \mathbf{E}}{\partial t^2} = 0
Δ E − μ ϵ ∂ t 2 ∂ 2 E = 0
波速 c = 1 / μ ϵ c = 1/\sqrt{\mu\epsilon}c = 1 / μ ϵ 在真空中约等于 3 × 1 0 8 m/s 3 \times 10^8 \text{ m/s}3 × 1 0 8 m/s ——恰好等于当时已知的光速测量值。Maxwell 由此做出重大预言:光就是一种电磁波。这是 PDE 理论推动物理学重大突破的经典案例。
时间依赖的 Schrödinger 方程:
i ℏ ∂ ψ ∂ t = − ℏ 2 2 m Δ ψ + V ψ i\hbar \frac{\partial \psi}{\partial t} = -\frac{\hbar^2}{2m} \Delta \psi + V\psi
i ℏ ∂ t ∂ ψ = − 2 m ℏ 2 Δ ψ + V ψ
形式上看似扩散方程(一阶时间、二阶空间),但虚数单位 i ii 使其本质上是色散型双曲方程。与热传导方程的本质区别是:概率密度 ∣ ψ ∣ 2 |\psi|^2∣ ψ ∣ 2 守恒(不是耗散),波包会随时间扩散但概率总保持为 1。
Black-Scholes 方程刻画了期权价格的演化:
∂ V ∂ t + 1 2 σ 2 S 2 ∂ 2 V ∂ S 2 + r S ∂ V ∂ S − r V = 0 \frac{\partial V}{\partial t} + \frac{1}{2}\sigma^2 S^2 \frac{\partial^2 V}{\partial S^2} + rS \frac{\partial V}{\partial S} - rV = 0
∂ t ∂ V + 2 1 σ 2 S 2 ∂ S 2 ∂ 2 V + r S ∂ S ∂ V − r V = 0
这是一个倒向抛物型方程(已知终值求初值)。通过变换可转换为标准热传导方程,其解通过 Feynman-Kac 公式表示为标的资产价格的期望值:V ( S t , t ) = E ∗ [ e − r ( T − t ) Φ ( S T ) ] V(S_t, t) = \mathbb{E}^*[e^{-r(T-t)} \Phi(S_T)]V ( S t , t ) = E ∗ [ e − r ( T − t ) Φ ( S T ) ] ,其中 E ∗ \mathbb{E}^*E ∗ 表示风险中性测度下的期望。
无黏 Burgers 方程 u t + u u x = 0 u_t + u u_x = 0u t + u u x = 0 是最简单的非线性双曲型方程。即使初始条件光滑,解也会在有限时间内出现间断——这对应物理上的激波现象,如超音速飞机产生的音爆。
Riemann 问题 :分段常数初值 u ( x , 0 ) = { u L , x < 0 u R , x > 0 u(x,0) = \begin{cases} u_L, & x < 0 \\ u_R, & x > 0 \end{cases}u ( x , 0 ) = { u L , u R , x < 0 x > 0 的解展示了非线性波的两种基本结构:
激波 (Shock):当 u L > u R u_L > u_Ru L > u R 时,间断以速度 s = ( u L + u R ) / 2 s = (u_L + u_R)/2s = ( u L + u R ) / 2 稳定传播
稀疏波 (Rarefaction):当 u L < u R u_L < u_Ru L < u R 时,间断立即消散为连续的过渡区域
Riemann 问题的精确解是 Godunov 型数值方法的基础——每个网格界面上的 Riemann 问题提供了计算数值通量的依据。
Korteweg-de Vries(KdV)方程 u t + 6 u u x + u x x x = 0 u_t + 6uu_x + u_{xxx} = 0u t + 6 u u x + u x x x = 0 描述浅水波。它的发现开启了非线性科学的新时代。
KdV 方程的几个非凡性质:
孤波解 :u ( x , t ) = c 2 sech 2 ( c 2 ( x − c t − x 0 ) ) u(x,t) = \frac{c}{2} \text{sech}^2\left(\frac{\sqrt{c}}{2}(x - ct - x_0)\right)u ( x , t ) = 2 c sech 2 ( 2 c ( x − c t − x 0 ) ) ,波以速度 c cc 传播,波幅与波速成正比
弹性碰撞 :两个孤立子碰撞后各自恢复原状,仅产生相位偏移——表现出类似粒子的行为
完全可积性 :KdV 方程拥有无穷多守恒律(质量、动量、能量……),可被逆散射变换(Inverse Scattering Transform)精确求解
孤立子理论在光纤通信中有着重要应用——通过精心设计的光纤参数,光孤子可以在传输数千公里后保持脉冲形状不变,大幅提高通信容量。
反应-扩散方程的一般形式:u t = D Δ u + f ( u ) u_t = D\Delta u + f(u)u t = D Δ u + f ( u ) ,其中 D DD 是扩散系数矩阵,f ff 是反应项。
Turing(1952)的里程碑论文提出:两个反应-扩散方程的耦合系统,即使平衡态在无扩散时稳定,当引入扩散后可能失稳——形成空间上的周期模式。这一机制被称为扩散驱动的不稳定性 。
必要条件 :如果物种激活子(activator)的扩散慢于抑制子(inhibitor),局部激活会扩散不足而抑制子扩散充分,导致激活子局部聚集形成斑点——这与直觉相反(通常认为扩散总是起均匀化作用)。
这一理论成功解释了斑马条纹、猎豹斑点、沙丘波纹以及化学反应中(Belousov-Zhabotinsky 反应)的自发图案形成。
20 世纪 PDE 理论最重要的进展是将 PDE 的解放在函数空间而非逐点意义下理解。Sobolev 空间 W k , p ( Ω ) W^{k,p}(\Omega)W k , p ( Ω ) 中的函数具有弱导数——即满足分部积分公式的广义导数。
Lax-Milgram 引理 提供了椭圆型方程弱解存在性的统一框架:如果双线性形式 a : H × H → R a:H \times H \to \mathbb{R}a : H × H → R 满足连续性 ∣ a ( u , v ) ∣ ≤ C ∥ u ∥ ∥ v ∥ |a(u,v)| \leq C\|u\|\|v\|∣ a ( u , v ) ∣ ≤ C ∥ u ∥ ∥ v ∥ 和强制性 a ( u , u ) ≥ α ∥ u ∥ 2 a(u,u) \geq \alpha\|u\|^2a ( u , u ) ≥ α ∥ u ∥ 2 ,则对任意有界线性泛函 F FF ,方程 a ( u , v ) = F ( v ) a(u,v) = F(v)a ( u , v ) = F ( v ) 存在唯一解。
这对于 PDE 解的存在性意味着:只要 PDE 可以转化为合适的变分形式,且系数满足一定条件(如椭圆性),解一定存在——无需找到显式公式。
微局部分析是研究 PDE 解的高频行为(即奇性传播)的前沿工具。
核心概念包括:
波前集 (Wavefront Set):同时描述函数奇性的位置和方向
象征 (Symbol):将 PDE 算子的 Fourier 表示写成多项式形式
拟微分算子 (Pseudodifferential Operator):推广了微分算子,允许分数阶导数和非整数指数
奇性传播定理 :双曲型 PDE 解的奇性沿双特征曲线传播;椭圆型 PDE 的解在区域内没有奇性(椭圆正则性);抛物型 PDE 解的奇性随时间指数衰减。
入门偏微分方程建议遵循以下路径:
1. 基础预备 :
扎实的多元微积分:方向导数、梯度、散度、旋度、Green 定理、Stokes 定理
线性代数:特征值、特征向量、二次型
常微分方程:一阶方程、线性 ODE 组、级数解法
复变函数:解析函数、留数定理(对积分变换和特殊函数法有用)
2. 入门教材 :
R. Haberman , Applied Partial Differential Equations :偏工程应用,物理案例丰富,适合初学者建立直觉
W. Strauss , Partial Differential Equations: An Introduction :物理直觉强,语言清晰,适合自学者
L. C. Evans , Partial Differential Equations :研究生标准教材,理论严谨全面,适合深度学习
3. 数值方法入门 :
从一维热传导方程开始,理解显式 vs 隐式的稳定性
掌握 von Neumann 稳定性分析方法
理解 CFL 条件对双曲型 PDE 的意义
尝试用 Python(SciPy、FEniCS)求解简单 PDE
4. 进阶方向 :
非线性 PDE:激波、弱解、粘性解
流体力学 PDE:Navier-Stokes 方程的数学理论
自由边界问题:Stefan 问题、Hele-Shaw 流动
几何 PDE:Ricci 流、平均曲率流
偏微分方程是连接数学理论与物理世界的桥梁。从 Laplace 方程描述平衡态、热传导方程刻画扩散过程、到波动方程刻画波的传播,三大经典 PDE 构成了理解自然界的基本框架。它们的分类——椭圆型、抛物型、双曲型——不仅具有代数意义,更反映了深层物理本质:全局耦合 vs 局域传播、时间可逆 vs 不可逆、能量守恒 vs 耗散。
现代 PDE 理论的威力在于,它不仅提供了求解具体问题的工具,更塑造了理解自然现象的思维方式。有限元法和有限差分法将连续世界离散化为可计算的模型;弱解理论让数学能够处理不连续的真实物理过程;孤立子与激波则展示了非线性系统中秩序从混沌中涌现的奇妙可能。
对于学习者而言,PDE 培养的是一种以方程理解世界的思维方式——给定一个物理过程,如何用 PDE 建模、如何分析解的性质、如何设计数值解法。这一思维方式一旦建立,便能极大拓展解决实际问题的能力边界。
参考资源 :
Evans, L. C. Partial Differential Equations . American Mathematical Society, 2010.
Strauss, W. Partial Differential Equations: An Introduction . Wiley, 2008.
Olver, P. J. Introduction to Partial Differential Equations . Springer, 2014.
谷超豪等,《数学物理方程》,高等教育出版社
维基百科:Partial Differential Equation,https://en.wikipedia.org/wiki/Partial_differential_equation