变分法原理:从历史轶事到数学本质
变分法原理:从历史轶事到数学本质
变分法是数学物理中处理极值问题的重要工具,从最速降曲线到悬链线,其应用广泛且深刻。本文将带你领略变分法的基本思想及其在经典问题中的精彩应用。
变分原理
对付数学物理中的极值问题,变分法可谓是不可或缺的利器。今天,我们就来深入探讨变分法的基本思想。
变分法的历史轶事
大约在1696年6月,瑞士数学家Johann Bernoulli在第一份德语科学期刊《Acta Eruditorum》上向全球数学家发起了一项挑战:让一个物体从静止开始沿着一个光滑无摩擦的轨道下滑,如果要求下滑过程耗时最短,轨道应该是什么形状?
这个问题被称为最速降曲线问题。它吸引了众多数学家的关注,包括Johann本人、他的哥哥Jacob Bernoulli、Gottfried Leibniz和Guillaume de l'Hôpital等人都给出了各自的解法。
当这个问题传到Issac Newton耳中时,他仅用一晚上的时间就运用变分法解决了问题,并匿名将解答寄回。Newton的解法如此精妙,即便没有署名,Johann也立刻认出了这位数学巨匠,留下了著名的评价:"I recognize the lion by his claw mark."
变分法的基本原理
假设我们有两个定点A和B,连接这两点的任意曲线的方程y(x)都将满足如下的边界条件:
现在考虑如下形式的定积分:
其中F是关于y和其一阶导数y'的函数,我们期望找到一个具体的y(x),使得I有极值(极大或极小)。
在一般的极值问题中,我们考察的是自变量x的变化:x取值多少时,函数会有极值。而现在这个新问题的不同之处在于,我们考察的是函数y的变化:y是什么形式时,I会有极值。然而这两类问题依然有共通之处:当I取极值时,对y作微小的变化,I在一级近似下应该保持不变。
如果y有微小改变δy(高大上叫法:δy称作函数y的变分),那么I的变化为:
相应的变化为:
方括号里的第二项可以改写成:
然后我们可以进行分部积分:
由于y的边界条件固定,δy(0)=δy(1)=0,所以分部积分出来的第一项为零,仅第二项有贡献。代回(4)式中,稍作化简可以得到:
如果I有极值,对任意满足边界条件的δy都必须有δI = 0,这就要求:
这便是传说中的Euler-Lagrange方程,它是变分法的核心定理。有了此等大杀器,原则上就可以找出所寻求的极值函数y(x)。
通常来讲,Euler-Lagrange方程会是一个二阶的微分方程,y(x)的通解中含有的两个待定常数刚好可以通过两个边界条件确定。我们下面来举几个例子操练操练。
例1:两点间的最短路径
先来一个简单的例子小试牛刀。给定平面上两点A和B,连接它们的长度最短的曲线是什么?
这个问题的答案小学生都知道,我们在这里用变分法来杀杀这只小鸡仔。
曲线y(x)上相近的两点(x, y)和(x+dx, y+dy)之间的曲线元长度为:
曲线的总长度为:
现在希望L有最小值,我们可以取F = sqrt(1 + (y')^2),运用Euler-Lagrange方程来寻找可以让L有极小的函数y(x)。注意到:
代回(6)式中,容易得到:
括号里这一大坨的导数为零,那么括号里这一大坨必然是一个常数,我们马上可以推出y'也必然是一个常数。因此我们需要寻找的y(x)满足直线方程:
斜率k和截距b很容易通过边界点的坐标算出。由此我们证明了大家非常熟悉的结论:两点之间直线段的距离最短。
例2:最速降曲线
问题在开篇的历史故事介绍中已经有提到,我们这里直接进入解答环节。
为方便起见,我们将坐标系的y-轴搞成朝下的方向,斜向下的轨道可以由函数y(x)给出,其中轨道的起点和终点分别设为A和B,我们来试求最速降曲线的函数式。
当物理下滑到x位置时,它的速度大小可以根据能量守恒关系解出:
而根据定义,速度大小等于单位时间内走过的轨道长度:
其中我们已经利用了之前(7)式中得到的结果。
(11)与(12)式联立,可以写出:
积分后就可以得到总时间的表达式:
为了找出让T取得极小的y(x),我们可以取F = sqrt(1 + (y')^2) / sqrt(2gy),再套用Euler-Lagrange方程来怒算一波。
丢回(6)式里面,我们可以得到这么一个初步的方程:
看到这种东西,要保持平静,铁了头往下算,要相信好多恶心的东西会神奇地同归于尽。
瞧,柳暗花明又一村。不过这还远没完,解这个二阶微分方程还需要一个骚操作。我们对上式乘上一个y':
感谢CCAV这玩意儿居然是个全微分,它要等于零,方括号里那一坨等于常数就完儿事了。且让我们将这个常数写作C:
原来的二阶微分方程降次变成了一阶,我们终于可以愉快地分离变量两边积分了:
作三角换元,设θ = arcsin(sqrt(2gy) / C),则:
其中C1是积分常数。我们再作逆变换变回到y,注意到sin^2(θ) + cos^2(θ) = 1,于是:
我们可以得到所求的最速降轨道的函数表达式:
轨道起点为A,很容易得出C1,于是结果可以进一步简化:
另一方面,轨道终点为B,上面的常数C还必须满足:
盗图来源:Wikipedia BrachistochroneCurve 词条
可以证明,满足边界条件(21)的最速降曲线(20)将是一条摆线(cycloid):它是圆周上的一个定点在圆沿直线滚动时所形成的轨迹。
盗图来源:Wikipedia Cycloid 词条
从(20)式很难看出这个结论,但其实满足(17)式的y(x)还可以写成如下的参数方程:
其中r给出了滚动的圆的半径。可以作如下的验算:
这验证了(22)式的参数方程确实是(17)式的解。而参数方程可以更明确地表达出摆线的几何意义(如图)。
例3:悬链线
这个数学问题同样也起源于物理:悬在等高的两点间的受重力作用的软绳形成的曲线应该是什么形状?
这类曲线统称为悬链线(catenary),在工程和设计中有广泛的应用。比如悬索桥、架空电缆等都会出现悬链线的设计,而在很多拱门、教堂拱顶的设计中,还会出现倒悬链线的踪影。
盗图来源:Wikipedia Catenary 词条
盗图来源:Wikipedia Catenary 词条
我们在此考虑一个稍有不同的问题。假设有等高的两个支点,它们的坐标为A和B。软绳搭在这两个支点上,一部分悬在两个支点之间,多出来的部分自由下垂耷拉到地面上(如图所示)。
整个体系会自发去向势能最低的状态,因此我们需要找的便是势能最低状态随对应的y(x)函数。
记软绳单位长度的质量为μ,并取地面高度为重力势能的零点。左右竖着的两段的质量均为μh,重心在h/2的高度,因此它们具有的重力势能为:
至于悬挂在两个支点间的部分,我们可以先写出x和x+dx之间一小段的重力势能:
弯曲悬挂着的部分的总的重力势能就是:
结合(23)与(24)式,整个体系的总势能为:
注意到h为常数,因此可以取F = y' * sqrt(1 + (y')^2),再套用Euler-Lagrange方程来找出让U取得极小的y(x)。
代回(6)式中,可以先写出:
不要慌,要继续相信硬肝一波还是可以看到柳暗花明:
似乎看起来也还可以接受?接下来依然一步骚操作,两边同乘以y':
再次神奇地化成了一个全微分,它要等于零,需要圆括号里那一坨等于常数。
这问题又简化成了一个一阶的微分方程。常规操作,分离变量再两边积分:
不难想到用双曲换元,令y' = sinh(θ),于是dy' = cosh(θ)dθ,y = ∫sinh(θ)dθ = cosh(θ) + C2。(29)式变成:
其中C2为积分常数,它连同常数C1都必须匹配边界条件。
(30)式可以改写成:
,我们可以反解出y(x)的函数式:
在我们的问题中,y(x)显然关于x-轴对称,所以C2 = 0。因此:
支点坐标为B,因此边界条件还要求:
于是悬在两个支点之间的软绳的形态将有(31)式的双曲函数给出,其中的参数C1需满足(32)式的条件。
我们还可以试着讨论一下(32)式在什么情况下有解。令C1 = C,或C = sqrt(C1^2 - 1),则(32)式可以改写成:
作出图像,左边对应一条过原点、斜率为1的直线,右边对应一条过(0, 1)后斜率快速增长的曲线。
可以想见,如果C太小,方程将没有解。这时,相比支点的高度,支点之间悬着好长一段绳子,两侧荡着的部分提供的拉力根本拽不住中间那一大段的重量。而如果C足够大,方程将有两个解,其中一个会对应稳定平衡,另一个对应非稳定平衡。可以证明较大的C解会给出稳定平衡。
其他好玩的东西
未完待更
参考资料
- Michael Stone & Paul Goldbart, Mathematics for Physics [Chapter 1: Calculus of variations]
- Tom W.B. Kibble & Frank H. Berkshire, Classical Mechanics (5th Edition) [Chapter 3.6 The Calculus of Variations]
- https://en.wikipedia.org/wiki/Cycloid
- https://en.wikipedia.org/wiki/Catenary
- https://en.wikipedia.org/wiki/Brachistochrone_curve