物理学中 最小作用量原理(英语:least action principle),或更精确地,平稳作用量原理(英语:stationary action principle),是一种
变分原理,当应用于一个机械系统的
作用量时,可以得到此机械系统的
运动方程。这原理的研究引导出
经典力学的拉格朗日表述和哈密顿表述的发展。卡尔·雅可比特称最小作用量原理为
分析力学之母。
简介
物理学中最小作用量原理(英语:least action principle),或更精确地,平稳作用量原理(英语:stationary action principle),是一种
变分原理,当应用于一个
机械系统的
作用量时,可以得到此机械系统的
运动方程。这原理的研究引导出
经典力学的拉格朗日表述和哈密顿表述的发展。卡尔·雅可比特称最小作用量原理为
分析力学之母。
在现代物理学里,这原理非常重要,在
相对论、
量子力学、
量子场论里,都有广泛的用途。在现代数学里,这原理是
莫尔斯理论的研究焦点。本篇文章主要是在阐述最小作用量原理的历史发展。关于数学描述、推导和实用方法,请参阅条目
作用量。最小作用量原理有很多种例子,主要的例子是莫佩尔蒂原理(Maupertuis' principle)和
哈密顿原理。
在最小作用量原理之前,有很多类似的点子出现于
测量学和
光学。
古埃及的拉绳测量者(rope stretcher)在测量两点之间的距离时,会将固定于这两点的绳索拉紧,这样,可以使间隔距离减少至最低值。
托勒密在他的著作《地理学指南》(Geographia)第一册第二章里强调,测量者必须对于直线路线的误差做出适当的修正。
古希腊数学家
欧几里得在《反射光学》(Catoptrica)里表明,将光线照射于镜子,则光线的
反射路径的
入射角等于
反射角。稍后,亚历山大的希罗证明这路径的长度是最短的。
费马的表述
1662年,
皮埃尔·德·费马提出
费马原理,又称为“最短时间原理”:
光线移动的路径是需时最少的路径。
费马原理更正确的版本应是“平稳时间原理”。对于某些状况,光线移动的路径所需的时间可能不是最小值,而是最大值,或甚至是拐值。例如,对于平面镜,任意两点的反射路径光程是最小值;对于半椭圆形镜子,其两个焦点的光线反射路径不是唯一的,光程都一样,是最大值,也是最小值;对于半圆形镜子,其两个端点Q、P的
反射路径光程是最大值;又如最右图所示,对于由四分之一圆形镜与平面镜组合而成的镜子,同样这两个点Q、P的
反射路径的光程是拐值。
假设,介质1、介质2的折射率分别为 ,光线从介质1在点O移动进入介质2,则斯涅尔定律以方程表达为
其中, 为入射角, 为折射角。
从费马原理,可以推导出
斯涅尔定律。通过设定光程对于时间的导数为零,可以找到“平稳路径”,这就是光线移动的路径。光线在介质1与介质2的
速度分别为
其中,c是
真空光速。由于介质会减缓光线的速度,折射率 和 都大于1。
如右图1所示,从点Q到点P的移动时间T为
根据费马原理,光线移动的路径是所需时间为极值的路径,取移动时间T对变数x的导数,设定其为零:
由图中的边角关系,可以得到移动速度与折射角的关系式:
将移动速度与折射率的关系式代入,就会得到斯涅尔定律:
费马原理引发了极大的争议。假若介质的密度越小,光线的移动速度越快,则费马原理是正确的;但是,
艾萨克·牛顿和
勒内·笛卡儿都认为介质的密度越大,光线的移动速度就越快。1802年,
托马斯·杨做实验发现,当光波从较低密度介质移动进入较高密度介质之后,光波的波长会变短,他因此推论光波的运动速度会降低。
莫佩尔蒂的表述
最小作用量原理应用于作用量的最初始表述,时常归功于
皮埃尔·莫佩尔蒂。于1744年和1746年,他写出一些关于这方面的论文。但是,史学专家指出,这优先声明并不明确。
莱昂哈德·欧拉在他的1744年论文里就已谈到这原理。还有一些考据显示出,在1705年,
戈特弗里德·莱布尼茨就已经发现这原理了。
莫佩尔蒂发表的最小作用量原理阐明,对于所有的自然现象,
作用量趋向于最小值。他定义一个运动中的物体的作用量为A,物体质量m、移动速度v与移动距离s的乘积:A=mvs。
莫佩尔蒂又从
宇宙论的观点来论述,最小作用量好像是一种经济原理。在
经济学里,大概就是精省资源的意思。这论述的瑕疵是,并没有任何理由,能够解释,为什么作用量趋向最小值,而不是最大值。假若,我们解释最小作用量为大自然的精省资源,那么,我们又怎样解释最大作用量呢?
折射理论
于1744年,在巴黎科学院发表的一篇论文《几种以前互不相容的自然定律的合一论》(Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles)中,莫佩尔蒂提出,光
折射的路径,从一种介质到另一种介质,是作用量的最小值。按照这论点,如前图,假设光线从
折射率为的介质1折射于折射率为介质2,则作用量为
其中,m是光线的质量。虽然光线并没有质量,这变量对于结果没有任何影响,可以被忽略。
取作用量对于变数x的导数,设定为零,经过一些运算,可以得到
请注意,这结果与牛顿的光粒子理论相符合;但是,与费马得到的结果南辕北辙,大不相同。
非弹性碰撞
1747年,莫佩尔蒂在伯林科学院(Academy of Berlin)发表了论文《运动与静止定律》(Loix du mouvement et du repos)。在这篇论文里,他将
碰撞分为两种,
弹性碰撞与
非弹性碰撞。弹性碰撞遵守
动量守恒和
能量守恒;非弹性碰撞只遵守动量守恒。莫佩尔蒂可以将最小作用量原理应用于弹性碰撞与非弹性碰撞,正确地计算出碰撞后的物体的速度。
思考一个一维非弹性碰撞,假设两个质量分别为的物体O1和物体O2,分别以初始速度朝着同一方向移动,而且,,物体O1紧追着物体O2。当两物体发生非弹性碰撞后,结合成为物体O3,以终结速度移动。从固定于物体O3的参考系观察,物体O1和物体O2的速度分别为。所以,作用量为
其中,t是时间。
取作用量对于变数的导数,设定为零,经过一些运算,可以得到
所以,最终速度为
请注意,按照这种设定参考系的方法,前面折射问题的光折射作用量应该是
还有,前面光折射作用量的距离参数是任意值,但是,非弹性碰撞作用量的碰撞前距离参数与碰撞后距离参数被设定为相等。
由于这些不一致之处,促使
恩斯特·马赫严厉批评,莫佩尔蒂的最小作用量原理只是一个模糊不清的概念,勉强地被用来解释各种不同的物理现象。
欧拉的表述
1744年,
莱昂哈德·欧拉在论文《寻找具有极大值或极小值性质的曲线,等周问题的最广义解答》(Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti)里,以非常清楚的字句,给出最小作用量原理的定义:
设定一个质量为M,速度为v的粒子移动无穷小距离 ds。这粒子的动量为Mv,当乘以无穷小距离时,会给出ds,粒子的动量积分于无穷小距离ds。现在,我宣明,这移动粒子的真实轨道(在所有连结两个端点的可能轨道之中)是为最小值的轨道,或者,假定质量是个常数,是为最小值的轨道。
如同欧拉所写,是动量积分于移动路径。采用现代术语,这积分等于简略作用量;其中,p是
广义动量,q是
广义坐标。因此,在同一年,稍微比莫佩尔蒂晚一点,欧拉独立地发表了,与莫佩尔蒂的理论等同的,关于
变分原理的理论。欧拉并没有争夺优先荣誉。
直线运动
假设没有任何作用力施加于这粒子,则这粒子以均匀速度移动:
只有在轨道长度s为最小值时,才能得到作用量最小值。这轨道是一条直线。
抛物线运动
假设这移动于二维空间的粒子感受到均匀
重力,则根据活力定律(principle of vis viva),
其中,v是瞬时速度,v0是最初速度,y是粒子朝着y-轴移动的距离, g是加速度常数。
将这方程代入作用量:
令A=0,求作用量的稳定值,应用
变分法,可以得到欧拉-
拉格朗日方程:
其中,k1是积分常数。重新编排,可以得到
将这方程积分,
其中,k2是积分常数。
假设粒子的初始位置为(0,0),初始速度为,则
欧拉又将这结果推广至一群粒子。他认为
最小作用原理之所以正确,是因为粒子的惯性试着阻抗任何关于状态的改变,自由粒子会选择遵循影响最小的作用力。
表观目的论
微分运动方程数学等价于其对应的积分运动方程,这具有很重要的
哲学意义。微分方程描述局部于空间的一点或单独时间的片刻。举例而言,
牛顿第二定律解释为瞬时作用力F施加于质量为m的粒子会造成
瞬时加速度为a的运动。明显对比地,作用量原理不会局部于一点,而牵涉到积分于一段时间间隔或一个空间的局域。更重要地,通常在经典作用量原理的表述里,系统的初始状态和终结状态是固定不变的,也就是说,
设定一个移动粒子开始于位置x1、时间t1,结束于位置x2、时间t2,连接这两个端点的物理轨道是作用量积分的平稳值。
特别地针对这程序,终结状态的固定动作似乎额外地赋予了作用量原理一些
目的论的特色。在
物理学史里,这特色不经意地制造出很多激烈的争论。
应用
相对论运用
时空事件的
四维世界把最小作用量原理解释为能够从可能的
世界线中挑选出实际的世界线的原理。在这种情况下相对论并没有给最小作用原理添加进新的物理内容。这种物理内容可以为量子物理所引入。只有作出某种把相对论和微观世界联系在一起的解释的情况下,根据更为一般的设想,相对论或许有“推出”最小作用原理的可能。在建立广义相对论时爱因斯坦用过最小作用原理。此时作用量的概念得到某些新的解释。如所周知,在决定
空间和时间的
曲率时借助于四个
恒等式,并且力求排除表征空间时间特性但不表征曲率的多余的参量。这些恒等式按其
物理意义而言表示不同坐标系中空间和时间曲率的同一性,曲率张量取决于能量
冲量张量。在研究此问题时,爱因斯坦指出,上述四个恒等式有物理意义,也就是具有守恒定律的意义,并且表示了空间时间的特性。然而,现在当我们谈能量冲量张量时,空间的首要特性,即其均匀性对应于冲量分量守恒;而时间的均匀性对应于
能量守恒。这样,守恒定律就对应于曲率
张量之间恒等的数量关系,作为与这种或那种坐标表示无关的物理特性的曲率对应于作用量。爱丁顿提出在
广义相对论中对作用量这一概念意义的极为精细、深刻的说法。他指出:对
时空连续统而言,作用量扮演着类似于能量在
空间关系上所扮演的角色。在
四维世界里,作用量是曲率的量度,即决定
质点运动的四维
连续统的基本特性的量度。我们顺便指出:在叙述魏尔的
统一场论时爱丁顿曾顺带提到对作用量的一种很有益的解释。爱丁顿说,可能作用量就是
概率的函数,然而当把一些概率连乘,则作用量就相加,从而作用量可以认为是概率的
对数。由于概率的对数是
负数,所以作用量就要看成是概率的对数再加上负号,此时最小作用原理则表示实际实现的运动的最大概率。
在现代量子力学中最小作用量原理起着重要作用。不但如此,对于作用量概念的思考也激起对现存理论进行总结的尝试。表征微观世界之基本量,即作用量子和引入到宏观力学的基本数量关系中的量,即由能量按时间积分,这两个量的
量纲一致,促使近代理论家在一系列设想上尽管没有引出什么具体的物理理论,但是却引出一些看来是很有前途的物理理论。