| 此條目需要 精通或熟悉相关主题的编者参与及协助编辑。 (2014年7月22日) 請邀請適合的人士改善本条目。更多的細節與詳情請參见討論頁。 |
图1:绿线标出的是约束g(x,y) = c的点的轨迹。蓝线是f的等高线。箭头表示梯度,和等高线的法线平行。
在数学中的最优化问题中,拉格朗日乘数法(英語:Method of Lagrange multiplier,以数学家约瑟夫·拉格朗日命名)是一种寻找多元函数在其变量受到一个或多个条件的约束时的局部极值的方法。
方法說明
對一個有
个变量与
个约束条件的最优化问题,拉格朗日乘數法會將其转换成一个
个变量的方程组,稱作拉格朗日方程(英語:Lagrange function),這個方程組的解將包括所有最優化問題的解。拉格朗日乘數法將會引入一个或一组新的未知数,即拉格朗日乘数(英語:Lagrange multiplier),又称拉格朗日乘子,或拉氏乘子,它们是在转换后的方程,即约束方程中作为梯度的线性组合中各个向量的系数。
比如,求
在
时的局部極值时,我们可以引入新变量拉格朗日乘数
,这时我们只需要求下列拉格朗日函数的局部极值:
![{\displaystyle {\mathcal {L}}(x,y,\lambda )=f(x,y)-\lambda \cdot g(x,y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/15caf491c2951011b82052d0a89c2fbc75f98b57)
更一般地,对含n个变量和k个约束的情况,有:
![{\displaystyle {\mathcal {L}}\left(x_{1},\ldots ,x_{n},\lambda _{1},\ldots ,\lambda _{k}\right)=f\left(x_{1},\ldots ,x_{n}\right)-\sum \limits _{i=1}^{k}{\lambda _{i}g_{i}\left(x_{1},\ldots ,x_{n}\right)},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8e0d0b20a1c96d8b46361916d2b2e5f04aa2d64a)
拉格朗日乘数法所得的臨界點会包含原问题的所有臨界點,但并不保证每个拉格朗日乘數法所得的臨界點都是原问题的臨界點。拉格朗日乘数法的正确性的证明牵涉到偏微分,全微分或連鎖律。
介绍
微积分中最常见的问题之一是求一个函数的极大极小值(极值)。但是很多时候找到极值函数的显式表达是很困难的,特别是当函数有先决条件或约束时。拉格朗日乘数则提供了一个非常便利方法来解决这类问题,而避开显式地引入约束和求解外部变量。
先看一个三维的例子:假设有函数:
,要求其极值(最大值/最小值),且满足条件
![{\displaystyle g\left(x,y\right)=c}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5fc60bd0ab88e57612d30d7931cef0bb2774c67e)
c为常数。對不同
的值,不难想像出
![{\displaystyle f\left(x,y\right)=d_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/45f5ce0c5074c4b0ded7581dfb003b12234894f8)
的等高线。而方程
的可行集所构成的线正好是
。想像我们沿着
的可行集走;因为大部分情况下
的等高线和
的可行集线不会重合,但在有解的情况下,这两条线会相交。想像此时我们移动
上的点,因为
是连续的方程,我们因此能走到
更高或更低的等高线上,也就是说
可以变大或变小。只有当
和
相切,也就是说,此时,我们正同时沿着
和
走。这种情况下,会出现极值或鞍点。
气象图中就很常出现这样的例子,当温度和气压两列等高线同时出现的时候,切点就意味着约束极值的存在。
用向量的形式来表达的话,我们说相切的性质在此意味着
和
的切线在某点上平行,同时也意味着两者的梯度向量有如下关系(引入一个未知标量
):
![{\displaystyle \nabla f\left(x,y\right)=-\lambda \nabla \left(g\left(x,y\right)-c\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0fd7d2d8ef93a641831a4a9726da9049a4243b46)
即:
.
一旦求出
的值,将其套入下式,易求在无约束条件下的极值和对应的极值点。
= ![{\displaystyle f\left(x,y\right)+\lambda \left(g\left(x,y\right)-c\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1e3dc9553349730ff0e7132ef0737568a6b49f09)
新方程
在达到极值时与
相等。因为
达到极值时
,而
,也就是说
等于零。
证明
设函数
在
点处有极值
,且在
点的邻域内连续。则在
点处有
![{\displaystyle f\left(x,y\right)=\kappa }](https://wikimedia.org/api/rest_v1/media/math/render/svg/1640dc350ce4568821630531b5fba32211301f20)
另有一常值函数
![{\displaystyle g\left(x,y\right)=c}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5fc60bd0ab88e57612d30d7931cef0bb2774c67e)
两函数在
点处的全微分为
![{\displaystyle \mathrm {d} f={\frac {\partial {f}}{\partial {x}}}\mathrm {d} x+{\frac {\partial {f}}{\partial {y}}}\mathrm {d} y=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/997b03080eea2eb2f433524849456ed45c7cf1ee)
![{\displaystyle \mathrm {d} g={\frac {\partial {g}}{\partial {x}}}\mathrm {d} x+{\frac {\partial {g}}{\partial {y}}}\mathrm {d} y=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dd7ec332bc49a46c63691ee5d35ed747ee17b1a0)
當中的等式右方等於零是由於極值會發生在兩者函數斜率完全相同且
在區段內有極值的時候
由于
和
是任取的无穷小量,故该线性方程组的系数成比例,有
![{\displaystyle {\dfrac {\dfrac {\partial {f}}{\partial {x}}}{\dfrac {\partial {g}}{\partial {x}}}}={\dfrac {\dfrac {\partial {f}}{\partial {y}}}{\dfrac {\partial {g}}{\partial {y}}}}=-\lambda }](https://wikimedia.org/api/rest_v1/media/math/render/svg/596b6ccf3f22e6f1a160cb7b740e88e8d0558be6)
即
![{\displaystyle {\frac {\partial {f}}{\partial {x}}}+\lambda \cdot {\frac {\partial {g}}{\partial {x}}}=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9ffa8312c0ebe2105e3d507c3c6f2e51a155b64f)
![{\displaystyle {\frac {\partial {f}}{\partial {y}}}+\lambda \cdot {\frac {\partial {g}}{\partial {y}}}=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/af7bdf5c1b2c79fa7463df8b126c61b5f06e1dab)
将上二式分别乘以
和
,再相加并积分,得到一新函数
![{\displaystyle {\mathcal {L}}(x,y,\lambda )=f(x,y)+\lambda \cdot g(x,y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c2c3e70ab0ad7c13278b89b3a623275469457829)
那么,求原函数极值的问题就转化为求该函数极值的问题。
类似地,这种求极值的方法也可以推广到多维函数
。
拉格朗日乘数的运用方法
如f定义为在Rn上的方程,约束为gk(x)= ck(或将约束左移得到gk(x) − ck = 0)。定义拉格朗日Λ为
。
注意极值的条件和约束现在就都被记录到一个式子里了:
![{\displaystyle \nabla \Lambda =0\Leftrightarrow \nabla f=-\sum _{k}\lambda _{k}\nabla \ g_{k},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4e9390eaf44d30a38360eac31fc64974304e5e09)
和
。
拉格朗日乘数常被用作表达最大增长值。原因是从式子:
。
中我们可以看出λk是当方程在被约束条件下,能够达到的最大增长率。拉格朗日力学就使用到这个原理。
拉格朗日乘数法在卡罗需-库恩-塔克条件被推广。
例子
求此方程的最小值:
![{\displaystyle f(x,y)=x^{2}y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/687374a359ba01bd39c777d7555d91d3bf377a25)
同时未知数满足
![{\displaystyle x^{2}+y^{2}=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ec84b90236512e8d27ff1a8f7707b60b63327de1)
因为只有一个未知数的限制条件,我们只需要用一个乘数
.
![{\displaystyle g(x,y)=x^{2}+y^{2}-1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8d43ec5185724659a6b4d6c91a08362775843e71)
![{\displaystyle \Phi (x,y,\lambda )=f(x,y)+\lambda g(x,y)=x^{2}y+\lambda (x^{2}+y^{2}-1)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/da92bf9b54f71b5b89673f00f8bfe66ba99cfd20)
将所有
方程的偏微分设为零,得到一个方程组,最小值是以下方程组的解中的一个:
![{\displaystyle 2xy+2\lambda x=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ea00f3a4ad6bd7f49ea51a59a2cca64f9c5c0d41)
![{\displaystyle x^{2}+2\lambda y=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/60a111051e75827f5066807f0ffa05746c6b88ff)
![{\displaystyle x^{2}+y^{2}-1=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1ee594b8851d760d0e2d44aba714907aca657b8f)
求此离散分布的最大熵:
。
所有概率的总和是1,因此我们得到的约束是g(p)= 1即
。
可以使用拉格朗日乘数找到最高熵(概率的函数)。对于所有的k从1到n,要求
![{\displaystyle {\frac {\partial }{\partial p_{k}}}(f+\lambda (g-1))=0,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0fba7d6255080d97706aee6ce35d107f0772592f)
由此得到
。
计算出这n个等式的微分,我们得到:
。
这说明pi都相等(因为它们都只是λ的函数)。解出约束∑k pk = 1,得到
。
因此,使用均匀分布可得到最大熵的值。
经济学
约束最优化在经济学占有很重要的地位。例如一个消费者的选择问题可以被视为一个求效用方程在预算约束下的最大值问题。拉格朗日乘数在经济学中被解释为影子价格,设定在某种约束下,在这里即收入的边际效用。
拉格朗日乘数就是效用函数在最优解处对收入的偏导数,也就是在最优解处增加一个单位收入带来的效用增加,或者说在最优解处有效用衡量收入的价值,称之为收入的边际效用。
在企业生产问题中,拉格朗日乘数用来衡量要素投入变动所带来的收入变动,du/dm=λ,u表示效用函数或生产函数,m表示收入或要素投入。
在具体数学推导中还可以运用包络定理的内容。
参考
对外链接
参考拉格朗日原作或方法的命名:
更深入的介绍和互动applet: