线性规划对偶问题的理解
- 1.弱对偶
- 2.强对偶
曾在上课的时候多次遇到这个求一个问题的对偶形式,大多是硬套公式。记一次,忘一次。后来在苏大佬的博客中看到了相关阐述,感觉豁然开朗,(可以记得就一些了)遂做笔记记之。原文详见:https://spaces.ac.cn/archives/6280
在规划和优化问题中,对偶形式 是一个非常重要的概念。一般情况下,对偶是一种变换,能够将原问题转换成一个等价的,看起来几乎不一样的新问题:
原问题⟶对偶变换对偶问题原问题\overset{\text{对偶变换}}{\longrightarrow}对偶问题原问题⟶对偶变换对偶问题
线性规划的一般目标式为:
minx{cTx∣Ax=b,x≥0}(1)\min_x\{c^Tx|Ax=b, \ x\ge0\}\tag{1}xmin{cTx∣Ax=b, x≥0}(1)
在离散化情况下,x,c∈Rnx,c \in \mathbb{R^n}x,c∈Rn(行向量),b∈Rmb \in \mathbb{R}^mb∈Rm, A∈Rm×nA\in \mathbb{R}^{m\times n}A∈Rm×n, Ax=bAx=bAx=b对应为m个等式约束。
1.弱对偶
假定式 (1)的最小值在x∗x^*x∗处取得,那么将有:
Ax∗=bAx^*=bAx∗=b
在其两边个乘上一个y∈Rmy\in\mathbb{R}^my∈Rm,使其变成一个标量:
yTAx=yTb(2)y^TAx=y^Tb\tag{2}yTAx=yTb(2)
假设(1): yTA<cTy^TA < c^TyTA<cT,那么有(x非负):
yTAx∗<cTx∗y^TAx^* < c^Tx^*yTAx∗<cTx∗
带入(2)式,有(x在左边不见了):
yTb<cTx∗y^Tb<c^Tx*yTb<cTx∗
也就是说,在假设(1)的条件下,任意的yTby^TbyTb总是不大于(1)式,即使是最大的yTby^TbyTb也一样:
maxy{yTb∣yTA<cT}≤minx{cTx∣ATx=b,x≥0}(3)\max_y\{y^Tb | y^TA < c^T\} \le \min_x\{c^Tx|A^Tx = b, x\ge0\}\tag{3}ymax{yTb∣yTA<cT}≤xmin{cTx∣ATx=b,x≥0}(3)
即左边的最大值 不大于 右边的最小值。弱对偶只是找到了原来问题的下界,就是那个极大值。这个下界可以给优化问题提供一个近似目标 用于计算。
(在构造的过程中 原来的约束构了新的目标。将自变量消除了)
2.强对偶
强对偶形式是说(3)式中的等号成, 即:
maxy{yTb∣yTA<cT}=minx{cTx∣ATx=b,x≥0}(3)\max_y\{y^Tb | y^TA < c^T\} = \min_x\{c^Tx|A^Tx = b, x\ge0\}\tag{3}ymax{yTb∣yTA<cT}=xmin{cTx∣ATx=b,x≥0}(3)
强对偶形式的推到需要用到Farkas引理,从等式约束中得出的得出的一个结论(矩阵A和向量b )基本思路是max 可以任意程度的接近于min(详见苏大神的博文)。
结论:强弱对偶的变换形式是一致的,区别就在于等号是否能够取得到