高级优化理论与方法（十四）

Non-linear Constrained Optimization
- KKT-Theorem(FONC)
- SONC
- Definition
- SOSC
- - Example 1
  - Example 2
Convex Optimization Problems
- Definition
- - Lemma
  - Theorem
  - Lemma
  - Example
  - Theorem
- Theorem
- - Example
- Definition
- Theorem
- - Lemma
  - Corollary
  - Lemma
- Theorem
- - Corollary
- Theorem
- Theorem
- - Example
总结

Non-linear Constrained Optimization

KKT-Theorem(FONC)

$f,h,g\in C^1,x$ : regular point & local minimizer. Then, exist $\lambda^*\in \mathbb{R}^m,\mu \in \mathbb{R}^p$ :
① $\mu^*\geq 0$
② $Df(x^*)+{\lambda^*}^T Dh(x^*)+{\mu^*}^T Dg(x^*)=0$
③ ${\mu^*}^T g(x^*)=0$

SONC

Thm: $f,h,g\in C^2,x^*$ :regular point & local minimizer.Then, exist $\lambda^*\in \mathbb{R}^m,\mu \in \mathbb{R}^p$ :
① $\mu^*\geq 0,Df(x^*)+{\lambda^*}^T Dh(x^*)+{\mu^*}^T Dg(x^*)=0,{\mu^*}^T g(x^*)=0$
② $\forall y\in T(x^*):y^TL(x,\lambda,\mu)y\geq 0$

注： $T(x^*)=\{y:Dh(x^*)y=0,Dg_j(x^*)y=0,\forall j\in J(x^*)\}$

Definition

Def: $\tilde{T}(x^*,\mu)=\{y:Dh(x^*)y=0,Dg_j(x^*)y=0, for j\in \tilde{J}(x^*,\mu^*)\}$

Remark: $\because \tilde{J}(x^*,\mu^*)\subseteq J(x^*) \therefore T(x^*)\subseteq \tilde{T}(x^*,\mu^*)$

SOSC

Thm: $f,h,g\in C^2$ . If exists $x^*\in\mathbb{R}^n$ and $\lambda^*\in\mathbb{R}^m,\mu\in\mathbb{R}^p$ s.t.
① $\mu^*\geq 0,Df(x^*)+{\lambda^*}^T Dh(x^*)+{\mu^*}^T Dg(x^*)=0,{\mu^*}^T g(x^*)=0$
② $\forall y\in \tilde{T}(x^*)$ with $y\neq 0:y^TL(x^*,\lambda^*,\mu^*)y>0$
then $x^*$ is a strict local minimizer.

Example 1

min $x_1x_2$
s.t. $x_1+x_2\geq 2$
$x_2\geq x_1$

$f(x)=x_1x_2$
$g_1(x)=2-x_1-x_2$
$g_2(x)=x_1-x_2$

$\nabla f(x)=\begin{bmatrix} x_2\\ x_1 \end{bmatrix},\nabla g_1(x)=\begin{bmatrix} -1\\ -1 \end{bmatrix},\nabla g_2(x)=\begin{bmatrix} 1\\ -1 \end{bmatrix}$

KKT-conditions: $\begin{cases} \mu_1,\mu_2\geq 0\\ x_2-\mu_1+\mu_2=0\\ x_1-\mu_1-\mu_2=0\\ \mu_1(2-x_1-x_2)+\mu_2(x_1-x_2)=0\\ 2-x_1-x_2\leq 0\\ x_1-x_2\leq 0 \end{cases}$

$x^*=\begin{bmatrix} 1\\ 1 \end{bmatrix},\mu^*=\begin{bmatrix} 1\\ 0 \end{bmatrix}$

$Dg_1(x^*)=[-1,-1],Dg_2(x^*)=[1,-1],Df(x)=[1,1]$
$\Rightarrow x^*,Dg_j(x^*) \forall j\in J(x^*)$ linearly independent
$\Rightarrow x^*$ regular point

$T(x^*)=\{y:[-1,-1]y=0,[1,-1]y=0\}=\{0\}$
SONC is satisfied by $x^*,\mu^*$

$L(x,\lambda,\mu)=F(x)+\lambda H(x)+\mu G(x)=\begin{bmatrix} 0&1\\ 1&0 \end{bmatrix}+[1,0]\begin{bmatrix} 0&0\\ 0&0 \end{bmatrix}=\begin{bmatrix} 0&1\\ 1&0 \end{bmatrix}$
$\tilde{T}(x^*,\mu^*)=\{y:[-1,-1]y=0\}=\{y:-y_1=y_2\}$

$[1,-1]\in \tilde{T}(x^*,\mu^*)$
$[1,-1]\begin{bmatrix} 0&1\\ 1&0 \end{bmatrix}\begin{bmatrix} 1\\ -1 \end{bmatrix}=[-1,1]\begin{bmatrix} 1\\ -1 \end{bmatrix}=-2<0$
SOSC fails.
no local min.

Example 2

min $f(x)=(x_1-1)^2+x_2-2$
s.t. $h(x)=x_2-x_1-1=0$
$g(x)=x_1+x_2-2\leq 0$

$Df(x)=[2x_1-2,1],Dh(x)=[-1,1],Dg(x)=[1,1]$
KKT-conditions: $\begin{cases} \mu\geq 0\\ 2x_1-2-\lambda+\mu=0\\ 1+\lambda+\mu=0\\ \mu (x_1+x_2-2)=0\\ x_2-x_1-1=0\\ x_1+x_2-2\leq 0 \end{cases}$

$\Rightarrow \mu^*=0,x_1^*=\frac{1}{2},x_2^*=\frac{3}{2},\lambda^*=-1$
$x$ regular

$L(x^*,\lambda^*,\mu^*)=F(x^*)+{\lambda^*}^TH(x^*)+{\mu^*}^TG(x^*)=\begin{bmatrix} 2&0\\ 0&0 \end{bmatrix}$

$T(x^*)=\{y:[-1,1]y=0,[1,1]y=0\}=\{0\}$ ,SONC satisfied
$\tilde{T}(x^*,\mu^*)=\{y:[-1,1]y=0\}=\{y:y_1=y_2\}$
$y^T\begin{bmatrix} 2&0\\ 0&0 \end{bmatrix}y=[a,a]\begin{bmatrix} 2&0\\ 0&0 \end{bmatrix}\begin{bmatrix} a\\ a \end{bmatrix}=2a^2$

$\forall y\neq 0:2a^2>0\Rightarrow x^*=\begin{bmatrix} \frac{1}{2}\\ \frac{3}{2} \end{bmatrix}$ strict local minimizer

Convex Optimization Problems

min $f (x)$
s.t. $x\in \Omega$

$\Omega:$ a convex set
$f :$ a convex function

Definition

Def: $\Omega:$ convex set, if $\forall x,y\in\Omega,\forall \alpha \in (0,1):\alpha x+(1-\alpha)y\in \Omega$ .

Def: The graph of $f:\Omega\rightarrow \mathbb{R}$ is a set of points in $\Omega \times \mathbb{R}\subseteq\mathbb{R}^{n+1}$ by $\Bigg\{\begin{bmatrix} x\\ f(x) \end{bmatrix}:x\in\Omega\Bigg\}$

Def: The epigraph of $f$ , denoted by $e p i (f)$ is a set of points: $epi(f)=\Bigg\{ \begin{bmatrix} x\\ \beta \end{bmatrix}:x\in \Omega,\beta\in\mathbb{R},f(x)\leq\beta\Bigg\}$

Def: A function $f:\Omega\rightarrow \mathbb{R},\Omega\subseteq \mathbb{R}^n$ is convex on $\Omega$ , if its epigraph is convex.

Lemma

Lem: If a function $f:\Omega\rightarrow \mathbb{R}$ is a convex on $\Omega$ , then $\Omega$ is a convex set.

Theorem

Thm: A function $f:\Omega\rightarrow \mathbb{R}$ is convex, if and only if $\forall x,y\in\Omega,\alpha\in (0,1): f(\alpha x+(1-\alpha)y)\leq \alpha f(x)+(1-\alpha)f(y)$ .

注：若把上式的小于等于号改成大于等于号，则 $f$ 是凹函数( concave function）。

Lemma

Lem: Suppose $f,f_1,f_2$ are convex. Then, $\beta f$ for $\beta\geq 0$ is convex and so is $f_1+f_2$ .

Example

$f(x)=x_1x_2,\Omega=\{x:x_1\geq 0,x_2\geq0\}$

$x=\begin{bmatrix} 1\\ 2 \end{bmatrix},y=\begin{bmatrix} 2\\ 1 \end{bmatrix}$

$\alpha x+(1-\alpha)y=\begin{bmatrix} \alpha+2(1-\alpha)\\ 2\alpha+(1-\alpha) \end{bmatrix}=\begin{bmatrix} 2-\alpha\\ 1+\alpha \end{bmatrix}$

$f(\alpha x+(1-\alpha)y)=(2-\alpha)(1+\alpha)=2+\alpha-\alpha^2$

$\alpha f(x)+(1-\alpha)f(y)=2\alpha+2(1-\alpha)=2$

$\because \forall \alpha\in (0,1),2+\alpha-\alpha^2>2$
$\therefore f$ is not a convex function

Theorem

Thm: Let $f:\Omega\rightarrow \mathbb{R}$ and $f\in C^1$ . $\Omega$ is an open convex set. Then, $f$ is convex $\Leftrightarrow \forall x,y\in \Omega: f(y)\geq f(x)+Df(x)(y-x)$ .

Theorem

$f\in C^2,\Omega:$ an open convex set.
$f$ convex $\Leftrightarrow \forall x\in\Omega:F(x)$ of $f$ at $x$ is positive semidefinite.

Example

$f(x)=-8x^2\Rightarrow F(x)--16<0$ (✕)
$f(x)=4x_1^2+3x_2^2+5x_3^2+6x_1x_2+x_1x_3-3x_1-3x_2+15$
$F(x)=\begin{bmatrix} 8&6&1\\ 6&6&0\\ 1&0&10 \end{bmatrix}$
$\Delta_1=|8|>0$
$\Delta_2=\begin{bmatrix} 8&6\\ 6&6 \end{bmatrix}>0$
$\Delta_3=\begin{bmatrix} 8&6&1\\ 6&6&0\\ 1&0&10 \end{bmatrix}=114>0$
$\Rightarrow F(x)$ positive definite
$f(x)=2x_1x_2-x_1^2-x_2^2$
$F(x)=\begin{bmatrix} -2&2\\ 2&-2 \end{bmatrix}$ (✕)

Definition

Def: strictly convex: $f(\alpha x+(1-\alpha)y)<\alpha f(x)+(1-\alpha)f(y)$

Def: (strictly) concave $\Leftrightarrow -f$ (strictly) convex

Theorem

Thm: convex optimization:
$x^*$ is global minimizer $\Leftrightarrow x^*$ is a local minimizer.

Lemma

Lem: $f :$ convex function on $\Omega$ . Then, for all $c\in\mathbb{R}, \Gamma_c=\{x\in\Omega:f(x)\in c\}$ is convex.

Corollary

$f :$ convex function on $\Omega$ . The set of all global minimizer of $f$ is convex.

Lemma

Lem: $f :$ convex function on $\Omega$ . $f\in C^1$ . If $x^*\in\Omega$ satisfies $\forall x\in\Omega,x\neq x^*:Df(x^*)(x-x^*)\geq 0$ , then $x^*$ is a global minimizer.

Theorem

Thm: $f :$ convex. $f\in C^1$
If $x^*\in \Omega$ satisfies $\forall d\in \mathbb{R}^n:d^T\nabla f(x^*)\geq 0$ , then $x^*$ is a global minimizer.

Corollary

If $x^*$ satisfies $\nabla f(x^*)=0$ , then $x^*$ global minimizer.

Theorem

Consider
min $f (x)$
s.t. $h (x) = 0$

$h\in C^1$
Assume $\Omega=\{x:h(x)=0\}$ is convex, for example $A x = b$ .
$f :$ convex function on $\Omega=\{x:h(x)=0\}$ . If $x^*\in\Omega$ and $\lambda^*\in\mathbb{R}^m$ satisfy $Df(x^*)+\lambda^*Dh(x^*)=0$ , then $x^*$ is a global minimizer.

Theorem

Consider
min $f (x)$
s.t. $h (x) = 0$
$g(x)\leq 0$

Assume: $\Omega=\{x:h(x)=0,g(x)\leq 0\}$

Thm: If $x^*\in\Omega,\lambda^*\in\mathbb{R}^m$ and $\mu^*\in\mathbb{R}^p$ satisfy
KKT $\begin{cases} \mu^*\geq 0\\ Df(x^*)+{\lambda^*}^TDh(x^*)+{\mu^*}^TDg(x^*)=0\\ {\mu^*}^Tg(x^*)=0 \end{cases}$
then $x^*$ is a global minimizer.

Example

存钱问题： $x_k$ 表示第 $k$ 月存入银行的钱，银行月利率为 $r$ ，初始银行账户为0，存入的钱总共不超过D，求怎样存钱使得 $n$ 月后账户余额最多。

max $y_n=(1+r)^nx_1+(1+r)^{n-1}x_2+(1+r)x_n$
s.t. $\sum_{i=1}^n x_i\leq D$
$x\geq 0$

$\begin{cases} \mu_1 (e^T-D)=0,\mu_1\geq 0\\ \mu_2 x=0\\ e^Tx\leq D\\ x\geq 0\\ [(1+r)^n,(1+r)^{n-1},\cdots,1]+\mu_1e-\mu_2=0 \end{cases}$

$\mu_1=(1+r)^n,\mu_2=(1+r)^ne-c$
$x_1=D,x_2=\cdots=x_n=0\Rightarrow$ global opt.

注：该问题从目标函数到限制条件全是线性函数，线性函数显然也是凸函数。于是该问题虽然是线性规划问题，但也可以用凸优化的方法来解。

总结

本文先讨论了非线性优化问题，再讨论了凸优化问题。在非线性优化问题中，介绍了FONC，SONC和SOSC。并给出了两个例子，介绍了求解非线性优化问题的思路，先通过KKT条件（FONC），求出可能的极值点，再用SONC和SOSC来验证，以此严格说明求出的点是或不是极值点。在凸优化问题部分，先介绍了凸的概念。从图的角度引入了凸函数的概念，并给出了其等价定义。最后给出了一系列定理，证明了KKT条件不仅是凸优化问题的必要条件，也是充分条件。于是，求解凸优化问题，只需要用KKT条件求解即可。