高级优化理论与方法(十三)

高级优化理论与方法(十三)

  • Non-linear Constrained Optimization
    • Case 1
      • Definition
        • Example 1
        • Example 2
      • Necessary/Sufficient Conditions
      • Definition
        • Example
      • Theorem
      • FONC(Lagrange's Condition)
        • 2-Dimensional
        • Summary:
        • Lagrange's Theorem[FONC]
      • Lagrange's Function
        • Example 1
        • Example 2
        • Example 3
      • SONC
      • SOSC
        • Example 1
        • Example 2
    • Case 2
      • Definition
      • KKT-Theorem(FONC)
        • Example 1
        • Example 2
  • 总结

Non-linear Constrained Optimization

min f ( x ) f(x) f(x)
s.t. h ( x ) = 0 h(x)=0 h(x)=0
g ( x ) ≤ 0 g(x)\leq 0 g(x)0

x ∈ R n , f : R n → R , h : R n → R m , g : R n → R p x\in \mathbb{R}^n, f: \mathbb{R}^n\rightarrow \mathbb{R},h:\mathbb{R}^n\rightarrow \mathbb{R}^m,g:\mathbb{R}^n\rightarrow \mathbb{R}^p xRn,f:RnR,h:RnRm,g:RnRp

注:非线性优化问题和线性优化问题的最大区别在于目标函数是否是线性函数。

Case 1

min f ( x ) = 0 f(x)=0 f(x)=0
s.t. h ( x ) = 0 h(x)=0 h(x)=0

h : R n → R m , h ∈ C 1 h:\mathbb{R}^n\rightarrow \mathbb{R}^m,h\in C^1 h:RnRm,hC1 (continuously differential)

Definition

Def: Let x ∗ x^* x be with h 1 ( x ∗ ) = 0 , ⋯ , h m ( x ∗ ) = 0 h_1(x^*)=0,\cdots,h_m(x^*)=0 h1(x)=0,,hm(x)=0. x ∗ x^* x is a regular point, if ∇ h 1 ( x ∗ ) , ⋯ , ∇ h m ( x ∗ ) \nabla h_1(x^*),\cdots,\nabla h_m(x^*) h1(x),,hm(x) are linearly independent.

Jacobian: D h ( x ∗ ) = [ D h 1 ( x ∗ ) D h 2 ( x ∗ ) ⋯ D h m ( x ∗ ) ] T Dh(x^*)=\begin{bmatrix} Dh_1(x^*)\\ Dh_2(x^*)\\ \cdots\\ Dh_m(x^*) \end{bmatrix}^T Dh(x)= Dh1(x)Dh2(x)Dhm(x) T

Def: Surface: S = { x ∈ R n : h 1 ( x ) = 0 , ⋯ , h m ( x ) = 0 } S=\{x\in\mathbb{R}^n:h_1(x)=0,\cdots,h_m(x)=0\} S={xRn:h1(x)=0,,hm(x)=0}

Example 1

n = 3 , m = 1 , h ( x ) = x 2 − x 3 2 n=3,m=1,h(x)=x_2-x_3^2 n=3,m=1,h(x)=x2x32
D h ( x ) = [ 0 , 1 , − 2 x 3 ] Dh(x)=[0,1,-2x_3] Dh(x)=[0,1,2x3]
∀ x ∈ R 3 , D h ( x ) ≠ 0 \forall x\in\mathbb{R}^3,Dh(x)\neq 0 xR3,Dh(x)=0
S = { x : x 2 − x 3 2 = 0 } S=\{x:x_2-x_3^2=0\} S={x:x2x32=0}

Example 2

h 1 ( x ) = x 1 , h 2 ( x ) = x 2 − x 3 2 h_1(x)=x_1,h_2(x)=x_2-x_3^2 h1(x)=x1,h2(x)=x2x32

D h ( x ∗ ) = [ 1 0 0 0 1 − 2 x 3 ] Dh(x^*)=\begin{bmatrix} 1&0&0\\ 0&1&-2x_3 \end{bmatrix} Dh(x)=[100102x3]
S = { x : x 1 = 0 , x 2 − x 3 2 = 0 } S=\{x:x_1=0,x_2-x_3^2=0\} S={x:x1=0,x2x32=0}

Necessary/Sufficient Conditions

FONC: x ∗ x^* x local minimizer ⇒ ∇ f ( x ∗ ) = 0 \Rightarrow \nabla f(x^*)=0 f(x)=0
SONC: x ∗ x^* x local minimizer ⇒ ∇ f ( x ∗ ) = 0 , ∀ y : y T F ( x ∗ ) y ≥ 0 \Rightarrow \nabla f(x^*)=0,\forall y:y^T F(x^*)y\geq 0 f(x)=0,y:yTF(x)y0
SOSC: (1) ∇ f ( x ∗ ) = 0 \nabla f(x^*)=0 f(x)=0 (2) ∀ y : y T F ( x ∗ ) y ≥ 0 ⇒ x ∗ \forall y:y^T F(x^*)y\geq 0\Rightarrow x^* y:yTF(x)y0x strictly local minimizer

Definition

Def: A curve C C C on a surface S S S is a set of points { x ( t ) ∈ S : t ∈ ( a , b ) } , x ( t ) : R → R n \{x(t)\in S:t\in(a,b)\},x(t):\mathbb{R}\rightarrow \mathbb{R}^n {x(t)S:t(a,b)},x(t):RRn is a continuous function.

Curve differentiable: x ˙ ( t ) = d x d t ( t ) = [ x ˙ 1 ( t ) x ˙ 2 ( t ) ⋯ x ˙ n ( t ) ] \dot{x}(t)=\frac{dx}{dt}(t)=\begin{bmatrix} \dot{x}_1(t)\\ \dot{x}_2(t)\\ \cdots\\ \dot{x}_n(t) \end{bmatrix} x˙(t)=dtdx(t)= x˙1(t)x˙2(t)x˙n(t) exists for all t ∈ ( a , b ) t\in (a,b) t(a,b)
x ¨ ( t ) = d 2 x d t 2 ( t ) = [ x ¨ 1 ( t ) x ¨ 2 ( t ) ⋯ x ¨ n ( t ) ] \ddot{x}(t)=\frac{d^2x}{dt^2}(t)=\begin{bmatrix} \ddot{x}_1(t)\\ \ddot{x}_2(t)\\ \cdots\\ \ddot{x}_n(t) \end{bmatrix} x¨(t)=dt2d2x(t)= x¨1(t)x¨2(t)x¨n(t) exists for all t ∈ ( a , b ) t\in (a,b) t(a,b)

Def: tangent space at x ∗ ∈ S = { x ∈ R n : h ( x ) = 0 } x^*\in S=\{x\in\mathbb{R}^n:h(x)=0\} xS={xRn:h(x)=0} is the set T ( x ∗ ) = { y : D h ( x ∗ ) y = 0 } T(x^*)=\{y:Dh(x^*)y=0\} T(x)={y:Dh(x)y=0}

Example

S = { x ∈ R 3 : h 1 ( x ) = x 1 = 0 , h 2 ( x ) = x 1 − x 2 = 0 } S=\{x\in \mathbb{R}^3: h_1(x)=x_1=0,h_2(x)=x_1-x_2=0\} S={xR3:h1(x)=x1=0,h2(x)=x1x2=0}

D h ( x ∗ ) = [ 1 0 0 1 − 1 0 ] Dh(x^*)=\begin{bmatrix} 1&0&0\\ 1&-1&0 \end{bmatrix} Dh(x)=[110100]
S S S regular points
T ( x ) = { y : ∇ h 1 ( x ) T y = 0 , ∇ h 2 ( x ) T y = 0 } = { [ 0 , 0 , α ] : α ∈ R } ⇒ x 3 T(x)=\{y:\nabla h_1(x)^Ty=0,\nabla h_2(x)^Ty=0\}=\{[0,0,\alpha]:\alpha\in\mathbb{R}\}\Rightarrow x_3 T(x)={y:h1(x)Ty=0,h2(x)Ty=0}={[0,0,α]:αR}x3-axis

Theorem

Thm: Let x ∗ x^* x be a regular point. T ( x ∗ ) T(x^*) T(x): tangent space at x ∗ x^* x. Then: y ∈ T ( x ∗ ) ⇔ ∃ y\in T(x^*)\Leftrightarrow \exist yT(x) differentiable curve on S S S passing through x ∗ x^* x with derivative y y y at x ∗ x^* x.

FONC(Lagrange’s Condition)

2-Dimensional

h : R 3 → R h: \mathbb{R}^3\rightarrow \mathbb{R} h:R3R
Let x ∗ = [ x 1 ∗ , x 2 ∗ ] T , h ( x ∗ ) = 0 x^*=[x_1^*,x_2^*]^T, h(x^*)=0 x=[x1,x2]T,h(x)=0
Assume ∇ h ( x ∗ ) ≠ 0 \nabla h(x^*)\neq 0 h(x)=0
Let x ( t ) : R → R 2 , x ( t ) x(t):\mathbb{R} \rightarrow \mathbb{R}^2,x(t) x(t):RR2,x(t) continuously differentiable.
x ( t ) = [ x 1 ( t ) x 2 ( t ) ] , t ∈ ( a , b ) , x ∗ = x ( t ∗ ) x(t)=\begin{bmatrix} x_1(t)\\ x_2(t) \end{bmatrix},t\in(a,b),x^*=x(t^*) x(t)=[x1(t)x2(t)],t(a,b),x=x(t)
∵ ∀ t ∈ ( a , b ) : h ( x ( t ) ) = 0 \because \forall t\in (a,b): h(x(t))=0 t(a,b):h(x(t))=0
∴ ∀ t : d d t h ( x ( t ) ) = 0 \therefore \forall t: \frac{d}{dt}h(x(t))=0 t:dtdh(x(t))=0
∴ ∇ h ( x ∗ ) \therefore \nabla h(x^*) h(x) orthogonal to x ( t ∗ ) x(t^*) x(t)

Assume x ∗ = x ( t ∗ ) x^*=x(t^*) x=x(t) minimizer of f ( x ) f(x) f(x) on S = { x : h ( x ) = 0 } S=\{x:h(x)=0\} S={x:h(x)=0}

Define ϕ ( t ) = f ( x ( t ) ) ⇒ F O N C d ϕ d t ( t ∗ ) = 0 \phi(t)=f(x(t))\stackrel{FONC}{\Rightarrow} \frac{d\phi}{dt}(t^*)=0 ϕ(t)=f(x(t))FONCdtdϕ(t)=0
0 = d d t ϕ ( t ∗ ) = ∇ f ( x ( t ∗ ) ) T x ˙ ( t ∗ ) = ∇ f ( x ∗ ) T x ˙ ( t ∗ ) 0=\frac{d}{dt}\phi(t^*)=\nabla f(x(t^*))^T\dot{x}(t^*)=\nabla f(x^*)^T\dot{x}(t^*) 0=dtdϕ(t)=f(x(t))Tx˙(t)=f(x)Tx˙(t)
⇒ ∇ f ( x ∗ ) \Rightarrow \nabla f(x^*) f(x) is orthogonal to x ˙ ( t ∗ ) \dot{x}(t^*) x˙(t)
∇ f ( x ∗ ) = λ ∇ h ( x ∗ ) \nabla f(x^*)=\lambda \nabla h(x^*) f(x)=λh(x)

Summary:

x ∗ x^* x is a minimizer of f : R 2 → R f:\mathbb{R}^2\rightarrow \mathbb{R} f:R2R with h ( x ) = 0 , h : R 2 → R h(x)=0,h:\mathbb{R}^2\rightarrow \mathbb{R} h(x)=0,h:R2R. Then, ∇ h ( x ∗ ) \nabla h(x^*) h(x) and ∇ f ( x ∗ ) \nabla f(x^*) f(x) are parallel.
⇒ \Rightarrow If ∇ h ( x ∗ ) ≠ 0 \nabla h(x^*)\neq 0 h(x)=0, then ∃ λ ∗ \exist \lambda^* λ s.t. ∇ f ( x ∗ ) + λ ∗ ∇ h ( x ∗ ) = 0 \nabla f(x^*)+\lambda^*\nabla h(x^*)=0 f(x)+λh(x)=0

Lagrange’s Theorem[FONC]

x ∗ x^* x is a local minimizer of f : R n → R f:\mathbb{R}^n\rightarrow\mathbb{R} f:RnR, subject to h ( x ) = 0 , h : R n → R m , m ≤ n h(x)=0, h:\mathbb{R}^n\rightarrow\mathbb{R}^m,m\leq n h(x)=0,h:RnRm,mn. Assume x ∗ x^* x is regular. Then ∃ x ∗ ∈ R m \exist x^*\in \mathbb{R}^m xRm s.t. D f ( x ∗ ) + λ ∗ T D h ( x ∗ ) = 0 Df(x^*)+{\lambda^*}^TDh(x^*)=0 Df(x)+λTDh(x)=0

Lagrange’s Function

Lagrange’s function: l : R n × R m → R l:\mathbb{R}^n\times\mathbb{R}^m\rightarrow \mathbb{R} l:Rn×RmR
l ( x , λ ) = f ( x ) + λ T h ( x ) l(x,\lambda)=f(x)+\lambda^Th(x) l(x,λ)=f(x)+λTh(x)

min l ( x , λ ) ⇐ l(x,\lambda)\Leftarrow l(x,λ) FONC
D l ( x ∗ , λ ∗ ) = 0 ⇒ { D x l ( x ∗ , λ ∗ ) = 0 D λ l ( x ∗ , λ ∗ ) = 0 Dl(x^*,\lambda^*)=0\Rightarrow \begin{cases} D_xl(x^*,\lambda^*)=0\\ D_{\lambda}l(x^*,\lambda^*)=0 \end{cases} Dl(x,λ)=0{Dxl(x,λ)=0Dλl(x,λ)=0

Example 1

已知长方体的表面积为 A A A,求体积的最大值。
max x 1 x 2 x 3 x_1x_2x_3 x1x2x3
s.t. x 1 x 2 + x 2 x 3 + x 1 x 3 = A 2 ( A > 0 ) x_1x_2+x_2x_3+x_1x_3=\frac{A}{2}(A>0) x1x2+x2x3+x1x3=2A(A>0)
f ( x ) = − x 1 x 2 x 3 , h ( x ) = x 1 x 2 + x 2 x 3 + x 1 x 3 − A 2 f(x)=-x_1x_2x_3,h(x)=x_1x_2+x_2x_3+x_1x_3-\frac{A}{2} f(x)=x1x2x3,h(x)=x1x2+x2x3+x1x32A
∇ f ( x ) = [ − x 2 x 3 , − x 1 x 3 , − x 1 x 2 ] T \nabla f(x)=[-x_2x_3,-x_1x_3,-x_1x_2]^T f(x)=[x2x3,x1x3,x1x2]T
∇ h ( x ) = [ x 2 + x 3 , x 1 + x 3 , x 1 + x 2 ] T \nabla h(x)=[x_2+x_3,x_1+x_3,x_1+x_2]^T h(x)=[x2+x3,x1+x3,x1+x2]T
All feasible solutions are regular.
λ ∈ R \lambda\in\mathbb{R} λR
{ ∇ f ( x ) + λ ∇ h ( x ) = 0 h ( x ) = 0 ⇒ { x 2 x 3 − λ ( x 2 + x 3 ) = 0 x 1 x 3 − λ ( x 1 + x 3 ) = 0 x 1 x 2 − λ ( x 1 + x 2 ) = 0 x 1 x 2 + x 2 x 3 + x 1 x 3 − A 2 = 0 \begin{cases} \nabla f(x)+\lambda \nabla h(x)=0\\ h(x)=0 \end{cases}\Rightarrow \begin{cases} x_2x_3-\lambda(x_2+x_3)=0\\ x_1x_3-\lambda(x_1+x_3)=0\\ x_1x_2-\lambda(x_1+x_2)=0\\ x_1x_2+x_2x_3+x_1x_3-\frac{A}{2}=0 \end{cases} {f(x)+λh(x)=0h(x)=0 x2x3λ(x2+x3)=0x1x3λ(x1+x3)=0x1x2λ(x1+x2)=0x1x2+x2x3+x1x32A=0

x 1 = x 2 = x 3 = A 6 x_1=x_2=x_3=\sqrt{\frac{A}{6}} x1=x2=x3=6A 时,取到最值

Example 2

f ( x ) = x 1 2 + x 2 2 , h ( x ) = x 1 2 + 2 x 2 2 − 1 f(x)=x_1^2+x_2^2,h(x)=x_1^2+2x_2^2-1 f(x)=x12+x22,h(x)=x12+2x221
∇ f ( x ) = [ 2 x 1 2 x 2 ] , ∇ h ( x ) = [ 2 x 1 4 x 2 ] \nabla f(x)=\begin{bmatrix} 2x_1\\ 2x_2 \end{bmatrix},\nabla h(x)=\begin{bmatrix} 2x_1\\ 4x_2 \end{bmatrix} f(x)=[2x12x2],h(x)=[2x14x2]
All feasible solutions are regular.
{ ∇ f ( x ) + λ ∇ h ( x ) = 0 h ( x ) = 0 ⇒ { 2 x 1 + 2 λ x 1 = 0 2 x 2 + 4 λ x 2 = 0 x 1 2 + 2 x 2 2 = 1 \begin{cases} \nabla f(x)+\lambda \nabla h(x)=0\\ h(x)=0 \end{cases}\Rightarrow \begin{cases} 2x_1+2\lambda x_1=0\\ 2x_2+4\lambda x_2=0\\ x_1^2+2x_2^2=1 \end{cases} {f(x)+λh(x)=0h(x)=0 2x1+2λx1=02x2+4λx2=0x12+2x22=1

either x 1 = 0 x_1=0 x1=0 or λ = − 1 \lambda=-1 λ=1

λ = − 1 ⇒ { x 1 = ± 1 x 2 = 0 \lambda=-1\Rightarrow\begin{cases} x_1=\pm 1\\ x_2=0 \end{cases} λ=1{x1=±1x2=0

x 1 = 0 ⇒ { λ = − 1 2 x 2 = ± 1 2 x_1=0\Rightarrow\begin{cases} \lambda=-\frac{1}{2}\\ x_2=\pm \frac{1}{\sqrt{2}} \end{cases} x1=0{λ=21x2=±2 1

f ( [ 1 0 ] ) = f ( [ − 1 0 ] ) = 1 f(\begin{bmatrix} 1\\ 0 \end{bmatrix})=f(\begin{bmatrix} -1\\ 0 \end{bmatrix})=1 f([10])=f([10])=1

f ( [ 0 1 2 ] ) = f ( [ 0 − 1 2 ] ) = 1 2 f(\begin{bmatrix} 0\\ \frac{1}{\sqrt{2}} \end{bmatrix})=f(\begin{bmatrix} 0\\ -\frac{1}{\sqrt{2}} \end{bmatrix})=\frac{1}{2} f([02 1])=f([02 1])=21

x 1 = 0 , x 2 = ± 1 2 x_1=0,x_2=\pm \frac{1}{\sqrt{2}} x1=0,x2=±2 1时,取到最小值 1 2 \frac{1}{2} 21

Example 3

min − x T Q x -x^TQx xTQx
s.t. x T P x = 1 x^TPx=1 xTPx=1
P , Q > 0 , P T = P , Q T = Q P,Q>0,P^T=P,Q^T=Q P,Q>0,PT=P,QT=Q

f ( x ) = − x T Q x , h ( x ) = x T P x − 1 f(x)=-x^TQx,h(x)=x^TPx-1 f(x)=xTQx,h(x)=xTPx1
l ( x , λ ) = x T Q x + λ ( 1 − x T P x ) l(x,\lambda)=x^TQx+\lambda(1-x^TPx) l(x,λ)=xTQx+λ(1xTPx)
D x l ( x , λ ) = 2 x T Q − 2 λ x T P = 0 ⇒ ( λ P − Q ) x = 0 ⇒ P − 1 Q x = λ x ⇒ λ , x D_xl(x,\lambda)=2x^TQ-2\lambda x^TP=0\Rightarrow (\lambda P-Q)x=0\Rightarrow P^{-1}Qx=\lambda x\Rightarrow \lambda,x Dxl(x,λ)=2xTQ2λxTP=0(λPQ)x=0P1Qx=λxλ,x are P − 1 Q P^{-1}Q P1Q’s eigenvalue and eigenvector
D λ l ( x , λ ) = 1 − x T P x = 0 D_{\lambda}l(x,\lambda)=1-x^TPx=0 Dλl(x,λ)=1xTPx=0

Q x = P λ x Qx=P\lambda x Qx=Pλx
⇒ x T Q x = λ x T P x \Rightarrow x^TQx=\lambda x^TPx xTQx=λxTPx
⇒ x T Q x = λ \Rightarrow x^TQx=\lambda xTQx=λ
⇒ λ ∗ : \Rightarrow \lambda^*: λ: maximal eigenvalue of P − 1 Q P^{-1}Q P1Q

SONC

Assume f : R n → R , h : R n → R m f:\mathbb{R}^n\rightarrow \mathbb{R},h:\mathbb{R}^n\rightarrow \mathbb{R}^m f:RnR,h:RnRm twice continuously differentiable.
l ( x , λ ) = f ( x ) + λ T h ( x ) = f ( x ) + λ 1 h 1 ( x ) + ⋯ + λ m h m ( x ) l(x,\lambda)=f(x)+\lambda^Th(x)=f(x)+\lambda_1h_1(x)+\cdots+\lambda_mh_m(x) l(x,λ)=f(x)+λTh(x)=f(x)+λ1h1(x)++λmhm(x)
L ( x , λ ) = F ( x ) + λ 1 H 1 ( x ) + ⋯ + λ m H m ( x ) L(x,\lambda)=F(x)+\lambda_1H_1(x)+\cdots+\lambda_mH_m(x) L(x,λ)=F(x)+λ1H1(x)++λmHm(x)

Thm(SONC): x ∗ x^* x a local minimizer of f : R n → R f:\mathbb{R}^n\rightarrow \mathbb{R} f:RnR with h ( x ) = 0 , h : R n → R m , m ≤ n , f , h ∈ C 2 h(x)=0,h:\mathbb{R}^n\rightarrow \mathbb{R}^m,m\leq n,f,h\in C^2 h(x)=0,h:RnRm,mn,f,hC2. Then, ∃ λ ∗ ∈ R m \exist \lambda^*\in \mathbb{R}^m λRm, s.t. { D f ( x ∗ ) + λ ∗ T D h ( x ∗ ) = 0 ∀ y ∈ T ( x ∗ ) = { y : D h ( x ∗ ) y = 0 } : y T L ( x ∗ , λ ∗ ) y ≥ 0 \begin{cases} Df(x^*)+{\lambda^*}^TDh(x^*)=0\\ \forall y\in T(x^*)=\{y:Dh(x^*)y=0\}:y^TL(x^*,\lambda^*)y\geq 0 \end{cases} {Df(x)+λTDh(x)=0yT(x)={y:Dh(x)y=0}:yTL(x,λ)y0

SOSC

f , h ∈ C 2 f,h\in C^2 f,hC2, If ∃ x ∗ ∈ R n , λ ∗ ∈ R m \exist x^*\in\mathbb{R}^n,\lambda^*\in \mathbb{R}^m xRn,λRm, s.t.

  1. D f ( x ∗ ) + λ ∗ T D h ( x ∗ ) = 0 Df(x^*)+{\lambda^*}^TDh(x^*)=0 Df(x)+λTDh(x)=0
  2. ∀ y ∈ T ( x ∗ ) : y T L ( x ∗ , λ ∗ ) y > 0 \forall y\in T(x^*):y^TL(x^*,\lambda^*)y>0 yT(x):yTL(x,λ)y>0

then x ∗ x^* x is a strict local minimizer of f ( x ) f(x) f(x) w.r.t. h ( x ) = 0 h(x)=0 h(x)=0

Example 1

max x T Q x x^TQx xTQx
s.t. x T P x = 1 x^TPx=1 xTPx=1

Q = [ 4 0 0 1 ] , P = [ 2 0 0 1 ] Q=\begin{bmatrix} 4&0\\ 0&1 \end{bmatrix},P=\begin{bmatrix} 2&0\\ 0&1 \end{bmatrix} Q=[4001],P=[2001]

P − 1 Q = [ 2 0 0 1 ] P^{-1}Q=\begin{bmatrix} 2&0\\ 0&1 \end{bmatrix} P1Q=[2001]
⇒ λ 1 = 2 , λ 2 = 1 \Rightarrow \lambda_1=2,\lambda_2=1 λ1=2,λ2=1
⇒ λ ∗ = 2 \Rightarrow \lambda^*=2 λ=2
⇒ x ∗ = [ 1 2 , 0 ] T \Rightarrow x^*=[\frac{1}{\sqrt{2}},0]^T x=[2 1,0]T or x ∗ = [ − 1 2 , 0 ] T x^*=[-\frac{1}{\sqrt{2}},0]^T x=[2 1,0]T

Example 2

Consider min 1 2 x T Q x \frac{1}{2}x^TQx 21xTQx
s.t. A x = b Ax=b Ax=b

Q > 0 , Q = Q T , A ∈ R m × n , m ≤ n , b ∈ R m , r a n k A = m Q>0,Q=Q^T,A\in\mathbb{R}^{m\times n},m\leq n, b\in\mathbb{R}^m,rankA=m Q>0,Q=QT,ARm×n,mn,bRm,rankA=m

l ( x , λ ) = 1 2 x T Q x + λ T ( b − A x ) l(x,\lambda)=\frac{1}{2}x^TQx+\lambda^T(b-Ax) l(x,λ)=21xTQx+λT(bAx)
D x l ( x , λ ) = x T Q − λ T A = 0 D_xl(x,\lambda)=x^TQ-\lambda^TA=0 Dxl(x,λ)=xTQλTA=0
⇒ x = Q − 1 A T λ \Rightarrow x=Q^{-1}A^T\lambda x=Q1ATλ
⇒ A x = A Q − 1 A T λ \Rightarrow Ax=AQ^{-1}A^T\lambda Ax=AQ1ATλ
⇒ λ = ( A Q − 1 A T ) − 1 b \Rightarrow \lambda=(AQ^{-1}A^T)^{-1}b λ=(AQ1AT)1b
⇒ x = Q − 1 A T ( A Q − 1 A T ) − 1 b \Rightarrow x=Q^{-1}A^T(AQ^{-1}A^T)^{-1}b x=Q1AT(AQ1AT)1b

L ( x , λ ) = Q > 0 L(x,\lambda)=Q>0 L(x,λ)=Q>0

Case 2

min f ( x ) f(x) f(x)
s.t. h ( x ) = 0 h(x)=0 h(x)=0
g ( x ) ≤ 0 g(x)\leq 0 g(x)0

f : R n → R f:\mathbb{R}^n\rightarrow \mathbb{R} f:RnR
h : R n → R m , m ≤ n h:\mathbb{R}^n\rightarrow \mathbb{R}^m,m\leq n h:RnRm,mn
g : R n → R p g:\mathbb{R}^n\rightarrow \mathbb{R}^p g:RnRp

Definition

Def: An inequality constraint g j ( x ) ≤ 0 g_j(x)\leq 0 gj(x)0 is called active at x ∗ x^* x, if g j ( x ∗ ) = 0 g_j(x^*)=0 gj(x)=0; otherwise, inactive.

Def: Let x ∗ x^* x satisfy h ( x ∗ ) = 0 h(x^*)=0 h(x)=0 and g ( x ∗ ) ≤ 0 g(x^*)\leq 0 g(x)0. Let J ( x ∗ ) = { j : g j ( x ∗ ) = 0 } , x ∗ J(x^*)=\{j: g_j(x^*)=0\},x^* J(x)={j:gj(x)=0},x is called regular, if ∇ h i ( x ∗ ) \nabla h_i(x^*) hi(x) for all 1 ≤ i ≤ m 1\leq i\leq m 1im and ∇ g i ( x ∗ ) \nabla g_i(x^*) gi(x) for all j ∈ J ( x ∗ ) j\in J(x^*) jJ(x) are linear independent.

KKT-Theorem(FONC)

Let f , h , g ∈ C 1 , x ∗ f,h,g\in C^1, x^* f,h,gC1,x be a regular point and a local minimizer of f ( x ) f(x) f(x) w.r.t. h ( x ∗ ) = 0 h(x^*)=0 h(x)=0 and g ( x ∗ ) ≤ 0 g(x^*)\leq 0 g(x)0. Then, there exist λ ∗ ∈ R m \lambda^*\in\mathbb{R}^m λRm and μ ∗ ∈ R p \mu^*\in\mathbb{R}^p μRp s.t.

  1. μ ∗ ≥ 0 \mu^*\geq 0 μ0
  2. D f ( x ∗ ) + λ ∗ T D h ( x ∗ ) + μ ∗ T D g ( x ∗ ) = 0 Df(x^*)+{\lambda^*}^TDh(x^*)+{\mu^*}^TDg(x^*)=0 Df(x)+λTDh(x)+μTDg(x)=0
  3. μ ∗ T g ( x ∗ ) = 0 {\mu^*}^Tg(x^*)=0 μTg(x)=0
Example 1

min − 400 R ( 10 + R ) 2 -\frac{400R}{(10+R)^2} (10+R)2400R
s.t. − R ≤ 0 -R\leq 0 R0

∇ f ( R ) = − 400 ( 10 − R ) ( 10 + R ) 3 \nabla f(R)=-\frac{400(10-R)}{(10+R)^3} f(R)=(10+R)3400(10R)

{ μ ≥ 0 D f ( x ∗ ) + λ ∗ T D h ( x ∗ ) + μ ∗ T D g ( x ∗ ) = 0 μ T g ( x ) = 0 g ( x ) ≤ 0 h ( x ) = 0 \begin{cases} \mu\geq 0\\ Df(x^*)+{\lambda^*}^TDh(x^*)+{\mu^*}^TDg(x^*)=0\\ \mu^T g(x)=0\\ g(x)\leq 0\\ h(x)=0 \end{cases} μ0Df(x)+λTDh(x)+μTDg(x)=0μTg(x)=0g(x)0h(x)=0

⇒ { μ ≥ 0 − 400 ( 10 − R ) ( 10 + R ) 3 − μ = 0 μ R = 0 R ≥ 0 \Rightarrow \begin{cases} \mu\geq 0\\ -\frac{400(10-R)}{(10+R)^3}-\mu=0\\ \mu R=0\\ R\geq 0 \end{cases} μ0(10+R)3400(10R)μ=0μR=0R0

If μ > 0 \mu>0 μ>0, then R = 0 , μ = − 4 R=0,\mu=-4 R=0,μ=4(✕)
If μ = 0 ⇒ R = 10 \mu=0\Rightarrow R=10 μ=0R=10(✓ )

Example 2

min − 4000 ( 10 + R ) 2 -\frac{4000}{(10+R)^2} (10+R)24000
s.t. − R < 0 -R<0 R<0

∇ f ( R ) = 8000 ( 10 + R ) 3 \nabla f(R)=\frac{8000}{(10+R)^3} f(R)=(10+R)38000

KKT: { μ ≥ 0 8000 ( 10 + R ) 3 − μ = 0 μ R = 0 R ≥ 0 \begin{cases} \mu\geq 0\\ \frac{8000}{(10+R)^3}-\mu=0\\ \mu R=0\\ R\geq 0 \end{cases} μ0(10+R)38000μ=0μR=0R0

μ = 0 ⇒ \mu=0\Rightarrow μ=0 no solution(✕)
μ > 0 ⇒ R = 0 , μ = 8 \mu>0\Rightarrow R=0,\mu=8 μ>0R=0,μ=8(✓ )

总结

这节课主要介绍了非线性约束优化问题。按照不同的约束条件,把问题分为了两种情形。第一种情形是只有等式约束,第二种情形既有等式约束又有不等式约束。在第一种情形下,重点介绍了拉格朗日条件,并在二维情况下推导出了拉格朗日条件。由于拉格朗日条件是一阶必要条件(FONC),又进一步介绍了用拉格朗日条件来求最值的拉格朗日乘数法。然后简要地介绍了二阶必要条件(SONC)和二阶充分条件(SOSC)。最后考虑了第二种情形,并给出了KKT条件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/842106.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于flask的错误:ImportError: cannot import name ‘Flask

学习flask框架的时候报错ImportError: cannot import name ‘Flask’ 可尝试如下两种方法解决&#xff1a; 方法一&#xff1a;若没安装过flask&#xff0c;则进入cmd&#xff0c;输入pip install flask 方法二&#xff1a;若安装过flask&#xff0c;则看文件名是否是flask …

精通C++ STL(二):string类的模拟实现

目录 string类各函数接口总览 默认成员函数 构造函数 拷贝构造函数 赋值运算符重载函数 析构函数 迭代器相关函数 begin和end 容量和大小相关函数 size和capacity reserve和resize empty 修改字符串相关函数 push_back append operator insert erase clear swap c_str 访…

跨平台之用VisualStudio开发APK嵌入OpenCV(一)

序 本篇是杂谈以及准备工作&#xff08;此处应无掌声&#xff09; 暂时不管iOS&#xff08;因为开发hello world都要年费&#xff09; 软件&#xff1a; Visual Studio 2019&#xff08;含Android SDK和NDK编译器等&#xff09; OpenCV 这是一个女仆级的系列文章&#xf…

探索数据结构:单链表的实践和应用

&#x1f511;&#x1f511;博客主页&#xff1a;阿客不是客 &#x1f353;&#x1f353;系列专栏&#xff1a;渐入佳境之数据结构与算法 欢迎来到泊舟小课堂 &#x1f618;博客制作不易欢迎各位&#x1f44d;点赞⭐收藏➕关注 ​ 一、前言 前面我们学习了数据结构中的顺序表&…

扭蛋机小程序开发,数字化发展对行业带来的优势

随着科技的不断进步和大众对娱乐消费需求的提高&#xff0c;线上扭蛋机得到了快速发展&#xff0c;市场规模不断扩大。线上扭蛋机是基于淘宝的小程序&#xff0c;它以电商的模式让消费者进行虚拟扭蛋&#xff0c;获得各类商品&#xff0c;扭蛋机小程序中的商品包括玩具、IP周边…

线段(线性dp)

题目链接&#xff1a;[TJOI2007] 线段 - 洛谷 思路&#xff1a; f[i][0]表示走完第i行且停在第i行的左端点最少用的步数 f[i][1]同理&#xff0c;停在右端点的最少步数。 那么转移就很简单了&#xff0c;走完当前行且停到左端点&#xff0c;那么一定是从右端点过来的&#x…

Spring是怎么处理循环依赖的

Spring框架处理循环依赖主要依赖于其容器的设计和几个关键的缓存机制&#xff0c;这里所说的“三级缓存”是一个广为流传的概念&#xff0c;用于简化描述Spring处理循环依赖的过程。实际上&#xff0c;Spring处理循环依赖的核心策略可以概括为以下几个步骤&#xff0c;主要针对…

算法课程笔记——高斯消元

算法课程笔记——高斯消元 先乘后除&#xff0c;精度 #include<bist/stdc.h>usingnamespacestd; #definemaxn 2800intn,m,x,ans; bitset<N>a[N]; voidgauss(){ intcnt0; for(inti1;i<n;i){ intmaxxcnt1; for(intji1;j<n;j){ …

2024年上半年软件系统架构师考试【回忆版】

文章目录 考试时间考试地点综合知识案例分析1、微服务架构的优点和缺点2、质量属性的6个要素3、分布式锁 Redis的缺点4、MongoDB 存储矢量图的优势 论文回忆版论文一、论单元测试的设计与应用论文二、论大数据模型的设计与应用论文三、论模型驱动的架构设计及应用论文四、论云自…

Android端 可使用Yolov5训练 路标识别

相信大家对于路标识别&#xff0c;红绿灯识别&#xff0c;图形识别opencv中也是一件烦人的事情&#xff0c;其参数是及其受到现实环境因素的影响的&#xff0c;那么今天我就给大家推荐一种方式&#xff0c;缺点是周期长&#xff0c;但其优点是如果训练效果好久对于环境的各种变…

django在线考试系统-计算机毕业设计源码78268

摘 要 本论文主要论述了如何使用python语言、Django框架开发一个在线考试系统&#xff0c;本系统将严格按照软件开发流程&#xff0c;进行各个阶段的工作&#xff0c;面向对象编程思想进行项目开发。在引言中&#xff0c;作者将论述该系统的当前背景以及系统开发的目的&#xf…

阿里云产品DTU评测报告(三)

这阿里云产品DTU评测报告&#xff08;三&#xff09; 连接物联网平台创建项目 连接物联网平台 在开始连接物联网平台之前&#xff0c;首先需要下载开发工具Visual Studio Code 开发工具&#xff0c;开发工具可以到https://code.visualstudio.com/ 去查找下载&#xff0c;下载完…

安泰电子:功率放大器的选择方法有哪些

选择适合的功率放大器是实现电子系统中的关键步骤之一。以下是一些选择功率放大器的常用方法和考虑因素&#xff1a; 功率需求&#xff1a;首先确定你的系统需要多大的功率输出。功率输出需求通常由被驱动设备的功率要求决定。计算出所需功率后&#xff0c;选择一个具有适当功率…

查询linux下目录的大小

要找出 abc 目录中占用空间最大的子目录&#xff0c;你可以使用 du 命令来递归地查看每个子目录的大小&#xff0c;然后排序以找到最大的一个。下面是具体的步骤&#xff1a; du -h --max-depth1 /usr/local/abc | sort -rh让我解释一下这个命令&#xff1a; 1.du -h --max-d…

GaussDB数据库的备份与恢复

1.逻辑备份-gs_dump gs_dump是一款用于导出数据库相关信息的工具&#xff0c;支持导出完整一致的数据库对象&#xff08;数据库、模式、表、视图等&#xff09;数据&#xff0c;同时不影响用户对数据库的正常访问。 备份sql语句 gs_dump是openGauss用于导出数据库相关信息的工…

Java I/O 序列化:详述Java的I/O流模型,File类用法,以及Java序列化机制

1. Java I/O Java I/O概述: Java的I/O系统非常强大和灵活,它的设计模式基于装饰器模式。主要包括:字节流(InputStream / OutputStream)、字符流(Reader / Writer)、缓冲流(Buffered)、对象流(Object I/O)以及数据流(Data I/O)。它们都在java.io包下。 字节流和…

Redis使用Set实现点赞功能

文章目录 set 数据类型介绍不排序实现排序实现 set 数据类型介绍 Redis中的set类型是一组无序的字符串值。 set通过其独特的数据结构和丰富的命令提供了在存储和处理集合元素方面的一些非常有用的功能。下面列出了主要的set类型命令&#xff1a; SADD key member1 [member2]&a…

不可错过的数据存储指南:JVS物联网平台存储策略详解

在物联网时代&#xff0c;数据的采集、存储和分析成为了关键环节。随着设备点位不断生成大量数据&#xff0c;如何高效地管理和保存这些数据&#xff0c;同时考虑存储成本和后续的数据分析价值&#xff0c;成为了亟待解决的问题。JVS物联网平台提供了灵活多样的存储策略&#x…

【BI 可视化插件】怎么做? 手把手教你实现

背景 对于现在的用户来说&#xff0c;插件已经成为一个熟悉的概念。无论是在使用软件、 IDE 还是浏览器时&#xff0c;插件都是为了在原有产品基础上提供更多更便利的操作。在 BI 领域&#xff0c;图表的丰富性和对接各种场景的自定义是最吸引人的特点。虽然市面上现有的 BI 软…

常见web安全漏洞

一、信息泄露 概念 信息泄露是由于Web服务器或应用程序没有正确处理一些特殊请求&#xff0c;泄露Web服务器的一些敏感信 息&#xff0c;如用户名、密码、源代码、服务器信息、配置信息等。 造成信息泄露主要的三个原因: ①Web服务器配置存在问题&#xff0c;导致一些系统…