$$ \min f(x)\\ s.t. \ x\in\Omega $$
最优性条件 :变分刻画约束优化问题
一阶充分
$$ d^T\nabla f(x^*)>0,\forall d\in T_\Omega(x) $$
⇒$x^*$是严格极小点。
二阶必要条件
极小点⇒海塞矩阵对可行方向的二次型大于等于零
二阶充分条件
一阶欧拉式为零,海塞对可行方向的二次型(范数)大于零。
⇒$x^*$是严格极小点
一元可微函数 | 无约束优化 | 约束优化 | 拉格朗日条件(等式约束) | KKT 条件(不等式约束) | |
---|---|---|---|---|---|
一阶必要条件 | |||||
FONC | $f^\prime(x^*)=0$ | $\nabla f(x^*)=0$ | $\bm d^T\nabla f (\bm x^)\ge 0,\ \forall d\in T_\Omega (x^)$ |
可行方向:
可行解集$\Omega$一定可以刻画为一些等式方程组和不等式方程组的解集。
内点int(\Omega) 边界点bd(\Omega)
线性化可行方向(近似的可行方向)
$$ x\in bd(\Omega) \to \\ 0\ne d=\lim_{x\to x^\prime}T(x) $$
<aside> 👘
Convex Optimization 唯一可求解的问题
<aside> 📢
</aside>
$$ \Omega=\{x\in\mathbb F^n:h_i(x)=0,i=2\cdots m\} $$
约束可微。$\mathbf h(\mathbf x)=0$
超平面的交集构成可行域(约束集),可以用曲线是曲面的交想象之(注意区分这里想象的曲线和之后真正使用的参数化的曲线,后者只有一个变量)。
【regularity】正则→没有多余的等式约束,即每个约束至少提供了一个梯度信息。$rank \ Dh(x^)=m$等价于$x^$为正则点
正则点:满足等式约束的点,其等式约束的梯度向量是线形无关的。
曲面维数与正则点
曲面:$S=\{x\in F^n:h_{1\cdots m}(x)=0\}$,如果$S$曲面上所有点都是正则点,那么曲面的维数确定为$n-m$
切空间与法空间
【线形化可行方向全体】
切空间,等式约束的导数(梯度)做系数矩阵的齐次线形方程组的解
$$ T_{x^}M=T(x^)=\{\vec d\mid \left(D h_i(x^*)\right) \vec d=0\}\\=\mathcal N(Dh_i) $$
【切平面】切平面$\mathrm{TP}(x)$-移动到原点→切空间$\mathrm T_x\mathrm M$
$h(x)$→一阶泰勒展开
→$h(x^)+h^\prime(x^)(x-x^)$or$h(x^)+[\nabla h(x^)]^T(x-x^)$→移动到原点
→$T(x)=\{d\in F^n:[\nabla h(x^*)]^Td=0\}$得到切空间。
更一般地,$n$个等式约束
$$ T_\Omega(x)=\{d\in F^n:\begin{pmatrix} \nabla h_1(x)^T\\ \nabla h_2(x) ^T\\ \cdots \\ \nabla h_n(x)^T \end{pmatrix}d=0\}=\mathcal N(Jh(x^*)). $$
$$ TP(x^)=T(x^)+x^* $$
一阶展开的思想可以具体化为一个定理:
【法空间】等式约束的导数做矩阵变换的像,系数矩阵的行向量(梯度)张成的子空间
法空间是切空间的正交补空间。
$$ N(x^)=\mathcal R(Dh(x^)^T) $$
$$ N(x^)=\{x\mid x=Dh(x^)^T z,z\in \mathbb F^m\}=\mathcal L\left(\nabla h_i(x^*)\right) $$
齐次线性方程组$\mathbf A\mathbf x=0,\mathbf A\in \mathbb F^{m\times n}$基础解系$\text{span}(\xi_1,\xi_2,\cdots,\xi_{n-\text{rank}\mathbf A})=\mathcal N(\mathbf A)=\{x\in \mathbb F^n:Ax=0\}=\ker(\mathbf A)$核空间, 非齐次线性方程组$x^*=\eta+...=\eta +\mathcal N(\mathbf A)$齐次解构成的子空间的平移。 像空间$\mathcal R(A)=\{Ax\in \mathbb F^m:\forall x\in \mathbb F^n\}$ 值域空间与核空间垂直,互为正交补空间$\mathcal V^\perp=\{x:v^Tx=0,\forall v\in \mathcal V\}$。
??
lagrange条件极值$\lambda_i$。