<aside> 🧸 凸优化问题有多项式解法。
凸优化问题的最优性条件总可以写为等价条件。[【Convex Optimization 】【充分条件】 凸优化总有稳定点是全局极值点,是KKT系统的解,是拉格朗日函数的鞍点](https://hazysite.notion.site/KKT-13ed969b881f809c83f1ebe6ded223fc) 【定理】凸优化的局部极小点就是全局极小点,两者等价。 (必要性)全局极小一定局部极小 (充分性)反证,若存在全局极小比局部极小更小,两点凸组合的函数值小于函数值的凸组合,函数值的凸组合小于局部极小不组合;小量凸组合也是凸组合,进而局部极小条件矛盾。
约束优化问题的难点在于判断问题是否是凸优化问题:是则易否则找特例。
</aside>
【凸分析】
<aside> 🏛️
凸的定义:函数中,空间中,集合中
</aside>
【graph图】:函数图像,曲线,曲面可以看成空间点集合。
$$ gph (f)=\left\{\begin{pmatrix}\bm x\\\beta\end{pmatrix}\subset\mathbb R^{n+1}\mid \beta= f(\bm x),\bm x\in \Omega\right\}. $$
【epigraph上图】:函数的上方的点的集合
$$ epi(f)=\left\{\begin{pmatrix}\bm x\\\beta\end{pmatrix}\subset\mathbb R^{n+1}\mid \beta\ge f(\bm x),\bm x\in \Omega\right\}. $$
【凸函数第一定义】函数的上图是凸集
【凸函数第二定义】
【Jensen不等式】
自变量的凸组合不大于函数值的凸组合
$$ f\left(\alpha \bm x+(1-\alpha)\bm y\right)\le\alpha f(\bm x)+(1-\alpha)f(\bm x). $$
$$ \sum _i p_if(\bm x_i)\ge f(\sum_i p_i\bm x_i) $$
【凸组合】 $\sum_i\alpha_ix_i,\sum_i\alpha_i=1.$
【KL距离 https://en.wikipedia.org/wiki/Kullback–Leibler_divergence】【相对熵】衡量随机事件的距离的唯一方法
【严格凸函数】
取严格不等号
【强凸函数】
$$ f(\alpha\bm x+(1-\alpha)\bm y)\le \alpha f(\bm x)+(1-\alpha)f(\bm y)-\frac{\alpha(1-\alpha)c}2\lVert\bm x-\bm y\lVert^2 $$
【可微凸函数】
【不可微函数】一阶次梯度展开https://en.wikipedia.org/wiki/Subderivative
$$ g\in\mathbb R^n $$
【一阶充要条件】 【可微凸函数】定义在开凸集上的函数满足任意点函数图像被切平面(大于一阶泰勒展开)支撑,则函数为凸函数
$$ f(y)\ge f(x)+Df(x)(y-x) $$
【不可微函数】
$$ f(y)\ge f(x)+g^T\mid_x(y-x) $$
【二阶充要条件】海塞矩阵半正定,则为凸函数
$$ f\in\mathcal C^3 $$
【保凸运算operations yielding convexity 】
$$ \sum _{j=1}^mt_jf_j $$
取sup最小上界
$$ \sup {j\in J} f_j\\ \cap{j\in J} epi \ f_j $$
$$ g\circ A $$
膨胀函数
$$ ug(x/u). $$
卷积,最小卷积Min Convolution
随约束条件变换的最优解的函数,定义为Ag function。他也是保凸变换
$$ Ag\\ epiger. hull\ of \ A^\prime(epi\ g). $$
偏极小
<aside> <img src="/icons/chess-bishop_yellow.svg" alt="/icons/chess-bishop_yellow.svg" width="40px" /> 【定理】凸优化的局部极小点就是全局极小点,两者等价。 (必要性)全局极小一定局部极小 (充分性)反证,若存在全局极小比局部极小更小,两点凸组合的函数值小于函数值的凸组合,函数值的凸组合小于局部极小不组合;小量凸组合也是凸组合,进而局部极小条件矛盾。
</aside>
【最优性条件】
【凸函数的下水平集是凸集】 反之不然。必要条件
$$ S_f(c)=\{x\in\Omega\mid f(x)\le c,\forall c\in \mathbb R\}. $$
【FONS一阶充要条件】一阶可微的凸函数,
$$ Df(\bm x^)(\bm x-\bm x^)\ge 0 $$
等式约束的凸优化,等式约束一定是线性约束,求解优化(拉格朗日)等价于求解方程组
$$ \nabla f(x^*)\pm A^T\lambda =0,\\Ax=b. $$
不等式约束的凸优化,不等式约束只能是凸函数(才能保证他们的零下水平集都是凸集),求解优化(KKT条件)
$$ \mu^\le 0,\\ \nabla f(x^)\pm \lambda ^T a+\mu^{T}\nabla g(x^)=\bm 0,\\ \mu^{*T}g(x)=0. $$
【凹优化】目标函数是凹的,约束集是凸集。
<aside> <img src="/icons/chess-bishop_yellow.svg" alt="/icons/chess-bishop_yellow.svg" width="40px" /> 若凹函数在凸集内点取极小,f在X上必是常值函数。
</aside>
【非凸优化问题】