凸优化 ¶
约 1231 个字 预计阅读时间 5 分钟
速通版本,宝藏视频
基本概念 ¶
直线与线段 ¶
\(\theta x_{1} + (1-\theta) x_{2}\)
- 当 \(\theta \in \mathbb{R}\) 时,为直线
- 当 \(\theta \in [0,1]\) 时,为线段
放射集 ¶
-
仿射集:\(\forall x_1, x_2 \in A, \forall \theta \in \mathbb{R}\),满足 \(\theta x_1+(1-\theta)x_2 \in A\),那么 A 是放射集
注:对仿射组合运算封闭的集合
-
仿射 (Affine) 组合:\(\theta_1 x_1+…+\theta_k x_k\),满足 \(\theta_1+…+\theta_k=1\),\(\forall x_1,.., x_k \in A\)
注:如果 A 是放射集,那么放射组会也是放射集 (\(\theta_1 x_1+…+\theta_k x_k \in A\))
\(\theta_1 x_1+ \theta_2 x_2\),\(\forall x_1, x_2 \in A, \forall \theta_i \in \mathbb{R}\)
如果 \(x_1\) 和 \(x_2\) 不共线,那 \(\theta_1 x_1+ \theta_2 x_2\) 扩展为一个平面
- 仿射包 (Affine hull):集合 \(S\) 中点 \(x_i\) 的所有仿射组合构成的集合
$$ text{aff } S = left{ x = theta_1 x_1 + dots + theta_m x_m mid sum_{i=1}^m theta_i = 1, x_i in S, i=1,dots,m right} $$
-
性质:仿射包为包含 \(S\) 的最小仿射集
-
如果 S 是放射集,那 aff S 是放射集 S 本身
线性子空间 ¶
取 \(\forall x_0 \in \text{Aff}\),构造 \(V = \text{Aff} - x_0 = \left\{ x - x_0 \mid x \in \text{Aff} \right\}\)(\(V\) 含零元素)
对线性组合运算封闭的集合(\(V\) 对加法和数乘运算封闭
- 含有零元素
- 齐次线性方程组 \(Ax=0\) 的解集 \(\Leftrightarrow\) 线性子空间
- 几何上是过原点的超平面,依然是放射集
线性子空间与放射集的关系
- 仿射集是子空间的平移,也称仿射子空间
- 线性方程组 \(Ax=b\) 的解集 \(\Leftrightarrow\) 仿射集
- 几何上是经平移的超平面,称为仿射超平面
凸集 ¶
凸集:\(\theta x_1 + (1-\theta) x_2 \in C\),其中 \(0 \leq \theta \leq 1\),\(\forall x_1, x_2 \in C\)
注:对凸组合运算封闭的集合 , 即 \(x_1\),\(x_2\) 两点的线段还 \(\in C\)
凸 (convex) 组合:\(\theta_1 x_1 + \dots + \theta_k x_k\),满足 \(\theta_1 + \dots + \theta_k = 1\) 且 \(\theta_i \geq 0\)
凸包(Convex hull):把一个非凸集合,通过凸组合变为凸集 $$ text{conv } S = left{ x = theta_1 x_1 + dots + theta_m x_m mid sum_{i=1}^m theta_i = 1, theta_i geq 0, x_i in S, i=1,dots,m right} $$
- 示例:离散点凸包、扇形凸包
- 性质:凸包为包含 \(S\) 的最小凸集
\(C\) 严格凸:\(\forall x_1, x_2 \in C\),\(\theta \in (0, 1) \implies \theta x_1 + (1-\theta) x_2 \in \text{relint}C\)
要不要我帮你整理一份凸集相关概念的核心条件总结表?
放射集和凸集
如果 C 是放射集,那他一定是凸集 区别:放射集\(\theta\)无非负要求
凸锥 ¶
锥 (cone):\(\forall x \in S\) 和 \(\theta \geq 0\),满足 \(\theta x \in S\) 
对于固定的 \(x_1\),\(\theta_1 x_1\) 是一个射线,又 \(\forall x \in S\),因此是无数条射线的集合,形成了锥
锥组合:\(\theta_1 x_1 + \theta_2 x_2\),其中 \(\theta_1, \theta_2 \geq 0\)
非负线性组合,因为 AX=0 的解 X 就是一个锥
凸锥:\(\theta_1, \theta_2 \geq 0\),\(\forall x_1, x_2 \in S\), 满足 \(\theta_1 x_1 + \theta_2 x_2 \in S\)
注:对锥组合运算封闭的集合
\(\theta_1 x_1\) 和 \(\theta_2 x_2\) 分别为两个射线上的矢量,矢量叠加一定在这两个射线中间
性质: - 凸锥是包含零元素的凸集 - 不是所有的锥都是凸锥!
锥包(Conic hull):
注:锥包是包含 \(S\) 的最小凸锥
超平面与半空间 ¶
(仿射)超平面 (Hyperplane):
其中 \(a \neq 0\),仿射维度为 \(n-1\),也是凸的,过原点的时候是凸锥
半空间 (halfspace):
其中 \(a \neq 0\),半空间是凸集,不是放射集,过原点的时候是凸锥
系数 \(a\) 是超平面的法向量(梯度
) !
球和椭球 ¶
球 ¶
令 \(\frac{x - x_c}{r} = u\)(\(r\) 为半径
(单位球的伸缩平移变换,\(u^T u \leq 1\) 对应单位球)
球是凸集
椭球 (ellipsoid) ¶
- 定义形式:
其中 \(P \in \mathbb{S}_{++}^n\)(\(P\) 为n 阶正定对称矩阵集合)
- 等价形式:
令 \(u = P^{-\frac{1}{2}} (x - x_c)\),则:
椭球半径
对 \(P^{-1}\) 做对角化(\(P^{-1} = T^T \Lambda^{-1} T\),其中 \(TT^T = I\) 为正交矩阵,\(\Lambda = \text{diag}(\lambda_1, \dots, \lambda_n)\)
(通过平移旋转将椭球转化为轴对齐形式,\(\sqrt{\lambda_i}\) 对应各轴半径)