一、基本性质和例子
定义
函数是凸的,如果是凸集,且对于任意和任意,有:
意味着点和之间的线段,即从到的弦在函数的图像上方。
如果式(1)中的不等式当以及时严格成立,则是严格凸的。
如果函数是凸的,那么函数是凹的。
如果函数是严格凸的,那么函数是严格凹的。
对于仿射函数,由于,因此所有的仿射函数是即凸且凹的。
反之如果某个函数即是凸又是凹的,那么它是仿射函数。
性质
函数是凸的,当且仅当其在与其定义域相交的任何直线上都是凸的。换言之,函数是凸的,当且仅当对于任意和任意向量,函数是凸的(其定义域为)。
证明:
- 已知函数是凸的,因此存在,选取一个位于所形成的直线上,确保,令,则, ,有:
因此函数是凸的。
- 已知是凸的,对于,取,有,令。由于在这条直线上是凸的,因此:
故是凸函数。
拓展值延伸
如果是凸函数,我们定义它的拓展值延伸如下:
延伸函数是定义在全空间上的,取值集合为。我们也可以从延伸函数的定义中确定原函数的定义域,即.
通过延伸我们可以简化符号描述,不在需要限定对于所有的。例如对于式(1),可以描述为:对于任意和,以及,有:
凸集的示性函数:设是一个凸集,考虑(凸)函数,其定义域为,对于所有的,有。其拓展值延伸可以描述如下:
凸函数被称作集合的示性函数。
作用:函数等价于定义在集合上的函数
注:对于凹函数可以利用进行同样的定义。
二、一阶条件
假设可微(即其梯度在开集内处处存在),则函数是凸函数的充要条件是是凸集且对于任意,下式成立:
由得出的仿射函数即为函数在点附近的 Taylor 近似。
不等式(5)表明,对于一个凸函数,其一阶 Taylor 近似实质上是原函数的一个全局下估计。
反之如果某个函数的一阶 Taylor 近似总是其全局下估计,那么这个函数是凸的。
对于,在处的一阶 Taylor 展开为
对于凸函数而言,函数与一阶 Taylor 展开有着固定的不等式关系:
全局下估计:
- 全局:指不管有多大,都有该不等式成立,是全局任意取值的。
- 下估计:对所有都成立。
如果式(5)中的不等号换成,则为函数严格凸的充要条件。
对于函数,其为凹函数的充要条件是是凸集且对于任意,下式成立:
证明:
先考虑的情况,我们证明可微函数是凸函数的充要条件是对于内的任意和,有
首先假设是凸函数,且。因为是凸集(某个区间),对于任意,我们有,由函数的凸性可得:
将上式两端同除可得:
当,可以得到不等式 (7).
为了证明充分性,假设对(某个区间)内的任意和,函数满足不等式(7)。选择任意,令。两次应用不等式(7)可得:
将第一个不等式乘以,第二个不等式乘以,并将二者相加可得:
从而说明了函数是凸的。
现在来证明一般情况,即。设,考虑过这两点的直线上的函数,即函数,此函数对求导可得:。
首先假设函数是凸的,则函数是凸的,由前面可知,有,即:
再假设此不等式对于任意和均成立,因此若以及,我们有:
即,说明了函数是凸的。
三、二阶条件
现在假设二阶可微,即对于开集内的任意一点,它的 Hessian 矩阵或者二阶导数存在,则函数是凸函数的充要条件是,其Hessian矩阵是半正定阵:即对于所有的,有:
严格凸的条件可以部分由二阶条件刻画,如果对于任意,有,则函数严格凸。
反过来则不一定成立:函数是严格凸的,但是在处,二阶导数为0
四、常见函数的凹凸性
凸函数:
上的:
1. 仿射函数:上的,
2. 指数函数:,函数在上是凸的
- 幂函数:上的,或
- 绝对值幂函数:当时,函数在上是凸函数。
- 负熵函数:上的
上的:
范数:上的任意范数均为凸函数
最大值函数:函数在上是凸的
直观解释:最大值函数的“上包络”会形成一条“包住所有函数曲线的上壳”,这种上壳形状天然向上弯曲,不会出现向下凹陷的部分,故保持凸性。
证明:
二次-线性分式函数:函数,其定义域为,是凸函数。
对于,。
.
因此 Hessian 矩阵为:
因为. 因此是半正定的,是凸函数。
指数和的对数:函数在上是凸函数。
这个函数可以看成最大值函数的可微近似,对于任意,下面的不等式成立:
凹函数:
上的:
1. 仿射函数:上的,
2. 幂函数:上的,
3. 对数函数:上的函数
上的:
- 几何平均:几何平均函数在定义域上是凹函数。
- 对数-行列式:函数在定义域上是凹函数。
五、上境图
函数的图像定义为
它是空间的一个子集。函数的上境图定义为
它也是空间的一个子集。
性质
一个函数是凸函数,当且仅当其上境图是凸集。
一个函数是凹函数,当且仅当其亚图式凸集。
亚图:.
例题:
矩阵分式函数,在定义域上是凸的。
考虑的上境图,.即 。利用Schur补,对与标量有等价关系:
因此.
记,映射是仿射的。
而对于半正定锥是凸的,因此也是凸集。
故矩阵分式函数是凸集。
利用上境图证明凸函数的一阶条件
要证,对于,有:
可以描述为:
这意味着法向量为的超平面在边界点支撑着
六、下水平集
函数的下水平集定义为
对于任意值,凸函数的下水平集仍然是凸集。
如果,有,。因为是凸函数,因此:
故.
但反过来不一定成立。
如果是凹函数,那么由定义的上水平集也是凸集。
下水平集的性质可以用来判断集合的凸性:如果某个集合可以描述为
- 一个凸函数的下水平集
- 一个凹函数的上水平集
则集合是凸集。
七、Jensen 不等式及其拓展
基本不等式
有时也称作 Jensen 不等式。此不等式可以很方便地拓展至更多点的凸组合:
如果函数是凸函数, 且 ,则下式成立
考虑凸集时,次不等式可以拓展至无穷项和、积分以及期望。例如如果上 且,则当相应的积分存在时,下式成立
即.
惩罚不确定性:
假设,则是中的随机变量,其均值为零,则有
因此,随机化或者扰动(即在自变量上增加一个零均值的随机变量)从平均效果上不会减小凸函数的值。
附:做题细节
函数,求
先求:对于.
对求偏导,因此.其中,当,否则. 对所有的求和:
再对$k$求和,得到:$\nabla_x(x^TPx) = (P + P^T)x$.故,因为,故。
因此,因此.
Schur 补
考虑进行一下划分的矩阵
其中。如果,矩阵
被称为在中的Schur补。
性质:.