3.1 凸函数
本文最后更新于120 天前,其中的信息可能已经过时,如有错误请发送邮件至 2641805259@qq.com

一、基本性质和例子

定义

函数是凸的,如果是凸集,且对于任意和任意,有:

意味着点之间的线段,即的弦在函数的图像上方

如果式(1)中的不等式当以及时严格成立,则严格凸的。

如果函数是凸的,那么函数是凹的。

如果函数是严格凸的,那么函数是严格凹的。

对于仿射函数,由于,因此所有的仿射函数是即凸且凹的

反之如果某个函数即是凸又是凹的,那么它是仿射函数。

性质

函数是凸的,当且仅当其在与其定义域相交的任何直线上都是凸的。换言之,函数是凸的,当且仅当对于任意和任意向量,函数是凸的(其定义域为)。

证明:

  1. 已知函数是凸的,因此存在,选取一个位于所形成的直线上,确保,令,则, ,有:

因此函数是凸的。

  1. 已知是凸的,对于,取,有,令。由于在这条直线上是凸的,因此:

是凸函数。

 

拓展值延伸

如果是凸函数,我们定义它的拓展值延伸如下:

延伸函数是定义在全空间上的,取值集合为。我们也可以从延伸函数的定义中确定原函数的定义域,即.

通过延伸我们可以简化符号描述,不在需要限定对于所有的。例如对于式(1),可以描述为:对于任意,以及,有:

凸集的示性函数:是一个凸集,考虑(凸)函数,其定义域为,对于所有的,有。其拓展值延伸可以描述如下:

凸函数被称作集合示性函数

作用:函数等价于定义在集合上的函数

注:对于凹函数可以利用进行同样的定义。

二、一阶条件

假设可微(即其梯度在开集内处处存在),则函数是凸函数的充要条件是凸集且对于任意,下式成立:

得出的仿射函数即为函数在点附近的 Taylor 近似。

不等式(5)表明,对于一个凸函数,其一阶 Taylor 近似实质上是原函数的一个全局下估计

反之如果某个函数的一阶 Taylor 近似总是其全局下估计,那么这个函数是凸的。

对于,在处的一阶 Taylor 展开为

对于凸函数而言,函数与一阶 Taylor 展开有着固定的不等式关系:

全局下估计:

  • 全局:指不管有多大,都有该不等式成立,是全局任意取值的。
  • 下估计:对所有都成立。

如果式(5)中的不等号换成,则为函数严格凸的充要条件。

对于函数,其为凹函数的充要条件是是凸集且对于任意,下式成立:

证明:

先考虑的情况,我们证明可微函数是凸函数的充要条件是对于内的任意,有

首先假设是凸函数,且。因为是凸集(某个区间),对于任意,我们有,由函数的凸性可得:

将上式两端同除可得:

,可以得到不等式 (7).

为了证明充分性,假设对(某个区间)内的任意,函数满足不等式(7)。选择任意,令。两次应用不等式(7)可得:

将第一个不等式乘以,第二个不等式乘以,并将二者相加可得:

从而说明了函数是凸的。

现在来证明一般情况,即。设,考虑过这两点的直线上的函数,即函数,此函数对求导可得:

首先假设函数是凸的,则函数是凸的,由前面可知,有,即:

再假设此不等式对于任意均成立,因此若以及,我们有:

,说明了函数是凸的。

三、二阶条件

现在假设二阶可微,即对于开集内的任意一点,它的 Hessian 矩阵或者二阶导数存在,则函数是凸函数的充要条件是,其Hessian矩阵是半正定阵:即对于所有的,有:

严格凸的条件可以部分由二阶条件刻画,如果对于任意,有,则函数严格凸。

反过来则不一定成立:函数是严格凸的,但是在处,二阶导数为0

四、常见函数的凹凸性

凸函数:

  • 上的:

    1. 仿射函数:上的

    2. 指数函数:,函数上是凸的

    1. 幂函数:上的
    2. 绝对值幂函数:时,函数上是凸函数。
    3. 负熵函数:上的
  •  

  • 上的:

    1. 范数:上的任意范数均为凸函数

    2. 最大值函数:函数上是凸的

      直观解释:最大值函数的“上包络”会形成一条“包住所有函数曲线的上壳”,这种上壳形状天然向上弯曲,不会出现向下凹陷的部分,故保持凸性。

      证明:

    3. 二次-线性分式函数:函数,其定义域为,是凸函数。

      对于

      .

      因此 Hessian 矩阵为:

      因为. 因此是半正定的,是凸函数。

    4. 指数和的对数:函数上是凸函数。

      这个函数可以看成最大值函数的可微近似,对于任意,下面的不等式成立:

凹函数:

  • 上的:

    1. 仿射函数:上的

    2. 幂函数上的

    3. 对数函数:上的函数

  • 上的:

    1. 几何平均:几何平均函数在定义域上是凹函数。
    2. 对数-行列式:函数在定义域上是凹函数。

 

五、上境图

函数的图像定义为

它是空间的一个子集。函数上境图定义为

它也是空间的一个子集。

性质

  • 一个函数是凸函数,当且仅当其上境图是凸集。

  • 一个函数是凹函数,当且仅当其亚图式凸集。

    亚图:.

例题:

矩阵分式函数在定义域上是凸的。

考虑的上境图,.即 。利用Schur补,对与标量有等价关系:

因此.

,映射是仿射的。

而对于半正定锥是凸的,因此也是凸集。

故矩阵分式函数是凸集。

利用上境图证明凸函数的一阶条件

要证,对于,有:

可以描述为:

这意味着法向量为的超平面在边界点支撑着

六、下水平集

函数下水平集定义为

对于任意值,凸函数的下水平集仍然是凸集。

如果,有。因为是凸函数,因此:

.

但反过来不一定成立。

如果是凹函数,那么由定义的上水平集也是凸集。

下水平集的性质可以用来判断集合的凸性:如果某个集合可以描述为

  • 一个凸函数的下水平集
  • 一个凹函数的上水平集

则集合是凸集。

七、Jensen 不等式及其拓展

基本不等式

有时也称作 Jensen 不等式。此不等式可以很方便地拓展至更多点的凸组合:

如果函数是凸函数,,则下式成立

考虑凸集时,次不等式可以拓展至无穷项和、积分以及期望。例如如果,则当相应的积分存在时,下式成立

.

惩罚不确定性:

假设,则中的随机变量,其均值为零,则有

因此,随机化或者扰动(即在自变量上增加一个零均值的随机变量)从平均效果上不会减小凸函数的值。

附:做题细节

  1. 函数

    先求:对于.

    求偏导,因此.其中,当,否则. 对所有的求和:

    再对$k$求和,得到:$\nabla_x(x^TPx) = (P + P^T)x$.
    

    ,因为,故

    因此,因此.

  2. Schur 补

    考虑进行一下划分的矩阵

    其中。如果,矩阵

    被称为中的Schur补

    性质:.

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇