ウルフ条件

アルミホ条件と曲率条件

要約

視点

あるステップ長 $α k$ がウルフ条件を満たすとは、探索方向 $p k$ が与えられたものとして以下の2つの不等式が成り立つことをいう。

f({\boldsymbol {x}}_{k}+\alpha _{k}{\boldsymbol {p}}_{k})\leq f({\boldsymbol {x}}_{k})+c_{1}\alpha _{k}{\boldsymbol {p}}_{k}^{\top }\nabla f({\boldsymbol {x}}_{k})

(i)

-{\boldsymbol {p}}_{k}^{\top }\nabla f({\boldsymbol {x}}_{k}+\alpha _{k}{\boldsymbol {p}}_{k})\leq -c_{2}{\boldsymbol {p}}_{k}^{\top }\nabla f({\boldsymbol {x}}_{k})

(ii)

ここで、 $0 < c 1 < c 2 < 1$ である（不等式iiを評価する際、たとえば最急降下法の場合は ${\boldsymbol {p}}_{k}=-\nabla f({\boldsymbol {x}}_{k})$ 、ニュートン法の場合は ${\boldsymbol {p}}_{k}=-{\boldsymbol {H}}^{-1}\nabla f({\boldsymbol {x}}_{k})$ で $H$ が正定値行列であるため ${\boldsymbol {p}}_{k}^{\top }\nabla f({\boldsymbol {x}}_{k})<0$ が成り立つことに留意する）。

$c 1$ は十分に小さく、 $c 2$ は十分に大きくとることが多い。ノセダル（英語版）とライトはニュートン法および準ニュートン法については $c 1 = 10 - 4, c 2 = 0.9$ 、非線形共役勾配法については $c 2 = 0.1$ を例として与えている^[3]。不等式iはアルミホ条件^{[注釈 1]}^[4]と呼ばれ、不等式iiは曲率条件と呼ばれる。不等式iはステップ長 $α k$ が $f$ を「十分に」減少させることを、iiは勾配が十分に減少したことを保証する。条件iおよびiiはステップ長の上限と下限をそれぞれ与えるものとして解釈することができる。

Remove ads

強いウルフ条件

要約

視点

方向 $p k$ に制限した一変数関数 $φ (α) = f (x k + α k p k)$ を考える。ウルフ条件は $φ$ の最適点からは遠いステップ長を与える場合がある。曲率条件を次のように変更したとする: -

\left|{\boldsymbol {p}}_{k}^{\top }\nabla f({\boldsymbol {x}}_{k}+\alpha _{k}{\boldsymbol {p}}_{k})\right|\leq c_{2}\left|{\boldsymbol {p}}_{k}^{\top }\nabla f({\boldsymbol {x}}_{k})\right|

(iii)

iおよびiiiは強いウルフ条件と呼ばれ、 $α k$ を $φ$ の臨界点付近に制限する。

Remove ads

理論的根拠

最適化アルゴリズムにウルフ条件を課す主な理由は、勾配がゼロに収束することを保証するためである。特に、 $p k$ と勾配との方向余弦 $\cos \theta _{k}={\frac {\nabla f(\mathbf {x} _{k})^{\mathrm {T} }\mathbf {p} _{k}}{\|\nabla f(\mathbf {x} _{k})\|\|\mathbf {p} _{k}\|}}$ がゼロから遠くかつ条件iおよびiiが満たされる場合、 $\nabla f(\mathbf {x} _{k})\rightarrow 0$ が成り立つ。

また、準ニュートン法を用いて ${\boldsymbol {p}}_{k}=-B_{k}^{-1}\nabla f({\boldsymbol {x}}_{k})$ のように探索方向を決めるとき、行列 $B k$ をBFGS法やDFP法で更新する場合、 $B k$ が正定値かつiおよびiiが成り立つならば $B k +1$ も正定値となるということも理由としてあげられる。

Remove ads

注意

ウルフ条件はアルミホ条件よりも複雑であり、ウルフ条件にもとづく勾配降下法よりもアルミホ条件に基づいた値のほうがより良い理論的保証がある（Backtracking line searchの"Upper bound for learning rates"節および"Theoretical guarantee"節を参照）。

アルミホ条件と曲率条件

強いウルフ条件

理論的根拠

注意

脚注

参考文献

関連項目

Wikiwand - on