トップQs
タイムライン
チャット
視点

ウルフ条件

ウィキペディアから

Remove ads

ウルフ条件(ウルフじょうけん、: Wolfe conditions)とは、無制約最適化問題において非厳密直線探索を行う際に用いられる一連の不等式をいう。特に準ニュートン法を行う際によく用いられる。1969年フィリップ・ウルフ英語版が初めて発表した[1][2]

ある滑らかな関数 について無制約最適化問題 を解く際、近似的な部分問題 を解くことがしばしばある。ここで xk は現在の反復における最適推定解、 は探索方向、 はステップ長である。

非厳密直線探索は、損失関数を厳密に最小化するのではなく、「十分に」小さくするステップ長 を得る効率的な方法を提供する。これを行う際、ウルフ条件は新たな探索方向 pk を探索する前にある α の推定値が満たすべき条件として用いられる。

Remove ads

アルミホ条件と曲率条件

要約
視点

あるステップ長 αk がウルフ条件を満たすとは、探索方向 pk が与えられたものとして以下の2つの不等式が成り立つことをいう。

(i)
(ii)

ここで、0 < c1 < c2 < 1 である(不等式iiを評価する際、たとえば最急降下法の場合は ニュートン法の場合は H が正定値行列であるため が成り立つことに留意する)。

c1 は十分に小さく、c2 は十分に大きくとることが多い。ノセダル英語版とライトはニュートン法および準ニュートン法については c1 = 104, c2 = 0.9非線形共役勾配法については c2 = 0.1 を例として与えている[3]。不等式iアルミホ条件[注釈 1][4]と呼ばれ、不等式ii曲率条件と呼ばれる。不等式iはステップ長 αkf を「十分に」減少させることを、iiは勾配が十分に減少したことを保証する。条件iおよびiiはステップ長の上限と下限をそれぞれ与えるものとして解釈することができる。

Remove ads

強いウルフ条件

要約
視点

方向 pk に制限した一変数関数 φ(α) = f(xk+αkpk) を考える。ウルフ条件は φ の最適点からは遠いステップ長を与える場合がある。曲率条件を次のように変更したとする: -

(iii)

iおよびiii強いウルフ条件と呼ばれ、αkφ臨界点付近に制限する。

Remove ads

理論的根拠

最適化アルゴリズムにウルフ条件を課す主な理由は、勾配がゼロに収束することを保証するためである。特に、pk と勾配との方向余弦英語版 がゼロから遠くかつ条件iおよびiiが満たされる場合、 が成り立つ。

また、準ニュートン法を用いて のように探索方向を決めるとき、行列 BkBFGS法DFP法で更新する場合、Bk が正定値かつiおよびiiが成り立つならば Bk+1 も正定値となるということも理由としてあげられる。

Remove ads

注意

ウルフ条件はアルミホ条件よりも複雑であり、ウルフ条件にもとづく勾配降下法よりもアルミホ条件に基づいた値のほうがより良い理論的保証がある(Backtracking line search"Upper bound for learning rates"節および"Theoretical guarantee"節を参照)。

脚注

参考文献

関連項目

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads