トップQs
タイムライン
チャット
視点
ウルフ条件
ウィキペディアから
Remove ads
ウルフ条件(ウルフじょうけん、英: Wolfe conditions)とは、無制約最適化問題において非厳密直線探索を行う際に用いられる一連の不等式をいう。特に準ニュートン法を行う際によく用いられる。1969年にフィリップ・ウルフが初めて発表した[1][2]。
![]() | この項目「ウルフ条件」は翻訳されたばかりのものです。不自然あるいは曖昧な表現などが含まれる可能性があり、このままでは読みづらいかもしれません。(原文:en: Wolfe conditions) 修正、加筆に協力し、現在の表現をより自然な表現にして下さる方を求めています。ノートページや履歴も参照してください。(2024年8月) |
ある滑らかな関数 について無制約最適化問題 を解く際、近似的な部分問題 を解くことがしばしばある。ここで xk は現在の反復における最適推定解、 は探索方向、 はステップ長である。
非厳密直線探索は、損失関数を厳密に最小化するのではなく、「十分に」小さくするステップ長 を得る効率的な方法を提供する。これを行う際、ウルフ条件は新たな探索方向 pk を探索する前にある α の推定値が満たすべき条件として用いられる。
Remove ads
アルミホ条件と曲率条件
要約
視点
あるステップ長 αk がウルフ条件を満たすとは、探索方向 pk が与えられたものとして以下の2つの不等式が成り立つことをいう。
(i)
(ii)
ここで、0 < c1 < c2 < 1 である(不等式iiを評価する際、たとえば最急降下法の場合は 、ニュートン法の場合は で H が正定値行列であるため が成り立つことに留意する)。
c1 は十分に小さく、c2 は十分に大きくとることが多い。ノセダルとライトはニュートン法および準ニュートン法については c1 = 10−4, c2 = 0.9、非線形共役勾配法については c2 = 0.1 を例として与えている[3]。不等式iはアルミホ条件[注釈 1][4]と呼ばれ、不等式iiは曲率条件と呼ばれる。不等式iはステップ長 αk が f を「十分に」減少させることを、iiは勾配が十分に減少したことを保証する。条件iおよびiiはステップ長の上限と下限をそれぞれ与えるものとして解釈することができる。
Remove ads
強いウルフ条件
要約
視点
方向 pk に制限した一変数関数 φ(α) = f(xk+αkpk) を考える。ウルフ条件は φ の最適点からは遠いステップ長を与える場合がある。曲率条件を次のように変更したとする: -
(iii)
Remove ads
理論的根拠
最適化アルゴリズムにウルフ条件を課す主な理由は、勾配がゼロに収束することを保証するためである。特に、pk と勾配との方向余弦 がゼロから遠くかつ条件iおよびiiが満たされる場合、 が成り立つ。
また、準ニュートン法を用いて のように探索方向を決めるとき、行列 Bk をBFGS法やDFP法で更新する場合、Bk が正定値かつiおよびiiが成り立つならば Bk+1 も正定値となるということも理由としてあげられる。
Remove ads
注意
ウルフ条件はアルミホ条件よりも複雑であり、ウルフ条件にもとづく勾配降下法よりもアルミホ条件に基づいた値のほうがより良い理論的保証がある(Backtracking line searchの"Upper bound for learning rates"節および"Theoretical guarantee"節を参照)。
脚注
参考文献
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads