從起始點 $\mathbf {x} _{0}$ 和初始的Hessian矩陣 $B_{0}$ ，重複以下步驟， $\mathbf {x} _{k}$ 會收斂到優化問題的解：

通過求解方程 $B_{k}\mathbf {p} _{k}=-\nabla f(\mathbf {x} _{k})$ ，獲得下降方向 $\mathbf {p} _{k}$ 。
在 $\mathbf {p} _{k}$ 方向上進行一維的優化（線搜索），找到合適的步長 $\alpha _{k}$ 。如果這個搜索是完全的，則 $\alpha _{k}=\arg \min f(\mathbf {x} _{k}+\alpha \mathbf {p} _{k})$ 。在實際應用中，不完全的搜索一般就足夠了，此時只要求 $\alpha _{k}$ 滿足Wolfe條件。
令 $\mathbf {s} _{k}=\alpha _{k}\mathbf {p} _{k}$ ，並且令 $\mathbf {x} _{k+1}=\mathbf {x} _{k}+\mathbf {s} _{k}$ 。
$\mathbf {y} _{k}={\nabla f(\mathbf {x} _{k+1})-\nabla f(\mathbf {x} _{k})}$ 。
$B_{k+1}=B_{k}+{\frac {\mathbf {y} _{k}\mathbf {y} _{k}^{\mathrm {T} }}{\mathbf {y} _{k}^{\mathrm {T} }\mathbf {s} _{k}}}-{\frac {B_{k}\mathbf {s} _{k}\mathbf {s} _{k}^{\mathrm {T} }B_{k}^{\mathrm {T} }}{\mathbf {s} _{k}^{\mathrm {T} }B_{k}\mathbf {s} _{k}}}$ 。

$f(\mathbf {x} )$ 表示要最小化的目標函數。可以通過檢查梯度的範數 $||\nabla f(\mathbf {x} _{k})||$ 來判斷收斂性。如果 $B_{0}$ 初始化為 $B_{0}=I$ ，第一步將等效於梯度下降，但接下來的步驟會受到近似於Hessian矩陣的 $B_{k}$ 的調節。

算法

拓展閱讀