神经微分方程
来自维基百科,自由的百科全书
神经微分方程(英語:neural differential equation)是机器学习中的一种微分方程,其方程右侧项由人工神经网络的权重参数化。[1]神经常微分方程(nerual ordinary differential equation,简称neural ODE)是最常见的神经微分方程,可写作如下形式:
在经典的神经网络中,各层是按自然数排序的。而在神经ODE中,各层形成一个由正实数排序的连续体。具体来说,函数将每个正序号t映射为一个实数值,表示神经网络在该层的状态。
与残差神经网络的关联
神经ODE可以被视为一种具有连续层而非离散层的残差神经网络。[1]将单位时间步长的欧拉方法应用于神经ODE,会得到残差神经网络的前向传播公式:
其中表示该残差神经网络的第层。在残差神经网络中,前向传播是通过逐层应用一系列变换来实现的,而神经ODE的前向传播则是由求解微分方程来完成的。具体而言,给定神经ODE的输入,对应的输出可以通过求解以下初值问题得到:
而时的解即为输出。
通用微分方程
在已知某些物理信息的情况下,可以将神经ODE与已有的第一性原理模型相结合,构建一个被称为通用微分方程(universal differential equation,简称UDE)的物理信息神经网络模型。[3][4][5][6]例如,洛特卡-沃尔泰拉模型的UDE版本可写成以下形式:[7]
其中和是神经网络参数化的修正项。
参见
参考文献
Wikiwand - on
Seamless Wikipedia browsing. On steroids.