神经微分方程
神经微分方程(英語:neural differential equation)是机器学习中的一种微分方程,其方程右侧项由人工神经网络的权重参数化。[1]神经常微分方程(nerual ordinary differential equation,简称neural ODE)是最常见的神经微分方程,可写作如下形式:
在经典的神经网络中,各层是按自然数排序的。而在神经ODE中,各层形成一个由正实数排序的连续体。具体来说,函数将每个正序号t映射为一个实数值,表示神经网络在该层的状态。
神经ODE可以理解为连续时间控制系统,其数据插值能力可以用可控制性来解释。[2]
与残差神经网络的关联
神经ODE可以被视为一种具有连续层而非离散层的残差神经网络。[1]将单位时间步长的欧拉方法应用于神经ODE,会得到残差神经网络的前向传播公式:
其中表示该残差神经网络的第层。在残差神经网络中,前向传播是通过逐层应用一系列变换来实现的,而神经ODE的前向传播则是由求解微分方程来完成的。具体而言,给定神经ODE的输入,对应的输出可以通过求解以下初值问题得到:
而时的解即为输出。
通用微分方程
在已知某些物理信息的情况下,可以将神经ODE与已有的第一性原理模型相结合,构建一个被称为通用微分方程(universal differential equation,简称UDE)的物理信息神经网络模型。[3][4][5][6]例如,洛特卡-沃尔泰拉模型的UDE版本可写成以下形式:[7]
其中和是神经网络参数化的修正项。
参见
参考文献
- ^ 1.0 1.1 Chen, Ricky T. Q.; Rubanova, Yulia; Bettencourt, Jesse; Duvenaud, David K. Neural Ordinary Differential Equations (PDF). Bengio, S.; Wallach, H.; Larochelle, H.; Grauman, K.; Cesa-Bianchi, N.; Garnett, R. (编). Advances in Neural Information Processing Systems 31. Curran Associates, Inc. 2018. arXiv:1806.07366 .
- ^ Ruiz-Balet, Domènec; Zuazua, Enrique. Neural ODE Control for Classification, Approximation, and Transport. SIAM Review. 2023, 65 (3): 735–773. ISSN 0036-1445. arXiv:2104.05278 . doi:10.1137/21M1411433 (英语).
- ^ Christopher Rackauckas; Yingbo Ma. Universal Differential Equations for Scientific Machine Learning. 2024. arXiv:2001.04385 [cs.LG].
- ^ Xiao, Tianbai; Frank, Martin. RelaxNet: A structure-preserving neural network to approximate the Boltzmann collision operator. Journal of Computational Physics. 2023, 490: 112317. Bibcode:2023JCoPh.49012317X. arXiv:2211.08149 . doi:10.1016/j.jcp.2023.112317 (英语).
- ^ Silvestri, Mattia; Baldo, Federico; Misino, Eleonora; Lombardi, Michele, Mikyška, Jiří; de Mulatier, Clélia; Paszynski, Maciej; Krzhizhanovskaya, Valeria V. , 编, An Analysis of Universal Differential Equations for Data-Driven Discovery of Ordinary Differential Equations, Computational Science – ICCS 2023 (Cham: Springer Nature Switzerland), 2023, 10476: 353–366 [2024-08-18], ISBN 978-3-031-36026-8, doi:10.1007/978-3-031-36027-5_27 (英语)
- ^ Christoph Plate; Carl Julius Martensen. Optimal Experimental Design for Universal Differential Equations. arXiv:2408.07143 [math.OC].
- ^ Patrick Kidger. On Neural Differential Equations (Doctor of Philosophy论文). University of Oxford, Mathematical Institute. 2021.