神經微分方程
神經微分方程(英語:neural differential equation)是機器學習中的一種微分方程,其方程右側項由人工神經網絡的權重參數化。[1]神經常微分方程(nerual ordinary differential equation,簡稱neural ODE)是最常見的神經微分方程,可寫作如下形式:
在經典的神經網絡中,各層是按自然數排序的。而在神經ODE中,各層形成一個由正實數排序的連續體。具體來說,函數將每個正序號t映射為一個實數值,表示神經網絡在該層的狀態。
神經ODE可以理解為連續時間控制系統,其數據插值能力可以用可控制性來解釋。[2]
與殘差神經網絡的關聯
神經ODE可以被視為一種具有連續層而非離散層的殘差神經網絡。[1]將單位時間步長的歐拉方法應用於神經ODE,會得到殘差神經網絡的前向傳播公式:
其中表示該殘差神經網絡的第層。在殘差神經網絡中,前向傳播是通過逐層應用一系列變換來實現的,而神經ODE的前向傳播則是由求解微分方程來完成的。具體而言,給定神經ODE的輸入,對應的輸出可以通過求解以下初值問題得到:
而時的解即為輸出。
通用微分方程
在已知某些物理信息的情況下,可以將神經ODE與已有的第一性原理模型相結合,構建一個被稱為通用微分方程(universal differential equation,簡稱UDE)的物理信息神經網絡模型。[3][4][5][6]例如,洛特卡-沃爾泰拉模型的UDE版本可寫成以下形式:[7]
其中和是神經網絡參數化的修正項。
參見
參考文獻
- ^ 1.0 1.1 Chen, Ricky T. Q.; Rubanova, Yulia; Bettencourt, Jesse; Duvenaud, David K. Neural Ordinary Differential Equations (PDF). Bengio, S.; Wallach, H.; Larochelle, H.; Grauman, K.; Cesa-Bianchi, N.; Garnett, R. (編). Advances in Neural Information Processing Systems 31. Curran Associates, Inc. 2018. arXiv:1806.07366 .
- ^ Ruiz-Balet, Domènec; Zuazua, Enrique. Neural ODE Control for Classification, Approximation, and Transport. SIAM Review. 2023, 65 (3): 735–773. ISSN 0036-1445. arXiv:2104.05278 . doi:10.1137/21M1411433 (英語).
- ^ Christopher Rackauckas; Yingbo Ma. Universal Differential Equations for Scientific Machine Learning. 2024. arXiv:2001.04385 [cs.LG].
- ^ Xiao, Tianbai; Frank, Martin. RelaxNet: A structure-preserving neural network to approximate the Boltzmann collision operator. Journal of Computational Physics. 2023, 490: 112317. Bibcode:2023JCoPh.49012317X. arXiv:2211.08149 . doi:10.1016/j.jcp.2023.112317 (英語).
- ^ Silvestri, Mattia; Baldo, Federico; Misino, Eleonora; Lombardi, Michele, Mikyška, Jiří; de Mulatier, Clélia; Paszynski, Maciej; Krzhizhanovskaya, Valeria V. , 編, An Analysis of Universal Differential Equations for Data-Driven Discovery of Ordinary Differential Equations, Computational Science – ICCS 2023 (Cham: Springer Nature Switzerland), 2023, 10476: 353–366 [2024-08-18], ISBN 978-3-031-36026-8, doi:10.1007/978-3-031-36027-5_27 (英語)
- ^ Christoph Plate; Carl Julius Martensen. Optimal Experimental Design for Universal Differential Equations. arXiv:2408.07143 [math.OC].
- ^ Patrick Kidger. On Neural Differential Equations (Doctor of Philosophy論文). University of Oxford, Mathematical Institute. 2021.