热门问题
时间线
聊天
视角
ONNX
来自维基百科,自由的百科全书
Remove ads
ONNX(英語:Open Neural Network Exchange)是一種針對機器學習所設計的開放式的文件格式,用於存儲訓練好的模型。它使得不同的人工智能框架(如Pytorch、MXNet)可以採用相同格式存儲模型數據並交互。 ONNX的規範及代碼主要由微軟、亞馬遜、Facebook和IBM等公司共同開發,以開放源代碼的方式託管在Github上。[2][3][4] 目前官方支持加載ONNX模型並進行推理的深度學習框架有: Caffe2、PyTorch、MXNet、ML.NET、TensorRT 和 Microsoft CNTK,並且 TensorFlow 也非官方的支持ONNX。
Remove ads
歷史
ONNX最初被命名為Toffee[5],並且由臉書內發布PyTorch的團隊開發。[6] 在2017年,ONNX第一個正式版本由臉書與微軟共同發布。在此之後,IBM、華為、英特爾、AMD、Arm和高通都宣布計劃支持ONNX。
2017年10月,微軟宣布將在該計畫中加入其認知工具包Microsoft Cognitive Toolkit和Project Brainwave平台。
2019年11月,ONNX被Linux基金會AI接納為研究生課程。[7]
2020年10月,Zetane Systems成為ONNX生態系統的成員。[8]
意圖
該倡議的目標是:
讓開發人員更輕鬆地在框架之間移動,其中一些框架可能更適合開發過程的特定階段,例如快速訓練、網路架構靈活性或行動裝置上的推理。[9]
ONNX Runtime
ONNX Runtime(縮寫:ORT [10])是一個開源項目,旨在加速各種環境中 ONNX 模型的推理和學習[11]。無論框架、作業系統或硬體為何,ONNX模型都可以透過單一執行時間API使用[12]。它還根據部署環境自動進行最佳化[13]。 ONNX Runtime的設計策略是實現加速器運行時抽象化和效能最佳化,並透過自動劃分ONNX模型並使用最佳加速器執行子模型來實現這一目標[14]。
參考文獻
外部鏈接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads