热门问题
时间线
聊天
视角
ONNX
来自维基百科,自由的百科全书
Remove ads
ONNX(英语:Open Neural Network Exchange)是一种针对机器学习所设计的开放式的文件格式,用于存储训练好的模型。它使得不同的人工智能框架(如Pytorch、MXNet)可以采用相同格式存储模型数据并交互。 ONNX的规范及代码主要由微软、亚马逊、Facebook和IBM等公司共同开发,以开放源代码的方式托管在Github上。[2][3][4] 目前官方支持加载ONNX模型并进行推理的深度学习框架有: Caffe2、PyTorch、MXNet、ML.NET、TensorRT 和 Microsoft CNTK,并且 TensorFlow 也非官方的支持ONNX。
Remove ads
历史
ONNX最初被命名为Toffee[5],并且由脸书内发布PyTorch的团队开发。[6] 在2017年,ONNX第一个正式版本由脸书与微软共同发布。在此之后,IBM、华为、英特尔、AMD、Arm和高通都宣布计划支持ONNX。
2017年10月,微软宣布将在该计划中加入其认知工具包Microsoft Cognitive Toolkit和Project Brainwave平台。
2019年11月,ONNX被Linux基金会AI接纳为研究生课程。[7]
2020年10月,Zetane Systems成为ONNX生态系统的成员。[8]
意图
该倡议的目标是:
让开发人员更轻松地在框架之间移动,其中一些框架可能更适合开发过程的特定阶段,例如快速训练、网络架构灵活性或移动设备上的推理。[9]
ONNX Runtime
ONNX Runtime(缩写:ORT [10])是一个开源项目,旨在加速各种环境中 ONNX 模型的推理和学习[11]。无论框架、操作系统或硬件为何,ONNX模型都可以透过单一执行时间API使用[12]。它还根据部署环境自动进行最佳化[13]。 ONNX Runtime的设计策略是实现加速器运行时抽象化和效能最佳化,并透过自动划分ONNX模型并使用最佳加速器执行子模型来实现这一目标[14]。
参考文献
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads