首页 > 文章列表 > 如何用ONNX Runtime正确加载和推理PyTorch导出的ONNX模型?

如何用ONNX Runtime正确加载和推理PyTorch导出的ONNX模型?

132 2025-04-03

如何用ONNX Runtime正确加载和推理PyTorch导出的ONNX模型?

PyTorch ONNX模型的加载与推理详解

本文详细阐述如何加载并使用torch.onnx.export导出的ONNX模型进行推理。torch.onnx.export函数可将PyTorch模型转换为ONNX格式,方便在其他框架中部署。然而,直接使用PyTorch张量作为ONNX Runtime的输入会导致错误。

文中示例展示了使用torch.onnx.export导出模型,以及使用ONNX Runtime推理时遇到的错误:“runtimeerror: input must be a list of dictionaries or a single numpy array for input 'x'.” 该错误指出ONNX Runtime要求输入数据为NumPy数组,而非PyTorch张量。

解决方法:将PyTorch张量转换为NumPy数组

关键在于将PyTorch张量转换为NumPy数组。 以下是两种正确的代码示例:

方法一:

import onnxruntime
import numpy
import torch

resnet_onnx = onnxruntime.InferenceSession('onnx.pb')

# x = torch.ones(2, 2)  # 错误:输入类型为torch.tensor
x = numpy.ones((2, 2), dtype=numpy.float32)  # 正确:输入类型为numpy.ndarray

inputs = {resnet_onnx.get_inputs()[0].name: x}
print(resnet_onnx.run(None, inputs))

此方法将输入x的类型从torch.tensor更改为numpy.ndarray,并指定数据类型为numpy.float32,解决了类型不匹配问题。

方法二:

import onnxruntime as ort
import numpy as np

# 加载模型
sess = ort.InferenceSession("onnx.pb")

# 准备输入数据
input_data = np.ones((2, 2)).astype("float32")

# 运行模型
output_data = sess.run(None, {"x": input_data})[0]

# 输出模型的预测结果
print(output_data)

此方法同样使用NumPy数组作为输入,并清晰地展示了如何获取模型输出。

两种方法均成功加载并运行导出的ONNX模型,核心在于确保输入数据的类型与ONNX Runtime的要求一致。 使用NumPy数组是避免错误的关键步骤。

来源:1741266989