首页　>　文章列表　>　如何用ONNX Runtime正确加载和推理PyTorch导出的ONNX模型？

如何用ONNX Runtime正确加载和推理PyTorch导出的ONNX模型？

132 2025-04-03

PyTorch ONNX模型的加载与推理详解

本文详细阐述如何加载并使用torch.onnx.export导出的ONNX模型进行推理。torch.onnx.export函数可将PyTorch模型转换为ONNX格式，方便在其他框架中部署。然而，直接使用PyTorch张量作为ONNX Runtime的输入会导致错误。

文中示例展示了使用torch.onnx.export导出模型，以及使用ONNX Runtime推理时遇到的错误：“runtimeerror: input must be a list of dictionaries or a single numpy array for input 'x'.” 该错误指出ONNX Runtime要求输入数据为NumPy数组，而非PyTorch张量。

解决方法：将PyTorch张量转换为NumPy数组

关键在于将PyTorch张量转换为NumPy数组。以下是两种正确的代码示例：

方法一：

import onnxruntime
import numpy
import torch

resnet_onnx = onnxruntime.InferenceSession('onnx.pb')

# x = torch.ones(2, 2)  # 错误：输入类型为torch.tensor
x = numpy.ones((2, 2), dtype=numpy.float32)  # 正确：输入类型为numpy.ndarray

inputs = {resnet_onnx.get_inputs()[0].name: x}
print(resnet_onnx.run(None, inputs))

此方法将输入x的类型从torch.tensor更改为numpy.ndarray，并指定数据类型为numpy.float32，解决了类型不匹配问题。

方法二：

import onnxruntime as ort
import numpy as np

# 加载模型
sess = ort.InferenceSession("onnx.pb")

# 准备输入数据
input_data = np.ones((2, 2)).astype("float32")

# 运行模型
output_data = sess.run(None, {"x": input_data})[0]

# 输出模型的预测结果
print(output_data)

此方法同样使用NumPy数组作为输入，并清晰地展示了如何获取模型输出。

两种方法均成功加载并运行导出的ONNX模型，核心在于确保输入数据的类型与ONNX Runtime的要求一致。使用NumPy数组是避免错误的关键步骤。

来源：1741266989

上一篇　Python如何构建无限级树结构并处理层级数据？下一篇　Python如何构建无限级树结构？