首页 > 文章列表 > PyTorch模型导出ONNX后如何正确进行推理?

PyTorch模型导出ONNX后如何正确进行推理?

457 2025-03-28

PyTorch模型导出ONNX后如何正确进行推理?

本文阐述如何正确地使用torch.onnx.export导出的ONNX模型进行推理。 torch.onnx.export函数可将PyTorch模型转换为ONNX格式,方便跨框架部署。然而,直接使用PyTorch张量作为ONNX模型输入会导致错误。

导出后的ONNX模型(.onnx.pb文件)包含模型结构和权重。 推理需要借助ONNX Runtime。 原始代码使用PyTorch的torch.ones(2,2)创建张量作为输入,导致RuntimeError: input must be a list of dictionaries or a single numpy array for input 'x'错误。这是因为ONNX Runtime期望的是NumPy数组,而非PyTorch张量。

正确方法:使用NumPy数组作为输入

以下两种方法均可实现正确推理:

方法一:

import onnxruntime
import numpy as np
import torch

resnet_onnx = onnxruntime.InferenceSession('onnx.pb')

# 使用NumPy数组作为输入
x = np.ones((2, 2), dtype=np.float32)

inputs = {resnet_onnx.get_inputs()[0].name: x}
print(resnet_onnx.run(None, inputs))

此方法使用np.ones((2, 2), dtype=np.float32)创建形状为(2,2),数据类型为float32的NumPy数组。 dtype=np.float32确保数据类型与模型兼容。 resnet_onnx.run(None, inputs)运行模型并打印输出。

方法二:

import onnxruntime as ort
import numpy as np

# 加载模型
sess = ort.InferenceSession("onnx.pb")

# 准备输入数据
input_data = np.ones((2, 2)).astype("float32")

# 运行模型
output_data = sess.run(None, {"x": input_data})[0]

# 输出模型的预测结果
print(output_data)

此方法与方法一效果相同,但API调用方式略有不同。 核心在于使用NumPy数组作为模型输入,避免了因输入类型不匹配导致的错误。 两种方法都解决了原始代码中的错误。

来源:1741265443