首页　>　文章列表　>　PyTorch模型导出ONNX后如何正确进行推理？

PyTorch模型导出ONNX后如何正确进行推理？

457 2025-03-28

本文阐述如何正确地使用torch.onnx.export导出的ONNX模型进行推理。 torch.onnx.export函数可将PyTorch模型转换为ONNX格式，方便跨框架部署。然而，直接使用PyTorch张量作为ONNX模型输入会导致错误。

导出后的ONNX模型（.onnx.pb文件）包含模型结构和权重。推理需要借助ONNX Runtime。原始代码使用PyTorch的torch.ones(2,2)创建张量作为输入，导致RuntimeError: input must be a list of dictionaries or a single numpy array for input 'x'错误。这是因为ONNX Runtime期望的是NumPy数组，而非PyTorch张量。

正确方法：使用NumPy数组作为输入

以下两种方法均可实现正确推理：

方法一：

import onnxruntime
import numpy as np
import torch

resnet_onnx = onnxruntime.InferenceSession('onnx.pb')

# 使用NumPy数组作为输入
x = np.ones((2, 2), dtype=np.float32)

inputs = {resnet_onnx.get_inputs()[0].name: x}
print(resnet_onnx.run(None, inputs))

此方法使用np.ones((2, 2), dtype=np.float32)创建形状为(2,2)，数据类型为float32的NumPy数组。 dtype=np.float32确保数据类型与模型兼容。 resnet_onnx.run(None, inputs)运行模型并打印输出。

方法二：

import onnxruntime as ort
import numpy as np

# 加载模型
sess = ort.InferenceSession("onnx.pb")

# 准备输入数据
input_data = np.ones((2, 2)).astype("float32")

# 运行模型
output_data = sess.run(None, {"x": input_data})[0]

# 输出模型的预测结果
print(output_data)

此方法与方法一效果相同，但API调用方式略有不同。核心在于使用NumPy数组作为模型输入，避免了因输入类型不匹配导致的错误。两种方法都解决了原始代码中的错误。

来源：1741265443

上一篇　phpstudy搭建多站点教程，高效管理多个网站下一篇　Windows服务器用户权限管理最佳实践