本文阐述如何正确地使用torch.onnx.export
导出的ONNX模型进行推理。 torch.onnx.export
函数可将PyTorch模型转换为ONNX格式,方便跨框架部署。然而,直接使用PyTorch张量作为ONNX模型输入会导致错误。
导出后的ONNX模型(.onnx.pb
文件)包含模型结构和权重。 推理需要借助ONNX Runtime。 原始代码使用PyTorch的torch.ones(2,2)
创建张量作为输入,导致RuntimeError: input must be a list of dictionaries or a single numpy array for input 'x'
错误。这是因为ONNX Runtime期望的是NumPy数组,而非PyTorch张量。
正确方法:使用NumPy数组作为输入
以下两种方法均可实现正确推理:
方法一:
import onnxruntime import numpy as np import torch resnet_onnx = onnxruntime.InferenceSession('onnx.pb') # 使用NumPy数组作为输入 x = np.ones((2, 2), dtype=np.float32) inputs = {resnet_onnx.get_inputs()[0].name: x} print(resnet_onnx.run(None, inputs))
此方法使用np.ones((2, 2), dtype=np.float32)
创建形状为(2,2),数据类型为float32的NumPy数组。 dtype=np.float32
确保数据类型与模型兼容。 resnet_onnx.run(None, inputs)
运行模型并打印输出。
方法二:
import onnxruntime as ort import numpy as np # 加载模型 sess = ort.InferenceSession("onnx.pb") # 准备输入数据 input_data = np.ones((2, 2)).astype("float32") # 运行模型 output_data = sess.run(None, {"x": input_data})[0] # 输出模型的预测结果 print(output_data)
此方法与方法一效果相同,但API调用方式略有不同。 核心在于使用NumPy数组作为模型输入,避免了因输入类型不匹配导致的错误。 两种方法都解决了原始代码中的错误。