苹果芯片强大的计算能力,特别是神经网络引擎(NPU),使其成为深度学习开发者的理想平台。本文将探讨如何在Apple Silicon架构下,充分利用PyTorch进行模型训练和向量生成,并解释如何有效地使用CPU、GPU和NPU。
Apple Silicon集成了CPU、GPU和NPU,为深度学习提供了强劲的硬件支持。PyTorch通过mps
设备指定,可以利用加速计算。然而,许多开发者对mps
究竟调用GPU还是NPU,以及如何利用NPU进行模型训练和向量生成存在疑问。
目前,PyTorch的mps
后端仅支持GPU加速。Metal Performance Shaders (MPS) 仅能利用Apple Silicon的GPU。NPU主要用于推理而非训练。若需使用NPU,则需借助CoreML框架。由于苹果尚未公开NPU的编程接口,因此无法直接在PyTorch中使用NPU进行模型训练或向量生成。 追求Apple Silicon平台高效推理的开发者,建议使用CoreML。