在昇騰 NPU 上安裝#
Xinference 能在昇騰 NPU 上運行,使用如下命令安裝。
警告
開源版本依賴 Transformers 進行推理,在 310p3 等晶片上會存在運行緩慢的問題。我們提供了支援 MindIE 引擎,效能更為強大,相容性更佳的企業版本來支援 Ascend NPU。詳細請參考 Xinference 企業版
安裝 PyTorch 和昇騰擴展#
安裝 PyTorch CPU 版本和對應的昇騰擴展。
以 PyTorch v2.1.0 為例。
pip3 install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cpu
接著安裝 昇騰 PyTorch 擴展.
pip3 install 'numpy<2.0' pip3 install decorator pip3 install torch-npu==2.1.0.post3
執行下列命令查看,若正常運作,將顯示昇騰 NPU 的數量。
python -c "import torch; import torch_npu; print(torch.npu.device_count())"
安裝 Xinference#
pip3 install xinference
現在你可以參考 文件 來使用 Xinference。Transformers 是開源唯一支援的昇騰 NPU 引擎。
企業支援#
如果你在昇腾 NPU 遇到任何效能或其他問題,歡迎諮詢 Xinference 企業版,在 這裡 聯絡我們。