入門指南#
- 安裝
- 使用
- 日誌
- Docker 映像
- 在 Kubernetes 集群中安裝 Xinference
- 故障排除
- 沒有 huggingface 倉庫權限
- NVIDIA 驅動與 PyTorch 版本不匹配
- 外部系統無法透過
<IP>:9997存取 Xinference 服務 - 啟動內建模型需要很長時間,模型有時下載失敗
- 使用官方 Docker 映像時,RayWorkerVllm 因 OOM 而死亡,導致模型無法載入
- 載入 LLM 模型時提示缺少
model_engine參數 - 解決 MKL 執行緒層衝突
- 配置 PyPI 鏡像以加快軟體套件安裝速度
- 使用 uv 安裝 Xinference 1.12.0 失敗(截至 2025 年 11 月)
- vLLM + Torch + Xinference 相容性問題(段錯誤)
- 環境變數
- XINFERENCE_ENDPOINT
- XINFERENCE_MODEL_SRC
- XINFERENCE_HOME
- XINFERENCE_HEALTH_CHECK_FAILURE_THRESHOLD
- XINFERENCE_HEALTH_CHECK_INTERVAL
- XINFERENCE_HEALTH_CHECK_TIMEOUT
- XINFERENCE_DISABLE_HEALTH_CHECK
- XINFERENCE_DISABLE_METRICS
- XINFERENCE_DOWNLOAD_MAX_ATTEMPTS
- XINFERENCE_TEXT_TO_IMAGE_BATCHING_SIZE
- XINFERENCE_SSE_PING_ATTEMPTS_SECONDS
- XINFERENCE_MAX_TOKENS
- XINFERENCE_ALLOWED_IPS
- XINFERENCE_BATCH_SIZE
- XINFERENCE_BATCH_INTERVAL
- XINFERENCE_ALLOW_MULTI_REPLICA_PER_GPU
- XINFERENCE_LAUNCH_STRATEGY
- XINFERENCE_MAX_CONCURRENT_LAUNCHES
- XINFERENCE_ENABLE_VIRTUAL_ENV
- XINFERENCE_VIRTUAL_ENV_SKIP_INSTALLED
- XINFERENCE_CSG_TOKEN
- XINFERENCE_CSG_ENDPOINT
- XINFERENCE_QWEN3_RERANK_TEMPLATE
- XINFERENCE_LAUNCH_HISTORY_DB_PATH
- 版本發佈說明