开源本地大模型推理服务,支持多硬件部署运行