bisheng-rt 是一个开源的推理服务框架,负责模型推理和资源分配。它能够高效部署各种模型,并为所有模型类型提供一致的用户体验。
本项目是 bisheng 的子项目。
通过 Bisheng 平台的 模型管理器 使用。
我们提供开放的云服务供您便捷使用。详见 免费试用。
关于安装、开发、部署和管理的指南,请查阅 bisheng-rt 开发者文档。
报告问题、提出疑问
我们欢迎任何关于本项目的反馈、问题或错误报告。
用户可以在 Issues 中提交,请遵循 Stack Overflow 文档 中概述的流程。
如有疑问,建议在我们的社区 GitHub 讨论区 中提问。
bisheng-rt 使用了以下依赖: