查看我们的 HuggingFace🤗 集合,获取最新的开放权重检查点和演示!
NVIDIA NeMo Speech 专为从事语音模型(包括自动语音识别、文本转语音和语音大语言模型)研究的研究人员和 PyTorch 开发者而构建。它旨在帮助您利用现有代码和预训练模型检查点,高效地创建、定制和部署新的 AI 模型。
有关技术文档,请参阅 NeMo 框架用户指南。
自 Pytorch 2.6 起,torch.load 默认使用 weights_only=True。某些模型检查点可能需要使用 weights_only=False。在这种情况下,您可以在运行使用 torch.load 的代码之前设置环境变量 TORCH_FORCE_NO_WEIGHTS_ONLY_LOAD=1。但是,这仅应在处理受信任的文件时进行。从不信任的来源加载非仅权重的文件可能存在任意代码执行的风险。
| 版本 | 状态 | 描述 |
|---|---|---|
| 最新版 | 最新(即 main 分支)的文档。 | |
| 稳定版 | 稳定版(即最新发布版本)的文档 - 即将添加 |
NeMo Speech 可通过 pip 安装:pip install 'nemo-toolkit[all]'
我们欢迎社区贡献!请参考 CONTRIBUTING.md 了解流程。
NeMo 采用 Apache License 2.0 许可证。