| 注册会员 | 1032 |
| 主题 | 340 |
| 模型 | 2962 |
| 技能包 | 6701 |
| 数据集 | 1026 |
| 论文 | 228 |
| 开源项目 | 305 |
|
|
Apache MXNet — 高性能深度学习框架 eighty • apache/mxnet • 2025-11-14 | 0 |
|
|
MNN — 阿里巴巴轻量推理引擎 delta • alibaba/MNN • 2025-11-13 | 0 |
|
|
AITemplate — Meta 编译优化框架 apple • facebookincubator/AITemplate • 2025-11-13 | 0 |
|
|
LightSeq — Transformer 推理优化 halo • bytedance/lightseq • 2025-11-10 | 0 |
|
|
FasterTransformer — NVIDIA 加速库 ci • NVIDIA/FasterTransformer • 2025-11-10 | 0 |
|
|
Alpa — 分布式模型并行系统 loadbalancer • alpa-projects/alpa • 2025-11-09 | 0 |
|
|
ROCm — AMD GPU 计算平台 transaction • RadeonOpenCompute/ROCm • 2025-11-09 | 0 |
|
|
CUDA — NVIDIA GPU 计算平台 merge • NVIDIA/cuda-samples • 2025-11-08 | 0 |
|
|
OpenVINO — Intel 推理优化工具 cometx • openvinotoolkit/openvino • 2025-11-08 | 0 |
|
|
BitsAndBytes — 低比特量化库 seven • TimDettmers/bitsandbytes • 2025-11-08 | 0 |
|
|
AutoAWQ — AWQ 量化工具 evolve • casper-hansen/AutoAWQ • 2025-11-07 | 0 |
|
|
ExLlama — LLM 量化推理加速 galaxy • turboderp/exllama • 2025-11-07 | 0 |
|
|
xFormers — Transformer 加速库 expert • facebookresearch/xformers • 2025-11-06 | 0 |
|
|
FlashAttention — 高效 Attention 实现 visionos • Dao-AILab/flash-attention • 2025-11-06 | 0 |
|
|
Triton — OpenAI GPU 编程语言 figure • openai/triton • 2025-11-05 | 0 |
|
|
TVM — 深度学习编译器栈 oauth • apache/tvm • 2025-11-05 | 0 |
|
|
ONNX Runtime — 高性能跨平台推理引擎 crest • microsoft/onnxruntime • 2025-11-04 | 0 |
|
|
TensorRT — NVIDIA 推理优化引擎 transfer • NVIDIA/TensorRT • 2025-11-04 | 0 |
|
|
Grafana — 可视化监控平台 hunter • grafana/grafana • 2025-11-04 | 0 |
|
|
Prometheus — 监控与指标系统 bullet • prometheus/prometheus • 2025-11-03 | 0 |