OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  代码  ›  AxLearn — 面向大模型训练研究的 JAX 原生框架

AxLearn — 面向大模型训练研究的 JAX 原生框架

 
  tranquil ·  2026-02-25 17:43:28 · 7 次点击  · 0 条评论  

AXLearn 深度学习库

build-and-test

本库正在积极开发中,API 可能会发生变化。

目录

章节 描述
简介 什么是 AXLearn?
快速开始 如何开始使用 AXLearn。
核心概念 核心概念与设计原则。
CLI 使用指南 如何使用命令行界面。
基础设施 核心基础设施组件。

简介

AXLearn 是一个构建于 JAXXLA 之上的库,旨在支持大规模深度学习模型的开发。

AXLearn 采用面向对象的方法来解决构建、迭代和维护模型过程中出现的软件工程挑战。其配置系统允许用户通过可复用的构建模块组合模型,并能与 FlaxHugging Face transformers 等其他库集成。

AXLearn 为大规模训练而生。它支持在数千个加速器上以高利用率训练参数高达数千亿的模型。它同样设计用于在公有云上运行,并提供了部署和管理任务及数据的工具。基于 GSPMD 构建,AXLearn 采用了全局计算范式,允许用户在虚拟的全局计算机上描述计算,而非基于单个加速器。

AXLearn 支持广泛的应用领域,包括自然语言处理、计算机视觉和语音识别,并包含了用于训练最先进模型的基准配置。

欲了解更多关于 AXLearn 核心组件和设计的详细信息,请参阅 核心概念。如果你想立即动手实践,请查看 快速开始

7 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私 ·  条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 12 ms
Developed with Cursor