
官方网站 • 文档 • Twitter • 加入 Slack 社区 
Label Studio 是一个开源的数据标注工具。它通过简洁直观的用户界面,支持对音频、文本、图像、视频和时间序列等多种数据类型进行标注,并能将标注结果导出为多种模型格式。该工具既可用于准备原始数据,也可用于改进现有训练数据,以获得更精确的机器学习模型。

有自定义数据集?您可以定制 Label Studio 以满足您的需求。阅读这篇介绍性博客文章了解更多信息。
您可以在本地安装 Label Studio,或将其部署在云实例中。也可以尝试 Label Studio Teams。
Label Studio 的官方 Docker 镜像位于此处,可通过 docker pull 下载。
在 Docker 容器中运行 Label Studio,并通过 http://localhost:8080 访问。
docker pull heartexlabs/label-studio:latest
docker run -it -p 8080:8080 -v `pwd`/mydata:/label-studio/data heartexlabs/label-studio:latest
所有生成的资源,包括 SQLite3 数据库存储 label_studio.sqlite3 和上传的文件,都将位于 ./mydata 目录中。
您可以通过附加新的参数来覆盖默认的启动命令:
docker run -it -p 8080:8080 -v `pwd`/mydata:/label-studio/data heartexlabs/label-studio:latest label-studio --log-level DEBUG
如果您想构建本地镜像,请运行:
docker build -t heartexlabs/label-studio:latest .
Docker Compose 脚本提供了一个生产就绪的堆栈,包含以下组件:
要从 http://localhost 开始使用该应用,请运行以下命令:
docker-compose up
# 要求 Python >=3.7 <=3.9
pip install label-studio
# 在 http://localhost:8080 启动服务器
label-studio
conda create --name label-studio
conda activate label-studio
pip install label-studio
您可以在本地运行最新的 Label Studio 版本,而无需通过 pip 安装包。
# 安装所有包依赖项
pip install -e .
# 运行数据库迁移
python label_studio/manage.py migrate
# 在开发模式下启动服务器,地址为 http://localhost:8080
python label_studio/manage.py runserver
您可以通过一键部署在 Heroku、Microsoft Azure 或 Google Cloud Platform 上部署 Label Studio:
Label Studio 应用的前端部分位于 frontend/ 文件夹中,使用 React JSX 编写。如果您在那里进行了一些更改,在构建/启动实例之前应运行以下命令:
cd label_studio/frontend/
npm ci
npx webpack
cd ../..
python label_studio/manage.py collectstatic --no-input
如果在安装过程中看到任何错误,请尝试重新运行安装命令:
pip install --ignore-installed label-studio
要在 Windows 上运行 Label Studio,请从 Gohlke builds 下载并安装以下 wheel 包,以确保使用正确版本的 Python:
- lxml
# 升级 pip
pip install -U pip
# 如果您在 Win64 上运行 Python 3.8,请安装从 Gohlke 下载的包:
pip install lxml‑4.5.0‑cp38‑cp38‑win_amd64.whl
# 安装 label studio
pip install label-studio
pip install -r deploy/requirements-test.txt
cd label_studio
# postgres(假设使用默认的 postgres 用户、数据库、密码)
DJANGO_DB=default DJANGO_SETTINGS_MODULE=core.settings.label_studio python -m pytest -vv -n auto
# sqlite3
DJANGO_DB=sqlite DJANGO_SETTINGS_MODULE=core.settings.label_studio python -m pytest -vv -n auto

Label Studio 包含多种模板来帮助您标注数据,您也可以使用专门设计的配置语言创建自己的模板。最常见的标注模板和用例包括以下几种:

使用 Label Studio 机器学习 SDK 连接您最喜欢的机器学习模型。请按照以下步骤操作:
这使您可以:
您可以将 Label Studio 用作机器学习工作流的独立部分,也可以将其前端或后端集成到现有工具中。
| 项目 | 描述 |
|---|---|
| label-studio | 服务器,以 pip 包形式分发 |
| label-studio-frontend | React 和 JavaScript 前端,可以在 Web 浏览器中独立运行或嵌入到您的应用程序中。 |
| data-manager | 用于管理数据的 React 和 JavaScript 前端。包含 Label Studio Frontend。依赖于 label-studio 服务器或具有预期 API 方法的自定义后端。 |
| label-studio-converter | 以您最喜欢的机器学习库的格式编码标签 |
| label-studio-transformers | 连接并配置用于 Label Studio 的 Transformers 库 |
想使用超酷功能 X但 Label Studio 不支持?查看我们的公共路线图!
@misc{Label Studio,
title={{Label Studio}: Data labeling software},
url={https://github.com/heartexlabs/label-studio},
note={Open source software available from https://github.com/heartexlabs/label-studio},
author={
Maxim Tkachenko and
Mikhail Malyuk and
Andrey Holmanyuk and
Nikolai Liubimov},
year={2020-2022},
}
本软件根据 Apache 2.0 LICENSE 获得许可 © Heartex。2020-2021
