LabelLLM:开源数据标注平台
简体中文 | English
产品介绍
LabelLLM是一个创新的开源平台,致力于优化大型语言模型开发中不可或缺的数据标注过程。它专为独立开发者和中小型研究团队设计,旨在提高标注效率。LabelLLM的核心承诺是通过提供全面的任务管理解决方案和多样化的多模态数据支持,简化并提高模型训练的数据标注过程。
主要特点
灵活配置
LabelLLM以其适应性强的框架著称,提供一系列可定制的特定任务工具,以满足各种数据标注项目的多样需求。这种灵活性使其能够无缝集成到各种任务参数中,成为模型训练数据准备中的宝贵资产。
多模态数据支持
认识到数据多样性的重要性,LabelLLM扩展了其功能,涵盖了广泛的数据模态,包括音频、图像和视频。这种全面的方法确保用户可以在单一统一平台下进行涉及多种类型数据的复杂标注项目。
全面的任务管理
为确保最高标准的质量和效率,LabelLLM具有全面的任务管理系统。该系统提供实时监控标注进度和质量控制,从而保证所有项目数据准备阶段的完整性和及时性。
人工智能辅助标注
LabelLLM支持预标注加载,用户可以根据实际需求进行细化和调整。这一功能提高了标注的效率和准确性。
https://github.com/user-attachments/assets/1acb2096-38dc-4225-8aa5-bdb616862679
产品特性
多功能性
通过LabelLLM,用户可以访问广泛的数据标注工具套件,设计用于满足各种任务需求,同时不影响标注的效率或精确度。
用户友好
除了强大的功能外,LabelLLM还特别注重用户体验,提供直观的配置和工作流程,简化数据标注任务的设置和分配。
效率提升
通过incorporateAI辅助标注,LabelLLM大幅提高了标注效率。
入门指南
视频教程
点击下方图片观看视频:
本地部署
-
在本地克隆项目或下载项目代码压缩包。
-
安装Docker,选择相应的操作系统类型并下载安装,然后启动Docker服务。
Docker安装教程:https://docs.docker.com/get-docker/
-
在相应项目的文件地址下运行命令:
docker compose up
注意:初次安装可能需要一些时间,请耐心等待并确保网络连接良好。
如果你在中国,可以使用以下命令加快下载速度:// /etc/docker/daemon.json { "registry-mirrors": [ "https://docker.m.daocloud.io" ] }
-
打开浏览器访问 Localhost:9001。
用户名:user 密码:password
-
创建新的访问密钥并填写以下字段:
- 访问密钥:MekKrisWUnFFtsEk
- 密钥:XK4uxD1czzYFJCRTcM70jVrchccBdy6C
你可以在 ./backend/.env 文件中找到内置的AK/SK环境变量。或者,你可以创建新的访问密钥并更新.env文件中的AK/SK。
-
打开浏览器访问以下地址:
http://localhost:8086/supplier 标注
http://localhost:8086/operator 管理
将localhost替换为相应的ip地址,可以与其他团队成员共享,他们可以直接使用而无需重复部署。
首个注册账号将默认设置为管理员,后续账号需要设置才能获得操作端账号权限,请不要忘记首个注册账号和密码!
引用
@article{he2024opendatalab,
title={Opendatalab: Empowering general artificial intelligence with open datasets},
author={He, Conghui and Li, Wei and Jin, Zhenjiang and Xu, Chao and Wang, Bin and Lin, Dahua},
journal={arXiv preprint arXiv:2407.13773},
year={2024}
}
技术交流
欢迎加入Opendatalab官方微博群!
链接
配置详情
后端文档 配置文件
前端文档 配置文件