Encord Active 项目介绍
什么是 Encord Active?
Encord Active 是一个开源工具包,旨在测试、验证和评估模型,并优先处理对标签最有价值的数据,以提升模型性能。它能够帮助用户在数据收集、标签样本标注和模型生产等各个阶段理解和改善数据、标签和模型。
使用 Encord Active,用户可以:
- 通过高级错误分析测试、验证和评估模型
- 生成模型可解释性报告
- 搜索、策划和优先考虑最有价值的标签数据
- 利用自然语言搜索数据(测试版功能)
- 找出并修正数据集中的错误和偏差(如重复项、异常值、标签错误)
安装指南
要安装 Encord Active 的 CLI,推荐在合适的虚拟环境中使用 pip
:
pip install encord-active
建议使用虚拟环境工具如 venv
来管理环境:
python3.9 -m venv ea-venv
source ea-venv/bin/activate
pip install encord-active
Encord Active 需要 Python 3.9。如果安装时遇到困难,可参考官方文档以获取详细的安装说明。
快速开始
通过以下命令可以立即启动 Encord Active 项目:
encord-active quickstart
也可以使用 Docker 运行:
docker run -it --rm -p 8000:8000 -v ${PWD}:/data encord/encord-active quickstart
这将下载一个小型数据集并启动 Encord Active 应用程序供用户探索。
使用场景
Encord Active 在计算机视觉项目的各个阶段都能提供帮助。无论用户刚开始数据收集、完成了第一批样本的标注,还是已有多个模型在生产环境中运行,Encord Active 都能帮助用户分析和提升数据与模型的质量。
Encord Active 版本
Encord Active 提供两种版本:
- Encord Active Cloud
- Encord Active OS
Active Cloud 可与 Encord Annotate 紧密集成,无需安装,即可开箱使用。而 Active OS 允许用户自行托管,并且是完全开源的工具包版本。
关键功能
- 数据探索与标签分布分析
- 数据、标签异常值检测
- 模型分解(包括目标检测模型和分类模型)
- 相似性搜索
- 数据和标签标记
- TP/FP/FN 可视化分析
数据类型支持
Encord Active 支持多种数据类型和标签格式,如 jpg
、png
、tiff
、mp4
,以及Bounding Boxes、Polygons、Segmentations和Classifications等多种标注类型。
社区与支持
用户可以通过加入 Slack 社区来与 Encord Active 团队建立联系,反馈意见或报告问题。项目欢迎开源贡献,如果企业正在使用 Encord Active,鼓励将公司加入 ADOPTERS 列表,为项目增加动力和可信度。
Encord Active 是一个非常灵活且可扩展的工具,旨在帮助开发者和数据科学家更好地利用数据以提高模型性能。通过开源的方式提供,越来越多的功能和改进正在逐步加入其中,为用户提供强大的数据处理和模型优化支持。