❓ Encord Active是什么?
[Encord Active][encord-active-landing]是一个开源工具包,用于测试、验证和评估您的模型,并发现、整理和优先处理最有价值的数据进行标注,以提升模型性能。
使用Encord Active可以:
- 通过高级错误分析来测试、验证和评估您的模型
- 生成模型可解释性报告
- 发现、整理和优先处理最有价值的数据进行标注
- 使用自然语言搜索您的数据(测试版功能)
- 查找并修复数据集错误和偏差(重复项、异常值、标签错误)
![主页视觉效果]
安装
最简单的安装CLI的方法是在合适的虚拟环境中使用pip
:
pip install encord-active
我们建议使用虚拟环境,比如venv
:
python3.9 -m venv ea-venv
source ea-venv/bin/activate
pip install encord-active
encord-active
需要[python3.9][python-39]。 如果您在安装encord-active
时遇到问题,可以在这里找到更详细的安装说明。如果您只想看看它的运行效果,可以尝试这个Colab笔记本。
👋 快速入门
通过加载您的环境并运行以下代码即可立即开始。 这将下载一个小型数据集并为您启动Encord Active应用程序以供探索:
encord-active quickstart
docker run -it --rm -p 8000:8000 -v ${PWD}:/data encord/encord-active quickstart
打开UI后,我们建议您查看[工作流程文档][encord-active-docs-workflow]以了解一些常见的工作流程。
💡 何时使用Encord Active?
Encord Active可以帮助您在计算机视觉旅程的各个阶段理解和改进您的数据、标签和模型。
无论您是刚开始收集数据、标注了第一批样本,还是已经有多个模型在生产环境中运行,Encord Active都能为您提供帮助。
🚀 Encord Active版本
Encord Active (EA)有两个版本:
- Encord Active云版 🌥️
- Encord Active开源版 💻
[Active云版][active-cloud]与[Encord Annotate][annotate]紧密集成,Active云版和Annotate由Encord托管 - 您可以注册并开始使用Active,无需安装任何东西。
或者自行托管并开始在本地使用开源工具包 ⬇️。
🔖 文档
我们的完整文档可在[这里][encord-active-docs]找到。特别是,我们建议查看:
⬇️ 下载沙盒数据集
快速熟悉Encord Active的另一种方法是从其沙盒下载数据集。 下载命令将询问使用哪个预构建数据集,并将其下载到当前工作目录中的新目录中。
encord-active download
cd /path/of/downloaded/project
encord-active start
然后应用程序应该在浏览器中打开。
如果没有,请导航到localhost:8000
。
我们的[文档][encord-active-docs]包含有关页面中可以看到的内容的更多信息。
导入您的数据集
快速导入数据集
要导入您的数据(不包含标签),将您的数据保存在一个目录中并运行以下命令:
# 在虚拟环境中
encord-active init /path/to/data/directory
将使用目录中的数据创建一个项目。
要启动项目,请运行:
cd /path/to/project
encord-active start
你可以在[文档][encord-active-docs-init]中找到关于init
命令的更多详细信息。
从COCO导入
要从COCO导入你的数据、标签和预测,将数据保存在一个目录中并运行以下命令:
# 安装COCO额外功能
(ea-venv)$ python -m pip install encord-active[coco]
# 导入带有COCO注释的样本
encord-active import project --coco -i ./images -a ./annotations.json
# 导入COCO模型预测
encord-active import predictions --coco results.json
从Encord平台导入
本节需要[在Encord上设置ssh密钥][encord-docs-ssh],因此稍微更加技术性。
要导入Encord项目,请使用以下命令:
encord-active import project
该命令将允许你搜索你的Encord项目并选择要导入的项目。
⭐ 概念和功能
质量指标:
质量指标应用于你的数据、标签和预测,以分配质量指标分数。 插入你自己的或依赖Encord Active的预构建质量指标。 质量指标自动分解你的数据、标签和模型质量,从以数据为中心的角度向你展示如何提高模型性能。 Encord Active附带25多个指标,更多指标即将推出;也非常欢迎[贡献][contribute-url]。
核心功能:
访问我们的[文档][encord-active-docs]了解更多信息。
支持的数据:
数据类型 | 标签 | 项目规模 | |||
---|---|---|---|---|---|
jpg | ✅ | 边界框 | ✅ | 图像 | 25,000 |
png | ✅ | 多边形 | ✅ | 视频 * | 25,000 帧 |
tiff | ✅ | 分割 | ✅ | ||
mp4 * | ✅ | 分类 | ✅ | ||
折线 | 🟡 |
* 需要[Encord Annotate][annotate]账户
Active Cloud 🌩️
不想在你的服务器上托管Encord Active?或者你正在为你的项目加载超过25k张图像?查看[Active Cloud][active-cloud],它扩展了Encord Active开源的功能,帮助你:
✅ 通过集合更好地策划数据集
✅ 使用内置和自定义指标评估模型
✅ 执行自然语言搜索
✅ 通过图像搜索你的数据集
✅ 与注释平台集成
✅ 按元数据过滤
![active-cloud][active-banner]
[免费试用][try-cloud-free]
🧑🏽💻开发
🛠 构建你自己的质量指标
Encord Active的构建考虑到了可定制性。因此,你可以轻松构建自己的自定义指标 🔧。 有关此主题的详细信息,请参阅文档中的[编写你自己的指标][encord-active-docs-write-metric]页面。
如果你需要帮助或指导,请随时在我们的 [Slack工作区][slack-join] 中联系我们!
👪 社区和支持
[加入我们的Slack社区][slack-join]以与Encord Active背后的团队联系。 此外,请随时通过GitHub问题[提出改进建议或报告问题][report-issue]。
🎇 贡献
如果你在组织中使用Encord Active,请尝试将你的公司名称添加到[ADOPTERS.md][adopters]。这确实有助于项目获得动力和可信度。这是对项目的一个小贡献,但影响很大。
如果你想分享你的自定义指标或改进该工具,请查看我们的[贡献文档][contribute-url]。
🦸 贡献者
BibTeX
@misc{Encord2024,
author = {Encord},
title = {Encord Active},
year = {2024},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/encord-team/encord-ctive}},
}
许可证
该存储库根据Apache 2.0许可证发布。