#数据标注

Scale - 优化AI应用的全方位数据服务平台
热门AI开发模型训练AI工具Scale GenAI Platform企业AI数据标注生成AIAI应用开发
Scale AI为自动驾驶、地图、AR/VR、机器人等多领域提供优质数据服务,并通过其先进的生成AI平台,帮助企业释放AI潜力,加速技术革新。
autolabel - 利用大语言模型自动标注、清洗和丰富文本数据集的Python库
AutolabelRefuelLLMPython库数据标注Github开源项目
Autolabel是一个Python库,利用大语言模型(LLM)自动标注、清洗和丰富文本数据集。它大幅减少手动标注的时间和成本,同时提供高准确率的标注结果。该库支持多种NLP任务,如分类、问答、命名实体识别等,兼容OpenAI、Anthropic、HuggingFace等多家提供商的LLM。Autolabel还提供信心估算、结果解释、缓存和状态管理功能,并支持使用Refuel托管的开源LLM进行标注。用户可根据具体任务配置标注指南,并通过简单的三步流程完成数据标注。
Adala - 提供灵活可扩展运行时环境的自主数据标注框架
Adala数据标注人工智能机器学习自适应学习Github开源项目
Adala 是一个用于数据处理的自主数据标注框架,具备灵活的运行时环境和Python集成。通过迭代学习,系统内的智能体可以独立获取技能,适应不同的环境。Adala 提供可靠的数据处理结果和多种定制化选项,适合AI工程师、机器学习研究人员、数据科学家和教育工作者使用,并兼容OpenAI和VertexAI等大型语言模型。
xtreme1 - 开源多模态训练数据平台,专注于数据标注、管理和本体管理,支持计算机视觉和大模型项目
Xtreme1数据标注AI驱动工具多模式训练数据计算机视觉Github开源项目
Xtreme1是一款开源多模态训练数据平台,专注于数据标注、管理和本体管理,支持计算机视觉和大模型项目。凭借AI驱动工具,高效进行2D/3D物体检测、分割及LiDAR-摄像头融合,提升效率。平台具有强大的数据管理和质量监控功能,并提供模型结果可视化,辅助模型评估。Xtreme1云端版本长期免费,安装方便,兼容多种操作系统和硬件。
DLTA-AI - AI赋能的数据标注、追踪和注释工具
DLTA-AI数据标注目标跟踪分割模型机器学习Github开源项目
一款集成先进计算机视觉模型的工具,简化图像数据集创建,支持零样本分割和目标跟踪,提供多种模型选择与自定义导出格式,无缝结合Labelme,提升标注效率。
dataspeech - 简化语音数据集标注与处理的实用工具
Data-Speech数据标注语音数据集音频转换语音AIGithub开源项目
Data-Speech是一套用于语音数据集标注的实用脚本工具。它提供简洁代码库,支持音频转换和注释,有助于语音AI模型开发。该工具能重现研究论文中的注释方法,使用自然语言描述标注说话者特征。Data-Speech可处理LibriTTS-R和MLS等数据集,并为Parler-TTS库提供支持。它提供从数据集注释、特征映射到自然语言描述生成的完整工作流程。
deepdataspace - 开源计算机视觉数据集工具 提供可视化 标注和分析功能
DeepDataSpace数据可视化数据标注模型分析开源数据集工具Github开源项目
DeepDataSpace是一个开源计算机视觉数据集工具,提供交互式数据可视化、探索和智能标注功能。支持多平台和协作工作流,易于安装使用。通过直观界面帮助用户高效管理和分析大规模图像数据集,适用于CV项目开发和研究。
label-studio-frontend - React数据标注前端库 满足多场景需求
前端库ReactGithub开源项目Label Studio数据标注开源工具
Label Studio Frontend是基于React开发的开源数据标注前端库。作为NPM包可集成到应用中,支持图像、音频、文本等多种标注类型。该库提供灵活的配置选项和丰富的界面控件,允许开发者根据具体需求进行定制。适用于构建各类数据标注系统,为机器学习和人工智能项目提供标注支持。
label-studio-converter - 多格式标注数据转换工具 Label Studio Converter
数据导入Github开源项目Label Studio数据标注格式转换机器学习
Label Studio Converter是一款开源的标注数据转换工具,可将Label Studio的标注结果转换为JSON、CSV、CoNLL 2003、COCO、Pascal VOC XML等多种机器学习格式。此外,它还支持将YOLO格式的预标注数据导入Label Studio。通过命令行和Python API接口,Label Studio Converter简化了数据格式转换流程,有效连接了数据标注和模型训练环节。
labelU - 多模态数据标注平台 支持图像视频音频处理
LabelU数据标注人工智能多模态数据开源平台Github开源项目
LabelU是一个多模态数据标注平台,提供图像、视频和音频处理工具。支持2D边界框、语义分割、多边形和关键点等图像标注功能,以及视频分割、分类和信息提取。具备音频分析能力,支持AI辅助标注。适用于数据分析和模型训练,提高标注效率和准确性。
LLM4Annotation - 大型语言模型在数据标注中的应用及研究进展
大语言模型数据标注知识蒸馏提示工程少样本学习Github开源项目
LLM4Annotation项目概述了大型语言模型在数据标注领域的应用研究。该项目涵盖LLM标注方法、质量评估及学习利用等方面,探讨了LLM提升数据标注效率和质量的潜力。这份综述为相关研究人员提供了系统性参考,展示了LLM在数据标注领域的最新进展。
GTS - 全球领先的AI训练数据集收集和标注服务
AI工具AI数据集机器学习数据收集数据标注人工智能
GTS作为AI数据集收集和标注领域的先驱,拥有25年以上行业经验,为机器学习模型提供高质量图像、视频、语音和文本数据集。公司提供全面的数据管理解决方案,包括数据标注、操作优化、流程部署和人机协作。GTS专注为各行业提供准确可靠的AI训练数据,推动AI技术发展与应用。
Clickworker - 全球众包平台提供AI训练数据与数据管理服务
AI工具AI训练数据机器学习众包数据标注clickworker
Clickworker作为一家专业众包平台,汇聚了600多万名来自136个国家的众包工作者。平台提供包括音频、图像、视频在内的高质量AI训练数据集,并提供内容编辑、问卷调查、网络研究、分类标记等数据管理服务。通过移动应用实现全球数据采集,为AI和机器学习项目提供定制化训练数据。公司拥有ISO 27001认证,符合GDPR要求,注重数据质量与安全性。
Encord - 优化计算机视觉和多模态AI模型开发流程的综合平台
AI工具Encord数据开发平台计算机视觉AI模型数据标注
Encord是一个面向计算机视觉和多模态AI团队的数据开发平台。它提供了智能数据管理、清理和整理工具,简化了标注和工作流程管理,并支持AI模型性能评估。平台集成了数据管理、标注和模型评估功能,有助于提升模型质量和加快AI应用开发。Encord支持多种视觉格式,具备高级过滤功能,并注重数据安全。它能与云存储和MLOps工具无缝集成,为AI开发提供全面解决方案。
Surge AI - 全球顶尖AI数据标注与RLHF平台
AI工具Surge AI数据标注人工智能语言模型RLHF
Surge AI提供全球化数据标注服务,为AI和大型语言模型训练提供高质量数据。支持RLHF、内容审核、搜索评估等多种场景,覆盖40多种语言。通过现代化API和工具,帮助企业高效获取人工数据,加速AI开发与评估。全球顶级AI公司的首选合作伙伴。
Innovatiana - 马达加斯加数据标注外包服务商致力于社会影响力
AI工具数据标注人工智能外包服务道德外包数据质量
Innovatiana是一家位于马达加斯加的数据标注外包服务商,为人工智能项目提供高质量数据标注。公司注重员工福利,提供公平薪酬和良好工作环境。服务涵盖计算机视觉、自然语言处理、数据收集等领域,采用灵活定价和严格质量控制。Innovatiana通过创造就业机会和道德外包,在提供优质服务的同时实现积极社会影响。
MD.ai - 医学影像AI平台助力放射学报告和数据标注
AI工具医疗影像AIDICOM数据标注临床报告AI工作流程
MD.ai作为医学影像AI平台,专注加速放射学AI模型开发。提供DICOM数据标注工具,应用语言模型优化临床报告。支持多设备同步、多语言操作,具备AI辅助标注、PHI检测功能。助力医疗专业人员构建高质量数据集和AI模型,推动放射学AI技术进步。
Datature - 一体化AI视觉平台简化企业计算机视觉应用开发
AI工具计算机视觉人工智能模型训练数据标注模型部署
Datature是一个无代码计算机视觉MLOps平台,提供数据管理、标注、训练和部署的全流程解决方案。支持图像分类、目标检测和分割等任务,具备AI辅助标注和自动模型训练功能,可显著提高开发效率。适用于医疗、零售和智慧城市等多个领域,有助于快速开发AI视觉应用。平台还提供开发工具,支持大规模部署和集成,是一个功能完备的计算机视觉开发平台。
Label Studio - 开源数据标注工具支持多种数据类型
AI工具数据标注开源平台Label Studio机器学习人工智能
Label Studio是一款开源数据标注工具,支持图像、音频、文本、时间序列等多种数据类型。该平台提供灵活配置,可集成机器学习模型辅助标注,支持多用户协作。适用于准备训练数据、微调大语言模型和验证AI模型等场景,为数据科学和机器学习工作提供支持。
BasicAI - 专业数据标注平台和服务 提升AI模型性能
AI工具数据标注AI模型BasicAI训练数据平台自动标注
BasicAI为全球AI企业提供专业数据标注服务和平台。支持图像、视频、音频、文本和传感器融合等多种数据类型,已标注超30万数据集。BasicAI Cloud平台集成自动化标注工具和团队管理功能,显著提升标注效率和质量。拥有160多个领域专家团队,在自动驾驶、ADAS和智慧城市等领域积累丰富经验,为AI模型优化提供可靠支持。
Hasty - 智能视觉数据处理与AI模型开发平台
AI工具AI模型训练数据标注质量控制计算机视觉数据安全
Hasty是一个专业的视觉AI解决方案平台,整合智能数据标注、质量控制、模型训练和部署功能,为视觉AI开发提供全面解决方案。平台运用AI技术优化标注流程,实现90%质量控制自动化,并提供便捷的模型训练与部署工具。作为一站式视觉AI开发环境,Hasty简化了从原始图像到生产就绪模型的全过程,降低了对MLOps专业技能的需求。平台严格遵守HIPAA、GDPR和ISO-IEC 27001安全标准,保障用户数据所有权和隐私,为用户提供安全可靠的视觉AI开发体验。
People For AI - 专业数据标注服务 为机器学习项目提供训练数据集
AI工具数据标注AI项目机器学习图像标注数据质量
People For AI提供专业数据标注服务,专注于机器学习项目的训练数据集制作。公司擅长复杂图像和文本标注,采用内部长期雇佣的专业人员确保质量和安全。透明的项目管理和专家团队支持是其特色。通过高质量数据标注,People For AI旨在加速客户的AI项目部署进程。
sammo - 大型语言模型提示词运行和优化库
SAMMO大语言模型提示工程数据标注并行处理Github开源项目
SAMMO是一个用于运行和优化大型语言模型提示词的开源库。该项目支持数据标注、提示词设计、指令优化、提示词压缩和大规模执行等功能。SAMMO提供并行化和速率限制能力,可进行大规模查询而不会过载API。这个库适合需要高效处理和优化LLM提示词的多种应用场景。