Logo

#数据质量

applied-ml学习资源汇总 - 大型科技公司机器学习实践分享

1 个月前
Cover of applied-ml学习资源汇总 - 大型科技公司机器学习实践分享

数据中心AI:新兴的人工智能范式

2 个月前
Cover of 数据中心AI:新兴的人工智能范式

RedPajama-Data-v2: 一个包含30万亿个令牌的开放数据集,用于训练大型语言模型

2 个月前
Cover of RedPajama-Data-v2: 一个包含30万亿个令牌的开放数据集,用于训练大型语言模型

Argilla: 人工智能工程师和领域专家的数据集协作工具

2 个月前
Cover of Argilla: 人工智能工程师和领域专家的数据集协作工具

CleanVision: 开源图像数据集审核工具助力数据中心化计算机视觉

2 个月前
Cover of CleanVision: 开源图像数据集审核工具助力数据中心化计算机视觉

大型语言模型的数据管理:提升AI性能的关键

2 个月前
Cover of 大型语言模型的数据管理:提升AI性能的关键

应用机器学习:从理论到实践的探索之旅

2 个月前
Cover of 应用机器学习:从理论到实践的探索之旅

Argilla: 打造高质量AI数据集的协作工具

2 个月前
Cover of Argilla: 打造高质量AI数据集的协作工具

相关项目

Project Cover
argilla
Argilla是一款为AI工程师和领域专家设计的数据集管理工具,旨在通过高效的数据管理和标注流程提升AI项目的数据质量和模型效果。Argilla支持文本分类、命名实体识别和多模态模型等多种AI项目的数据收集和反馈,帮助用户快速迭代和优化数据与模型。该工具提供开源社区支持,用户可以参与并共享开源数据集和模型。通过与Hugging Face Spaces的集成,用户可以轻松部署和使用Argilla,提高AI项目的整体效率和质量。
Project Cover
Evidently AI
Evidently AI是一个开源的AI质量协作平台,旨在评估、测试和监控机器学习、LLM及通用AI应用。此平台帮助用户管理AI产品质量,维护模型性能,及时识别及应对数据偏移和异常。它支持文本、表格数据和嵌入式数据的监控,适用于各种规模的公司,提供直观的界面与丰富的可视化功能。
Project Cover
applied-ml
通过精选的论文、文章和博客,学习企业如何实施数据科学与机器学习项目。了解不同公司对问题的定义、所采用的机器学习技术、背后的科学原理,以及所取得的商业成果,以便更好地评估投资回报。同时还包括最新的机器学习研究进展和实用指南。
Project Cover
OpenMetadata
OpenMetadata是一个开源元数据管理平台,集成数据发现、观察和治理功能。它拥有中央元数据存储库、列级血缘分析和团队协作工具,支持75种以上数据源连接器。该平台致力于帮助组织充分利用数据资产,实现全面的元数据管理。
Project Cover
RedPajama-Data
RedPajama-Data-v2是一个包含30万亿tokens的开放数据集,用于训练大型语言模型。该数据集涵盖了超过100B的文本文档,来源于84个CommonCrawl快照。它包含英语、德语、法语、意大利语和西班牙语5种语言的内容,并提供多种质量信号和去重处理。项目提供完整的数据处理流程,包括准备工件、计算质量信号和去重等步骤,为语言模型研究提供高质量的大规模语料资源。
Project Cover
Prolific
Prolific平台为研究项目提供可靠的在线参与者。20万多经过严格审核的用户保证数据质量和真实性。支持文本、图像、语音等多种研究形式,适用于学术、AI、产品开发和市场调查等领域。自助式操作简便,平均2小时内完成数据收集,并提供API支持自动化和扩展。Prolific致力于为全球研究提供高效、多样化的数据解决方案。
Project Cover
Branded Research
这是一个利用AI技术确保数据质量的市场调研平台,提供独特的受众抽样和深入的消费者洞察。通过先进算法和多元化受众群体,平台支持产品开发、概念测试等研究,并提供API接口实现自动化访问。该平台致力于捕捉消费者态度和情感,为企业决策提供全面、智能的见解支持。平台拥有超过20万名研究参与者,覆盖100多个消费者细分市场和行业。其AI验证技术可以95%以上的准确率识别无效回复,确保数据质量。
Project Cover
Innovatiana
Innovatiana是一家位于马达加斯加的数据标注外包服务商,为人工智能项目提供高质量数据标注。公司注重员工福利,提供公平薪酬和良好工作环境。服务涵盖计算机视觉、自然语言处理、数据收集等领域,采用灵活定价和严格质量控制。Innovatiana通过创造就业机会和道德外包,在提供优质服务的同时实现积极社会影响。
Project Cover
Prolific
Prolific作为专业的在线研究参与者招募平台,为学术研究、人工智能开发和市场调查等领域提供高质量数据。平台拥有超过20万名经过严格审核的活跃参与者,保证数据真实性和可靠性。支持灵活的项目设计,提供300多种筛选条件,通常在2小时内即可完成数据收集。Prolific凭借严谨和道德的方法,为全球研究人员和组织提供多样化的优质数据资源,赢得众多知名机构的信赖。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号