Logo

#数据转换

Logo of trex
trex
Trex是一款将非结构化数据转换为结构化数据的工具。通过指定正则表达式或上下文无关语法,Trex能智能地调整数据以符合指定的架构。用户可以通过Python客户端和API密钥,在云端或本地系统中进行自托管。Trex具备结构化JSON生成、自定义CFG生成和正则生成等功能,且处理速度显著提升,并有明确的开发计划,以满足更多智能模型需求。
Logo of Jaiqu
Jaiqu
Jaiqu是一款基于AI的JSON转换工具,采用jq查询语言语法实现自动化数据处理。它支持模式验证、模糊匹配和复杂数据映射,能将任意JSON输入转换为目标格式。这个开源项目为开发者提供了高效的JSON处理解决方案,尤其适合需要频繁进行数据格式转换的应用场景。
Logo of content-collections
content-collections
Content Collections是一个开源的内容管理工具,可将多种格式内容转换为类型安全的数据集合。它提供流畅的开发体验和简洁的API,支持内容预处理和自动更新。该工具适配多种主流Web框架,通过内置验证保证数据准确性,使开发者能更专注于应用构建。Content Collections无需手动获取解析数据,可显著提升开发效率。
Logo of collapse
collapse
collapse是一款强大的R语言数据处理和统计分析工具包。基于C/C++开发,它提供了高效的统计函数、数据操作和内存管理功能。支持分组计算、加权分析,兼容多种数据类型和R包。collapse还具备高级聚合、数据转换和时间序列分析能力,其高性能算法使其尤其适合处理大规模复杂数据集。
Logo of laravel-responder
laravel-responder
此包支持通过Fractal transformers转换数据,生成和序列化成功与错误响应,处理例外情况,并辅助响应测试。兼容PHP 7.0+及Laravel 5.1+或Lumen 5.1+,可通过Composer安装,提供多种响应创建方法,包括服务注入、helper函数和facade。提供高质量响应并配备详尽文档,便于开发者快速上手。
Logo of uniflow-llm-based-pdf-extraction-text-cleaning-data-clustering
uniflow-llm-based-pdf-extraction-text-cleaning-data-clustering
uniflow是一个开源项目,为多种文档类型提供统一的LLM接口,实现数据提取和转换。支持PDF、HTML和TXT等格式,兼容OpenAI、Google Gemini和AWS BedRock等主流LLM模型。该项目致力于解决遗留文档处理和数据准备的难题,为数据科学家提供生成隐私保护训练数据集的工具,简化LLM微调流程。uniflow还包含多个实用案例,如财务报告分析和教育资料问答生成等。
Logo of jsonAi.cloud
jsonAi.cloud
jsonAi.cloud是一个创新的在线平台,专门用于将各种数据快速转换为结构化JSON格式。用户可以定义自定义JSON schema并创建专用API endpoint。通过发送数据,用户可接收AI驱动的结构化JSON响应。平台支持复杂的嵌套对象和自定义字段,提供实时测试和调整功能。jsonAi.cloud提供免费和灵活的付费计划,确保数据安全性,并优化API响应时间。这是一个面向开发者和企业的高效、灵活的解决方案,用于处理和转换多种格式的数据。
Logo of Labelme2YOLO
Labelme2YOLO
Labelme2YOLO是一个开源工具,用于将LabelMe标注工具的JSON格式转换为YOLO文本文件格式。它支持批量转换和单文件转换,能自动分割训练验证集,并可生成YOLOv5 v7.0实例分割数据集。通过简单的命令行操作,用户可获得YOLO格式的标签、图像文件和dataset.yaml配置。这个工具简化了数据集准备过程,方便了YOLO目标检测和实例分割任务的开展。
Logo of datacap
datacap
DataCap是一个开源的数据管理与分析平台,支持多种数据源和数据库类型。该平台集成了数据转换、集成和可视化功能,能够高效处理大数据、关系型和NoSQL数据库。DataCap提供丰富的数据库连接器,包括ClickHouse、MySQL和PostgreSQL等主流数据库,方便用户进行多源数据管理、转换、图表制作和监控。
Logo of transform
transform
Transform是一个开源的在线代码转换平台,支持多种编程语言和数据格式间的互相转换。该平台提供直观的界面,方便开发者进行代码转换、格式化和优化。Transform能高效处理JSON、XML、CSS等多种格式,提升开发效率。平台还支持自定义转换规则,可满足特定项目需求。作为一个功能丰富的开源工具,Transform为开发者提供了便捷的代码处理解决方案。
Logo of ReportPDF
ReportPDF
ReportPDF是一款AI驱动的在线工具,将电子表格数据转换为结构清晰的PDF报告。该工具自动分析数据,生成视觉吸引的报告,适用于财务报表、市场分析和项目进度等多种场景。这一创新解决方案提高了报告制作效率,为企业和专业人士节省时间。ReportPDF能够生成专业、美观的报告输出。
Logo of recap
recap
Recap是一个开源数据模式管理工具,支持从多种数据源读取和写入标准格式的数据模式。它兼容Avro、BigQuery、Confluent Schema Registry等格式,提供命令行界面、HTTP/JSON网关和API接口。Recap内置模式注册表功能,可进行模式存储和版本控制。该工具简化了数据集成和模式管理流程,适用于各类数据处理场景。
Logo of prql
prql
PRQL是一种新兴的数据查询语言,旨在提供比SQL更简洁和强大的管道式查询功能。它保留了SQL的可读性和声明性特点,同时引入了变量和函数等抽象概念。PRQL可编译成SQL,因此兼容各种SQL数据库。它简化了复杂查询的编写过程,提升了数据处理效率。目前PRQL处于活跃开发阶段,已支持多种开发环境,并持续优化功能和稳定性。
Logo of hamilton
hamilton
Hamilton是一个Python库,用于构建数据转换的有向无环图(DAG)。它通过Python函数定义DAG,自动构建执行流程,具有良好的可移植性和表达能力。Hamilton支持多种执行环境,提供数据验证、实验跟踪等功能,并有UI界面用于可视化和监控。适用于ETL、机器学习、LLM应用等数据处理场景,有助于提高团队协作效率和代码可维护性。
Logo of One Connect Solution
One Connect Solution
One Connect Solution是一个结合人工智能和大数据技术的数据集成与决策管理平台,为企业提供自动机器学习、数据转换和语义分析等功能。该平台采用无代码/低代码设计,支持数据上传、ML算法自动检测和多源数据集成,帮助组织快速分析信息并制定策略。通过提升效率和优化流程,One Connect Solution成为企业数字化转型的有力工具。
Logo of dozer
dozer
Dozer是一款实时数据同步工具,利用CDC技术从多种数据源同步到多个目标存储。该工具性能优于Debezium+Kafka组合,支持无状态转换。Dozer主要用于数据仓库同步,如Clickhouse,并可用于构建数据API和LLM集成。通过单一配置文件运行,Dozer支持Postgres、MySQL、Snowflake等多种数据源和目标存储,为数据同步提供灵活高效的解决方案。