#数据转换

trex - 结构化数据转换工具,支持正则表达式与上下文无关语法
Trex数据转换安装指南工具使用功能路线图Github开源项目
Trex是一款将非结构化数据转换为结构化数据的工具。通过指定正则表达式或上下文无关语法,Trex能智能地调整数据以符合指定的架构。用户可以通过Python客户端和API密钥,在云端或本地系统中进行自托管。Trex具备结构化JSON生成、自定义CFG生成和正则生成等功能,且处理速度显著提升,并有明确的开发计划,以满足更多智能模型需求。
laravel-responder - 优化Laravel和Lumen的API响应生成器,支持Fractal数据转换
Laravel ResponderAPI响应FractalLaravel数据转换Github开源项目
此包支持通过Fractal transformers转换数据,生成和序列化成功与错误响应,处理例外情况,并辅助响应测试。兼容PHP 7.0+及Laravel 5.1+或Lumen 5.1+,可通过Composer安装,提供多种响应创建方法,包括服务注入、helper函数和facade。提供高质量响应并配备详尽文档,便于开发者快速上手。
datacap - 多源数据管理与分析可视化平台
DataCap数据集成数据可视化数据转换数据库连接器Github开源项目
DataCap是一个开源的数据管理与分析平台,支持多种数据源和数据库类型。该平台集成了数据转换、集成和可视化功能,能够高效处理大数据、关系型和NoSQL数据库。DataCap提供丰富的数据库连接器,包括ClickHouse、MySQL和PostgreSQL等主流数据库,方便用户进行多源数据管理、转换、图表制作和监控。
prql - 现代化的数据转换语言,SQL 的强大替代方案
PRQL数据查询语言SQL替代品数据转换开源项目Github
PRQL是一种新兴的数据查询语言,旨在提供比SQL更简洁和强大的管道式查询功能。它保留了SQL的可读性和声明性特点,同时引入了变量和函数等抽象概念。PRQL可编译成SQL,因此兼容各种SQL数据库。它简化了复杂查询的编写过程,提升了数据处理效率。目前PRQL处于活跃开发阶段,已支持多种开发环境,并持续优化功能和稳定性。
Jaiqu - 智能JSON查询与转换工具,实现自动化数据处理
JaiquJSONAI数据转换jq查询语言Github开源项目
Jaiqu是一款基于AI的JSON转换工具,采用jq查询语言语法实现自动化数据处理。它支持模式验证、模糊匹配和复杂数据映射,能将任意JSON输入转换为目标格式。这个开源项目为开发者提供了高效的JSON处理解决方案,尤其适合需要频繁进行数据格式转换的应用场景。
uniflow-llm-based-pdf-extraction-text-cleaning-data-clustering - 多源文档提取与转换的统一LLM框架
uniflowLLM接口文档提取数据转换模型微调Github开源项目
uniflow是一个开源项目,为多种文档类型提供统一的LLM接口,实现数据提取和转换。支持PDF、HTML和TXT等格式,兼容OpenAI、Google Gemini和AWS BedRock等主流LLM模型。该项目致力于解决遗留文档处理和数据准备的难题,为数据科学家提供生成隐私保护训练数据集的工具,简化LLM微调流程。uniflow还包含多个实用案例,如财务报告分析和教育资料问答生成等。
transform - 全能在线代码转换平台
Transform在线转换工具开源项目Web开发数据转换Github
Transform是一个开源的在线代码转换平台,支持多种编程语言和数据格式间的互相转换。该平台提供直观的界面,方便开发者进行代码转换、格式化和优化。Transform能高效处理JSON、XML、CSS等多种格式,提升开发效率。平台还支持自定义转换规则,可满足特定项目需求。作为一个功能丰富的开源工具,Transform为开发者提供了便捷的代码处理解决方案。
hamilton - 简化数据转换DAG的构建与管理
HamiltonDAGPython数据转换可视化Github开源项目
Hamilton是一个Python库,用于构建数据转换的有向无环图(DAG)。它通过Python函数定义DAG,自动构建执行流程,具有良好的可移植性和表达能力。Hamilton支持多种执行环境,提供数据验证、实验跟踪等功能,并有UI界面用于可视化和监控。适用于ETL、机器学习、LLM应用等数据处理场景,有助于提高团队协作效率和代码可维护性。
content-collections - 将内容高效转换为类型安全的数据集合
Content Collections内容管理类型安全开发体验数据转换Github开源项目
Content Collections是一个开源的内容管理工具,可将多种格式内容转换为类型安全的数据集合。它提供流畅的开发体验和简洁的API,支持内容预处理和自动更新。该工具适配多种主流Web框架,通过内置验证保证数据准确性,使开发者能更专注于应用构建。Content Collections无需手动获取解析数据,可显著提升开发效率。
jsonAi.cloud - 将JSON数据结构化并生成API端点的智能平台
AI工具JSON创建API端点数据转换JSON结构AI服务
jsonAi.cloud是一个创新的在线平台,专门用于将各种数据快速转换为结构化JSON格式。用户可以定义自定义JSON schema并创建专用API endpoint。通过发送数据,用户可接收AI驱动的结构化JSON响应。平台支持复杂的嵌套对象和自定义字段,提供实时测试和调整功能。jsonAi.cloud提供免费和灵活的付费计划,确保数据安全性,并优化API响应时间。这是一个面向开发者和企业的高效、灵活的解决方案,用于处理和转换多种格式的数据。
ReportPDF - AI驱动的电子表格自动生成PDF报告工具
AI工具AI生成PDF报告电子表格数据转换自动化报告
ReportPDF是一款AI驱动的在线工具,将电子表格数据转换为结构清晰的PDF报告。该工具自动分析数据,生成视觉吸引的报告,适用于财务报表、市场分析和项目进度等多种场景。这一创新解决方案提高了报告制作效率,为企业和专业人士节省时间。ReportPDF能够生成专业、美观的报告输出。
One Connect Solution - 智能数据分析与决策自动化平台
AI工具数据集成机器学习语义分析数据转换云迁移
One Connect Solution是一个结合人工智能和大数据技术的数据集成与决策管理平台,为企业提供自动机器学习、数据转换和语义分析等功能。该平台采用无代码/低代码设计,支持数据上传、ML算法自动检测和多源数据集成,帮助组织快速分析信息并制定策略。通过提升效率和优化流程,One Connect Solution成为企业数字化转型的有力工具。
collapse - R语言高效数据处理与统计分析工具
collapseR包数据转换统计计算性能优化Github开源项目
collapse是一款强大的R语言数据处理和统计分析工具包。基于C/C++开发,它提供了高效的统计函数、数据操作和内存管理功能。支持分组计算、加权分析,兼容多种数据类型和R包。collapse还具备高级聚合、数据转换和时间序列分析能力,其高性能算法使其尤其适合处理大规模复杂数据集。
Labelme2YOLO - LabelMe标注转YOLO格式数据集转换工具
Labelme2YOLO数据转换目标检测机器学习数据集处理Github开源项目
Labelme2YOLO是一个开源工具,用于将LabelMe标注工具的JSON格式转换为YOLO文本文件格式。它支持批量转换和单文件转换,能自动分割训练验证集,并可生成YOLOv5 v7.0实例分割数据集。通过简单的命令行操作,用户可获得YOLO格式的标签、图像文件和dataset.yaml配置。这个工具简化了数据集准备过程,方便了YOLO目标检测和实例分割任务的开展。
recap - 多源数据模式读写与转换工具
Recap数据架构API集成数据转换开源项目Github
Recap是一个开源数据模式管理工具,支持从多种数据源读取和写入标准格式的数据模式。它兼容Avro、BigQuery、Confluent Schema Registry等格式,提供命令行界面、HTTP/JSON网关和API接口。Recap内置模式注册表功能,可进行模式存储和版本控制。该工具简化了数据集成和模式管理流程,适用于各类数据处理场景。
axios - 多功能的跨平台HTTP请求库
axiosHTTP客户端Promise请求拦截数据转换Github开源项目
Axios是一个功能丰富的HTTP请求库,可用于浏览器和Node.js环境。它提供了请求/响应拦截、数据转换、请求取消等核心功能,并支持便捷的API调用方式。Axios具有良好的浏览器兼容性,支持TypeScript,并能高效处理各种HTTP请求场景。
dozer - 实时多源数据同步工具 支持CDC技术和多目标存储
Dozer实时数据移动CDC数据仓库数据转换Github开源项目
Dozer是一款实时数据同步工具,利用CDC技术从多种数据源同步到多个目标存储。该工具性能优于Debezium+Kafka组合,支持无状态转换。Dozer主要用于数据仓库同步,如Clickhouse,并可用于构建数据API和LLM集成。通过单一配置文件运行,Dozer支持Postgres、MySQL、Snowflake等多种数据源和目标存储,为数据同步提供灵活高效的解决方案。