#文档提取
uniflow-llm-based-pdf-extraction-text-cleaning-data-clustering - 多源文档提取与转换的统一LLM框架
Github开源项目模型微调数据转换uniflowLLM接口文档提取
uniflow是一个开源项目,为多种文档类型提供统一的LLM接口,实现数据提取和转换。支持PDF、HTML和TXT等格式,兼容OpenAI、Google Gemini和AWS BedRock等主流LLM模型。该项目致力于解决遗留文档处理和数据准备的难题,为数据科学家提供生成隐私保护训练数据集的工具,简化LLM微调流程。uniflow还包含多个实用案例,如财务报告分析和教育资料问答生成等。
DocuPull - 智能产权文件数据提取与处理解决方案
人工智能AI工具数据提取文档提取DocuPull标题报告
DocuPull平台利用人工智能技术提取契约、抵押和留置权搜索中的关键数据,自动生成产权报告。该系统提供产权、修正、从属、结算和记录文件提取等服务,简化房地产和法律行业的文档处理流程。DocuPull的智能化解决方案在提高效率和准确性方面表现出色,为相关行业提供了便捷的文档处理工具。