#PDF处理

PDF GPT: 革新PDF文档交互体验的AI助手

2 个月前

PDF GPT是一款创新的AI工具,能够让用户与PDF文档进行智能对话。它通过先进的自然语言处理技术,为用户提供精准的文档内容检索和问答服务,大大提升了PDF文档的阅读和理解效率。

pdfGPT PDF处理 OpenAI 语义搜索嵌入 Github 开源项目

2 个月前

PyMuPDF-Utilities: 强大的PDF处理工具箱

2 个月前

PyMuPDF-Utilities是一个包含各种PDF处理示例和实用工具的开源项目,为开发者提供了丰富的PDF操作参考和解决方案。

PyMuPDF PDF处理文本提取 OCR 文档处理 Github 开源项目

2 个月前

OpenContracts：免费开源的文档分析平台

2 个月前

OpenContracts是一款创新的开源文档分析工具，旨在简化大规模文档管理、分析和数据提取。它集成了先进的AI技术，为用户提供了一个功能强大且易于使用的平台，可以有效地处理各种类型的文档，特别是合同。

OpenContracts 文档分析平台 PDF处理向量嵌入人工标注 Github 开源项目

2 个月前

AnyParser: 精确、私密且可配置的文档检索大语言模型

2 个月前

AnyParser是一款由CambioML开发的开源工具,旨在提供准确、私密且可配置的非结构化数据提取API。它能够从PDF、图片、图表等非结构化数据中精确提取文本、数字和符号,并转换为结构化格式。

AnyParser API 数据提取 PDF处理结构化数据 Github 开源项目

2 个月前

LlamaParse: 高效解析复杂文档的先进工具

2 个月前

LlamaParse是LlamaIndex开发的一款强大的文档解析API,旨在高效解析和表示复杂文档,以实现最佳的检索增强生成(RAG)。它可以轻松处理包含表格、图像等嵌入对象的PDF等复杂文档,为RAG应用提供结构化数据。

LlamaParse 文档解析 API LlamaIndex PDF处理 Github 开源项目

2 个月前

PDFDeal: 提升PDF处理效率的强大Python工具

2 个月前

PDFDeal是一个功能强大的Python库，它不仅封装了Doc2X API，还提供了本地PDF处理功能，旨在提高PDF文档在检索增强生成(RAG)系统中的召回率。本文将深入探讨PDFDeal的特性、应用场景以及它如何改变PDF文档处理的方式。

pdfdeal PDF处理 OCR识别知识库构建 Doc2X Github 开源项目

2 个月前

gImageReader: 一款强大的开源OCR软件

2 个月前

gImageReader是一款基于tesseract-ocr的简单而强大的图像文字识别(OCR)软件,支持PDF文档和图像的文字识别,具有多语言支持、批量处理、后处理等丰富功能。

gImageReader OCR软件图像识别 tesseract-ocr PDF处理 Github 开源项目

2 个月前

PyMuPDF: 强大的 Python PDF 处理库

2 个月前

PyMuPDF 是一个高性能的 Python 库，用于 PDF 和其他文档格式的数据提取、分析、转换和处理。它提供了丰富的功能和简单易用的 API，是处理 PDF 文档的理想选择。

PyMuPDF Python库 PDF处理文档分析数据提取 Github 开源项目

2 个月前

Nougat: 革新学术文档的智能解析技术

2 个月前

Nougat是一款由Facebook Research开发的创新型学术文档解析工具,能够准确理解LaTeX数学公式和表格,为学术文献处理带来全新体验。

Nougat 学术文档解析 OCR技术机器学习 PDF处理 Github 开源项目

2 个月前

MinerU：一站式开源高质量数据提取工具

2 个月前

MinerU是一个强大的开源工具，专门用于从PDF、网页和电子书中提取高质量数据。它为用户提供了一个一站式的解决方案，简化了复杂文档的数据提取过程。

MinerU PDF处理文本提取机器学习开源工具 Github 开源项目

2 个月前

相关项目

grobid

GROBID 是一个将PDF等原始文档转换为结构化XML/TEI编码文档的机器学习库，专为技术和科学出版物设计。功能包括文献标题和参考文献的提取、全文结构化以及PDF坐标解析等。提供丰富的Web服务API、Docker镜像和批处理能力，适用于高效大规模的文献处理，适合生产环境。其深度学习模型显著提升解析精度，并已被众多科研机构和平台采用，支持Linux和macOS操作系统。

llama_parse

LlamaParse是LlamaIndex开发的文件解析API，旨在提高LlamaIndex框架的检索和上下文扩充能力。该API支持多种文件格式，可将解析结果输出为Markdown或纯文本。LlamaParse提供每日1000页的免费解析额度，支持异步和批量处理，并可与SimpleDirectoryReader集成，简化文件处理和索引流程。通过直接集成到LlamaIndex中，LlamaParse为开发者提供了更高效的文档处理解决方案。

Stirling-PDF

Stirling-PDF是一款功能全面的开源PDF处理工具，支持本地部署。它提供PDF分割、合并、转换、重组、添加图片、旋转和压缩等多项功能。该工具基于Spring Boot开发，集成PDFBox和LibreOffice等技术，通过Docker快速部署。支持暗黑模式、并行处理和API集成，可满足各类PDF处理需求。

MinerU

MinerU是一个开源的PDF转换工具，专注于科研文献处理。它能将PDF转换为markdown和JSON等机器可读格式，同时保留原文档结构和语义连贯性。该工具支持移除页眉页脚，处理多列布局，提取图像和表格，以及将公式转换为LaTeX格式。MinerU兼容多种操作系统和硬件环境，可在CPU或GPU上运行，为大规模语言模型的发展提供数据支持。

nougat

Nougat是一个开源的神经网络模型，专门用于解析学术PDF文档。该模型能够理解LaTeX数学公式和表格，支持单个文件和批量处理。Nougat提供命令行界面和API接口，输出采用轻量级标记语言，与Mathpix Markdown兼容。此外，Nougat还支持数据集生成、模型训练和评估功能。项目托管在GitHub上，可通过pip安装使用。

any-parser

AnyParser作为一款专业的API工具，可将PDF、图像和图表等非结构化数据精确转换为结构化格式。该工具支持从PDF提取文本及布局，从图像中提取表格数据，并能将结果转换为Markdown格式。AnyParser具有简便的安装过程和API密钥配置，并提供了详尽的使用示例。这使得AI工程师和金融分析师能够高效处理各种复杂的数据提取任务。

go-fitz

go-fitz是对MuPDF的fitz库的Go语言封装，支持从PDF、EPUB和MOBI文档中提取页面内容，并可输出为图像、文本、HTML或SVG格式。该项目具有多种构建标签，适应不同使用场景。go-fitz主要用于处理和转换多种文档格式，可集成到需要文档内容提取和转换功能的Go应用中。go-fitz支持extlib、static、pkgconfig和musl等构建标签，允许用户根据需求选择使用外部MuPDF库或静态链接。项目提供了示例代码，展示了如何使用go-fitz提取PDF页面并保存为JPEG图像。

PyMuPDF

PyMuPDF是一个高性能的Python库，用于处理PDF及其他文档格式。它支持数据提取、分析、转换和操作，兼容Python 3.8及以上版本。该库提供简洁的API，可高效处理文档页面和提取文本。PyMuPDF还支持字体子集创建和OCR等可选功能，适用于各种文档处理任务。无需额外依赖，安装便捷，是文档处理领域的实用工具。

langchain-ask-pdf

这款Python应用程序读取PDF文档并将其分割成较小文本块，同时使用OpenAI技术创建文本向量表示，针对自然语言提问。本应用找到与提问语义相似的文本块并生成回答。应用还利用Streamlit构建用户界面，借助Langchain处理LLM。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com