papermage

统一工具包助力处理表示和操作视觉文档

papermage 文档处理 PDF解析实体识别数据结构 Github 开源项目

papermage是一款专门用于处理PDF文档的开源工具包。它能够创建Document对象、解析文档结构、提取文本和元数据。该工具支持多层次文档分割，包括页面、行和句子等，并可在不同层次间自由导航。papermage允许保存和加载Document对象，还支持通过自定义预测器进行功能扩展。这个统一平台为处理、表示和操作视觉丰富的文档提供了便利。

访问官网

Github

介绍相关项目

Umi-OCR - 高效离线OCR工具支持多语言识别和灵活调用

GithubOCR软件Umi-OCR开源项目截图OCR批量识别文字识别

Umi-OCR是一款开源的文字识别工具，适用于Windows和Linux系统。它提供离线OCR引擎，支持截图识别、批量识别、PDF识别等功能。软件还具备二维码识别和生成、公式识别等特性。Umi-OCR支持多语言界面，可通过命令行和HTTP接口调用，是一款功能全面的OCR解决方案。

Stirling-PDF - 本地部署的全能PDF处理开源解决方案

DockerGithubPDF处理Stirling-PDF开源软件开源项目文档管理

Stirling-PDF是一款功能全面的开源PDF处理工具，支持本地部署。它提供PDF分割、合并、转换、重组、添加图片、旋转和压缩等多项功能。该工具基于Spring Boot开发，集成PDFBox和LibreOffice等技术，通过Docker快速部署。支持暗黑模式、并行处理和API集成，可满足各类PDF处理需求。

paper-qa - 基于文档的智能问答系统实现精准信息检索和回答生成

GithubLLMPaperQA嵌入式向量开源项目异步处理文献问答

paper-qa是一款轻量级文档问答工具包，专门从PDF和文本文件中提取信息并生成回答。通过文档嵌入、向量搜索和摘要生成等技术，结合大型语言模型，paper-qa能够提供高质量且有据可依的回答。支持OpenAI、Anthropic等多种嵌入和语言模型，并可集成本地托管模型。工具提供异步API，支持自定义文档添加和引用格式推断，还可整合外部向量存储。这些特性使paper-qa成为科研和信息检索领域的实用解决方案。

pdf2htmlEX - 将PDF精确转换为HTML的开源工具支持复杂排版和公式

GithubPDF转HTMLpdf2htmlEX开源工具开源项目文档转换网页渲染

pdf2htmlEX是一个开源的PDF转HTML工具，能精确还原PDF文档的文本、字体和布局。它支持复杂的学术论文和杂志排版，可处理大量公式和图表。该工具提供灵活的输出选项，包括生成单一HTML文件或按需加载页面。pdf2htmlEX保持较小的文件体积，同时支持链接、大纲和打印等功能，适用于多种在线发布场景。

mdpdf - 命令行Markdown转PDF工具支持自定义样式和页眉页脚

APIGithubMarkdownPDF转换命令行工具开源项目自定义样式

mdpdf是一个功能全面的Markdown到PDF转换工具，提供命令行界面和JavaScript API。它支持自定义页眉、页脚和样式表，兼容GitHub Markdown CSS，可进行emoji转换，并允许调整页面大小和方向。mdpdf适用于各种Markdown到PDF的转换需求，从基础转换到复杂定制都能胜任。

omniparse - 多类型非结构化数据解析与结构化平台

GithubOmniParse多媒体处理开源项目文档解析结构化数据网页爬取

OmniParse是一个专注于非结构化数据处理的开源平台。该平台能够解析文档、表格、图像、视频、音频和网页等多种格式，将其转化为结构化数据，以便于生成式AI应用使用。OmniParse支持约20种文件类型，具备本地处理能力，无需依赖外部API。这使其适用于多种AI应用场景，包括检索增强生成(RAG)和模型微调等。

iTextMaster - 智能文档分析与交互的AI驱动解决方案

AI分析AI工具PDF交互iTextMaster文档助手智能问答

iTextMaster是一个智能文档处理平台，集成ChatGPT技术，提供文本识别、分析和摘要功能。支持PDF和网页内容处理，可生成摘要和智能问答。平台支持多语言，实现与文档的自然语言交互，适用于处理各类复杂文档，有效提升信息处理效率。

any-parser - 将非结构化数据转换为结构化格式的精确API解析工具

APIAnyParserGithubPDF处理开源项目数据提取结构化数据

AnyParser作为一款专业的API工具，可将PDF、图像和图表等非结构化数据精确转换为结构化格式。该工具支持从PDF提取文本及布局，从图像中提取表格数据，并能将结果转换为Markdown格式。AnyParser具有简便的安装过程和API密钥配置，并提供了详尽的使用示例。这使得AI工程师和金融分析师能够高效处理各种复杂的数据提取任务。

PaperMemory - 自动化学术文献管理与代码匹配浏览器扩展

GithubPaperMemory学术研究开源项目文献管理浏览器扩展自动化工具

PaperMemory作为一款浏览器扩展，能够自动化管理学术文献。它可以记录浏览的论文，查找相关代码仓库，并匹配预印本与正式发表版本。该工具支持论文搜索、标记、评论和BibTeX引用生成，同时兼容多个学术平台。PaperMemory还提供PDF重命名、直接下载和数据导出等功能，旨在简化文献管理过程。

papermark - 开源文档共享替代方案支持自定义品牌和分析

GithubPapermark开源开源项目数据分析文档共享自托管

Papermark是DocSend的开源替代方案，提供安全的文档共享功能。该平台支持自定义品牌和域名，内置分析工具以跟踪文档使用情况。作为自托管解决方案，Papermark确保用户对数据拥有完全控制权。基于Next.js、TypeScript和Prisma等现代技术，Papermark具备高性能和可扩展性，适合个人和企业用户的文档共享需求。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号