Project Icon

papermerge

开源文档管理系统 高效数字归档全文搜索

Papermerge开源文档管理系统专注于扫描文档处理和长期存储。系统集成OCR文本提取、全文搜索、现代化文件浏览等核心功能。支持多种文档格式,提供REST API和版本控制。作为基于Web的解决方案,Papermerge适用于需要高效数字文档管理的各类场景。

pdfdeal - PDF文本提取与优化工具 支持多种OCR引擎
Doc2XGithubOCR识别PDF处理pdfdeal开源项目知识库构建
pdfdeal是一个开源的PDF处理工具,专注于提取和优化文本内容。该工具支持多种OCR引擎,包括Doc2X,可实现PDF文本提取、图像文字识别和格式优化。pdfdeal支持多种文件格式,并提供与graphrag等检索增强生成(RAG)工具的集成指南,有助于提高知识库构建效率。
SearchMyDocs.ai - AI驱动的多格式文档搜索与对话系统
AI工具AI搜索ChatGPTOCR技术文档检索隐私安全
SearchMyDocs.ai是一款支持多种文件格式的智能文档搜索和对话系统。该平台采用先进的AI技术,实现精准信息检索,同时确保数据隐私和安全。用户可以轻松上传PDF、Markdown、Word等格式文档,并通过智能交互快速获取所需信息。该系统还具备OCR功能,支持JPEG、PNG、TIFF等图片格式的文本识别,进一步扩展了文档搜索和分析的范围。这一创新解决方案适用于个人和专业用户,有效提升文档管理效率和信息检索速度。
llmsherpa - PDF智能解析与大语言模型应用框架
GithubLLM SherpaLayoutPDFReaderPDF解析向量搜索开源项目文档结构分析
LLM Sherpa是一个开源项目,提供LayoutPDFReader工具用于智能解析PDF文档结构,包括章节、段落和表格。该工具支持精确分块并保留上下文信息,适用于向量搜索和生成式AI应用。项目提供API接口,便于集成到各类大语言模型应用中,如问答系统和文本摘要。LLM Sherpa简化了PDF处理流程,为开发者提供了高效的大语言模型应用开发框架。
pdfarranger - 开源多功能PDF文档管理工具
GUIGithubPDF ArrangerPDF编辑Python开源软件开源项目
PDF Arranger是一款开源的PDF文档管理工具,基于Python和GTK开发。它提供直观的图形界面,支持PDF页面的合并、拆分、旋转、裁剪和重排。作为pikepdf的前端,PDF Arranger具有跨平台兼容性,并支持图片导入功能。其简洁界面使PDF文档的编辑和管理更加高效。
dicoogle - 革新医学影像数据管理的开源PACS归档软件
DicoogleGithubPACS医学影像开源软件开源项目插件系统
Dicoogle是一款开源、跨平台的PACS归档软件,采用灵活的索引和检索机制替代传统中央数据库。它能自动处理医学影像元数据,包括私有DICOM标签,无需重新设计。软件提供强大的插件系统,支持功能扩展,广泛应用于医学影像教学、研究和临床领域。
llm-search - 支持多格式文档和语义重排搜索功能的问答系统
GithubpyLLMSearch大型语言模型开源项目文档嵌入混合搜索语义搜索
llm-search是一款高效的问答系统,提供简易的YAML配置和与多个本地文档集的交互能力。特色包括优化的文档解析、结合HyDE技术提高搜索结果的准确性和相关性的混合搜索、聊天历史、深度链接、重新排名和定制嵌入等。适用于各类大型语言模型,如OpenAI或本地方案,提供高度定制化。此外,系统能够生成高质量的密集和稀疏嵌入,以优化搜索效果,支持多查询和与其他LLM平台的互操作性。
paper-age - Age格式加密的纸质备份工具
Age格式GithubPDF输出PaperAgeQR码加密备份开源项目
PaperAge 是一款基于 Age 加密格式的开源纸质备份工具,专为安全存储小型秘密信息而设计。该工具可从文件或标准输入加密数据,生成含加密二维码的 PDF 文件,支持 A4 和信纸尺寸。PaperAge 通过优化二维码纠错级别和隐藏密码,确保在不受信任的打印环境下使用安全。主要应用于备份双因素认证恢复码等敏感数据,为需要离线存储方案的用户提供了简便而安全的选择。
openserp - 开源工具提供主流搜索引擎结果获取API
APICLIDockerGithubOpenSERP开源项目搜索引擎结果
OpenSERP是一款开源工具,为开发者提供Google、Yandex和Baidu等主流搜索引擎的结果获取API和CLI接口。该工具支持Docker部署和命令行使用,可设置语言、日期和文件类型等多种搜索参数。OpenSERP为需要大规模搜索数据的项目提供了一种免费且灵活的解决方案。
Stirling-PDF - 本地部署的全能PDF处理开源解决方案
DockerGithubPDF处理Stirling-PDF开源软件开源项目文档管理
Stirling-PDF是一款功能全面的开源PDF处理工具,支持本地部署。它提供PDF分割、合并、转换、重组、添加图片、旋转和压缩等多项功能。该工具基于Spring Boot开发,集成PDFBox和LibreOffice等技术,通过Docker快速部署。支持暗黑模式、并行处理和API集成,可满足各类PDF处理需求。
awesome-ocr - 综合OCR工具和技术资源库
GithubOCR图像处理开源项目文本检测文档分析深度学习
该项目整合了OCR领域的多种前沿工具和技术,涵盖图像校正、文本检测、表格识别和手写识别等方面。它提供了从预处理到后处理的完整OCR解决方案,包含大量开源实现和相关研究论文链接。这个资源库对从事文档分析和文本提取的开发者及研究人员具有重要参考价值。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号