热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#nlm-ingestor
nlm-ingestor - 多格式文档解析器助力RAG优化
nlm-ingestor
PDF解析
HTML解析
RAG
Apache Tika
Github
开源项目
nlm-ingestor是一个开源的文档解析工具,专门针对RAG(检索增强生成)进行了优化。它支持PDF、HTML和文本等多种格式,提供章节划分、段落链接和表格识别等精确的内容结构化功能。该项目整合了改进版Apache Tika和OCR技术,能够高效处理大型文档。nlm-ingestor不依赖特殊硬件,为开发者提供了强大的基础设施,有助于提高LLM项目的检索和生成性能。
1
1
相关文章
nlm-ingestor: 一款强大的文档解析工具
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号