#文档分类
Bewai - 智能文档处理平台
AI工具智能文档处理人工智能自动化文档分类数据提取
Bewai智能文档处理平台采用人工智能技术,实现自动化文档分类、数据提取和验证。支持PDF、Word、图片等多种格式,无需预设模板可识别30多种文档,识别率达97%。通过SaaS和API提供服务,适用于银行、保险等行业,提高文档处理效率,降低人力成本。平台界面友好,可帮助企业实现文档管理自动化,加速业务流程。
dit-base-finetuned-rvlcdip - 基于自监督学习的文档图像转换模型应用
文档分类自我监督学习视觉编码器Document Image TransformerRVL-CDIPHuggingfaceGithub开源项目模型
Document Image Transformer 是一种基于 Transformer 的模型,专为自监督学习而设计,通过大量文档图像来学习图像的内在表示。经过 RVL-CDIP 数据集的细调,该模型适用于文档图像分类、表格检测和文档布局分析等任务。通过在预训练编码器上添加线性层,可以灵活实现不同任务的目标。模型将图像划分为16x16像素固定块,并使用离散 VAE 编码器的视觉 token 进行预测。该技术解决方案在灰度图像分类中表现出色,尤其是在细分类别的文档图像任务中。
pebblo-classifier - 基于BERT的文本分类工具,优化协议文件整理
文本分类文档分类BERTGithub开源项目Pebblo ClassifierHuggingface机器学习模型
Pebblo Classifier是由DAXA.AI开发的文本分类模型,能够高效地对组织中的协议文档进行分类。该模型基于BERT技术,并从distilbert-base-uncased进行细调,支持21种文档标签分类,如董事会协议和咨询协议,简化文档整理过程。无需重新微调,用户可以通过简单代码实现快速集成。测试结果显示了模型的高精度和可靠性。