#实体识别

VERT: 微软亚洲研究院知识计算团队的实体识别与消歧工具包

2024年09月05日
Cover of VERT: 微软亚洲研究院知识计算团队的实体识别与消歧工具包

知识图谱教程与论文资源汇总:探索知识图谱的前沿进展

2024年09月05日
Cover of 知识图谱教程与论文资源汇总:探索知识图谱的前沿进展

Microsoft Recognizers Text: 多语言实体识别与解析的强大工具

2024年09月05日
Cover of Microsoft Recognizers Text: 多语言实体识别与解析的强大工具

PaperMage: 一个统一的科学文献处理、表示和操作工具包

2024年09月05日
Cover of PaperMage: 一个统一的科学文献处理、表示和操作工具包

BookNLP: 一个强大的长文本自然语言处理工具

2024年09月05日
Cover of BookNLP: 一个强大的长文本自然语言处理工具
相关项目
Project Cover

DeepKE

DeepKE是一款支持命名实体识别、关系抽取和属性抽取的知识图谱构建工具。其多功能性使其适用于多模式、低资源和文档级的知识提取场景。用户可以通过DeepKE-LLM和OneKE模型进行大规模语言模型集成,并能快速训练监督模型。工具包提供详细的文档、在线演示和多种模型选择,包括NER、关系抽取和事件抽取。支持Linux环境及Docker镜像配置,确保高效信息抽取。

Project Cover

chatbot_ner

Chatbot NER是一个开放源代码框架,专为会话AI设计,支持在文本中进行实体识别。它目前支持英语、印地语、古吉拉特语、马拉地语、孟加拉语和泰米尔语及其混合形式。通过使用常见模式和NLP技术,能够从语言的稀疏数据中提取必要的实体。Haptik团队正在扩展其支持范围到所有印度语言及其方言。该框架的API结构易于使用,特别适合会话式AI应用,并且提供详尽的文档以便用户设置和操作。

Project Cover

rasa_nlu_gq

rasa_nlu_gq是基于最新版本Rasa的改进版,对原有组件进行了优化和扩展。新特性包括双向LSTM和膨胀卷积模型的实体识别、jieba词性标注、实体反向修改意图、BERT模型的词向量特征提取,以及CPU和GPU资源配置优化。此项目还引入了TensorFlow API用于意图分类。详细安装说明及实例请参阅相关链接。

Project Cover

Few-NERD

Few-NERD是一个大规模精细标注的命名实体识别数据集,包含8种粗粒度类型、66种细粒度类型、188,200个句子、491,711个实体和4,601,223个标记。支持监督学习和少样本学习的三种基准任务。了解数据集的关键功能、最新更新,以及如何获取数据和运行模型的详细指南。

Project Cover

Kensho

Kensho开发的AI工具包提供语音转文字、实体识别、公司数据匹配、PDF数据提取和文档概念理解等功能。这套工具能从复杂数据中提取洞察,大幅提升工作效率。Kensho的AI解决方案以高精度、快速处理和安全性著称,广泛应用于金融、研究和数据分析领域。其Scribe语音转文字功能比知名服务准确度提高25%,2分钟音频处理时间不到1秒。目前提供免费试用,让用户亲身体验AI技术如何挖掘数据价值。

Project Cover

Recognizers-Text

Recognizers-Text是微软开发的开源工具库,专门用于多语言环境下的实体识别和解析。它支持识别数字、单位、日期和时间等实体,适用于中文、英文等多种语言。该库为LUIS等微软平台提供底层支持,同时提供C#、JavaScript等多种编程语言的独立包。目前该项目正在不断扩展对更多语言的支持。

Project Cover

booknlp

BookNLP是一个专门针对英文书籍和长文档的自然语言处理管道。它集成了多项功能,如词性标注、依存句法分析、实体识别、人物名称聚类、指代消解、引语说话人识别等。系统提供大小两种模型,可根据计算资源和精度需求灵活选择。BookNLP为文学文本分析和大规模文档处理提供了全面的语言学分析支持。

Project Cover

papermage

papermage是一款专门用于处理PDF文档的开源工具包。它能够创建Document对象、解析文档结构、提取文本和元数据。该工具支持多层次文档分割,包括页面、行和句子等,并可在不同层次间自由导航。papermage允许保存和加载Document对象,还支持通过自定义预测器进行功能扩展。这个统一平台为处理、表示和操作视觉丰富的文档提供了便利。

Project Cover

catalyst

Catalyst 是一个C#自然语言处理库,提供预训练模型、实体识别和高效的二进制序列化支持。兼容.NET Standard 2.0 并跨平台运行,支持Windows、Linux和macOS。具备精准的标记化处理和语言检测功能。其特点包括命名实体识别、词性标注、语言检测、词形还原和FastText嵌入训练。通过简单的NuGet包安装和流式模型存储,支持多线程并行文本处理,适合大规模文本分析需求。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号