Project Icon

amrlib

将AMR解析、生成和可视化简化的Python库

amrlib是一个简化抽象语义表示(AMR)处理的Python库。它提供句子到图解析、图到句子生成和AMR图形可视化功能。该库集成了高性能神经网络模型,支持SpaCy扩展,并包含评估指标API。amrlib还配备GUI界面,便于AMR转换和查看。作为处理AMR任务的工具,它适合自然语言处理领域的研究和开发。该库的解析模型在LDC2020T02数据集上达到了83.7的SMATCH分数,生成模型实现了54的BLEU分数,突显了其出色的性能优势。

amrlib

一个使AMR解析、生成和可视化变得简单的Python库。

有关最新文档,请参阅**ReadTheDocs**。

**!! 注意:**模型必须单独下载和安装。请参阅安装说明

关于

amrlib是一个Python模块,旨在通过提供以下功能使抽象意义表示(AMR)处理变得简单:

  • 句子到图(StoG)解析,将英语句子转换为AMR图。
  • 图到句子(GtoS)生成,将AMR图转换为英语句子。
  • 基于QT的图形用户界面,方便句子到图和图到句子的转换。
  • 在GUI和库函数中绘制AMR图的方法。
  • 用于StoG和GtoS模型的训练和测试代码。
  • SpaCy扩展,允许直接将SpaCy的DocsSpans转换为AMR图。
  • 句子到图对齐例程
    • FAA_Aligner(Fast_Align算法),基于ISI对齐器代码,详见此论文
    • RBW_Aligner(基于规则的词对齐),用于简单的单个标记到单个节点的对齐。
  • 评估指标API,包括...
    • Smatch(多进程,带有增强/详细得分)用于图解析
      关于smatch评分请参见底部注释
    • 用于句子生成的BLEU
    • 对齐评分指标,详细说明精确度/召回率

AMR模型

系统包含用于解析和生成的不同神经网络模型。**!! 注意:**模型必须单独下载和安装。 所有解析和生成模型的下载链接请参见amrlib-models

  • 解析(StoG)model_parse_xfm_bart_large在LDC2020T02上达到83.7 SMATCH分数
    有关解析模型的技术描述,请参见其wiki页面

  • 生成(GtoS)generate_t5wtense在带时态标记的LDC2020T02上达到54 BLEU,在未标记的LDC2020T02上达到44 BLEU

AMR查看器

GUI允许简单地查看、转换和绘制AMR图。

AMRView

AMR共指消解

该库不包含AMR共指消解的代码,但有一个相关项目amr_coref

以下论文的GitHub项目/代码具有类似或更好的得分:

要求和安装

该项目在Python 3和Ubuntu下构建和测试,但应该可以在任何Linux、Windows、Mac等系统上运行。

有关设置详情,请参阅安装说明

库使用

将句子转换为图:

import amrlib
stog = amrlib.load_stog_model()
graphs = stog.parse_sents(['这是对系统的测试。', '这是第二句话。'])
for graph in graphs:
    print(graph)

将图转换为句子:

import amrlib
gtos = amrlib.load_gtos_model()
sents, _ = gtos.generate(graphs)
for sent in sents:
    print(sent)

详细说明请参阅模型API

作为Spacy扩展使用

要作为扩展使用,您需要spaCy 2.0或更高版本。设置扩展并使用它:

import amrlib
import spacy
amrlib.setup_spacy_extension()
nlp = spacy.load('en_core_web_sm')
doc = nlp('这是对SpaCy扩展的测试。测试包含多个句子。')
graphs = doc._.to_amr()
for graph in graphs:
    print(graph)

详细说明请参阅Spacy API

释义

有关如何使用该库进行释义的示例,请参阅文档中的释义部分。

SMATCH评分

amrlib使用smatch库进行评分。 这是最常用于评分AMR解析器并在文献中报告结果的库。 在某些情况下,代码可能会给出不一致或错误的结果。 您可能希望查看smatchpp以获得改进的评分算法。

问题

如果您发现错误,请在GitHub问题列表上报告。 此外,如果您有功能请求或问题,也可以随时在那里发布。我很乐意考虑建议和Pull Request以增强模块的功能和可用性。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号