项目介绍
AdaSeq,全称为阿里巴巴达摩院序列理解工具库,是一个方便易用的一站式库,基于 ModelScope 架构。研究人员和开发者可以通过 AdaSeq 训练定制模型来解决各种序列理解任务,包括词性标注、块切分、命名实体识别、实体类型识别和关系抽取等。
主要特性
-
丰富的模型:AdaSeq 提供最新的先进模型、训练方法和实用工具套件,专注于序列理解任务。
-
前沿性能:项目目标是开发出性能超越市面上现有框架的最佳实现。
-
简便易用:用户只需一行命令即可获取最优模型。
-
可扩展性:用户可以轻松注册模块,或通过组合预定义模块创建定制的序列理解模型。
新动态
- 2022年7月:AdaSeq 的 U-RaNER 论文在 SemEval 2023 中荣获最佳论文奖。
- 2022年3月:U-RaNER 在 SemEval 2023 Task2 的多语言复杂命名实体识别中荣获九项第一名。
- 2022年12月:推出了基于检索的增强多模态实体理解模型 MoRe。
- 2022年11月:发布了超精细实体类型化模型 NPCRF 和无监督边界感知语言模型 BABERT。
快速体验
用户可以通过 ModelScope 在线演示来试用我们的模型,涵盖英语和中文的命名实体识别以及中文分词等任务。我们支持更多的任务、语言和领域。
模型库
AdaSeq 提供多种支持的模型,包括基于 Transformer 的 CRF、部分 CRF、检索增强的 NER、双仿射 NER、全局指针、多标签实体类型化等等。
数据集库
项目收集了很多用于序列理解任务的数据集,供用户参考和使用。
安装指南
AdaSeq 依赖 Python >= 3.7
、PyTorch >= 1.8
和 ModelScope >= 1.4
。确保在 ModelScope == 1.9.5
版本下流畅运行。
-
使用 pip 安装:
pip install adaseq
-
从源码安装:
git clone https://github.com/modelscope/adaseq.git cd adaseq pip install -r requirements.txt -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
安装验证
安装完成后,用户可以通过提供的演示配置文件进行模型训练验证。输入命令 adaseq train -c demo.yaml
,观察控制台上的训练日志,训练结束后会打印测试集上的结果。
教程
AdaSeq 提供详尽的使用教程,从快速上手、基本配置学习到多 GPU 训练和超参优化等。用户可以通过这些教程深入了解 AdaSeq 的各种功能。
贡献
任何形式的贡献都非常欢迎,详细指引请参考项目贡献指南。
许可
AdaSeq 项目采用 Apache 2.0 版本协议进行许可。