Project Icon

HanLP

面向多语种的生产环境自然语言处理工具,支持PyTorch与TensorFlow

HanLP是一款面向生产环境的多语种自然语言处理工具,基于PyTorch和TensorFlow双引擎。支持130种语言和多种NLP任务,包括分词、词性标注、命名实体识别和依存句法分析等。HanLP的预训练模型持续更新,并提供RESTful API和native API,适用于敏捷开发和移动应用。

HanLP 项目介绍

项目概述

HanLP 是一个面向生产环境的多语种自然语言处理工具包。它基于双引擎框架——PyTorch 和 TensorFlow 2.x,旨在普及和应用最先进的自然语言处理(NLP)技术。HanLP 具备功能完善、精度高、性能优异、语料最新、架构清晰、可自定义等特点。

多语种支持

HanLP 利用全球最大的多语种语料库,支持包括简繁中英日俄法德在内的130种语言。它可以处理10种联合任务和多个单任务,涵盖了各种自然语言处理功能。

主要功能

  • 分词:HanLP 提供了粗分、细分的分词功能,支持多任务及单任务的不同使用场景。
  • 词性标注:具备多种标注标准,包括 CTB、PKU 和 863。
  • 命名实体识别:支持 PKU、MSRA、OntoNotes 标准,能够识别日期、地点、组织等多种实体。
  • 依存句法分析:使用 SD、UD 和 PMT 标准进行句法结构的分析。
  • 成分句法分析语义依存分析语义角色标注:提供对句子成分、依存关系、语义角色的深入分析。
  • 高级功能:包括抽象意义表示、指代消解、语义文本相似度、文本风格转换、关键词提取、自动摘要(抽取式和生成式)、语法纠错、文本分类、情感分析和语种检测等。

API 使用

HanLP 提供两种主要的API:RESTful 和 native,以满足不同的开发需求。

RESTful API

RESTful API 轻量、易用,适合敏捷开发和移动应用。用户无需配置 GPU,安装简单快捷,并提供匿名和授权模式。

  • Python 应用

    from hanlp_restful import HanLPClient
    HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')
    
  • Golang 应用

    HanLP := hanlp.HanLPClient(hanlp.WithAuth(""),hanlp.WithLanguage("zh"))
    

Native API

适合需要利用深度学习技术的工程师和研究者,可在大规模数据的本地处理场景中应用。

  • 安装

    pip install hanlp
    
  • 多任务模型

    import hanlp
    HanLP = hanlp.load(hanlp.pretrained.mtl.CLOSE_TOK_POS_NER_SRL_DEP_SDP_CON_ELECTRA_SMALL_ZH)
    HanLP(['2021年HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。', '阿婆主来到北京立方庭参观自然语义科技公司。'])
    

模型训练与性能

HanLP 支持用户训练自己的领域模型,提供可复现的结果。其模型库包含多任务和单任务模型,使用户可以根据具体需求选择速度更快的多任务模型或精度更高的单任务模型。

通过三行代码,用户便能在 SIGHAN2005 PKU 语料库上训练出精度超越学术SOTA的分词模型。并且 HanLP 保证所有实验结果是可复现的。

输出格式

无论采用何种开发语言,HanLP 的输出结果统一为 JSON 格式,兼容字典类型的 Document,确保与不同开发环境和语言的适配性。

总之,HanLP 是自然语言处理领域的一款强大工具,无论是研究人员还是开发者,都可以利用其丰富的功能、灵活的接口进行深度的语言处理和分析。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号