Project Icon

NuNER-multilingual-v0.1

支持九种以上语言的高性能多语言实体识别系统

NuNER-multilingual-v0.1作为一个多语言实体识别系统,通过对多语言BERT模型进行优化,实现了对英语、法语等9种以上语言的支持。系统基于Oscar数据集训练,具备跨领域和跨语言的实体识别能力。在性能测评中,其F1宏观指标相比基础mBERT有明显提升,单层嵌入达到0.5892,双层嵌入达到0.6231的水平。该系统可直接使用或根据具体需求进行定制化训练。

LaBSE - 基于BERT的多语言句子编码引擎 助力跨语言语义检索
BERTGithubHuggingfaceLaBSE句子嵌入多语言开源项目模型自然语言处理
作为Google开源的多语言句子编码模型,LaBSE整合掩码语言建模与翻译语言建模技术,实现109种语言的高效句子嵌入。经CommonCrawl和维基百科数据集训练,可用于跨语言语义相似度计算和双语文本检索,并支持完整Python接口调用
bert-base-chinese-ner - 传统中文BERT模型及自然语言处理工具
CKIP BERTGithubHuggingfacetransformers模型命名实体识别开源项目模型繁體中文自然语言处理
该项目提供传统中文BERT等模型和多功能自然语言处理工具,辅助词性标注、分词和实体识别。建议使用BertTokenizerFast以提高性能。CKIP开发和维护,详情使用说明见GitHub页面。
bert-base-parsbert-ner-uncased - ParsBERT-NER:高性能波斯语命名实体识别模型
BERTGithubHuggingface命名实体识别开源项目机器学习模型波斯语自然语言处理
ParsBERT-NER是一个专门用于波斯语命名实体识别的预训练模型。该模型基于BERT架构,在ARMAN和PEYMA数据集上进行微调,支持识别组织、地点、人名等多种实体类型。在多个波斯语NER基准测试中,ParsBERT-NER展现出卓越性能,F1分数最高达98.79%。研究人员和开发者可通过Hugging Face Transformers库轻松使用这一模型进行波斯语自然语言处理任务。
nbailab-base-ner-scandi - 斯堪的纳维亚语言的命名实体识别模型
GithubHuggingfaceScandiNER北欧语言命名实体识别开源项目数据集模型模型性能
这个模型是NbAiLab/nb-bert-base的精调版本,适用于丹麦语、挪威语、瑞典语、冰岛语和法罗语的命名实体识别(NER)。通过整合DaNE、NorNE、SUC 3.0和WikiANN的一些数据集,模型可以提供高精度的NER结果,并支持多种语言包括英语。识别的实体类型包括人名、地名、组织名及其他类别。模型以Micro-F1得分约为89%的表现,以及4.16样本/秒的处理速度表现出色,同时模型体积合理,带来好的准确性和效率平衡。
distilbert-multilingual-nli-stsb-quora-ranking - DistilBERT多语言句子嵌入模型实现高效语义搜索和相似度计算
GithubHuggingfacesentence-transformers向量嵌入多语言模型开源项目模型自然语言处理语义相似度
这是一个基于DistilBERT的多语言句子嵌入模型,能将文本映射到768维向量空间。模型经NLI、STS-B和Quora数据集训练,支持多语言处理,适用于语义搜索、相似度计算和文本聚类等任务。通过sentence-transformers或Hugging Face Transformers,开发者可轻松将其集成到各类自然语言处理应用中,实现高效的文本分析和处理。
Few-NERD - 大规模精细标注的命名实体识别数据集
BERTFew-NERDGithubfew-shot实体识别开源项目监督学习
Few-NERD是一个大规模精细标注的命名实体识别数据集,包含8种粗粒度类型、66种细粒度类型、188,200个句子、491,711个实体和4,601,223个标记。支持监督学习和少样本学习的三种基准任务。了解数据集的关键功能、最新更新,以及如何获取数据和运行模型的详细指南。
deberta-xlarge-mnli - 高性能自然语言处理模型面向多任务学习优化
BERTDeBERTaGithubHuggingface人工智能开源项目机器学习模型自然语言处理
DeBERTa-xlarge-mnli是一个经过MNLI任务微调的大型语言模型。该模型采用解耦注意力机制和增强型掩码解码器,在多项NLU任务中表现优异。它在SQuAD、GLUE基准测试等任务上的成绩超越了BERT和RoBERTa,为复杂的自然语言理解应用提供了强大支持。
SpanMarkerNER - 命名实体识别的高效训练框架
BERTGithubHugging FaceNamed Entity RecognitionRoBERTaSpanMarker开源项目
SpanMarker是一个基于Transformer库的命名实体识别框架,支持BERT、RoBERTa和ELECTRA等编码器。框架提供模型加载、保存、超参数优化、日志记录、检查点、回调、混合精度训练和8位推理等功能。用户可以方便地使用预训练模型,并通过免费API进行快速原型开发和部署。
gliner_small-v2.1 - 基于双向Transformer的轻量级通用实体识别模型
GLiNERGithubHuggingface命名实体识别开源项目机器学习模型模型训练自然语言处理
gliner_small-v2.1是一个基于双向Transformer架构的命名实体识别模型,具备识别任意类型实体的能力。这款模型采用166M参数规模,在保持较小资源占用的同时提供灵活的实体识别功能。模型支持英语处理,采用Apache-2.0许可证开源发布。相比传统NER模型的固定实体类型限制和大语言模型的高资源消耗,该模型提供了一个平衡的解决方案。
quote-model-BERTm-v1 - BERT多语言模型在引用识别任务上的高性能微调应用
BERTGithubHuggingface多语言模型开源项目文本分类机器学习模型自然语言处理
quote-model-BERTm-v1是一个基于BERT多语言模型微调的引用识别工具。该模型在评估集上表现优异,准确率达93.14%,F1分数为0.8676。通过Adam优化器和线性学习率调度器,经过3轮训练而成。这一模型专门用于多语言环境下的高精度引用识别,可广泛应用于需要处理多语种文本引用的场景。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号