#多标签分类

classifier-multi-label - 基于BERT的多标签文本分类算法实现
多标签分类BERTtf.nn.softmax_cross_entropy_with_logitsTextCNNSeq2SeqGithub开源项目
本项目介绍了如何使用BERT结合TextCNN、Denses、Seq2Seq等多种算法实现多标签文本分类。涵盖了模型结构、损失函数和解码方法等细节,展示了不同方法在推理速度和分类效果上的表现,提供了实验数据和结论,帮助开发者选择最佳解决方案。
joytag - 多标签AI图像标记模型 支持5000+标签
JoyTagAI视觉模型图像标签多标签分类ViT架构Github开源项目
JoyTag是基于ViT-B/16架构的AI视觉模型,专用于图像多标签分类。采用Danbooru标记体系,支持5000多个标签,适用于手绘和摄影等多种图像类型。模型在0.4阈值下F1分数达0.578,能为每张图像生成独立标签预测。可用于diffusion模型训练等多种应用场景。
C-Tran - Transformer在多标签图像分类中的应用
图像分类Transformers多标签分类深度学习计算机视觉Github开源项目
C-Tran是一个探索Transformer在多标签图像分类中应用的开源项目。该项目提出了一种通用多标签图像分类方法,在COCO80和VOC20等数据集上展现出优秀性能。项目包含完整的训练和运行指南,涵盖数据处理和模型训练等关键步骤。C-Tran为计算机视觉领域提供了新的研究方向,对推进多标签图像分类技术具有重要意义。
xmc.dspy - Infer-Retrieve-Rank方法revolutionizing大规模多标签分类
Infer-Retrieve-Rank多标签分类极端多类别上下文学习语言模型Github开源项目
Infer-Retrieve-Rank (IReRa)是一种创新的多标签分类方法,专门针对具有大量类别的任务。这个通用且模块化的程序通过预训练语言模型和检索器的交互,高效处理复杂的分类问题。IReRa仅需少量标记示例即可优化性能,无需模型微调。该项目提供完整文档,包括安装、数据处理、运行指南等,方便研究人员在各种语言模型推理和检索任务中应用。
rubert-tiny-toxicity - 不当和有害内容分类模型
社交网络评论Github模型开源项目毒性Huggingface不当内容rubert-tiny多标签分类
该开源项目基于cointegrated/rubert-tiny模型,旨在快速识别和分类俄语短文本中的不当和有害内容。通过多标签分类技术,该模型可针对谩骂、淫秽、威胁和声誉风险进行评估,协助社交网络内容审核。
rubert-tiny2-russian-emotion-detection - RuBERT-tiny2模型实现高精度俄语情感分析
模型BERT情感检测开源项目HuggingfaceAniemoreGithub俄语多标签分类
该项目开发了基于RuBERT-tiny2架构的俄语文本情感分析模型,可识别7种情感类别。模型在CEDR M7数据集上实现85%的多标签准确率和76%的单标签准确率。项目提供Python接口便于集成,同时开源了功能全面的Aniemore软件包。这一解决方案为俄语文本的情感分析任务提供了高效准确的工具支持。
beto-contextualized-hate-speech - BETO基于情境的西班牙语仇恨言论多标签分类模型
BETO多标签分类模型西班牙语开源项目Huggingface仇恨言论检测Github文本分类
这个基于BETO的模型为西班牙语仇恨言论检测提供了创新解决方案。它不仅能识别针对8个不同群体的仇恨言论,还能检测暴力煽动。通过综合分析评论内容和背景信息,模型实现了更准确的多标签分类。研究人员和内容审核者可以利用此工具,快速获取详细的仇恨言论分析结果,有助于更好地理解和应对在线仇恨言论问题。
NADI2024-baseline - 多标签阿拉伯方言识别模型,提高文本分类的准确性
机器翻译阿拉伯方言识别开源项目模型NADI-2024-baseline多标签分类HuggingfaceMarBERTv2Github
该项目提供了一个基于BERT模型的多标签阿拉伯方言识别工具,通过微调多个数据集实现国家级方言识别。模型使用MarBERTv2作为基础,能够实现多标签预测,提高文本中多个方言的识别精度,为阿拉伯语自然语言处理提供良好的基础和测试平台,涵盖18个国家的方言。
tweet-topic-21-multi - 适用于英文多标签话题分类的推文模型
多标签分类推文Huggingfacetweet-topic-21-multi开源项目模型Github语言模型社交关注
tweet-topic-21-multi模型基于TimeLMs语言模型开发,通过对2018年1月至2021年12月间发布的超过1.24亿条推文进行训练,实现了多标签话题分类功能。模型采用11,267条推文进行微调,涵盖艺术文化、商业、科技、体育等多种话题,适用于需要高精度英文文本多标签分类的任务。
twitter-roberta-base-dec2021-tweet-topic-multi-all - 基于RoBERTa的多标签推文主题分类模型
多标签分类文本分类开源项目机器学习模型Github模型自然语言处理HuggingfaceTwitter RoBERTa
这是一个基于twitter-roberta-base-dec2021的微调模型,专注于多标签推文主题分类。模型在tweet_topic_multi数据集上训练,在test_2021测试集上实现76.48%的微平均F1分数。它能有效识别社交媒体文本中的多个主题,为内容分析提供了可靠的自然语言处理工具。
twitter-roberta-base-emotion-multilabel-latest - 精确识别推文情绪的多标签分类模型
多标签分类开源项目情感分析模型Github机器学习Huggingfacetweetnlptwitter-roberta-base-emotion-multilabel-latest
该项目微调了cardiffnlp/twitter-roberta-base-2022-154m模型,专注于SemEval 2018情感分析任务,显著增强推文的多标签情绪分类能力。模型在测试集上的F1 micro为0.7169,F1 macro为0.5464,是推文情感分析的理想选择。适用于tweetnlp和transformers中的文本分类任务,支持通过Python加载工具进行灵活使用,有助于社交媒体情感解析。
voice-safety-classifier - 语音聊天毒性检测的高精度分类工具
语音安全音频分类Huggingfacetoxicity detectionGithub开源项目模型多标签分类模型评估
该项目提供了一个新的语音聊天毒性检测基准模型,基于大规模数据集开发。模型使用WavLM base plus权重,经过2,374小时语音多标签微调,输出标签包括Profanity、DatingAndSexting、Racist、Bullying等。评估显示模型在二元分类任务中的精度达到94.48%。使用者可通过特定命令运行模型权重进行应用。
rubert-tiny2-cedr-emotion-detection - 俄语情感识别的多标签分类模型
CEDR数据集RuBERT多标签分类模型Github开源项目Adam优化器情感分类Huggingface
该模型基于cointegrated/rubert-tiny2进行微调,适用于俄语文本的多标签情感分类任务。模型在CEDR数据集上经过40个周期的训练,学习率为1e-5,批次大小为64。测试结果显示,模型在愉悦、悲伤、惊讶等情感识别上的表现优异,AUC平均值为0.8956,F1微平均值为0.9280,可用于多种俄语文本情感分析场景。
BERT-Emotions-Classifier - 情感多标签分类的高效工具
BERTHuggingface情感分类Github开源项目模型多标签分类情感分析数据集
BERT-Emotions-Classifier是一个专注于多标签情感分类的BERT模型,基于sem_eval_2018_task_1数据集训练,能够识别愤怒、恐惧、喜悦等多种情感。适用于社交媒体和客户评论中的情感分析以及基于情感的内容推荐。尽管存在情感类别和输入长度的限制,但该模型在情感分析中表现优异,需注意可能的偏差问题。