#DistilRoBERTa
distilroberta-base - DistilRoBERTa:轻量高效的英语语言模型
模型Github模型蒸馏开源项目语言模型Huggingface机器学习自然语言处理DistilRoBERTa
DistilRoBERTa-base是RoBERTa-base的精简版本,采用与DistilBERT相同的蒸馏技术。模型包含6层结构,768维向量和12个注意力头,总参数量为8200万,比原版减少33%。在保持相近性能的同时,处理速度提升一倍。主要应用于序列分类、标记分类和问答等下游任务的微调。该模型在英语处理上表现优异,但使用时需注意其可能存在的偏见和局限性。
emotion_text_classifier - DistilRoBERTa微调的多类情感分析模型
模型Github开源项目Huggingface机器学习情感分类深度学习自然语言处理DistilRoBERTa
这是一个基于DistilRoBERTa微调的情感分类模型,能够识别文本中的七种情绪,包括六种基本情绪和一种中性情绪。模型在《老友记》剧本数据集上进行了微调,特别适合分析电视剧和电影的对话文本。支持的情绪标签包括愤怒、厌恶、恐惧、快乐、中性、悲伤和惊讶,为自然语言处理中的情感分析任务提供了实用工具。
emotion-english-distilroberta-base - DistilRoBERTa英文文本情感分析模型
模型情感分类DistilRoBERTaGithubHugging Face开源项目Huggingface机器学习自然语言处理
该模型基于DistilRoBERTa-base微调,用于英文文本情感分析。可预测7种情绪:愤怒、厌恶、恐惧、快乐、中性、悲伤和惊讶。训练数据来自Twitter、Reddit等6个多样化数据集。提供简单的3行代码使用方法,适用于单个文本和完整数据集分析。模型在平衡数据集上的评估准确率为66%,远高于随机基准。
st-codesearch-distilroberta-base - 基于DistilRoBERTa的代码搜索嵌入模型
模型语义搜索代码搜索DistilRoBERTaGithub向量嵌入sentence-transformersHuggingface开源项目
st-codesearch-distilroberta-base是一个基于DistilRoBERTa的句子转换器模型,可将文本映射到768维向量空间。该模型在code_search_net数据集上训练,专门用于文本到代码的搜索任务。它支持语义搜索和聚类等应用,并提供简单的API接口。用户可以利用这个模型生成文本嵌入,实现代码搜索和相似度比较等功能。这个预训练模型为代码检索和自然语言处理任务提供了有力工具。
NSFW_text_classifier - DistilRoBERTa文本智能分类模型自动识别不当内容
NSFW分类模型文本分析GithubDistilRoBERTa内容审核Huggingface开源项目情感分析
DistilRoBERTa-base文本分类模型通过14317条Reddit帖子训练,可识别文本内容是否适合工作场合。模型采用NSFW(不适合工作场合)和SFW(适合工作场合)二分类方法,支持Pipeline快速部署,可用于社交媒体和在线社区的内容审核。