Project Icon

roberta-base-CoLA

RoBERTa模型在CoLA任务上的微调和性能分析

本项目展示了roberta-base模型在GLUE数据集的CoLA任务上的微调过程。模型经过5轮训练,使用32批量大小、2e-05学习率和128最大序列长度。采用交叉熵损失函数,模型在首轮训练后即达到85%的评估集准确率。这一结果凸显了RoBERTa模型在语言可接受性判断任务中的出色表现。

distilroberta-base-rejection-v1 - DistilRoBERTa模型用于检测LLM输出拒绝响应 准确率98.87%
GithubHuggingfaceLLMProtectAIdistilroberta-base开源项目拒绝检测文本分类模型
这是一个基于DistilRoBERTa的微调模型,用于检测大型语言模型(LLM)输出中的拒绝响应。模型将输入分为正常输出和拒绝检测两类,评估准确率达98.87%。采用Apache 2.0许可证,支持Transformers和ONNX运行时,易于集成。适用于内容审核和安全防护,可识别LLM对不当内容的拒绝响应。
twitter-roberta-large-hate-latest - 增强的多类别仇恨言论检测模型
GithubHuggingfaceRoBERTaSuperTweetEval仇恨言论检测开源项目推特文本分类模型
此RoBERTa-large模型基于154M推文数据进行训练,并在SuperTweetEval数据集上进行微调,以实现仇恨言论的多类别分类检测。模型能够准确识别多种仇恨类型,包括性别、种族和宗教等,为社交媒体内容管理提供支持。
twitter-xlm-roberta-base - XLM-T 基于推特的多语言模型用于情感分析和跨语言任务
GithubHuggingfaceXLM-Roberta-base多语言开源项目情感分析推特模型自然语言处理
XLM-T是一个基于XLM-RoBERTa架构的多语言模型,通过1.98亿条多语言推文训练而成。该模型专门用于Twitter数据分析,支持30多种语言的情感分析和跨语言相似度计算。XLM-T还提供了一个覆盖8种语言的统一Twitter情感分析数据集,可作为多语言自然语言处理任务的基准模型,并支持针对特定应用场景的进一步微调。
twitter-roberta-base-sentiment-latest - RoBERTa基础的推特情感分析模型 支持英文社交媒体文本
GithubHuggingfaceRoBERTaTweetEvalTwitter开源项目情感分析模型自然语言处理
这是一个基于RoBERTa-base的推特情感分析模型,通过1.24亿条推文训练并针对情感分析任务微调。模型可将英文推文分类为积极、中性或消极,支持Transformers库集成。适用于社交媒体分析和舆情监测等场景,是TweetNLP项目的组成部分,体现了社交媒体自然语言处理的最新进展。
roberta_toxicity_classifier - 高效的毒性评论分类模型
AUC-ROCF1-scoreGithubHuggingfaceJigsawRoBERTa开源项目模型毒性分类
该模型专注于毒性评论的分类,使用来自Jigsaw 2018、2019和2020年的数据集训练,包含约200万个英文例子。通过对RoBERTa模型的精细调校,在测试集上表现出色,AUC-ROC达到0.98,F1评分为0.76,是用于识别毒性内容的有效工具。
bert-base-uncased-yelp-polarity - BERT模型基于Yelp评论数据集实现高准确率情感分析
GithubHuggingfaceTextAttackbert-base-uncased序列分类开源项目模型模型微调自然语言处理
该项目基于bert-base-uncased模型,利用TextAttack框架和yelp_polarity数据集进行微调,构建了一个文本情感分类器。经过5轮训练,模型在评估集上达到96.99%的准确率。支持最大256的序列长度,专门用于Yelp评论的情感分析。模型采用16的批次大小和5e-05的学习率,展现出优秀的性能表现。
distilbert-base-uncased-ag-news - 使用精简版模型增强新闻文本分类性能
GithubHuggingfaceTextAttackdistilbert-base-uncased交叉熵损失函数准确率序列分类开源项目模型
该项目通过使用TextAttack工具和ag_news数据集对distilbert-base-uncased模型进行微调,提升了文本分类的精确度。模型经过5个周期的训练,采用了32的批量大小、2e-05的学习率和128的最大序列长度。在分类任务中采用了交叉熵损失函数。模型在验证集测试中取得了0.9479的最佳准确度。详见TextAttack的GitHub页面。
roberta-base-go_emotions - RoBERTa模型实现28种情感多标签分类
GithubHuggingfaceRoBERTago_emotions数据集text-classification多标签分类开源项目情感分析模型
该模型基于roberta-base,利用go_emotions数据集训练而成,可对文本进行28种情感的多标签分类。模型在测试集上实现0.474的准确率和0.450的F1分数。为提升性能,还提供ONNX版本。研究者可通过Hugging Face Transformers框架便捷应用此模型。值得注意的是,某些情感标签如'gratitude'表现优异,F1值超过0.9,而'relief'等标签表现欠佳,可能与训练数据分布不均有关。通过优化每个标签的阈值,模型的整体F1分数可提升至0.541,显示出进一步改进的潜力。
deberta-base - DeBERTa模型提升自然语言理解性能
DeBERTaGithubHuggingface开源项目微软模型注意力机制自然语言处理预训练模型
DeBERTa是一个改进BERT和RoBERTa模型的开源项目,通过解耦注意力和增强掩码解码器实现性能提升。该模型在SQuAD和MNLI等自然语言理解任务中表现优异,展现出在问答和推理方面的卓越能力。DeBERTa使用80GB训练数据,在多数NLU任务中超越了BERT和RoBERTa的表现。
roberta-base-finetuned-abbr - RoBERTa微调模型实现高精度缩写检测
GithubHuggingfacePLOD数据集RoBERTa命名实体识别开源项目微调模型模型自然语言处理
这是一个基于roberta-base在PLOD-filtered数据集上微调的模型,专门用于缩写检测。模型在评估中表现优异,精确率0.9645,召回率0.9583,F1值0.9614。采用掩码语言建模预训练,学习双向语言表示,适用于序列标注特别是缩写检测任务,为NLP应用提供有力支持。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号