unbiased-toxic-roberta

RoBERTa模型识别多语言有毒评论并减少偏见

模型评估 Huggingface 模型 Detoxify 机器学习有毒评论分类 Github 开源项目自然语言处理

该项目开发了基于RoBERTa的多语言模型,用于检测互联网上的有毒评论。模型在Jigsaw三个挑战数据集上训练,可识别威胁、侮辱和仇恨言论等多种有毒内容。它支持多种语言,易于使用,适用于研究和内容审核。项目还探讨了模型的局限性和伦理问题,努力减少对特定群体的意外偏见。

文档

BertWithPretrained - 基于PyTorch实现的BERT模型及相关下游任务

BERTGithubPyTorchTransformer中文文本分类开源项目英文文本分类

该项目基于PyTorch实现了BERT模型及其相关下游任务，详细解释了BERT模型和每个任务的原理。项目支持分类、翻译、成对句子分类、多项选择、问答和命名实体识别等任务，涵盖中文和英语的自然语言处理。此外，项目还含有丰富的数据集和预训练模型配置文件。

TextAttack - 为NLP模型生成对抗样本和进行数据增强的专业工具

GithubNLPTextAttack对抗样本开源项目数据增强模型训练

TextAttack是一个专为自然语言处理（NLP）提供对抗攻击、数据增强和模型训练的Python框架。通过多种预定义攻击策略，用户可以更好地理解和研究NLP模型。TextAttack支持简便的命令行操作和广泛的模型与数据集，提供详细的文档和示例代码，帮助提高模型的泛化能力和鲁棒性。

tidybot - 运用大语言模型实现个性化智能清理

GithubTidyBot大语言模型开源项目机器人助手物体识别用户偏好学习

TidyBot项目利用大语言模型的少样本总结能力，开发了个性化家庭清理机器人。系统结合语言规划和感知，从少量示例快速学习用户偏好并应用于新场景。在基准测试中，TidyBot对未见物品达91.2%准确率，实际测试中成功放置85.0%物品。这为机器人个性化物理协助提供了新思路。

subnet9_best2_competition1 - 介绍Hub上推出的transformers模型及其功能特性

GithubHuggingfacetransformers偏见风险开源项目技术规格模型模型共享环境影响

本文介绍了一款发布在Hub上的transformers模型，涵盖其训练数据、用途和评估方法。尽管当前信息有限，读者可以了解模型的应用范围及其可能的偏差和限制，同时本文也涉及其环境影响和技术规格，旨在帮助读者有效理解和使用该模型。

gpt2-imdb - 利用IMDB电影评论数据集微调的GPT-2模型

Adam优化器GithubHuggingfacegpt2-imdb学习率开源项目数据集模型训练超参数

该项目基于IMDB数据集对GPT-2模型进行微调，以增强情感分析的准确性。训练中采用Adam优化器和线性学习率调度器，学习率设置为5e-05。框架使用了Transformers 4.26.1、Pytorch 1.13.1和Datasets 2.9.0等技术，以有效提高深度学习训练。这款模型通过微调，提升了对电影评论数据集的处理能力，从而在情感分类任务中表现更加出色。

adversarial-robustness-toolbox - 机器学习安全与对抗性威胁防护库

Adversarial Robustness ToolboxGithubLinux Foundation AI & Data对抗性威胁开源项目机器学习安全模型防御

Adversarial Robustness Toolbox (ART) 是由 Linux Foundation AI & Data Foundation 托管的 Python 库，为开发者和研究人员提供评估和防护机器学习模型的工具，以抵御规避、投毒、提取和推理等对抗性威胁。ART 支持所有流行的机器学习框架（如 TensorFlow、Keras、PyTorch 等），适用于各种数据类型（图像、表格、音频、视频等）和任务（分类、目标检测、语音识别等）。持续开发中，欢迎反馈和贡献。

multilingual-e5-large-pooled - 多语言支持的句子相似性与特征提取模型

GithubHuggingfaceMTEBmultilingual-e5-large分类句子相似度开源项目模型特征提取

此项目基于多语言处理，融合Sentence Transformers技术，专注于句子相似性与特征提取。支持多语言，适用于分类、重排序、文本聚类等多种场景。模型在各种任务中表现优异，如MTEB AmazonCounterfactualClassification和MTEB BUCC中的分类与双语文本挖掘，表现出色。采用MIT许可证，具有高度使用灵活性。

bge-base-en-v1.5 - 增强文本处理能力的多任务学习模型

GithubHuggingfacesentence-transformers分类句子相似性句子聚类开源项目模型特征提取

bge-base-en-v1.5模型通过多任务学习优化自然语言处理技术，覆盖分类、检索、聚类和重排任务。在多个MTEB数据集上表现优异，例如在亚马逊情感分类任务中达到93.39%的准确率，在AskUbuntu重排任务中MRR达到74.28%。该模型具有MIT开源许可，适用于多种英语任务，为研究人员和开发者提供有效支持。

automated-interpretability - 语言模型神经元行为的自动化解释工具

GPT-2Github开源项目数据集模型权重神经元行为自动解释性

automated-interpretability项目开发了一套自动化工具，用于生成、模拟和评分语言模型中神经元行为的解释。该项目提供了代码库、神经元激活查看器和GPT-2 XL神经元的公开数据集。这些资源旨在帮助研究人员和开发者深入理解大型语言模型的内部机制。

Keras-TextClassification - 多样预训练模型支持的高效文本分类工具

GithubKeras-TextClassification嵌入式模型开源项目文本分类深度学习神经网络

为中文用户提供高效的文本分类解决方案，支持FastText、BERT、Albert等多种预训练模型，涵盖词、字、句子嵌入。详细介绍数据处理与模型训练流程，通过下载与调用数据，实现多标签分类和文本相似度计算，简化复杂的自然语言处理任务。

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com