Project Icon

pebblo-classifier

基于BERT的文本分类工具,优化协议文件整理

Pebblo Classifier是由DAXA.AI开发的文本分类模型,能够高效地对组织中的协议文档进行分类。该模型基于BERT技术,并从distilbert-base-uncased进行细调,支持21种文档标签分类,如董事会协议和咨询协议,简化文档整理过程。无需重新微调,用户可以通过简单代码实现快速集成。测试结果显示了模型的高精度和可靠性。

tweets-gender-classifier-distilbert - 基于DistilBERT的推文作者性别分类模型
BERTGithubHuggingface开源项目性别分类机器学习模型自然语言处理谷歌
这是一个基于DistilBERT模型的推文性别分类方案,通过分析推文内容预测作者性别。项目以google-bert/bert-base-uncased为基础模型,使用准确率和F1分数作为评估指标。该开源项目遵循apache-2.0许可证,可应用于社交媒体用户分析、市场研究、受众画像等场景。
deberta-v3-large-zeroshot-v1 - 强大高效的零样本文本分类能力
DeBERTa-v3GithubHuggingface开源项目文本分类模型模型训练自然语言推理零样本分类
模型适用于零样本分类,通过将文本分类任务转换为'真假'判定任务达到自然语言推理效果。使用Hugging Face pipeline实现,较现有模型表现优异。基于27项任务和310类文本进行训练,专注'Entailment'与'Not_Entailment'的二分类,且在多种文本分类场景中表现灵活。模型为开源,受到MIT许可证保护。
HarmBench-Llama-2-13b-cls - 文本行为分类与上下文分析的前沿方案
GithubHarmBenchHuggingfaceLLM分类器开源项目性能比较模型行为检测
该项目提供一款先进的文本行为分类工具,专为在HarmBench框架中使用而设计,采用Llama-2-13b模型支持标准和上下文行为识别。此工具不仅在文本中检测行为,还能全面分析其上下文。用户可通过官网获得使用指南和示例。经过与现有指标与分类器的比较,该分类器的性能显著优于大多数竞争对手,尤其在与GPT-4进行的性能对比中表现卓越。HarmBench环保倚赖自动化红队评估和分类技术,为用户提供稳定可靠的文本行为分类方案。
51-languages-classifier - 多语言文本分类模型可精准识别51种语言
GithubHuggingfaceMASSIVEXLM-Roberta分类多语言开源项目模型语言识别
该项目开发了一个基于XLM-Roberta的51语言分类器,能够精确区分51种不同语言的文本。模型使用MASSIVE数据集进行训练,该数据集包含超过100万条多语言话语样本。在评估中,模型在大多数语言上的F1分数均超过0.98,展现出优异的性能。研究人员和开发者可通过Hugging Face Transformers库轻松集成和使用这一多语言分类模型。
bert-base-uncased-finetuned-semeval24 - BERT微调模型在文本分类任务中的出色表现
F1GithubHuggingfacebert-base-uncased准确率开源项目损失模型精调
该微调模型基于google-bert/bert-base-uncased,采用Adam优化器和线性学习率调度策略,经过5个学习周期,在评估集合上取得了0.8254的准确率和0.8237的F1值,适用于需要精确度的文本分类任务。
fineweb-edu-fasttext-classifier - 高效快速的FastText分类器用于网页教育价值评估
FastTextGithubHuggingFaceFWHuggingface分类器开源项目教育价值模型模型评估
该项目引入了一种基于FastText的分类器,旨在评估网页的教育价值。通过使用fineweb-edu-llama3-annotations数据集进行训练,该模型支持高速数据处理,在CPU上每秒可分类超过2000个样本。该分类器与基于transformer的模型进行了性能比较,尤其在标签0、1、2上的表现相近,但在较高标签上性能稍有下降。适合用于需要快速判断网页教育内容的场景,是处理大数据的有效工具。
bert-toxic-comment-classification - BERT模型在毒性评论分类中的应用与实现
BERTGithubHuggingface开源项目文本分类机器学习模型模型训练毒性评论分类
该项目基于BERT模型,通过fine-tuning实现毒性评论的智能分类。模型在1500行测试数据上达到0.95 AUC,采用Kaggle竞赛数据集训练。项目提供简洁的Python接口,便于开发者快速集成文本毒性检测功能。适用于构建在线社区、内容平台的评论审核系统。
distilbert-base-multilingual-cased-sentiment - 多语种情感分析模型的高效文本分类能力
Amazon评论GithubHuggingfacedistilbert-base-multilingual-cased-sentiment开源项目情感分析文本分类机器学习模型
本项目基于distilbert-base-multilingual-cased模型进行微调,在amazon_reviews_multi数据集上实现了优异的文本分类效果,准确率和F1值均为0.7648。模型通过优化训练参数和分布式数据处理,实现高效运行,适合多语言情感分析应用场景,可用于全球市场的用户评价分析。
finbert-esg-9-categories - FinBERT-ESG九分类模型 企业可持续发展报告智能分析工具
ESG分析FinBERTGithubHuggingface企业治理开源项目模型气候变化金融文本分析
FinBERT-ESG九分类模型是一款专业的企业可持续发展报告分析工具。该模型基于14,000个人工标注的ESG报告和年度报告样本训练而成,能够将文本准确分类为气候变化、自然资本、污染与废物等9个细分ESG主题。这一工具有助于投资者评估企业长期可持续性并识别相关风险,为金融文本分析提供了重要支持。
ESG-BERT - ESG-BERT模型提升可持续投资领域的文本分析能力
BERT模型ESG-BERTGithubHuggingface可持续投资开源项目文本挖掘模型自然语言处理
ESG-BERT是针对可持续投资领域优化的BERT模型。在非结构化文本数据上的训练使其在下一句预测和掩码语言建模任务中表现出色。文本分类任务中,ESG-BERT的F1分数达0.90,超越通用BERT模型和传统机器学习方法。这一模型为可持续投资领域的自然语言处理任务提供了有力支持,显著提升了ESG相关文本分析效果。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号