相关项目
hatespeechdata
该项目汇集了涵盖多种语言的仇恨言论、在线辱骂和攻击性语言数据集。收录内容包括来自不同平台的文本、图像和音频数据。项目旨在为自然语言处理系统提供训练资源,以提升有害内容检测能力。此外,项目还提供关键词列表和贡献指南,为研究人员和开发者改进在线内容审核和仇恨言论检测技术提供支持。
scenario-teacher-data-hate_speech_filipino-model-xlm-roberta-base
该项目利用xlm-roberta-base模型微调适用于菲律宾语的仇恨言论检测,已达到78.17%的准确率和76.87%的F1得分。模型特别适应于处理此类任务,通过调整学习率和其他超参数优化性能。训练使用了Adam优化和线性学习率调度策略,总计训练了6969个epoch。