先进的自杀倾向分类模型
项目简介
这是一个旨在检测文本中自杀倾向的人工智能模型。该项目利用ELECTRA架构,在多样化的数据集上进行微调,创建了一个强大的分类模型,能够区分自杀倾向和非自杀倾向的文本表达。
模型标签
该模型将输入文本分为两类:
- LABEL_0:表示文本不含自杀倾向
- LABEL_1:表示文本含有自杀倾向
模型训练
模型在精心筛选的数据集上使用ELECTRA架构进行微调。训练过程涉及清理和预处理来自多个来源的文本,以创建全面的训练集。训练结果显示出良好的性能,主要指标包括:
- 准确率:93.94%
- 召回率:93.72%
- 精确率:92.82%
- F1分数:93.27%
这些指标表明模型能够准确地将文本序列分类为自杀倾向或非自杀倾向。
数据来源
研究团队从多个来源收集数据,创建了丰富多样的训练数据集。数据来源包括Reddit帖子、Twitter数据、自杀短语集等。所有数据在用于训练模型之前都经过了彻底的清理和预处理。
使用方法
用户需要先安装Transformers库。然后可以通过pipeline方法或直接使用tokenizer和模型来进行文本分类。项目提供了详细的代码示例,方便用户快速上手使用。
伦理考虑
自杀倾向是一个敏感而严肃的话题。在使用该模型时,需要谨慎行事并考虑伦理影响。模型的预测结果应该谨慎处理,并用于补充人类判断和干预,而不是替代。
模型来源
该项目基于Hugging Face模型库中的"gooohjy/suicidal-electra"模型进行微调,创建了这个专门用于自杀倾向检测的模型。
贡献
项目欢迎社区贡献和反馈,以进一步提高模型性能,增强数据集,并确保其负责任的部署。