项目简介
txlm-roberta-hindi-sentiment
是一个针对印地语情感分类的模型。这个模型以 Devanagari 文字符号呈现,基于来自 Cardiff-NLP 的 Twitter-XLM-RoBERTa-base 模型进行微调。
模型描述及训练数据
txlm-roberta-hindi-sentiment
是一种能够识别印地语情感的分类器模型。其训练数据来自一个公开的印地语数据集,详细信息可以在 GitHub 上找到。训练、测试和验证数据集分别包含了 6807、1634 和 635 条印地语标注样本。
性能表现
在训练后,该模型达到了 0.89 的加权平均宏 F1 分数。这意味着模型在识别不同情感类别时具有较高的准确性和一致性。对于更详细的性能分析,读者可以查看 Google Colab 笔记本中提供的混淆矩阵。
代码使用
如果您有兴趣亲自体验和微调这个模型,可以前往 LondonStory 的 GitHub 页面,在那里可以找到使用原生 PyTorch 模块进行微调的 Google Colab 笔记本:点此查看。
这个模型为希望研究印地语情感分析的研究人员提供了一个强有力的工具,其简单易用且基于开源,任何人都可以在其基础上进行修改和实验。