PropagandaTechniquesAnalysis-en-BERT项目介绍
项目概述
PropagandaTechniquesAnalysis-en-BERT是一个基于BERT的模型,专门用于分析和预测英语新闻文章中的宣传技巧。这个项目的目标是对文本进行细粒度分析,检测包含宣传技巧的所有片段及其类型。该模型的详细描述可以在这篇论文中找到。
模型特点
-
细粒度分析:不同于之前仅在文档级别进行宣传检测的方法,该模型能够识别文本中具体的宣传技巧片段。
-
多种宣传技巧识别:模型可以识别18种不同的宣传技巧。
-
基于BERT:利用BERT强大的自然语言处理能力,提高了宣传技巧识别的准确性。
-
可解释性:相比于其他缺乏解释性的系统,该模型提供了更好的可解释性。
使用方法
该项目提供了简单的Python代码示例,展示了如何使用模型进行预测。用户可以使用BertTokenizerFast进行分词,然后使用BertForTokenAndSequenceJointClassification模型进行预测。模型将返回序列级别和token级别的预测结果。
实际应用
该模型已经在Tanbih网站上线,用户可以在该网站上体验模型的实际效果。这为研究人员和公众提供了一个便捷的工具,用于分析新闻文章中的宣传技巧。
学术价值
该项目不仅提供了实用的模型,还为宣传技巧分析领域做出了学术贡献。相关研究已发表在2019年EMNLP-IJCNLP会议上,并提供了详细的引用信息,方便其他研究者引用和进一步研究。
开源贡献
项目采用MIT许可证,允许其他开发者自由使用和修改代码。这种开放的态度有助于推动该领域的研究和应用发展。
总的来说,PropagandaTechniquesAnalysis-en-BERT项目为新闻文章中的宣传技巧分析提供了一个强大而灵活的工具,它在学术研究和实际应用中都具有重要价值。