项目概述
finbert-esg-9-categories是一个专门用于ESG(环境、社会和公司治理)文本分析的金融领域语言模型。该模型基于FinBERT架构,通过对约14,000个来自企业ESG报告和年度报告的人工标注句子进行微调训练而成。
核心功能
这个模型最主要的功能是能够将输入的文本自动分类到九个精细的ESG主题类别中,包括:
- 气候变化
- 自然资本
- 污染与废弃物
- 人力资本
- 产品责任
- 社区关系
- 公司治理
- 商业道德与价值观
- 非ESG类别
应用价值
该模型可以帮助投资者更好地评估企业的长期可持续发展能力,并识别相关风险。它是对现有finbert-esg模型的补充和扩展,相比原模型仅将文本分为环境(E)、社会(S)、治理(G)三大类,本模型提供了更为精细和具体的分类结果。
使用方法
模型的使用非常简单直观,用户可以通过Transformers库的pipeline功能来实现文本分类。只需要几行Python代码,就能完成模型的加载和预测。模型会将输入的文本自动分类到最相关的ESG主题类别,并给出相应的置信度分数。
技术特点
- 基于BERT架构开发,具有强大的文本理解能力
- 专门针对金融领域ESG文本进行优化
- 提供九个细分类别的精确分类
- 使用大规模人工标注数据集进行训练
- 集成简单,易于部署使用
学术价值
该模型已在学术研究中得到认可,相关研究发表在《Contemporary Accounting Research》期刊上。对于想要在金融文本分析领域进行研究的学者来说,这是一个非常有价值的工具。