Project Icon

PIXIU

金融大规模语言模型的开发、微调与评估

PIXIU 项目专注于开发、微调和评估金融领域中的大规模语言模型(LLMs)。核心组件包括 FinBen 金融语言理解和预测评估基准、FIT 金融指令数据集,以及 FinMA 金融大规模语言模型。项目提供多任务和多模态的金融数据,涵盖股票走势预测等任务,旨在促进开放研究和透明性,提供包括模型、指令调优数据和评估数据集在内的开放资源。

PIXIU 项目简介

PIXIU 项目旨在推动金融领域大语言模型(LLM)的开发、微调和评估。该项目是了解和利用大语言模型在金融领域潜力的重要一步。

项目结构

PIXIU 仓库由几个核心组成部分构成,每个部分在金融自然语言处理管道中有其特定用途:

  • FinBen:金融语言理解和预测评估基准。FinBen 是金融大型语言模型的评估套件,专注于在各种金融背景下进行理解和预测任务。

  • FIT:金融指令数据集。FIT 是一个多任务和多模态的指令数据集,专门为金融任务量身定制,是细调大语言模型的训练场所。

  • FinMA:我们的金融大型语言模型。FinMA 是项目的核心,为我们的金融任务提供学习和预测能力。

项目主要特点

  • 开放资源:PIXIU 开放提供金融大语言模型、指令调优数据及包含在评估基准中的数据集,以鼓励开放研究和透明度。

  • 多任务:PIXIU 的指令调优数据和基准涵盖了多种金融任务,包括四个金融自然语言处理任务和一个金融预测任务。

  • 多模态:PIXIU 的指令调优数据和基准由多模态金融数据组成,包括股票运动预测任务中的时间序列数据,涵盖各种类型的金融文本,包括报告、新闻文章、推文和监管文件。

  • 多样性:不同于以往主要聚焦于金融自然语言处理任务的基准,PIXIU 的评估基准包括与现实世界场景一致的关键金融预测任务,增加了挑战性。

FinBen 2.0: 金融语言理解和预测评估基准

FinBen 2.0 提供了对比像 ChatGPT、GPT-4 和 BloombergGPT 这样的领先模型与 FinMA 的详细性能分析。所选取的任务和指标涵盖了金融自然语言处理和金融预测的各个方面。

任务

FinBen 提供了一系列任务,包括情感分析、分类、知识提取、数字理解、文本摘要、信用评分和预测等。同时,FinBen 收录了多个金融数据集,例如新闻情感分析数据集、信贷评分数据集和股票走势预测数据集。

评估

我们提供了针对评估过程的详细指导,包括如何在本地安装、如何使用 Docker 镜像运行项目、以及如何使用自动化任务评估工具。对于每种任务类型,PIXIU 提供了相应的预定义任务指标,例如分类任务中的准确率和 F1 得分,抽取和生成摘要任务的 Rouge 得分等。

创建新任务

开发者可以创建适用于 FinBen 的新任务,只需在 Huggingface 上创建数据集并在项目中实现任务。任务的实现可以使用我们提供的基础类,如分类、序列标注、关系抽取等,并在特定文件中定义并注册新任务。

总的来说,PIXIU 项目通过提供先进的金融大语言模型工具和基准,服务于金融领域的研究与应用,鼓励研究人员和开发者利用该平台进行深入探索和研究。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号