Project Icon

Bielik-7B-Instruct-v0.1

波兰语语言模型的优化与训练方法

Bielik-7B-Instruct-v0.1 是一种微调的波兰语语言模型,利用高性能计算提升语言理解能力。该模型通过权重损失和自适应学习率等技术进行优化,显著提高了性能,并提供多种精简版本。

Bielik-7B-Instruct-v0.1项目介绍

Bielik-7B-Instruct-v0.1是由开源项目SpeakLeash和高性能计算中心ACK Cyfronet AGH合作开发的一款经过指令微调的Polish大语言模型。这一项目主要利用了PLGrid环境下的大规模计算基础设施,并获得计算性拨款(编号PLG/2024/016951)的支持,在Athena和Helios超级计算机上进行训练。这款模型展现了出色的波兰语言理解和处理能力,能够准确执行多种语言学任务。

模型概述

  • 开发团队:SpeakLeash
  • 使用语言:波兰语
  • 模型类型:仅限因果解码
  • 微调基于:Bielik-7B-v0.1
  • 许可证:CC BY NC 4.0(仅限非商业用途)
  • 参考模型:speakleash:e38140bea0d48f1218540800bbc67e89

模型训练

Bielik-7B-Instruct-v0.1的训练依托于Krzysztof Ociepa开发的ALLaMo开源框架,可快速高效地训练类似LLaMA和Mistral结构的语言模型。训练中使用了一部分由注释人员精心校正过的波兰语指令和一些公开提供的英文指令数据集,比如OpenHermes-2.5和orca-math-word-problems-200k。

训练技术

为了优化模型性能,开发团队引入了以下技术:

  • 加权词元级损失:受离线强化学习和C-RLFT的启发
  • 自适应学习率:参考批量大小学习率研究
  • 用户指令屏蔽

训练超参数

  • 上下文长度: 4096
  • 微批量大小: 1
  • 批量大小: 高达4194304
  • 学习率(余弦,自适应): 7e-6 -> 6e-7
  • 预热迭代: 50
  • 总迭代次数: 55440
  • 优化器: AdamW
  • β1, β2: 0.9, 0.95
  • Adam_eps: 1e−8
  • 权重衰减: 0.05
  • 梯度裁减: 1.0
  • 精度: bfloat16(混合)

预量化和MLX版本

为了适应资源有限的用户,开发团队提供了量化版本的Bielik-7B-Instruct-v0.1模型,适用于非GPU与性能较弱的GPU。此外,也为Apple Silicon设备提供了相应的MLX版本。

模型评价

Bielik-7B-Instruct-v0.1在Open PL LLM Leaderboard上的多种NLP任务中进行了5-shot展示,其评估内容涉及情感分析、分类、文本分类等任务。尽管未直接评估聊天技能,但模型在计算机开放问题回答任务(RAG Reader)中表现突出,相较于Mistral-7B-v0.1,其平均得分提高了接近9个百分点。

局限性与偏见

Bielik-7B-Instruct-v0.1旨在展示基础模型可以如何轻松微调以获得优良性能,但该模型可能生成不准确或偏见的信息,不宜在需要内容审核的环境中直接应用。

许可证与引用

由于法律状况不明晰,模型以CC BY NC 4.0许可证发布,允许非商业用途。用户可用于科学和私人目的,但需满足许可证条件。

对于学术引用用户可按以下格式引用此模型:

@misc{Bielik7Bv01,
    title     = {Introducing Bielik-7B-Instruct-v0.1: Instruct Polish Language Model},
    author    = {Ociepa, Krzysztof et al.},
    year      = {2024},
    url       = {https://huggingface.co/speakleash/Bielik-7B-Instruct-v0.1},
    note      = {Accessed: 2024-04-01}, 
}
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号