用于指令调优的数据集和模型
txtinstruct 是一个用于训练指令调优模型的框架。
这个项目的目标是支持开放数据、开放模型以及与您自己的数据集成。当今最大的问题之一是指令遵循数据集和大型语言模型的许可不明确。txtinstruct 让您能够轻松构建自己的指令遵循数据集,并使用这些数据集来训练指令调优模型。
txtinstruct 基于 Python 3.8+ 和 txtai 构建。
安装
最简单的安装方式是通过 pip 和 PyPI
pip install txtinstruct
您也可以直接从 GitHub 安装 txtinstruct。建议使用 Python 虚拟环境。
pip install git+https://github.com/neuml/txtinstruct
支持 Python 3.8+
请参阅此链接以解决特定环境的安装问题。
示例
以下示例笔记本展示了如何使用 txtinstruct 构建模型。
笔记本 | 描述 | |
---|---|---|
txtinstruct 介绍 | 构建指令调优数据集和模型 |