Mol-Instructions
Mol-Instructions是一个开放的大规模生物分子指令数据集,包含分子导向、蛋白质导向和生物分子文本三类指令。数据集涵盖分子设计、蛋白质功能预测等多个任务,通过AI协作、数据提取和模板转换等方法构建。该数据集旨在增强大语言模型在生物分子领域的表现,现已在Hugging Face平台发布。