caduceus
Caduceus是一种双向等变长程DNA序列建模技术,可处理长达131k的DNA序列。其反向互补等变架构无需数据增强即可高效建模。项目提供预训练模型和实验复现指南,包括人类基因组预训练和多项下游任务评估,展示了在基因组学领域的应用潜力。该项目开源了模型代码和预训练权重,提供了详细的使用说明和实验复现步骤,涵盖了基因组基准测试、核苷酸转换器数据集和单核苷酸多态性变异效应预测等多个评估方法。