#基因组
DNABERT - DNABERT:用于基因组DNA语言处理的双向编码器模型
DNABERT基因组预训练模型GPUBERTGithub开源项目
DNABERT提供完整的源码、使用示例、预训练和微调模型,适用于各类基因组DNA语言处理任务。该项目利用Huggingface的扩展工具,增添了多任务支持和高效的可视化功能。最新版DNABERT-2不仅提升了多物种基因组的处理能力,还发布了全面的Genome Understanding Evaluation (GUE)基准测试,涵盖28个数据集。
DnaFeaturesViewer - 功能强大的DNA序列特征可视化Python库
DNA Features Viewer生物信息学可视化工具基因组Python库Github开源项目
DnaFeaturesViewer是一款功能强大的DNA序列特征可视化Python库。它能自动生成清晰简洁的图表,即使是复杂的重叠特征和长标签序列也能完美展示。该库兼容Matplotlib和Biopython,支持多种图像输出格式。DnaFeaturesViewer可从GenBank或GFF文件读取特征,绘制核苷酸序列和氨基酸翻译,并支持多行多页绘图。它为DNA序列分析和生物学研究提供了直观高效的可视化工具。
DNABERT_2 - 多物种基因组理解基础模型
DNABERT-2基因组深度学习人工智能生物信息学Github开源项目
DNABERT-2是一个针对多物种基因组理解的高效基础模型。该模型在28个GUE基准任务中表现优异,采用BPE替代k-mer标记化,ALiBi代替位置嵌入,并整合多项技术提升效率。DNABERT-2为基因组分析提供了强大工具,可用于序列分类、元素识别和功能预测等多种任务。
DNABERT-2-117M - 多物种基因组分析的先进Transformer模型
模型生物学DNABERT-2医学开源项目Huggingface基因组Github深度学习
DNABERT-2-117M是一个创新的多物种基因组分析工具,基于先进的Transformer架构。它整合了MosaicBERT技术,实现了DNA序列的高效嵌入计算。用户可以通过简单的Python代码调用模型,获取DNA序列的向量表示。这一功能为生物信息学和医学基因组学研究提供了强大支持,有望推动多种基因组分析任务的进展。