#生物信息学
protpardelle
Protpardelle是一个开源的全原子蛋白质生成模型项目,提供预训练模型、推理和训练代码。支持条件和无条件蛋白质设计,可通过HuggingFace网页应用或PyMOL插件使用。项目包含环境配置、示例命令和数据集获取方法,适合研究人员和开发者使用与贡献。
alphafold3-pytorch
这是AlphaFold 3的PyTorch开源实现项目。它包含完整的模型架构、训练和推理流程,以及详细的数据准备指南。项目支持原子级和分子级的输入处理,提供PDB数据集筛选和聚类脚本。丰富的文档和示例代码有助于用户理解和使用AlphaFold 3模型。该实现为蛋白质结构预测研究提供了有价值的开源工具。
ProLIF
ProLIF是一个用于生成生物分子复合物相互作用指纹的开源工具。它可分析分子动力学轨迹、对接模拟和实验结构数据,支持配体、蛋白质、DNA和RNA等多种分子类型。该工具提供详细文档和教程,适用于生物信息学和药物设计领域的复杂相互作用研究。ProLIF由MDAnalysis和RDKit等库提供技术支持,是这一领域的重要资源。
biocypher
BioCypher是一款专为生命科学领域设计的知识图谱工具,旨在简化创建和维护过程。它提供了灵活的数据存储、集成和推理功能,支持复杂数据的探索和分析。BioCypher可应用于人工智能研究,并具有用户友好的界面。该工具提供全面的文档和教程,帮助研究人员轻松构建和管理知识图谱。作为开源项目,BioCypher不断发展,为生物医学研究提供有力支持。
alphafold
AlphaFold是DeepMind开发的人工智能系统,可高精度预测蛋白质三维结构。系统支持单体和多聚体蛋白预测,并提供TM-score和对齐误差等评估指标。AlphaFold结合深度学习和基因数据库,在CASP14竞赛中获得重大突破。其开源代码和预训练模型为研究人员提供了强大的蛋白质结构分析工具,有助于推动生物学和医学研究进展。
genome-spy
GenomeSpy是一款基因组数据可视化工具包,采用Vega-Lite风格的语法和WebGL渲染技术。它能处理数千个患者样本,提供分面、过滤、排序和分组功能。此外,GenomeSpy具备交互式界面,支持会话管理、URL哈希和书签,方便研究人员分析复杂的基因组数据。
ComplexHeatmap
ComplexHeatmap是一个用于创建复杂热图的R软件包,提供灵活的多热图排列和多样化注释功能。该工具可视化不同数据集间的关联并揭示潜在模式,支持单热图、带注释热图、热图列表和行注释等功能。ComplexHeatmap适用于展示基因组数据、甲基化谱和单细胞RNA测序等复杂数据,并能创建增强型OncoPrint、UpSet图和3D热图。其高度定制性使其成为生物信息学和数据科学领域的强大可视化工具。
DNABERT_2
DNABERT-2是一个针对多物种基因组理解的高效基础模型。该模型在28个GUE基准任务中表现优异,采用BPE替代k-mer标记化,ALiBi代替位置嵌入,并整合多项技术提升效率。DNABERT-2为基因组分析提供了强大工具,可用于序列分类、元素识别和功能预测等多种任务。
DnaFeaturesViewer
DnaFeaturesViewer是一款功能强大的DNA序列特征可视化Python库。它能自动生成清晰简洁的图表,即使是复杂的重叠特征和长标签序列也能完美展示。该库兼容Matplotlib和Biopython,支持多种图像输出格式。DnaFeaturesViewer可从GenBank或GFF文件读取特征,绘制核苷酸序列和氨基酸翻译,并支持多行多页绘图。它为DNA序列分析和生物学研究提供了直观高效的可视化工具。