#ESM-2
esm2_t36_3B_UR50D - ESM-2系列先进蛋白质序列模型
生物信息学Huggingface模型机器学习语言建模GithubESM-2开源项目蛋白质模型
esm2_t36_3B_UR50D是ESM-2系列中的一款蛋白质模型,采用掩码语言建模方法训练。该模型拥有36层网络结构和30亿参数,在精度、内存消耗和训练时间之间取得了良好平衡。它适用于多种蛋白质序列相关任务的微调,可用于蛋白质序列分析和功能预测等研究领域。研究人员可以利用此模型进行各种蛋白质相关的前沿探索。
esm2_t6_8M_UR50D - ESM-2系列最小规模蛋白质序列预训练模型
模型生物信息学Github开源项目ESM-2Huggingface机器学习自然语言处理蛋白质模型
esm2_t6_8M_UR50D是ESM-2系列中参数最少的蛋白质语言模型,仅包含6层网络结构和800万参数。该模型通过掩码语言建模方法训练,可用于多种蛋白质序列输入任务的微调。尽管规模小巧,但在计算资源有限的情况下仍可提供不错的性能。研究人员可利用此模型快速开展蛋白质序列相关研究,为后续使用更大规模模型做准备。
esm2_t33_650M_UR50D - ESM-2蛋白质语言模型用于多种序列分析任务
生物信息学Huggingface模型机器学习GithubESM-2开源项目自然语言处理蛋白质模型
esm2_t33_650M_UR50D是ESM-2系列中的一款蛋白质语言模型,采用掩码语言建模方法训练。该模型包含33层网络结构和6.5亿参数,适用于蛋白质功能预测、结构分析、蛋白质折叠预测、突变效应分析等多种序列输入任务的微调。作为中等规模的模型,它在性能和资源需求间取得平衡,为蛋白质研究提供实用工具。
esm2_t30_150M_UR50D - ESM-2系列中的中型蛋白质序列分析模型
生物信息学神经网络Huggingface模型语言建模GithubESM-2开源项目蛋白质模型
esm2_t30_150M_UR50D是ESM-2系列中的中型模型,具有30层结构和1.5亿参数。这个基于掩码语言建模的蛋白质模型适用于多种蛋白质序列输入任务的微调。模型在性能和资源消耗间达到平衡,为蛋白质序列分析提供了实用的工具。
esm2_t12_35M_UR50D - ESM-2系列中的轻量级蛋白质语言模型
模型ESM-2蛋白质模型掩码语言建模人工智能Github生物技术Huggingface开源项目
esm2_t12_35M_UR50D是ESM-2系列中的轻量级蛋白质语言模型,采用12层结构,包含3500万个参数。该模型基于掩码语言建模训练,适用于多种蛋白质序列相关任务的微调。作为ESM-2系列中的小型模型,它在保持性能的同时大幅降低了资源需求,为蛋白质研究提供了高效工具。此模型特别适合资源受限环境,在各类蛋白质序列分析中展现出良好的应用价值。
esm2_t48_15B_UR50D - 大规模蛋白质语言模型用于多样化蛋白质序列分析
生物信息学Huggingface模型深度学习GithubESM-2开源项目自然语言处理蛋白质模型
作为ESM-2系列中参数量最大的蛋白质语言模型,esm2_t48_15B_UR50D拥有480亿参数。该模型采用掩码语言建模方法训练,可应用于多种蛋白质序列分析任务。虽然模型性能优异,但也需要较高的计算资源。研究人员可利用该模型进行蛋白质功能预测、结构分析等研究,为蛋白质科学领域带来新的突破。