#蛋白质语言模型

prot_t5_xl_uniref50 - 基于T5架构的大规模蛋白质序列预训练模型
模型GithubProtT5-XL-UniRef50蛋白质语言模型UniRef50特征提取开源项目Huggingface生物信息学
ProtT5-XL-UniRef50是基于T5-3B架构的蛋白质序列预训练模型,在UniRef50数据集的4500万个序列上进行自监督学习。该模型采用改进的掩码语言建模目标,能够捕捉蛋白质序列中的关键生物物理特性。ProtT5-XL-UniRef50可用于蛋白质特征提取和下游任务微调,在二级结构预测等任务中表现优异,为蛋白质序列研究提供了有力工具。
prot_bert - BERT蛋白质序列模型助力破解生命密码
模型ProtBert掩码语言建模Github氨基酸序列蛋白质语言模型Huggingface开源项目生物信息学
ProtBert是一种基于BERT架构的蛋白质序列预训练语言模型,在2.17亿个蛋白质序列上进行自监督学习。该模型能捕获序列中的关键生物物理特性,可用于蛋白质特征提取或下游任务微调。在二级结构预测和亚细胞定位等任务中表现优异,为解析蛋白质功能提供新工具。ProtBert展现了人工智能在生命科学领域的应用潜力。
prot_t5_xl_half_uniref50-enc - 低内存蛋白质序列特征提取模型
模型开源项目半精度模型HuggingfaceProtT5-XL-UniRef50特征提取Github蛋白质语言模型氨基酸嵌入
这是一个基于ProtT5-XL-UniRef50的半精度编码器模型,专门用于蛋白质序列特征提取。该模型在大规模蛋白质序列数据集上进行自监督预训练,可高效生成蛋白质和氨基酸的嵌入表示。仅需8GB显存即可运行,适用于资源受限环境,在多项下游任务中性能与原始模型相当。
IgBert - 专注抗体序列分析的预训练语言模型
抗体序列IgBert模型特征提取Github蛋白质语言模型机器学习开源项目Huggingface
IgBert是一个基于大规模抗体序列数据训练的语言模型,通过Observed Antibody Space数据集优化,主要用于分析抗体序列结构。该模型可同时处理抗体的重链和轻链序列,支持批量分析,并能生成序列特征表示。模型集成了序列处理工具,可用于多种抗体序列分析应用场景。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号