#蛋白质语言模型

prot_t5_xl_uniref50 - 基于T5架构的大规模蛋白质序列预训练模型

模型GithubProtT5-XL-UniRef50蛋白质语言模型UniRef50特征提取开源项目Huggingface生物信息学

ProtT5-XL-UniRef50是基于T5-3B架构的蛋白质序列预训练模型，在UniRef50数据集的4500万个序列上进行自监督学习。该模型采用改进的掩码语言建模目标，能够捕捉蛋白质序列中的关键生物物理特性。ProtT5-XL-UniRef50可用于蛋白质特征提取和下游任务微调，在二级结构预测等任务中表现优异，为蛋白质序列研究提供了有力工具。

prot_bert - BERT蛋白质序列模型助力破解生命密码

模型ProtBert掩码语言建模Github氨基酸序列蛋白质语言模型Huggingface开源项目生物信息学

ProtBert是一种基于BERT架构的蛋白质序列预训练语言模型，在2.17亿个蛋白质序列上进行自监督学习。该模型能捕获序列中的关键生物物理特性，可用于蛋白质特征提取或下游任务微调。在二级结构预测和亚细胞定位等任务中表现优异，为解析蛋白质功能提供新工具。ProtBert展现了人工智能在生命科学领域的应用潜力。

prot_t5_xl_half_uniref50-enc - 低内存蛋白质序列特征提取模型

模型开源项目半精度模型HuggingfaceProtT5-XL-UniRef50特征提取Github蛋白质语言模型氨基酸嵌入

这是一个基于ProtT5-XL-UniRef50的半精度编码器模型，专门用于蛋白质序列特征提取。该模型在大规模蛋白质序列数据集上进行自监督预训练，可高效生成蛋白质和氨基酸的嵌入表示。仅需8GB显存即可运行，适用于资源受限环境，在多项下游任务中性能与原始模型相当。

IgBert - 专注抗体序列分析的预训练语言模型

抗体序列IgBert模型特征提取Github蛋白质语言模型机器学习开源项目Huggingface

IgBert是一个基于大规模抗体序列数据训练的语言模型，通过Observed Antibody Space数据集优化，主要用于分析抗体序列结构。该模型可同时处理抗体的重链和轻链序列，支持批量分析，并能生成序列特征表示。模型集成了序列处理工具，可用于多种抗体序列分析应用场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号