#预训练模型

vit_large_patch14_clip_336.openai_ft_in12k_in1k - ViT图像分类与特征提取模型
图像分类ImageNet-1kHuggingface预训练模型Github开源项目模型WIT-400MVision Transformer
OpenAI的ViT图像分类模型,利用CLIP在WIT-400M上预训练,并在ImageNet数据集上微调,适合多种视觉任务。其高性能参数为研究与开发提供强大支持,通过示例代码,可轻松实现图像分类与嵌入功能。
gpt2 - 预训练语言模型与自然语言生成技术
预训练模型机器学习Github模型开源项目GPT-2Huggingface文本生成自然语言处理
这是一个由OpenAI开发的大规模预训练语言模型,基于Transformer架构,通过自监督学习方式在英文语料上训练。模型核心功能是预测文本序列中的下一个词,可用于文本生成及其他自然语言处理任务。支持ONNX部署,便于开发者进行实际应用开发和模型微调。
chinese-macbert-base - 通过MLM误差校正任务优化中文BERT模型的性能
开源项目预训练模型掩码语言模型自然语言处理模型Huggingface句子排序预测GithubMacBERT
项目通过引入MLM误差校正预训练任务,减少预训练和微调过程中的差异,提升中文自然语言处理的模型表现。采用同义词工具进行相似词替换,改进传统BERT的[MASK]标记。此外,还结合全词掩码、N-gram掩码和句序预测技术,增强模型功能。MacBERT的架构与原始BERT兼容,为研究人员提供灵活的替换方案。
bert-medium-mnli - Pytorch平台上的MNLI任务BERT预训练模型
MNLI开源项目预训练模型BERTPytorch模型HuggingfaceGithub论文
本项目提供基于Pytorch、从Tensorflow检查点转换而来的BERT预训练模型,专门用于MNLI任务。此BERT变体在Google官方库的基础上,经过四轮训练,在MNLI和MNLI-mm测试中表现分别为75.86%和77.03%。项目着重展示紧凑模型在预训练中的有效性,更多信息及原始实现可访问相关GitHub库,重点在于轻量化处理及自然语言推理的应用潜力。结合最新研究成果,此预训练模型为自然语言理解提供了高效解决方案,显著改善文本分类性能。
albert-large-v2 - 高效低内存占用的英语语言预训练模型
开源项目预训练模型模型GithubHuggingface语言模型ALBERT自监督学习掩码语言建模
ALBERT预训练模型采用英语,具有层权重共享特性,减少内存占用同时提升效率。其自监督语言学习通过掩码语言建模和句子顺序预测实现,适合用于序列和标记分类等任务。第二版模型采用更多训练数据和优化,性能优于初版。模型包含24层、128维嵌入、1024隐藏层及16个注意力头,适合掩码语言建模或句子预测,并需通过微调匹配特定任务需求。
bert-base-dutch-cased - 荷兰语BERT预训练模型,适用于多任务自然语言处理
University of GroningenBERTje荷兰语模型Github开源项目模型Huggingface预训练模型GroNLP
BERTje是一个由格罗宁根大学开发的荷兰语BERT预训练模型,目前托管于GroNLP组织。该模型保持原有权重,支持文本分析和自然语言处理,满足不同任务需求。BERTje在荷兰语相关应用中表现出色,提供高效的语言处理能力。
glm-4-9b-chat-1m - 广泛语言支持与长文本处理能力的先进预训练模型
Huggingface机器学习开源项目GLM-4-9B长文本能力多语言支持预训练模型模型Github
GLM-4-9B-Chat-1M 是智谱 AI 开发的先进预训练模型,具备网页浏览、代码执行和长文本推理等功能,支持 26 种语言,适用于需要大规模上下文处理的应用场景。最新更新提升了处理能力,支持长达 1M 上下文长度。
scibert_scivocab_cased - 科学文献领域的预训练语言模型
语言模型科学文本语料库SciBERTGithub模型开源项目预训练模型Huggingface
SciBERT是一款用于科学文本的预训练语言模型,基于Semantic Scholar的114万篇论文和31亿个标记进行训练。其专有的scivocab词汇表利于更好地匹配训练语料,支持cased和uncased模型版本,适合科学文献分析。