预训练AI工具集合:实用项目与应用推荐

siglip-large-patch16-384

siglip-large-patch16-384

开源项目模型

通过改进的损失函数提升多模态图像和文本的匹配效率

Llama-3-Swallow-8B-Instruct-v0.1

Llama-3-Swallow-8B-Instruct-v0.1

Llama3Huggingface

利用Meta Llama 3进行日语数据增强的持续预训练

Llama-3-Open-Ko-8B-Instruct-preview

Llama-3-Open-Ko-8B-Instruct-preview

预训练Github

Llama-3基础上的韩语模型适用于对话和指导任务

Qwen-7B

Qwen-7B

评测Qwen-7B

70亿参数规模的多语言开源预训练语言模型

electra-small-generator

electra-small-generator

transformerELECTRA

电教工具ELECTRA:文本编码新方法

TinyLlama-1.1B-Chat-v0.3

TinyLlama-1.1B-Chat-v0.3

大语言模型Github

轻量级高性能AI聊天助手 基于3万亿token训练

MistralRP-Noromaid-NSFW-Mistral-7B-GGUF

MistralRP-Noromaid-NSFW-Mistral-7B-GGUF

语言模型Mistral

基于Mistral-7B的角色扮演与NSFW模型合并项目

llm-jp-3-1.8b-instruct

llm-jp-3-1.8b-instruct

大规模语言模型Github

跨平台大规模语言模型的多语言开发与评估

AMD-Llama-135m

AMD-Llama-135m

语言模型神经网络

轻量级语言模型实现高效推理加速

bert-fa-base-uncased

bert-fa-base-uncased

开源项目情感分析

波斯语领域预训练的单语言Transformer模型

Llama-2-13B-fp16

Llama-2-13B-fp16

Llama 2量化参数

Llama 2模型的fp16格式转换提升推理性能

wav2vec2-xls-r-1b

wav2vec2-xls-r-1b

语音处理预训练

大规模多语言语音预训练模型支持128种语言处理

electra-large-discriminator

electra-large-discriminator

Github判别器

ELECTRA模型 革新自监督语言表示学习

LLaMA-1B-dj-refine-150B

LLaMA-1B-dj-refine-150B

模型LLM

LLaMA架构的开源语言模型基于精炼数据集训练

biomed_roberta_base

biomed_roberta_base

语言模型Huggingface

RoBERTa衍生模型在生物医学NLP任务中展现优异性能

Sheared-LLaMA-1.3B

Sheared-LLaMA-1.3B

模型开源项目

高效压缩训练的小型语言模型

mt5-base

mt5-base

Huggingface模型

多语言预训练文本转换模型 覆盖101种语言的强大NLP工具

TinyLlama-1.1B-intermediate-step-1431k-3T

TinyLlama-1.1B-intermediate-step-1431k-3T

语言模型模型

快速训练的轻量级1.1B参数Llama模型

TinyLlama-1.1B-Chat-v0.6

TinyLlama-1.1B-Chat-v0.6

模型TinyLlama

基于Llama 2架构的轻量级开源聊天模型

flan-ul2

flan-ul2

模型预训练

多语言encoder-decoder模型 适用于翻译问答和逻辑推理