热门Transformer工具集合:AI助手、应用和开源项目

mpt-7b-chat

mpt-7b-chat

Transformer开源项目

对MPT-7B-Chat模型的优化及其在开源LLaMA对话生成中的进展

Qwen1.5-4B-Chat

Qwen1.5-4B-Chat

开源项目模型

支持多语种与长上下文的高级语言模型

qwen

qwen

Optimum Habana开源项目

Qwen模型在Habana Gaudi处理器上的配置与训练概述

VILA1.5-13b

VILA1.5-13b

VILAGithub

多图像推理与跨设备应用的视觉语言模型

Yi-6B-Chat

Yi-6B-Chat

Yi开源

Yi-6B-Chat 打造开源双语语言模型的新篇章

seggpt-vit-large

seggpt-vit-large

图像分割Github

基于上下文的单次图像分割解决方案

Anita

Anita

DeepMount00/Anita自动化客户支持

意大利语问答模型为客户支持和信息检索提供有效解决方案

mit-b4

mit-b4

Hugging FaceImageNet

使用SegFormer预训练模型提升语义分割效率

segformer-b2-finetuned-ade-512-512

segformer-b2-finetuned-ade-512-512

视觉Transformer

SegFormer模型实现高效语义分割的新方法

sat-3l

sat-3l

句子分割Huggingface

高效的多语言句子分割模型

segformer-b4-finetuned-ade-512-512

segformer-b4-finetuned-ade-512-512

图像处理ADE20k

512x512分辨率下SegFormer的高效Transformer语义分割实现

rugpt3large_based_on_gpt2

rugpt3large_based_on_gpt2

rugpt3large_based_on_gpt2Huggingface

俄语Transformer模型SberDevices团队的训练与评估

Qwen2.5-1.5B-Instruct-bnb-4bit

Qwen2.5-1.5B-Instruct-bnb-4bit

Github性能提升

Unsloth功能提升模型微调效率,优化内存占用

OLMo-1B-hf

OLMo-1B-hf

开放语言模型开源项目

结合开放性与多功能性提升语言模型科学

t5-large-medium

t5-large-medium

Retrieva日语

基于Transformer的日文预训练模型,提高NLP任务性能

nq-distilbert-base-v1

nq-distilbert-base-v1

Transformer句子嵌入

句子向量化提升语义搜索与聚类效率

detr-resnet-50-panoptic

detr-resnet-50-panoptic

Transformer计算机视觉

DETR模型:结合ResNet-50的端到端目标检测与全景分割

Yi-34B-200K

Yi-34B-200K

Huggingface开源项目

开源双语大模型 提升长文本理解能力

deberta-v3-large-tasksource-nli

deberta-v3-large-tasksource-nli

Transformer零样本分类

自然语言推理的多任务学习模型,提升零样本分类性能

SciPhi-Mistral-7B-32k

SciPhi-Mistral-7B-32k

Transformer大语言模型

基于Mistral-7B-v0.1增强科学推理与教育能力的AI模型