大语言模型:精选AI工具、网站与开源项目

大语言模型

Qwen2.5-14B-Instruct-GPTQ-Int4

Qwen2.5-14B-Instruct-GPTQ-Int4

大语言模型Qwen2.5

Qwen2.5具备大规模多语言处理与长文本生成能力

OLMoE-1B-7B-0924

OLMoE-1B-7B-0924

allenai开源项目

开源混合专家模型,具备高性价比和竞争力

h2o-danube3-500m-base

h2o-danube3-500m-base

大语言模型Huggingface

500M参数的大规模语言模型,支持离线文本生成

komt-mistral-7b-v1

komt-mistral-7b-v1

komet大语言模型

韩语文本生成中的创新多任务指令调优模型

Hebrew-Gemma-11B-V2

Hebrew-Gemma-11B-V2

大语言模型Github

多语言处理的希伯来语-英语大规模生成模型

Meta-Llama-3.1-405B-llamafile

Meta-Llama-3.1-405B-llamafile

开源项目模型

Meta Llama 3.1 提供多平台兼容的开源语言模型

Qwen2.5-72B-Instruct-GPTQ-Int8

Qwen2.5-72B-Instruct-GPTQ-Int8

指令调优大语言模型

支持多语种和长文本处理的先进AI模型

Phi-CAT

Phi-CAT

Huggingface机器学习

在连续对抗训练中优化Phi-3-mini-4k模型

Zephyr-CAT

Zephyr-CAT

连续对抗训练Huggingface

使用Continuous Adversarial Training优化语言模型的对抗训练

Xwin-LM-7B-V0.2

Xwin-LM-7B-V0.2

AlpacaEvalXwin-LM

优化大语言模型对齐技术,显著提升性能

Qwen-14B

Qwen-14B

阿里云Qwen-14B

Qwen-14B模型优化多语言和学习效率

LIMA-13b-hf

LIMA-13b-hf

自然语言处理开源项目

基于Transformer架构的自动回归语言模型,用于自然语言处理的研究

Qwen2.5-0.5B-Instruct-bnb-4bit

Qwen2.5-0.5B-Instruct-bnb-4bit

优化训练Github

提升多语言长文本生成与指令跟随能力,改善结构化数据处理

Yi-34B

Yi-34B

开源Yi

开源双语大语言模型Yi-34B,在语言理解和推理性能上超越多款先进模型

Qwen2.5-0.5B-Instruct-GGUF

Qwen2.5-0.5B-Instruct-GGUF

量化开源项目

支持29种语言的多功能语言处理模型

Yi-6B-Chat

Yi-6B-Chat

Yi开源

Yi-6B-Chat 打造开源双语语言模型的新篇章

llm-jp-13b-v2.0

llm-jp-13b-v2.0

Huggingfacellm-jp

改进日本大型语言模型的开发与应用

Mistral-7B-v0.1-sharded

Mistral-7B-v0.1-sharded

Hugging Face大语言模型

模型带来更高效的文本生成性能

Qwen2.5-1.5B-Instruct-GGUF

Qwen2.5-1.5B-Instruct-GGUF

Qwen2.5长上下文支持

多语言文本生成与指令理解能力的优化与突破

meditron-7b

meditron-7b

大语言模型Meditron

在医学领域提升大型语言模型性能的创新方法