#长文本支持
internlm2-chat-1_8b - 优化指令遵循与对话功能的开源对话模型
开源模型长文本支持模型性能InternLM部署工具模型Github开源项目Huggingface
InternLM2-Chat-1.8B是一款经过精确调整的1.8亿参数开源对话模型,通过监督微调和在线RLHF优化,支持超长文本处理,适用于多种应用场景。其在推理、数学和编码任务中表现出色,依照Apache-2.0协议开源,商用需申请许可。
Qwen2.5-14B-Instruct-bnb-4bit - 高效微调多语言模型,优化长文本生成
模型微调HuggingfaceGithub开源项目模型Qwen2.5Unsloth多语言支持长文本支持
Qwen2.5模型利用Unsloth方法优化指令微调过程,节省70%的内存,支持多种模型如Llama 3.1和Gemma 2。同时,提供易用的Google Colab工具,支持多语言和长文本处理,适用于生成长达8000字符的内容,并集成到Transformers库中,便于部署应用。