#ChatML
Hermes-3-Llama-3.1-8B - 先进的通用语言AI系统 具备高级代理能力和优秀的多轮对话表现
人工智能Github开源项目语言模型模型Huggingface函数调用Hermes 3ChatML
Hermes-3-Llama-3.1-8B是Nous Research开发的新一代通用语言模型。该模型在Hermes 2基础上全面升级,显著提升了代理能力、角色扮演、推理、多轮对话和长文本处理能力。Hermes 3注重用户对齐,提供灵活的引导和控制功能。此外,模型还增强了函数调用、结构化输出、通用助手和代码生成等实用技能。
Violet_Twilight-v0.2-GGUF - SLERP技术融合的多语言AI文本生成模型
Github开源项目文本生成多语言支持模型Huggingface模型合并ChatML抽样设置
Violet_Twilight-v0.2-GGUF是一个融合Azure_Dusk-v0.2和Crimson_Dawn-v0.2的AI语言模型。它采用SLERP技术合并两个基础模型,支持包括中文在内的多种语言处理。该模型使用ChatML格式训练,具备强大的文本生成能力。Violet_Twilight-v0.2-GGUF提供多种采样设置,可根据需求调整输出效果,为AI文本生成应用提供灵活高效的解决方案。
UnslopNemo-12B-v2-GGUF - 增强AI模型表达能力的实验探索
Github开源项目模型数据集Mistral反馈HuggingfaceChatMLUnslopNemo
该项目通过减少RP数据集中的特点,以提高模型的表达力。适用于Mistral、ChatML以及文本补全任务。通过调整采样设置,用户有可能获得更优的结果。参与者被鼓励在讨论页面提供反馈,以帮助进一步改进性能。
MN-12B-Lyra-v4-GGUF-IQ-Imatrix - 基于Mistral的ChatML预设优化模型
Github开源项目模型MistralHuggingfaceSillyTavernChatMLSao10K模型调整
MN-12B-Lyra-v4是Sao10K在Mistral Nemo模型基础上进行的优化项目,采用了ChatML提示格式。该模型支持在SillyTavern中使用的ChatML预设,并具备多功能性和易用性。兼容Virt-io的ChatML v1.9预设,用于特定场景设置的指导可以在Hugging Face的文档中找到。MN-12B-Lyra-v4通过llama.cpp量化,更多信息可通过提供的链接查看。适用于自然语言处理和对话生成,特别在角色扮演应用中表现优异。
magnum-v2-12b-gguf - 基于Claude 3优化的量化多语言聊天模型
Github开源项目语言模型微调模型HuggingfaceGPU训练ChatMLMagnum
基于Mistral-Nemo-Base-2407开发的GGUF量化语言模型,通过复制Claude 3系列的文本生成能力,实现多语言对话功能。模型采用ChatML格式训练,整合多个数据集,经由8块H100 GPU完成双轮训练,具备自然流畅的语言交互表现。
koOpenChat-sft - 多语言AI对话模型,基于OpenChat3.5构建
Github开源项目模型AlpacaHuggingfaceChatML韩国人工智能OpenChat3.5koOpenChat-sft
koOpenChat-sft项目是一个基于OpenChat3.5的多语言AI对话模型,训练于A100 80GB设备,遵循ChatML和Alpaca(No-Input)指令格式。尽管没有详细的基准测试数据,模型的评估结果已在Open LLM Leaderboard中公布。其在HellaSwag和Winogrande等指标上的得分表明了其高效的对话能力,广泛适用于多种AI场景。欲知更多信息,可通过Telegram联系开发者。