Project Icon

Mistral-NeMo-Minitron-8B-Base

高效压缩的大规模语言模型适用于多种自然语言生成任务

Mistral-NeMo-Minitron-8B-Base是一个经过剪枝和蒸馏的基础文本生成模型。它采用4096维嵌入、32个注意力头、11520维MLP中间层和40层结构,结合分组查询注意力和旋转位置编码技术。该模型在MMLU等基准测试中表现优异,适用于多种自然语言生成任务。支持8k字符输入,可通过Transformers库轻松使用。

Mistral-Nemo-Instruct-2407-GGUF - 多语言高性能指令型语言模型的GGUF量化方案
GithubHuggingfaceMistral-Nemo-Instruct-2407大型语言模型开源项目提示模板模型模型量化硬件需求
Mistral-Nemo-Instruct-2407-GGUF是Mistral AI和NVIDIA联合开发的指令微调大语言模型的量化版本。该模型支持多语言处理,性能优于同等规模模型。项目提供多种GGUF量化方案,文件大小从4.79GB到24.50GB不等,适用于不同硬件配置,方便在各类设备上部署。
komt-mistral-7b-v1 - 韩语文本生成中的创新多任务指令调优模型
GithubHuggingfacekomet多任务指令大语言模型开源项目模型模型评估韩语性能
项目采用多任务指令调优方法,提升了韩语文本生成的准确性和有效性。通过监督数据集,生成适合大语言模型的训练数据并应用于komt-mistral-7b-v1,该模型是Mistral-7B-Instruct-v0.1的微调版本。评估结果显示,在韩语任务中的得分优于其他开源模型,尤其在文本生成和问答任务中表现出色,为韩语用户提供更智能的交互体验。
SciPhi-Mistral-7B-32k - 基于Mistral-7B-v0.1增强科学推理与教育能力的AI模型
GithubHuggingfaceSciPhi-Mistral-7B-32kTransformer大语言模型开源项目教育能力模型科学推理
SciPhi-Mistral-7B-32k是从Mistral-7B-v0.1微调而来的大型语言模型,通过四轮微调和超过十亿个token的数据集,实现了卓越的科学推理及教育能力。其特点包括采用变压器架构、组内查询注意力、滑窗注意力,并支持字节回退BPE分词器。SciPhi-Self-RAG-Mistral-7B-32k当前可用,具体细节可查看相关文档。
Mistral-Nemo-12B-ArliAI-RPMax-v1.1-GGUF - 基于Mistral Nemo 12B的创新多样性写作模型
ArliAI-RPMax-12B-v1.1GithubHuggingface创造力开源项目数据集模型训练
Mistral-Nemo-12B-ArliAI-RPMax-v1.1是基于Mistral Nemo 12B模型的开源项目,专为增强创意及非重复性而设计。该模型在仅两天内完成训练,通过减少重复性措施,对多样化情境与角色具备更强适应性,支持多种量化格式,满足不同应用需求。
distilbert-base-uncased - 紧凑高效的语言模型,提升下游任务处理速度
DistilBERTGithubHuggingface使用限制开源项目模型模型压缩训练数据语言模型
DistilBERT是一种高效的Transformers模型,比原始BERT更小更快,适合快速推理的下游任务。通过自监督预训练,它支持掩码语言建模和句子预测。主要用于全句任务如分类和问答,尽管继承了部分原模型偏见。在海量公开数据的支持下,DistilBERT在多种任务中表现优异,兼顾性能和速度。可在模型中心查看微调版本。
Mistral-Nemo-Instruct-2407-GGUF - Mistral Nemo多语言指令模型的量化版本
GGUFGithubHuggingfaceMistral-Nemo-Instruct-2407大语言模型开源项目机器学习模型量化模型
Mistral-Nemo-Instruct-2407模型的GGUF量化实现,包含从Q2到Q8多个量化等级,文件大小范围为4.9GB至13.1GB。模型原生支持英语、法语、德语等8种语言,基于Apache 2.0协议开源。项目提供了各量化版本的性能对比数据及使用文档,便于在性能和资源消耗间做出合适选择。
mistral-7b-sft-beta - 基于UltraChat数据集训练的Mistral-7B优化模型
GithubHuggingFaceHuggingfaceMistral-7B开源项目微调模型深度学习自然语言处理
Mistral-7B-sft-beta是一个在UltraChat数据集上训练的大型语言模型,基于Mistral-7B-v0.1开发。作为Zephyr-7B-β的基础训练模型,采用直接偏好优化方法,支持英语文本生成。模型包含7B参数,使用MIT开源协议,通过TRL框架的SFTTrainer在经过筛选的UltraChat对话数据集上完成训练。
UnslopNemo-12B-v3-GGUF - 实验性Mistral对话模型的增强表达版本
AI模型GithubHuggingfaceUnslopNemo开源项目数据集优化模型模型表现自然语言处理
UnslopNemo-12B-v3-GGUF作为Mistral架构的实验性语言模型,对原有RP数据集进行了90%的优化处理。模型集成了Metharme、Mistral和Text Completion等多种功能,支持灵活的采样器参数调整。目前处于持续优化阶段,通过社区反馈不断完善其性能表现。
SmolLM-1.7B - 小型化设计与处理能力兼备的语言模型,适用于多个应用场景
Cosmo-CorpusGithubHuggingfaceSmolLMTransformer开源项目模型生成模型语言模型
SmolLM系列语言模型基于Cosmo-Corpus高质量数据集开发,提供135M、360M和1.7B参数选项,表现出色的常识推理和广泛知识评估能力。模型通过多类型内容数据集训练,支持8位和bfloat16位精度,可在CPU和多GPU环境中运行。需注意,内容生成的准确性和一致性可能受限,仅供辅助使用。可通过HuggingFace平台便捷部署。
mistral-nemo-instruct-2407-awq - Mistral-Nemo-Instruct-2407模型的AWQ量化指令版本
GithubHuggingfaceMistralNeMo人工智能大语言模型开源项目模型自然语言处理
mistral-nemo-instruct-2407-awq是Mistral-Nemo-Instruct-2407模型的AWQ量化版本。这个项目通过使用AWQ(Activation-aware Weight Quantization)技术,在保持原有模型性能的基础上,显著降低了模型大小和计算资源需求。该模型适用于各类自然语言处理任务,为开发者和研究人员提供了一个优化的大规模语言模型选择。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号