Project Icon

mixtral-7b-8expert

高性能开源混合专家语言模型,支持多语言并具有出色的基准分数

Mixtral-7b-8expert是MistralAI开发的混合专家(MoE)模型在Hugging Face平台的实现。这个开源项目在MMLU、hella swag等多项基准测试中表现出色,支持英、法、意、西、德五种语言。模型提供简便的推理设置,基于Apache-2.0许可发布,适合自然语言处理研究和应用开发。

miqu-1-70b - 高性能70B大语言模型,支持32k上下文,采用Mistral格式
GithubHuggingfacemiqu 70b人工智能大型语言模型开源项目提示词格式模型模型设置
miqu-1-70b是一款采用Mistral格式的大型语言模型,具有32k tokens的上下文处理能力。模型采用高频基础ROPE设置,无需额外调整即可发挥优秀性能。经过温度系数1和top_p 0.95的参数组合测试,该模型适用于广泛的自然语言处理任务。
speechless-code-mistral-7b-v1.0 - 全面支持多语言的代码生成与推理模型
GPTQGithubHuggingfacePythonSpeechlessCoder开源项目文本生成模型模型优化
该项目展示了一款专注于代码生成和推理的模型,具备提升推理和规划能力的特点。其多种量化选项支持8位以下的CPU+GPU推断,使其在多种编程语言上均表现不俗。模型经过微调,覆盖了201,981个样本的数据集,包括编码、推理和规划样本,支持Alpaca指令格式。在HumanEval基准测试中通过率达51.22%,适用于多种编程语言的验证,如Python、Java、C++等,为编程助手和代码验证提供支持。
Swallow-MX-8x7b-NVE-v0.1 - 跨语言文本生成模型,强化日语能力
GithubHuggingfaceSwallow-MX-8x7b-NVE-v0.1开源项目日语数据模型模型性能训练数据集语言模型
Swallow-MX-8x7b-NVE-v0.1基于Mixtral-8x7B-Instruct持续预训练,增加了日语数据模块,提升了多语言文本生成性能。该模型在日文常识问答和翻译任务中表现突出,发布于Apache-2.0开源许可证下。该版本仍在开发中,提醒注意输出的安全性。项目由ABCI计划支持,适用于多语言自然语言处理任务。
switch-base-8 - 基于专家模型的高效语言模型训练
C4数据集GithubHuggingfaceSwitch TransformersT5屏蔽语言建模开源项目模型混合专家
Switch Transformers是一个创新的专家混合模型,专为在Colossal Clean Crawled Corpus数据集上进行掩码语言建模任务而设计,在训练速度上较T5-XXL模型提升4倍。其架构使用Sparse MLP层替代传统T5模型中的前馈层,提供更快训练且性能优异。该模型在未微调前并不适用于直接应用任务,需进一步调优。Switch Transformers适合需要高效和短时间内取得优异结果的开发者与研究者。
Mistral-7B-Instruct-v0.3-AWQ - Mistral模型AWQ量化版支持高级函数调用和三代分词
AWQ量化GithubHuggingfaceMistral-7B-Instruct-v0.3大语言模型开源项目模型模型量化自然语言处理
作为Mistral-7B-Instruct-v0.3的AWQ量化版本,该模型采用4比特压缩技术,在提供快速推理性能的同时保持了原有精度。通过扩展词汇表和引入第三代分词技术,增强了模型的理解能力。目前已集成到主流AI框架平台,可在搭载NVIDIA显卡的Linux或Windows系统上运行。
Mistral-Nemo-Base-2407 - Mistral和NVIDIA联合开发的多语言大模型支持128k超长上下文
GithubHuggingfaceMistral-Nemo-Base-2407多语言支持大语言模型开源项目机器学习模型深度学习
Mistral-Nemo-Base-2407是Mistral AI与NVIDIA合作推出的开源语言模型,采用12B参数规模和128k上下文窗口设计。模型支持英语、法语等8种语言,并在MMLU等多项基准测试中表现出色。基于40层transformer架构,可作为Mistral 7B的升级替代方案。该项目以Apache 2许可证发布,支持多语言及代码生成场景。
Mistral-Nemo-Instruct-2407-vllm-fp8 - 开源多语言指令微调大模型
Apache 2许可GithubHuggingfaceMistral-Nemo-Instruct-2407多语言大语言模型开源项目指令微调模型
Mistral-Nemo-Instruct-2407是Mistral AI与NVIDIA联合开发的开源指令微调语言模型。该模型在128K上下文窗口训练,支持多语言和代码生成,性能优于同等规模模型。采用Apache 2许可,可替代Mistral 7B使用。模型在多项基准测试中表现出色,支持mistral_inference、transformers和NeMo等框架进行推理。
Mistral-NeMo-Minitron-8B-Base - 高效压缩的大规模语言模型适用于多种自然语言生成任务
GithubHuggingfaceMistral-NeMo人工智能大语言模型开源项目模型模型压缩自然语言处理
Mistral-NeMo-Minitron-8B-Base是一个经过剪枝和蒸馏的基础文本生成模型。它采用4096维嵌入、32个注意力头、11520维MLP中间层和40层结构,结合分组查询注意力和旋转位置编码技术。该模型在MMLU等基准测试中表现优异,适用于多种自然语言生成任务。支持8k字符输入,可通过Transformers库轻松使用。
switch-base-128 - 探索语言模型优化与参数缩放的最新进展
GithubHuggingfaceSwitch Transformers专家开源项目模型混合专家蒙面语言建模语言模型
Switch Transformers采用专家混合(MoE)模型架构,针对掩码语言模型(MLM)任务进行训练。该模型使用稀疏多层感知器层取代传统的前馈层,提升了训练效率。在Colossal Clean Crawled Corpus上完成了高达万亿参数的预训练,表现出优于T5的微调效果,并实现了相较于T5-XXL模型的四倍加速,适合需要高效语言模型的应用。
Aurora - 通过指令调优激活 Mixtral-8x7B 稀疏专家混合体的中文聊天功能
AuroraGithubMixtral-8x7B中文对话能力开源项目指令调优语言模型
Aurora项目通过整合三大中文数据集,提升了Mixtral-8x7B稀疏专家模型的中文对话能力。通过数据预处理和指令微调,该模型在C-Eval、MMLU和CMMLU基准测试中表现出色。这项研究首次在稀疏专家模型上应用指令微调,提升了模型的架构能力,特别是在零样本任务中表现卓越。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号