Project Icon

SmolLM-135M-Instruct

轻量级指令语言模型的高效实现

SmolLM-135M-Instruct是一个1.35亿参数的轻量级指令语言模型。经过高质量教育数据训练和公开数据集微调后,模型具备基础知识问答、创意写作和Python编程能力。支持MLC、GGUF等多种本地部署方案,可通过Transformers框架调用。v0.2版本进一步优化了对话质量和任务完成能力。

Llama-3.2-1B-Instruct - Unsloth技术加速大型语言模型微调 提升效率降低资源消耗
GithubHuggingfaceLlama 3.2Unsloth内存优化多语言支持开源项目模型模型微调
Llama-3.2-1B-Instruct项目利用Unsloth技术优化大型语言模型微调过程。该方法可将微调速度提升2-5倍,同时减少70%内存占用。项目提供多个Google Colab笔记本,支持Llama 3.2、Gemma 2和Mistral等模型的高效微调。这一创新技术为AI语言模型开发提供了更高效的解决方案,有助于推动相关领域的进步。
Humanish-LLama3-8B-Instruct-GGUF - 介绍模型的量化技术实现文本生成性能突破
GithubHuggingfaceHumanish-LLama3-8B-Instruct基准测试开源项目数据集文本生成模型量化
该项目通过llama.cpp进行量化,优化了模型的嵌入和输出权重,使得文本生成更加高效。模型在多个数据集上表现出色,如IFEval数据集测试中达到严格准确率64.98%。项目提供多种文件格式,支持多样化的计算资源和硬件环境,以满足不同的使用需求,包括低内存和ARM芯片的优化场景。
Phi-3-vision-128k-instruct - 突破性视觉语言模型 128K上下文、多模态理解能力
GithubHuggingfacePhi-3-Vision-128K-Instruct图像理解多模态模型开源项目微软模型自然语言处理
Phi-3-vision-128k-instruct是一个开放式多模态模型,支持128K token的上下文处理。该模型通过文本和视觉数据集训练,在图像理解、OCR和图表分析等任务中表现优异。经过监督微调和偏好优化,模型具备精确的指令执行能力和安全性。作为Phi-3系列的成员,它适用于资源受限环境下的通用图像理解任务,为AI系统和应用提供支持。
Mistral-7B-Instruct-v0.3-GGUF - 支持功能调用的高质量指令跟随模型
GithubHuggingfaceLM StudioMistral 7B Instruct功能调用开源项目指令跟随模型
Mistral 7B Instruct v0.3是一款经过优化的指令跟随模型,新增功能调用支持进一步扩展应用范围,增强助理功能。此版本引入扩展词汇表和新的分词器,支持功能调用。模型由Mistral AI创建,GGUF量化由bartowski提供。提醒:本社区模型由第三方提供,用户需自行负责内容的准确和适用性。
Qwen2.5-14B-Instruct-GGUF - 提升语言生成能力支持多语言的14B指令微调模型
GithubHuggingfaceQwen2.5多语言支持开源项目指令调整模型语言模型长上下文支持
Qwen2.5-14B-Instruct-GGUF 模型在编码、数学和多语言支持方面表现卓越,能够生成最高达8K tokens的长文本,并支持128K的上下文长度。该模型适用于聊天与角色扮演,优化的指令跟随和结构化输出,覆盖29种语言,多语言能力强劲。为用户提供良好的长文本生成与结构化数据处理体验。
Llama-3.2-11B-Vision-Instruct - 高效训练和部署具有多语言能力的大规模语言模型
GithubHuggingfaceLlama 3.2MetaUnsloth大语言模型开源项目模型模型微调
Llama-3.2-11B-Vision-Instruct是Meta开发的多语言大规模视觉语言模型,具备强大的对话和图像理解能力。该项目采用Unsloth技术,实现训练速度提升2.4倍,内存使用减少58%。模型支持英语、德语、法语等多种语言,适用于对话、检索、摘要等任务。项目提供简单易用的Colab笔记本,方便开发者进行模型微调和部署。Llama-3.2系列在多项行业基准测试中表现出色,超越了许多开源和闭源的对话模型。
Mistral-7B-Instruct-v0.3-GPTQ - Mistral 7B指令模型的4位量化优化版本
GPTQ量化GithubHuggingfaceMistral-7B-Instruct-v0.3函数调用大语言模型开源项目指令微调模型
Mistral-7B-Instruct-v0.3是一个经过GPTQ 4位量化的语言模型。基于Mistral-7B-v0.3开发,集成了32768词汇量、v3分词器和函数调用功能。模型可用于创意写作等任务,但由于缺少内容审核机制,在应用环境选择上需要谨慎评估。
instruct-eval - 指令调优的大型语言模型的评估和比较
AlpacaFlan-T5GithubIMPACTInstructEvalLLM开源项目
InstructEval项目专注于全面评估和比较指令调优的大型语言模型(如Flan-T5和Alpaca),并提供简便的基准测试库和排行榜。该项目支持多种模型和任务,使研究者能够轻松直观地在学术基准(如MMLU和BBH)上比较模型表现。此外,InstructEval发布了用于评估LLM写作能力的IMPACT数据集和安全评估基准Red-Eval,为用户提供多样的测试工具和资源。
ml-engineering - 大规模语言模型与多模态模型的训练方法
BLOOM-176BContextual.AIGithubHuggingFaceLarge Language ModelsVLM开源项目
本指南系统介绍了方法、工具和逐步操作说明,帮助工程师成功训练大规模语言模型(LLM)和多模态模型(VLM)。内容涵盖丰富的脚本和命令,适合LLM/VLM训练工程师和操作员使用。基于作者在开源BLOOM-176B和IDEFICS-80B模型训练中的经验,提供有效解决方案,并持续更新,服务于ML社区。
instructor - 管理大型语言模型结构化输出的Python库
APIGithubLLMsPydanticPython库instructor开源项目
Instructor是一个优化的Python库,专为简化和增强大型语言模型(LLMs)的结构化输出设计。它提供了一系列强大的功能,如自动验证、重试机制和流式处理。支持多种主流模型,是提升LLM工作流效率的理想选择。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号