Project Icon

MN-12B-Starcannon-v3-i1-GGUF

多种量化选项提升模型性能和适应性

该项目提供多种量化文件类型和大小,满足不同用户需求,优化模型性能。用户可在mradermacher的Hugging Face页面获取IQ-quants与静态量化文件。有关GGUF文件的使用,建议查阅TheBloke的说明。本项目通过iMatrix文件,专注于高质量模型的量化,感谢nethype GmbH及nicoboss的硬件支持。

falcon-180B-i1-GGUF - 深入解析量化模型在质量与速度之间的平衡
Falcon-180BGithubHuggingfacetransformers使用条件开源项目模型量化
项目运用weighted/imatrix量化方法以提升质量、速度和文件大小。用户可依据需求选择不同类型和大小的量化模型,并通过性能对比获取最优方案。得益于nethype GmbH和@nicoboss提供的技术和计算资源支持,项目确保高质量的用户成果,并提供FAQ解答常见问题及模型请求功能。
gemma-2-2b-it-GGUF - Gemma 2B-it模型的多种量化版本及使用指南
GGUFGemmaGithubHuggingfaceLLMhuggingface开源项目模型量化模型
本项目提供Google Gemma 2B-it模型的11种量化版本,使用llama.cpp处理。量化级别从F32到IQ3_M,文件大小1.39GB至10.46GB。详细介绍各版本特点、使用场景和选择建议,并提供下载方法、提示词格式等说明。适合不同硬件配置的轻量级Gemma模型部署需求。
Qwen2.5-Coder-7B-Instruct-GGUF - 深度学习模型的多规格量化版本适配不同硬件和性能要求
GGUFGithubHuggingfaceQwen2.5-Coder-7B-Instructllama.cpp大语言模型开源项目模型量化
本项目为Qwen2.5-Coder-7B-Instruct模型提供了从15GB到2.78GB的多种量化版本。采用llama.cpp最新技术,包括K-quants和I-quants两种量化方案,并针对ARM架构优化。用户可根据设备内存容量和性能需求选择适合版本。各版本保留原始模型核心功能,适用于多种部署场景。
Mistral-7B-Instruct-v0.3-GGUF - Mistral-7B-Instruct模型的多种量化版本优化性能与文件大小
GGUFGithubHuggingfaceMistral-7B-Instruct-v0.3llama.cpp开源项目模型模型性能量化
该项目为Mistral-7B-Instruct-v0.3模型提供多种量化版本,采用llama.cpp的imatrix选项。量化类型从Q8_0到IQ1_S不等,文件大小范围为1.61GB至7.70GB。项目详细介绍了各版本特点,并提供下载指南和选择建议,方便用户根据硬件条件和性能需求选择最佳版本。
Qwen2.5-32B-AGI-GGUF - Qwen2.5-32B-AGI模型量化与性能优化概述
GithubHuggingfaceQwen2.5-32B-AGI开源项目文本生成权重模型模型优化量化
介绍Qwen2.5-32B-AGI在Llamacpp中的量化模型,强调文本生成性能的提升。多种量化格式(如Q8_0,Q6_K_L)满足不同需求,结合embed/output量化,适应低RAM环境。提供模型选择、下载与运行指南,含基于ARM芯片的性能优化方法。
Codestral-22B-v0.1-GGUF - Codestral-22B量化实现代码生成的多样化选择
Codestral-22B-v0.1GithubHuggingfaceRAM管理huggingface-cli开源项目文本生成模型量化
Codestral-22B-v0.1模型通过llama.cpp量化,为代码生成提供多种文件选择,适应不同的硬件配置和性能需求。推荐使用高质量的Q6_K和Q5_K量化文件,以获取最佳效果。同时,文中介绍了I-quant与K-quant选择依据,帮助使用者在速度与效果之间找到平衡。文章还详细说明了如何使用huggingface-cli下载文件,以简化获取资源的流程。
Replete-LLM-V2.5-Qwen-14b-GGUF - Replete-LLM-V2.5-Qwen-14b模型的多量化处理与硬件优化概述
ARM芯片GithubHuggingfaceRombos-LLM-V2.5-Qwen-14b开源项目性能比较模型模型优化量化
该项目对Rombos-LLM-V2.5-Qwen-14b模型进行了多种量化优化,使用了llama.cpp的b3825版本。支持多种量化格式,如f16、Q8_0、Q6_K_L等,适用不同硬件环境,推荐Q6_K_L和Q5_K_L以实现高质量和资源节省。用户可根据硬件需求选择合适的格式,并使用huggingface-cli进行下载。针对ARM芯片提供了特定的优化量化选项Q4_0_X_X,广泛适用于文本生成应用,提升运行效率和输出质量。
Mythomax-L2-13b-Q4_K_M-GGUF - MythoMax L2 13b模型的Q4_K_M量化版本
GithubGryphe/MythoMax-L2-13bHuggingfacetransformers个人使用开源项目模型量化
项目中包含MythoMax L2 13b模型的Q4_K_M量化版本,基于mradermacher的GGUF方案。这一版本能通过Text Gen Webui与llamacpp_hf结合实现个性化应用,适合希望优化资源利用和提升模型性能的开发者与研究人员。
Qwen2.5-32B-Instruct-GGUF - 全面汇总32B大语言模型量化版本 多设备支持
GGUFGithubHuggingfaceQwen2.5-32B-Instruct大语言模型开源项目推理优化模型量化
本项目提供Qwen2.5-32B-Instruct模型的多种量化版本,精度从f16到IQ2_XXS,文件大小9GB至65GB不等。量化模型适用于CPU、GPU等设备,可根据硬件配置选择。项目包含详细的模型选择指南和下载说明,便于用户使用这个32B参数的大语言模型。特别推荐Q6_K、Q5_K和Q4_K系列,以及新型IQ系列量化版本。
huihui-ai_-_Qwen2.5-14B-Instruct-abliterated-v2-gguf - Qwen2.5-14B模型无审查量化版本集合
GithubHuggingfaceQwen2.5-14B大语言模型开源项目权重文件模型模型部署量化模型
这是一个基于Qwen2.5-14B-Instruct模型的GGUF量化版本集合。模型采用abliteration技术移除了安全过滤限制,并提供从5.37GB到14.62GB的多种量化版本,包括Q2_K、IQ3、Q4等系列。项目基于Apache-2.0许可证开源,支持通过transformers库加载使用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号