Project Icon

Phi-3-medium-128k-instruct-quantized.w8a16

优化为INT8的14亿参数开源模型,提升计算效率

Phi-3模型的量化版本,通过将权重量化为INT8,将参数位数从16减少至8,约减少50%的磁盘和GPU使用,仍保有高性能。专为英语商业与研究用设计,不适用于违法行为。支持在vLLM和Transformers中高效部署,平均分数74.04逼近未量化版本。在OpenLLM基准中展现优异准确性与恢复能力。

Mythalion-13B-AWQ - 利用高效的低比特量化提升Transformer推理速度
GithubHuggingfaceMythalion 13B伪人AI开源项目文本生成模型模型整合量化
该项目提供高效的AWQ模型文件,支持4比特量化在多用户环境中实现快速Transformer推理。虽然未量化模型的整体吞吐量更高,但通过使用更小的GPU,AWQ模型显著降低了部署成本,例如仅需1台48GB GPU即可运行70B模型。该模型适合需要高吞吐量并行推理的场景,用户可借助vLLM或AutoAWQ轻松调用以降低成本并简化部署。
Meta-Llama-3-70B-Instruct-FP8 - FP8量化优化的Meta-Llama-3-70B指令模型实现高效部署
FP8GithubHuggingfaceLlama3vLLM大语言模型开源项目模型量化
Meta-Llama-3-70B-Instruct-FP8是一个经FP8量化优化的大型语言模型。通过AutoFP8技术,该模型将参数位数从16减至8,大幅降低存储和GPU内存需求。在OpenLLM基准测试中,其平均得分为79.16,与原始模型的79.51相近。这个英语助手式聊天模型适用于商业和研究领域,可通过vLLM后端实现高效部署。
Meta-Llama-3-8B-Instruct-FP8-KV - 基于FP8量化技术的Meta Llama 3指令模型
GithubHuggingfaceMeta-Llama-3vLLM人工智能开源项目模型模型量化深度学习
Meta-Llama-3-8B-Instruct-FP8-KV是一个采用FP8权重和激活量化的语言模型,通过每张量量化技术和FP8量化的KV缓存实现性能优化。模型与vLLM 0.5.0及以上版本兼容,基于AutoFP8框架和UltraChat数据集完成校准,适用于大规模语言模型的部署场景。
llama-3-cat-8b-instruct-v1-GGUF - 文本生成模型的量化选择
GithubHuggingfacellama.cpp开源项目文件下载模型模型性能质量选择量化
此项目通过llama.cpp进行模型量化,以满足多样化的硬件限制需求。量化文件选择从Q8_0到IQ1_S不等,推荐使用Q6_K和Q5_K_M文件。使用huggingface-cli可方便下载所需文件。I-quant和K-quant适应不同硬件,特别在低于Q4时,I-quant表现出色。支持CPU和Apple Metal,需注意性能平衡。
Meta-Llama-3.1-8B-Instruct-FP8-dynamic - Meta-Llama-3.1-8B的FP8量化技术优化多语言文本生成
GithubHuggingfaceMeta-Llama-3.1vLLM多语言开源项目模型模型优化量化
Meta-Llama-3.1-8B-Instruct-FP8-dynamic利用FP8量化技术优化内存使用,适用于多语言商业和研究用途,提升推理效率。该模型在Arena-Hard评估中实现105.4%回收率,在OpenLLM v1中达成99.7%回收率,展示接近未量化模型的性能表现。支持多语言文本生成,尤其适合聊天机器人及语言理解任务,且通过vLLM后端简化部署流程。利用LLM Compressor进行量化,降低存储成本并提高部署效率,保持高质量文本生成能力。
xgen-mm-phi3-mini-instruct-r-v1 - Salesforce开发的大规模多模态模型 支持高分辨率图像处理
AI研究GithubHuggingfaceXGen-MM图像处理多模态模型开源项目模型视觉语言模型
xgen-mm-phi3-mini-instruct-r-v1是Salesforce AI Research开发的大规模多模态模型。该模型在5B参数规模下实现了开源和闭源视觉语言模型中的领先性能,支持高分辨率图像处理,并具备出色的上下文学习能力。模型通过大规模训练提升了多模态AI技术水平,为图像理解和文本生成任务提供了强大支持。
Phi2-mini-Chinese - 从零开始训练0.2B参数的中文语言模型,支持Flash Attention加速
GithubPhi2-Chinese-0.2BSFT微调中文小模型开源项目数据清洗语言模型
项目包含从数据清洗、tokenizer训练、CLM预训练、SFT微调到RLHF优化的详细步骤,代码和模型已开源,可引用。支持Flash Attention加速,适用于大数据集处理。更多信息及模型权重在huggingface仓库。
Midnight-Miqu-70B-v1.5-4bit - 为大规模语言模型提供高效4位量化部署方案
AI模型压缩AWQGithubHuggingfaceMidnight-Miqu-70Blmdeploy开源项目模型量化模型
Midnight-Miqu-70B-v1.5-4bit是一个经过lmdeploy工具优化的4位量化模型,旨在实现大规模语言模型的高效部署。该项目通过自动量化技术显著减小模型体积,同时保持性能稳定。这为在资源受限环境中部署强大语言模型提供了实用解决方案,可应用于多种自然语言处理任务。
Hathor_Gamma-L3-8B-0.6-GGUF - 量化技术优化文本模型,适应多样硬件需求
GithubHathor_Gamma-L3-8B-0.6Huggingface开源项目性能优化文本生成模型模型下载量化
该项目使用llama.cpp的最新功能实现模型量化,提供多种质量和大小的量化文件选择。通过imatrix选项进行的量化,支持多种硬件需求。结合K-quant和I-quant技术,实现速度与性能的平衡,适用于内存受限环境。
ComfyUI-Phi-3-mini - Phi-3-mini模型集成ComfyUI:高效AI对话新选择
AI对话ComfyUIGithubPhi-3-mini多轮对话开源项目模型集成
ComfyUI-Phi-3-mini项目集成了微软的Phi-3-mini-4k-instruct模型。这款小巧快速的模型性能媲美GPT-3.5和Mixtral 8x7B,支持系统提示词设置和多轮对话。它能自动将中文输入转换为英文提示词,适用于生成补全提示词或日常对话。该开源项目提供简易安装步骤和使用指南,方便用户体验高效AI对话。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号