Project Icon

LLM2Vec-Sheared-LLaMA-mntp

三步实现大模型高效文本编码

LLM2Vec项目通过简单的三步法,将仅解码的大型语言模型转换为有效的文本编码器。这三步包括启用双向注意力机制、掩蔽下一个词预测和无监督对比学习。经过微调,这个模型能够在文本嵌入、信息检索和句子相似性等自然语言处理应用中取得高效表现。

vllm - 高性能与易用性的LLM推理与服务平台
GithubLLM服务PagedAttentionvLLM开源项目量化高吞吐量
vLLM是一个高性能且易用的LLM推理与服务平台,具备PagedAttention内存管理、CUDA/HIP图形加速、量化支持、并行解码算法及流式输出等技术优势。vLLM无缝集成Hugging Face模型,兼容多种硬件设备,支持分布式推理和OpenAI API。最新版本支持Llama 3.1和FP8量化。用户可通过pip安装并参考详细文档快速入门。
Llama-2-7b-hf - Meta开发的开源语言模型 支持多种参数规模和商业应用
GithubHuggingfaceLlama 2人工智能大语言模型开源项目模型自然语言处理预训练模型
Llama-2-7b-hf是Meta推出的开源大型语言模型之一,采用优化的Transformer架构。该模型经过2万亿token预训练,拥有70亿参数,支持4k上下文长度。Llama 2系列提供预训练和微调版本,可用于多种自然语言生成任务。在多项基准测试中表现优异,并支持商业应用,是一个功能强大的开源AI工具。
LLM2LLM - 探索迭代数据增强提升语言模型性能
GSM8KGithubLLM2LLM大语言模型开源项目数据增强迭代学习
LLM2LLM项目提出了一种迭代数据增强方法,旨在提升大型语言模型的性能。该方法通过数据生成和筛选,创建高质量训练数据,逐步改进模型能力。研究团队在GSM8K等数据集上的实验证实了方法的有效性。项目已开源代码并提供复现指南,为相关研究和开发工作提供了参考资源。
llmc - 开源工具压缩大型语言模型提升效率
GithubLLMCLLM压缩剪枝开源项目性能优化量化
llmc是一个压缩大型语言模型的开源工具,采用先进压缩算法提高效率和减小模型体积。它支持多种LLM和压缩方法,可在单GPU上量化评估大模型,兼容多种推理后端。项目提供LLM量化基准,帮助用户选择合适的压缩策略。
DeepSeek-LLM - 多语言大模型展现卓越编码与数学能力
DeepSeek LLMGithub人工智能开源开源项目自然语言处理语言模型
DeepSeek LLM是一个包含67亿参数的先进语言模型,经过2万亿英文和中文token的训练。该模型在推理、编码、数学和中文理解等方面表现优异,超越多个同类模型。其67B Chat版本在编码和数学方面尤为出色,在HumanEval和GSM8K等基准测试中名列前茅。项目开源了7B和67B的base与chat版本,可用于学术和商业研究。
all-MiniLM-L12-v2 - 基于自监督学习的高效句子嵌入模型
GithubHuggingfacesentence-transformers句子嵌入句子相似性对比学习开源项目微调模型
采用自监督对比学习技术,all-MiniLM-L12-v2模型专注于高效编码句子和短段落,利用超过11亿句对进行训练,加强语义搜索和信息检索性能。结合TPU与JAX/Flax技术优化,模型方便集成在sentence-transformers或HuggingFace Transformers中,适合多种文本处理应用。
paraphrase-MiniLM-L3-v2 - 轻量级句子嵌入模型实现语义搜索与文本聚类
GithubHuggingfacesentence-transformers向量嵌入开源项目模型自然语言处理语义相似度预训练模型
paraphrase-MiniLM-L3-v2是一个sentence-transformers模型,将文本映射到384维向量空间。该模型适用于语义搜索和文本聚类等任务,支持多种编程框架。经过多个数据集训练,模型体积小、推理速度快,能够生成高质量的句子嵌入,适合需要高效文本表示的应用场景。
Llama-3.2-1B - Meta推出多语言大规模语言模型 支持多种商业和研究场景
GithubHuggingfaceLlama 3.2人工智能多语言大语言模型开源项目模型自然语言处理
Llama-3.2-1B是Meta开发的多语言大规模语言模型,支持8种语言。采用优化的Transformer架构,经9T token训练,具128K上下文长度。适用于对话、检索、摘要等任务,性能优于多数开源和闭源模型。支持商业和研究用途,可开发AI助手、写作工具等。提供原始和量化版本,适应不同计算资源需求。该模型在多语言处理和应用灵活性方面表现出色。
Llama-2-7b-hf - Meta开发的Llama 2开源大语言模型系列
GithubHuggingfaceLlama 2人工智能元宇宙大语言模型开源项目模型自然语言处理
Llama 2是Meta开发的开源大语言模型系列,包含7B、13B和70B三种参数规模。模型采用优化的Transformer架构,支持4k上下文长度,适用于对话等多种自然语言任务。Llama 2在多项基准测试中表现优异,提供预训练和微调版本,可用于商业和研究。该项目开放了详细的使用说明和评估数据,促进了大语言模型的开放研究。
llm-resource - 大模型资源汇总及实用技术详解
ChatGPTGPT-2GithubLLMMOETransformer开源项目
LLM百宝箱是大模型相关资源的综合汇总,包括算法、训练、推理、数据工程、压缩和测评等方面。用户可以通过目录和链接快速找到相关内容,如Transformer和GPT模型的原理和源码解析,以及混合专家模型(MoE)等前沿技术。此外,还提供了LLM微调、对齐和推理优化的实现方案和技巧,帮助开发者和研究者深入掌握并应用大模型技术。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号