Project Icon

LLM2LLM

探索迭代数据增强提升语言模型性能

LLM2LLM项目提出了一种迭代数据增强方法,旨在提升大型语言模型的性能。该方法通过数据生成和筛选,创建高质量训练数据,逐步改进模型能力。研究团队在GSM8K等数据集上的实验证实了方法的有效性。项目已开源代码并提供复现指南,为相关研究和开发工作提供了参考资源。

Chinese-Llama-2 - 开源项目提升Llama-2模型中文处理能力
Chinese-Llama-2GithubLlama-2中文大模型开源项目自然语言处理
Chinese-Llama-2是一个开源项目,致力于增强Llama-2大语言模型的中文处理能力。项目采用LoRA微调、全参数指令微调和二次预训练等方法,并在中文指令数据集上训练Llama-2模型。提供了训练所需的数据集、教程和模型参数,旨在推动中文自然语言处理研究与应用。经过优化的模型在中文理解、生成和翻译等任务中表现出明显提升。
llm-data-creation - 大型语言模型驱动的自动数据生成框架
EMNLPGithub大语言模型开源项目微调数据创建评估
llm-data-creation是一个基于大型语言模型的数据生成框架。该项目仅需一个格式示例即可创建多种问答任务的合成数据,通过迭代过程生成更多相同格式的数据。这一方法特别适用于缺乏人工标注数据的场景。项目提供完整的数据创建、模型微调和评估流程,在10个公开基准数据集上的评估显示出优秀的跨域性能。
MobileLLM - 轻量高效的移动设备语言模型
AI模型GithubMobileLLM开源项目深度学习神经网络语言模型
MobileLLM是一个针对移动设备优化的大型语言模型项目。该模型通过SwiGLU激活函数、深窄架构、嵌入共享和分组查询注意力等技术,在亿级参数规模下实现了高性能。MobileLLM在零样本常识推理任务中表现出色,不仅在125M和350M参数规模上超越了现有最先进模型,还成功扩展至600M、1B和1.5B参数规模,展示了其在移动设备应用中的潜力。
llm-attacks - 研究大语言模型的对抗性攻击与安全防御
GCG算法GithubLLM攻击实验复现对抗性攻击开源项目语言模型
LLM-attacks项目致力于研究对齐语言模型的通用和可迁移对抗性攻击。项目实现了GCG算法,可对LLaMA-2等模型进行安全测试。研究者能够复现论文中的单一行为、多行为和迁移实验。项目提供完整的安装指南、模型使用说明和实验脚本,并包含交互式演示notebook。该研究有助于深入理解和提升大语言模型的安全性,对相关领域的发展具有重要价值。
Llama-2-7B-CAT - 改进大型语言模型的性能与应用策略
GithubHuggingfacemeta-llama开源项目技术规格模型环境影响训练数据
此项目专注于提升大型语言模型的性能,研究如何通过有效的训练方法进行改进。用户可以通过示例代码快速了解使用方法及模型的应用场景与局限性。
LLM-Workshop - 大语言模型实践与应用工作坊
GithubLLM人工智能开源项目机器学习深度学习自然语言处理
LLM-Workshop 是 Sourab Mangrulkar 创建的大语言模型工作坊。该项目为开发者和研究人员提供 LLM 技术学习平台,内容包括模型训练、调优技巧、应用开发等。工作坊旨在帮助参与者掌握 AI 和自然语言处理领域的实用技能,适合想要深入了解大语言模型技术的人员参与。
llm-datasets - LLM微调优质数据集与工具资源库
GithubLLM对话开源项目微调指令跟随数据集
LLM Datasets项目汇集了大语言模型微调所需的优质数据集、实用工具和核心概念。涵盖通用、数学逻辑、编程和对话等多个领域,项目详细阐述了高质量数据集的特征。为研究人员和开发者提供多样化的LLM微调数据资源,旨在促进模型性能提升。
mlc-llm - 通用大语言模型高性能部署引擎
AI模型优化GithubMLC LLMMLCEngine开源项目机器学习编译器高性能部署
MLC LLM是一款用于大语言模型的高性能部署引擎,支持用户在各种平台上开发、优化和部署AI模型。核心组件MLCEngine通过REST服务器、Python、JavaScript、iOS和Android等接口提供OpenAI兼容的API,支持AMD、NVIDIA、Apple和Intel等多种硬件平台。项目持续优化编译器和引擎,与社区共同发展。
llms - 大型语言模型的原理与实践应用全面解析
BERTGPTGithubTransformer开源项目自然语言处理语言模型
本项目全面介绍大型语言模型(LLMs)的基本概念、应用场景和技术演进。内容涵盖统计语言模型、神经网络语言模型,以及基于Transformer的预训练模型如GPT和BERT等。系统讲解LLMs核心原理,并探讨模型评估、文本生成和提示工程等实用技术。同时展示LLMs在计算机视觉等领域的创新应用,通过理论与实践结合,为读者提供深入了解LLMs技术的全面指南。
LLMGA - 用于精确图像生成和编辑的多模态大语言模型
ECCV2024GithubLLMGA图像生成多模态大模型开源项目
LLMGA基于多模态大语言模型,提供图像生成与编辑解决方案。结合Stable Diffusion和详细语言生成提示,项目提升了上下文理解并减少生成过程中的噪音,增强图像内容的精度。LLMGA支持文本到图像(T2I)、补画、扩画及指令编辑,适用于Logo设计、海报制作和故事绘本生成,支持中英文指令。广泛的模型和数据集选择满足不同需求,是理想的图像生成和编辑助手。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号