Project Icon

modded-nanogpt

基于PyTorch的高效GPT-2训练器变体

Modded-NanoGPT是一个基于Andrej Karpathy的llm.c项目的GPT-2训练器变体。该项目通过引入旋转嵌入等现代技术,将训练效率提高一倍,仅需5B tokens即可达到与原版相同的验证损失。代码简化至446行,实现了124M参数的transformer模型。在Fineweb验证集上,模型达到3.2818的验证损失。通过架构调整和超参数优化,该项目在保持性能的同时显著提升了训练速度。

FasterTransformer - 基于NVIDIA平台的高性能Transformer编解码器实现与调优
BERTFasterTransformerGPTGithubNVIDIATensorRT-LLM开源项目
FasterTransformer不仅支持多框架集成,还针对NVIDIA新一代GPU优化了编解码性能,极大提升了操作效率和处理速度。包含模型支持、性能对比及API演示的详细文档,有助于用户深入了解并有效使用FasterTransformer。
NanoLLM - 本地LLM推理优化工具包
GithubJetsonLLM优化NanoLLM多模态AI开源项目本地推理
NanoLLM是一个开源工具包,专注于优化大型语言模型(LLM)的本地推理性能。它提供了类HuggingFace的API接口,支持模型量化、视觉语言模型、多模态代理、语音处理、向量数据库和检索增强生成(RAG)等功能。这个项目致力于简化LLM的部署和应用,特别适合需要高效本地推理的场景。NanoLLM目前的最新版本是24.7,可通过Docker容器方便部署。有兴趣的开发者可以访问项目的官方文档获取更多详细信息和使用指南。
Sophia - 随机二阶优化器提升语言模型预训练效率
GithubSophia优化器开源项目机器学习语言模型预训练
Sophia是一种为大规模语言模型预训练设计的随机二阶优化器。它通过支持更大学习率,提高了训练速度和模型性能。该项目提供Sophia-G优化器的实现,包含超参数调优指南和GPT-2训练脚本,方便研究人员应用这一优化技术。Sophia适用于GPT-2等不同规模的模型,展现了良好的扩展性。
Awesome-GPTs - OpenAI平台GPT模型精选资源库
AI助手GPTsGithubOpenAI写作辅助学习工具开源项目
Awesome-GPTs汇集OpenAI平台上创新实用的GPT模型,涵盖学术研究、写作、教育、编程等多个领域。该项目展示顶级GPT模型,鼓励社区参与,为AI爱好者和开发者提供探索和分享平台。用户可根据需求选择合适的GPT工具,提升工作效率和学习体验。
Transformers-for-NLP-2nd-Edition - BERT到GPT-4的Transformer模型详解
BERTGPT-4GithubOpenAI APITransformers-for-NLP-2nd-Edition开源项目机器学习
本项目涵盖了从BERT到GPT-4的Transformer模型,提供了在Hugging Face和OpenAI环境下的微调、训练及提示工程示例。还包括ChatGPT、GPT-3.5-turbo、GPT-4和DALL-E的使用示例,包括语音到文本、文本到语音、文本到图像生成等内容。详述了GPT-4 API提示工程和最新平台更新,提供实用的指导与教程。
Megatron-LM - 优化GPU训练技术 加速大规模Transformer模型
GPU优化GithubMegatron-CoreMegatron-LM分布式训练大语言模型开源项目
Megatron-LM框架利用GPU优化技术实现Transformer模型的大规模训练。其Megatron-Core组件提供模块化API和系统优化,支持自定义模型训练。该项目可进行BERT、GPT、T5等模型预训练,支持数千GPU分布式训练百亿参数级模型,并提供数据预处理、模型评估和下游任务功能。
smartgpt - 为 LLM 提供使用插件完成复杂任务的能力
AutoGPTGPT-4GithubSmartGPT内存管理开源项目插件系统
SmartGPT是一种实验性项目,通过模块化和插件系统支持,将GPT-3.5和GPT-4用于自动完成复杂任务。其特点包括自动配置、动态执行和静态工具链。虽然在生态系统和内存管理方面有一些限制,但SmartGPT正在探索并推动大型语言模型的最大潜力。适合对AI创新感兴趣的开发者。
SecGPT - 专注网络安全的AI模型 助力智能化防御
GithubSecGPT人工智能大模型开源项目网络安全训练
SecGPT是一个面向网络安全领域的大型语言模型。它可用于漏洞分析、溯源分析、流量分析和攻击研判等多种安全任务。该模型采用自主开发的训练代码以节省显存,并结合高质量的网络安全数据集和DPO强化学习技术,提高了输出质量。SecGPT为网络安全工作提供智能辅助,有助于增强防御能力。
GPTFast - Hugging Face Transformers模型推理加速工具
GPTFastGithubHugging Face开源项目推理加速量化静态键值缓存
GPTFast是一个为Hugging Face Transformers模型优化推理速度的开源Python库。它集成了多种加速技术,如静态键值缓存、int4量化和推测解码,可将模型推理速度提升7.6-9倍。GPTFast支持torch.compile、int8量化、GPTQ int4量化等优化方法,通过简单的API调用即可应用于各类Hugging Face模型。该项目持续更新,未来计划引入更多先进的加速技术。
gpt-neox-20b - EleutherAI开发的大规模开源语言模型
GPT-NeoX-20BGithubHuggingface人工智能大规模语言模型开源项目机器学习模型自然语言处理
GPT-NeoX-20B是EleutherAI开发的200亿参数大规模语言模型。模型基于The Pile数据集训练,采用与GPT-3相似的架构,包含44层Transformer结构。作为研究导向的开源模型,支持下游任务开发和模型微调,但仅限于英语语言处理,且未经过人类反馈优化,不适合直接用于产品部署。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号