Project Icon

build-nanogpt

从零构建GPT-2模型的开源教学项目

build-nanogpt是一个开源教学项目,演示如何从零构建GPT-2模型。通过详细的Git提交记录和YouTube视频讲解,项目展示了124M参数GPT-2模型的完整构建过程。用户可在约1小时内重现模型,并可扩展至GPT-3规模。项目还提供模型训练示例、FAQ和勘误表,是深入理解大型语言模型原理的实用资源。该项目适合对大型语言模型感兴趣的开发者和研究人员,不仅提供了代码实现,还包含详细的解释和实践指导,有助于深入理解现代自然语言处理技术。

gpt2-small-portuguese - 葡萄牙语NLP高效精调模型的详细解析
GPorTuguese-2GithubHuggingfaceNLP任务开源项目微调模型葡萄牙语语言模型
研究展示了如何在有限资源下使用Hugging Face和fastai v2对英语GPT-2进行精调,构建出葡萄牙语语言模型。该模型基于GPT-2 small,经过一天训练获得37.99%的准确率和23.76的困惑度,显示了其在葡萄牙语文本生成及其他NLP任务中的表现。研究指出,迁移学习可在任何语言的前沿语言模型开发中发挥作用。
mGPT - 基于GPT架构的大规模多语种自然语言处理模型
GPTGithubHuggingfaceMegatron多语言模型开源项目模型深度学习自然语言处理
作为一个基于GPT-3架构的多语言处理模型,mGPT具备13亿参数量,覆盖25个语系的61种语言。模型采用Wikipedia和Colossal Clean Crawled Corpus作为训练数据,结合Deepspeed与Megatron框架实现并行计算,在低资源语言处理领域达到与XGLM相当的性能水平。模型训练过程中处理了488亿UTF字符,借助256个NVIDIA V100 GPU完成了为期14天的训练。
gptengineer.app - AI驱动快速网站原型开发,自然语言编辑一键部署
AI开发Githubgptengineer.app开源项目快速原型网站创建自然语言编辑
gptengineer.app是一个AI驱动的网站原型开发平台,通过自然语言指令实现快速创建和编辑。平台提供一键部署功能,便于将创意转化为实际网站。作为gpt-engineer开源项目的衍生,该平台继续支持开源社区。未来计划涵盖自动测试、调试和全栈功能扩展,致力于优化快速原型开发体验。
min-max-gpt - 为大规模GPT模型训练优化的开源框架
GPU训练GithubminGPT分布式训练大规模模型开源项目深度学习
min-max-gpt是一个针对大规模GPT模型训练优化的开源项目。该框架集成了muP初始化、混合精度训练、FSDP和DeepSpeed Zero-3等技术,并提供了不依赖Hugging Face的训练选项。这使得研究人员和开发者能够更灵活地控制训练过程。项目已在8块80GB A100 GPU上成功训练20B参数模型,展现了其在大规模语言模型训练方面的能力。
gpt-neo-2.7B - EleutherAI开发的27亿参数GPT-Neo语言模型展现多任务处理能力
EleutherAIGPT-NeoGithubHuggingface开源项目模型深度学习自然语言处理语言模型
GPT-Neo 2.7B是EleutherAI基于GPT-3架构开发的大规模语言模型,在The Pile数据集上训练了4200亿个token。模型在语言理解、科学推理等多个评估任务中表现优异,超越同等规模的GPT-2和GPT-3 Ada。尽管存在潜在偏见,GPT-Neo 2.7B仍为自然语言处理领域提供了新的研究方向和应用可能。
azure-openai-samples - Azure OpenAI的GPT基础知识、实际案例及解决方案
AI绘图AzureGPTGithubOpenAI开源项目自然语言处理
本项目提供了使用Azure OpenAI提供的GPT的基础资源,包括快速上手指南、实际使用案例以及端到端的解决方案。通过这些资源,用户可以了解GPT在聊天机器人、客户服务、内容生成、问答系统、文本摘要和情感分析等应用中的实际使用情况,并通过贡献和更新保持与技术发展的同步。项目基于GPT 3.5,并将在GPT-4可用时更新。
xiaogpt - 为小米AI音箱集成多种语言模型的开源项目
AI对话ChatGPTGithubxiaogpt小爱同学开源项目语音交互
xiaogpt是一个开源项目,旨在为小米AI音箱集成多种先进语言模型,包括ChatGPT、New Bing和ChatGLM等。该项目允许用户通过简单命令与AI助手对话,提升小爱同学的智能水平。支持多种配置选项,如不同TTS引擎、自定义提示词和关键字、流式响应等,使用户可以根据需求定制AI音箱体验。
transfer-learning-conv-ai - 使用迁移学习构建最先进的对话式 AI
Conversational AIGithubHuggingFaceOpenAI GPTTransfer Learning开源项目预训练模型
transfer-learning-conv-ai项目提供了一套完整的代码库,使用OpenAI GPT及GPT-2模型通过迁移学习技术培训对话型AI代理。用户可以在1小时内完成模型训练,还可以直接使用预训练模型。本代码库支持在单GPU或多GPU下训练,并兼容Docker环境。适合参与NeurIPS 2018对话竞赛。
llms - 大型语言模型的原理与实践应用全面解析
BERTGPTGithubTransformer开源项目自然语言处理语言模型
本项目全面介绍大型语言模型(LLMs)的基本概念、应用场景和技术演进。内容涵盖统计语言模型、神经网络语言模型,以及基于Transformer的预训练模型如GPT和BERT等。系统讲解LLMs核心原理,并探讨模型评估、文本生成和提示工程等实用技术。同时展示LLMs在计算机视觉等领域的创新应用,通过理论与实践结合,为读者提供深入了解LLMs技术的全面指南。
gpt-neox-20b - EleutherAI开发的大规模开源语言模型
GPT-NeoX-20BGithubHuggingface人工智能大规模语言模型开源项目机器学习模型自然语言处理
GPT-NeoX-20B是EleutherAI开发的200亿参数大规模语言模型。模型基于The Pile数据集训练,采用与GPT-3相似的架构,包含44层Transformer结构。作为研究导向的开源模型,支持下游任务开发和模型微调,但仅限于英语语言处理,且未经过人类反馈优化,不适合直接用于产品部署。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号