Project Icon

build-nanogpt

从零构建GPT-2模型的开源教学项目

build-nanogpt是一个开源教学项目,演示如何从零构建GPT-2模型。通过详细的Git提交记录和YouTube视频讲解,项目展示了124M参数GPT-2模型的完整构建过程。用户可在约1小时内重现模型,并可扩展至GPT-3规模。项目还提供模型训练示例、FAQ和勘误表,是深入理解大型语言模型原理的实用资源。该项目适合对大型语言模型感兴趣的开发者和研究人员,不仅提供了代码实现,还包含详细的解释和实践指导,有助于深入理解现代自然语言处理技术。

gpt2-small-portuguese - 葡萄牙语NLP高效精调模型的详细解析
GPorTuguese-2GithubHuggingfaceNLP任务开源项目微调模型葡萄牙语语言模型
研究展示了如何在有限资源下使用Hugging Face和fastai v2对英语GPT-2进行精调,构建出葡萄牙语语言模型。该模型基于GPT-2 small,经过一天训练获得37.99%的准确率和23.76的困惑度,显示了其在葡萄牙语文本生成及其他NLP任务中的表现。研究指出,迁移学习可在任何语言的前沿语言模型开发中发挥作用。
mGPT - 基于GPT架构的大规模多语种自然语言处理模型
GPTGithubHuggingfaceMegatron多语言模型开源项目模型深度学习自然语言处理
作为一个基于GPT-3架构的多语言处理模型,mGPT具备13亿参数量,覆盖25个语系的61种语言。模型采用Wikipedia和Colossal Clean Crawled Corpus作为训练数据,结合Deepspeed与Megatron框架实现并行计算,在低资源语言处理领域达到与XGLM相当的性能水平。模型训练过程中处理了488亿UTF字符,借助256个NVIDIA V100 GPU完成了为期14天的训练。
gptengineer.app - AI驱动快速网站原型开发,自然语言编辑一键部署
AI开发Githubgptengineer.app开源项目快速原型网站创建自然语言编辑
gptengineer.app是一个AI驱动的网站原型开发平台,通过自然语言指令实现快速创建和编辑。平台提供一键部署功能,便于将创意转化为实际网站。作为gpt-engineer开源项目的衍生,该平台继续支持开源社区。未来计划涵盖自动测试、调试和全栈功能扩展,致力于优化快速原型开发体验。
min-max-gpt - 为大规模GPT模型训练优化的开源框架
GPU训练GithubminGPT分布式训练大规模模型开源项目深度学习
min-max-gpt是一个针对大规模GPT模型训练优化的开源项目。该框架集成了muP初始化、混合精度训练、FSDP和DeepSpeed Zero-3等技术,并提供了不依赖Hugging Face的训练选项。这使得研究人员和开发者能够更灵活地控制训练过程。项目已在8块80GB A100 GPU上成功训练20B参数模型,展现了其在大规模语言模型训练方面的能力。
gpt-neo-2.7B - EleutherAI开发的27亿参数GPT-Neo语言模型展现多任务处理能力
EleutherAIGPT-NeoGithubHuggingface开源项目模型深度学习自然语言处理语言模型
GPT-Neo 2.7B是EleutherAI基于GPT-3架构开发的大规模语言模型,在The Pile数据集上训练了4200亿个token。模型在语言理解、科学推理等多个评估任务中表现优异,超越同等规模的GPT-2和GPT-3 Ada。尽管存在潜在偏见,GPT-Neo 2.7B仍为自然语言处理领域提供了新的研究方向和应用可能。
azure-openai-samples - Azure OpenAI的GPT基础知识、实际案例及解决方案
AI绘图AzureGPTGithubOpenAI开源项目自然语言处理
本项目提供了使用Azure OpenAI提供的GPT的基础资源,包括快速上手指南、实际使用案例以及端到端的解决方案。通过这些资源,用户可以了解GPT在聊天机器人、客户服务、内容生成、问答系统、文本摘要和情感分析等应用中的实际使用情况,并通过贡献和更新保持与技术发展的同步。项目基于GPT 3.5,并将在GPT-4可用时更新。
xiaogpt - 为小米AI音箱集成多种语言模型的开源项目
AI对话ChatGPTGithubxiaogpt小爱同学开源项目语音交互
xiaogpt是一个开源项目,旨在为小米AI音箱集成多种先进语言模型,包括ChatGPT、New Bing和ChatGLM等。该项目允许用户通过简单命令与AI助手对话,提升小爱同学的智能水平。支持多种配置选项,如不同TTS引擎、自定义提示词和关键字、流式响应等,使用户可以根据需求定制AI音箱体验。
transfer-learning-conv-ai - 使用迁移学习构建最先进的对话式 AI
Conversational AIGithubHuggingFaceOpenAI GPTTransfer Learning开源项目预训练模型
transfer-learning-conv-ai项目提供了一套完整的代码库,使用OpenAI GPT及GPT-2模型通过迁移学习技术培训对话型AI代理。用户可以在1小时内完成模型训练,还可以直接使用预训练模型。本代码库支持在单GPU或多GPU下训练,并兼容Docker环境。适合参与NeurIPS 2018对话竞赛。
llms - 大型语言模型的原理与实践应用全面解析
BERTGPTGithubTransformer开源项目自然语言处理语言模型
本项目全面介绍大型语言模型(LLMs)的基本概念、应用场景和技术演进。内容涵盖统计语言模型、神经网络语言模型,以及基于Transformer的预训练模型如GPT和BERT等。系统讲解LLMs核心原理,并探讨模型评估、文本生成和提示工程等实用技术。同时展示LLMs在计算机视觉等领域的创新应用,通过理论与实践结合,为读者提供深入了解LLMs技术的全面指南。
gpt-neox-20b - EleutherAI开发的大规模开源语言模型
GPT-NeoX-20BGithubHuggingface人工智能大规模语言模型开源项目机器学习模型自然语言处理
GPT-NeoX-20B是EleutherAI开发的200亿参数大规模语言模型。模型基于The Pile数据集训练,采用与GPT-3相似的架构,包含44层Transformer结构。作为研究导向的开源模型,支持下游任务开发和模型微调,但仅限于英语语言处理,且未经过人类反馈优化,不适合直接用于产品部署。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号