image-gpt

支持多数据集的生成预训练模型

Image GPT PyTorch 生成式预训练 CIFAR10 Fashion-MNIST Github 开源项目

Image GPT是一个基于生成像素预训练模型（Generative Pretraining from Pixels）的PyTorch实现，支持多种预训练模型和数据集。该项目允许下载预训练模型、量化图像、进行生成预训练和分类微调。它还具有BERT风格的预训练、支持加载OpenAI预训练模型等功能。目前，使用单个NVIDIA 2070 GPU可在Fashion-MNIST上实现高效训练，简化了多种图像数据集上的生成模型训练和应用流程。

访问官网

Github

介绍相关项目

AnyGPT - 基于离散序列建模的多模态语言模型

AnyGPTGithub多模态语言模型大语言模型开源项目模态转换离散序列建模

AnyGPT是一款基于离散序列建模的多模态语言模型，能够统一处理语音、文本、图像和音乐等多种模态。该模型通过将不同模态数据转换为统一的离散表示，实现了模态间的转换和自由对话。AnyGPT包含基础模型和聊天模型两个版本，前者实现了四种模态的对齐，后者基于AnyInstruct数据集训练，支持灵活的多模态交互。

gpt-fast - PyTorch原生高效文本生成项目

GithubPyTorchgpt-fast开源项目性能优化文本生成模型量化

gpt-fast是一个基于PyTorch的高效Transformer文本生成项目,代码精简(<1000行Python),仅依赖PyTorch和sentencepiece。项目特点包括极低延迟、int8/int4量化、推测解码和张量并行,支持NVIDIA和AMD GPU。gpt-fast不是框架或库,而是展示原生PyTorch性能的示例。它支持LLaMA系列和Mixtral 8x7B等模型,提供详细基准测试和多种优化技术。该项目实现了高效的文本生成,展现了PyTorch在AI领域的强大性能。

gpt-2-tensorflow2.0 - 在Tensorflow 2.0中实现的GPT-2模型预训练与文本生成

GPT-2GithubOpenAitensorflow开源项目文本生成模型预训练

该项目实现了OpenAi GPT-2模型在Tensorflow 2.0中的预训练和序列生成，并提供详细的设置和训练指南。用户可以使用示例数据进行预训练或下载OpenWebText数据进行训练。支持多GPU分布式训练，并提供命令行接口和TensorBoard集成，帮助高效地进行模型训练和优化。项目遵循MIT许可证，社区贡献和改进热烈欢迎。

GPT2-Chinese - GPT2-Chinese：支持多种中文Token化和大规模语料训练

BERT分词器GPT2-ChineseGithubHuggingface中文语言模型开源项目预训练模型

GPT2-Chinese项目提供了适用于中文的GPT2训练代码，支持BERT和BPE Tokenizer，能够生成诗词、新闻、小说等内容，适用于大规模语料训练。该项目基于Pytorch实现，支持最新的预训练模型，如通用中文模型和古诗词模型。详细的模型信息可以在Huggingface Model Hub中找到。用户可以自行训练和生成文本，同时支持FP16和梯度累积。

BioGPT - 预训练Transformer模型为生物医学文本提供强大工具

BioGPTGithubTransformer开源项目生物医学文本自然语言处理预训练模型

BioGPT是一个针对生物医学文本的预训练Transformer模型。该模型在关系提取、文档分类和问答等下游任务中表现优异。项目提供预训练模型和特定任务的微调模型，可通过多种渠道获取。BioGPT支持文本生成、特征提取等多种应用场景，为生物医学自然语言处理研究提供了实用工具。

picoGPT - 极简风格的GPT-2实现版本

GPT-2GithubNumPypicoGPT代码实现开源项目模型生成

picoGPT是一个极简风格的GPT-2实现版本，采用NumPy全面编写，前向传播过程在短短40行代码中展开。它虽然运行缓慢，不支持多重训练或高级的采样方法，但其独特的简化设计提供了一种有趣的学习与试验环境，极适合AI和机器学习领域的爱好者及开发者。

AudioGPT - 多功能音频生成与理解平台，支持语音、音乐、音效及虚拟人对话

AudioGPTGithub开源项目语音增强语音识别音乐生成音频合成

AudioGPT 是一个多功能音频生成与理解平台，具备语音合成、语音识别、语音分离、风格迁移、声音检测、声音提取、文本到音频转换等功能，还支持音乐生成与虚拟人对话。集成了 FastSpeech、whisper、GeneFace 等多个领先的基础模型，AudioGPT 为开发者提供强大的开源工具和预训练模型，支持多种音频相关任务，不断扩展其功能和应用场景。此平台适合音频处理、自然语言处理及多模态研究的需求。

TrackGPTs - 全面的GPT模型搜索和探索导航站

AI助手AI工具GPTs内容创作图像生成搜索引擎

TrackGPTs汇集超过70万个GPT模型,涵盖教育、生产力、生活方式、研究、写作和编程等领域。网站提供集中展示、分类浏览和搜索功能,方便用户快速找到所需的AI助手。通过TrackGPTs,可以轻松探索和比较各类GPT模型的特点与功能。

Multimodal-GPT - 整合视觉与语言功能的多模态对话机器人

GithubOpenFlamingo多模态GPT开源项目联合训练视觉指令语言模型

Multimodal-GPT是一个基于OpenFlamingo多模态模型的项目，通过结合视觉指令和语言指令数据的联合训练，有效提升模型性能。该项目支持VQA、图像描述、视觉推理、文本OCR和视觉对话等多种数据类型，并利用LoRA进行参数高效的微调。探索Multimodal-GPT的广泛应用可能性。

DeepImage-an-Image-to-Image-technology - 强大而多样化的图像生成与转换技术集合

CycleGANDeepImageGANGithubImage-to-ImageStyleGAN开源项目

DeepImage是一个综合性的图像生成与转换技术项目，包含多种先进算法如pix2pixHD、pix2pix和CycleGAN等。该项目提供了图像生成演示、理论研究资料和实践指南，涵盖从基础到前沿的生成对抗网络(GAN)技术。DeepImage为研究人员和开发者提供了一个全面的学习和实验平台，助力探索图像生成与转换的多种可能性。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号