#生成模型

Awesome ChatGPT Prompts - 提升ChatGPT使用效果的顶级提示和技巧指南
ChatGPT语言模型热门AI工具AI开发提示指令生成模型自定义GPT提示例子
本站集中展示了用于优化ChatGPT模型的各类提示和示例。您可以在此贡献和发现创新的ChatGPT应用方法,与全球开发者共同探讨和学习。站点还包括定制GPT模型商店与多语言提示生成器,为您的ChatGPT项目添加更多元素。
PhoGPT - 越南语生成预训练模型系列
Github开源项目聊天机器人预训练生成模型PhoGPTVietnamese
PhoGPT是一个高性能的越南语生成预训练模型系列,包括基础模型PhoGPT-4B和聊天变体PhoGPT-4B-Chat。PhoGPT-4B在102B词汇上预训练,支持8192上下文长度和20K词汇类型。PhoGPT-4B-Chat经过微调,提升了对话和指令响应能力。PhoGPT在开源模型中表现优异,适合多种生成任务。
ai-notes - 文本生成与图像理解的最新动态
Github开源项目语言模型Stable DiffusionGPT-4生成模型AI工程
「ai-notes」项目深度剖析生成模型和大规模语言模型,涵盖文本处理到图像生成等AI技术。本项目更新多种Markdown文件,内容包括模型评估、应用案例和技术细节。特别关注Stable Diffusion与GPT-4的最新进展,为工程师、研究者和技术爱好者提供宝贵资源。
uform - 用于内容理解和生成的袖珍型多模态 AI
Github开源项目多模态AI生成模型ONNX嵌入模型UForm
UForm是一个全面的多模态AI库,涵盖了从文本到图像,乃至视频剪辑的生成与理解等多种功能。支持多种语言,包含轻量级生成模型及高效的预训练变压模型,能够广泛应用于从服务器到智能手机等不同设备。主要优势包括快速的搜索性能、简易的模型部署过程及卓越的多语言应用能力,适用于快速嵌入、语义搜索、图像标题生成和视觉问答等多种场景。
freeGPT - 免费访问多种文本与图像生成模型
Github开源项目文本生成图像生成生成模型Python库freeGPT
freeGPT 提供免费下载和使用多种文本与图像生成模型,包括 gpt3 和 gpt4。通过安装并使用 Python 代码,即可轻松实现文本或图像生成。此外,还支持官方 Discord 机器人,提供更多应用实例和技术支持。
deep-learning-roadmap - 为开发者和研究人员提供的从入门到高级应用全覆盖,涵盖图像识别、自然语言处理等关键领域深度学习的综合资源,
Github开源项目深度学习卷积神经网络强化学习图像识别生成模型
为开发者和研究人员提供深度学习的综合资源,从入门到高级应用全覆盖,涵盖图像识别、自然语言处理等关键领域。借助本平台,您可以迅速找到所需资源,掌握最前沿的深度学习技术。
MobiLlama - 为资源受限设备提供高效的小型语言模型
Github开源项目大语言模型生成模型模型下载MobiLlama小语言模型
MobiLlama项目提供一个高效的开源小型语言模型,适用于设备上处理、节能和低内存占用的需求。通过参数共享技术,MobiLlama从较大模型简化而来,降低了预训练和部署成本,实现了资源受限设备上高效处理语言任务。
gretel-synthetics - 提供多模型支持的开源合成数据生成库
Github开源项目PyTorchTensorFlow生成模型合成数据Gretel Synthetics
Gretel.ai 提供的 Gretel Synthetics 是一个开源合成数据生成库,支持生成高质量的合成数据,适用于机器学习和数据分析。该库主要支持 LSTM、Timeseries DGAN 和 ACTGAN 模型,并与 TensorFlow、PyTorch 和 SDV 集成。用户可以通过简易的 Python 代码进行安装和使用。文档详细介绍了使用方法,包括配置、模型训练和数据生成,并提供多个示例和教程,帮助用户快速上手。
computer-vision-course - 由社区驱动的计算机视觉课程,涵盖卷积神经网络、视觉Transformer等核心技术
Github开源项目卷积神经网络Hugging Face生成模型Computer Vision社区课程
由Hugging Face社区超过60位贡献者共同创建的计算机视觉课程,涵盖从计算机视觉基础到卷积神经网络、视觉Transformer、多模态模型、生成模型等多种前沿技术。每位作者自由选择风格创作,并经过社区审核和修订。课程展示了开源社区的合作成就,欢迎新的贡献和改进建议。
diffusiondb - 大规模文本生成图像数据集,促进多领域研究
Github开源项目Stable Diffusion数据集生成模型文本生成图像DiffusionDB
DiffusionDB 是一个大规模文本生成图像数据集,包含1400万张由Stable Diffusion生成的图像,以真实用户的提示和超参数为基础。该数据集为研究生成模型与提示词的关系、检测深度伪造和设计人机交互工具提供了丰富资源,分为 DiffusionDB 2M 和 DiffusionDB Large 两个子集,满足不同需求。模块化的数据集结构使得用户可以高效加载所需部分。
diffusion-classifier - 利用大规模文本到图像生成模型实现零样本分类
Github开源项目Stable Diffusion生成模型ICCV 2023Diffusion Classifierzero-shot分类
本项目展示了如何利用大型文本图像生成模型如Stable Diffusion进行零样本分类,无需额外训练。该生成分类方法在多项基准测试中表现优越,超过其他扩散模型的知识提取方法。通过从ImageNet的类条件扩散模型中提取标准分类器,该模型即使在仅使用弱增强的情况下也表现出强大的分类性能和分布转移的稳健性。本研究推进了生成模型在下游任务中的应用,是对多模态组合推理能力的重要探索。
MOFA-Video - 可控图像动画图像到视频扩散模型
Github开源项目生成模型MOFA-Video图像动画ECCV 2024混合控制
MOFA-Video项目采用稀疏到稠密运动生成和基于流的运动适配技术,能通过轨迹、关键点序列及其组合等多种控制信号将单张图像转化为动画。最新更新包括关键点面部图像动画的推理脚本和轨迹图像动画的训练代码。该项目即将亮相ECCV 2024,并提供多个演示和检查点,便于用户测试和使用。访问项目页面了解更多详情和效果展示。
scepter - 优化生成模型训练和推理的开源工具
Github开源项目图像生成生成模型开源代码库SCEPTERAlibab
SCEPTER是一个开源库,专注于生成模型的训练、微调和推理,适用于图像生成、转换和编辑任务。整合了社区常见实现与阿里巴巴同意实验室的专有方法,涵盖实用的生成框架、易用的实现方法和交互界面SCEPTER Studio,可支持自定义图像编辑任务和多种生成模型。它是AIGC研究人员与开发者的理想工具。
awesome-semi-supervised-learning - 半监督学习资源汇总,减少标注成本,提升分类效果
Github开源项目深度学习生成模型分类Semi-Supervised Learning半监督学习方法
全面整理的半监督学习资源列表,包括最新研究、代码库和各种应用。半监督学习通过结合大量无标签数据和少量有标签数据,减少标注成本并提升模型准确度。资源涵盖计算机视觉、自然语言处理、生成模型、图基方法等多个领域,适用于深度学习框架。提供详细的文献综述、代码实现以及相关书籍和讲座链接,帮助用户了解和应用半监督学习技术。
diffae - 基于扩散模型的自编码器框架实现图像生成与编辑
Github开源项目深度学习图像处理计算机视觉生成模型Diffusion Autoencoders
diffae项目实现了基于扩散模型的自编码器框架,用于高质量图像的生成和编辑。该项目提供多个预训练模型,支持FFHQ、LSUN等数据集,实现了无条件生成、图像操作和插值等功能。项目包含使用说明、模型检查点和针对不同数据集的训练脚本,为图像生成和编辑研究提供了完整的工具链。
MM-Interleaved - 创新交错图文生成模型
Github开源项目预训练多模态生成模型MM-Interleaved图像文本
MM-Interleaved是一种新型交错图文生成模型,采用创新的多模态特征同步器MMFS。它能分析高分辨率图像的多尺度特征,生成精确文本描述和匹配图像。该模型在多模态理解和生成任务中表现出色,可适用于多种应用场景。
ect - 开源框架实现高效一致性模型生成
Github开源项目深度学习图像生成生成模型一致性模型ECT
ECT是一个开源框架,采用简单原则方法实现少步生成能力。该框架仅需小幅调优即可获得显著效果,并随训练计算量增加持续提升性能。ECT允许自定义一致性模型,在CIFAR10数据集上通过1-2步迭代生成高质量图像,性能超越先进扩散模型和GAN。
chroma - 用于蛋白质设计的可编程生成模型
Github开源项目Chroma扩散模型生成模型蛋白质设计条件控制
Chroma是一个创新的蛋白质设计生成模型,结合了扩散建模、等变图神经网络和条件随机场技术。它提供多种蛋白质条件器,用于控制子结构、对称性和形状等,并支持自定义条件器开发。Chroma可高效采样全原子结构,实现骨架序列生成、侧链打包等蛋白质建模任务。在普通GPU上,Chroma能快速生成大型蛋白质复合物,为蛋白质设计领域带来新的可能性。
conditional-flow-matching - 连续正规化流模型的高效训练库
Github开源项目PyTorch生成模型Flow MatchingTorchCFM连续正规化流
TorchCFM是一个专注于条件流匹配(CFM)方法的开源库,用于高效训练连续正规化流(CNF)模型。该库提供了多种CFM变体的实现,包括OT-CFM和[SF]2M,可用于图像生成、单细胞动力学和表格数据等任务。TorchCFM旨在帮助研究人员更便捷地使用和扩展这些先进的生成模型技术,缩小CNF与扩散模型之间的性能差距。
1d-tokenizer - 创新1D图像分词框架实现高效图像处理
Github开源项目神经网络计算机视觉生成模型TiTok图像标记化
1d-tokenizer项目开发了创新的1D图像分词框架,将256×256图像压缩至32个离散标记。该技术突破2D分词限制,提供更灵活紧凑的图像表示。相比扩散模型,生成速度提升数百倍,同时维持高质量输出。研究还深入探讨1D图像分词特性,为图像处理领域开辟新方向。
RectifiedFlow - 直线路径优化的快速数据生成与传输技术
Github开源项目深度学习机器学习图像生成生成模型Rectified Flow
RectifiedFlow是一种新型机器学习方法,通过连接样本间的直线路径并学习ODE模型,建立分布间的传输映射。该方法反复优化ODE轨迹,实现高效的一步生成,在保持多样性的同时提高了FID指标。RectifiedFlow在生成建模和无监督域转移方面具有广泛应用前景,为图像生成和数据处理领域提供了新的解决方案。
bayesian-flow-networks - 将贝叶斯方法与流网络相结合的生成模型新框架
Github开源项目深度学习机器学习生成模型概率模型Bayesian Flow Networks
Bayesian Flow Networks是一个结合贝叶斯方法和流网络的生成模型框架。项目提供完整代码实现,包含连续和离散数据的贝叶斯流定义,以及连续时间和离散时间的损失函数。支持MNIST、CIFAR-10和text8等数据集的训练、测试和采样。此框架在图像和文本生成任务中表现出色,为生成模型研究开辟新方向。
SiT - 可扩展插值变换器 融合流模型和扩散模型的图像生成新方法
Github开源项目深度学习机器学习图像生成生成模型SiT
SiT项目开发了可扩展插值变换器,这是一种基于扩散变换器的生成模型。通过灵活连接分布,SiT实现了对动态传输生成模型的模块化研究。在条件ImageNet 256x256基准测试中,SiT以相同的骨架和参数超越了DiT,并通过优化扩散系数获得了2.06的FID-50K分数。项目提供PyTorch实现、预训练模型和训练脚本,推动了图像生成技术的进步。
awesome-ebm - 全面汇总能量函数模型与学习资源
Github开源项目神经网络机器学习生成模型能量模型对比散度
awesome-ebm项目汇集了能量函数模型(EBM)和能量函数学习的全面资源。包括早期至最新的相关论文、教程、讲座和开源库。涵盖EBM在图像生成、分类、密度估计、强化学习等领域的应用,为研究和开发人员提供丰富的学习参考。
Awesome-Evaluation-of-Visual-Generation - 视觉生成评估方法全面汇总
Github开源项目视频生成图像生成生成模型评估指标视觉生成评估
该资源库汇集了视觉生成评估领域的各种方法。内容涵盖图像和视频生成模型评估、样本质量评估及用户控制一致性评估等多个方面。项目详细介绍了Inception Score、Fréchet Inception Distance等经典指标及最新评估方法。同时收录了视觉生成改进研究和其他相关资源,为该领域研究者提供全面参考。
sige - 提升图像编辑效率的空间增量生成引擎
Github开源项目深度学习图像编辑生成模型SIGE卷积优化
SIGE是一种空间增量生成引擎,通过在编辑区域选择性执行计算来提高图像编辑效率。这种方法显著减少了条件生成对抗网络和扩散模型的计算量和延迟,同时保持了图像质量。SIGE对DDPM、Stable Diffusion和GauGAN等模型的性能提升明显,在NeurIPS 2022发表,并开源了代码和基准数据集。
LFM - 潜空间流匹配实现高效图像生成
Github开源项目PyTorch图像生成生成模型潜在空间Flow Matching
LFM项目创新性地将流匹配应用于预训练自编码器的潜空间,显著提升高分辨率图像生成的效率。这种方法不仅在计算资源有限的情况下保持了图像质量,还首次将条件生成任务融入流匹配框架。经过广泛测试,LFM在多个数据集上均取得了优异的定量和定性结果。
k-diffusion - 扩散模型框架支持多种采样算法和模型架构
Github开源项目PyTorch生成模型注意力机制transformerk-diffusion
k-diffusion是一个基于PyTorch的扩散模型实现框架。它支持分层Transformer模型、多种采样算法和Min-SNR损失加权。该框架提供模型包装器、CLIP引导采样功能,以及对数似然、FID和KID等评估指标的计算。k-diffusion为扩散模型研究和应用提供了实用工具。
awesome-flow-matching - 流匹配与随机插值技术推动生成模型创新
Github开源项目生成模型Flow Matching概率流插值随机插值
awesome-flow-matching项目收集了流匹配和随机插值领域的前沿研究成果,涵盖理论基础和实际应用。项目包含Flow Matching、Stochastic Interpolants等创新技术,为研究人员和开发者提供全面资源,有助于深入理解先进生成模型方法,推动人工智能领域技术进步。
awesome-AI-based-protein-design - AI蛋白质设计研究前沿资源汇总
人工智能Github开源项目深度学习生成模型蛋白质设计结构预测
本资源库汇集了AI驱动蛋白质设计领域的前沿研究成果,包括来自Nature、Science等顶级期刊的重要论文。内容涵盖概述、方法论和应用等多个方面,按类别进行组织。资源库持续更新,跟踪该领域最新进展,为研究人员提供参考。探索AI在蛋白质设计中的创新应用,关注这一不断发展的交叉学科领域。
pfgmpp - 统一扩散和泊松流的生成模型框架
人工智能Github开源项目深度学习图像生成生成模型PFGM++
PFGM++是一个统一扩散模型和泊松流生成模型的框架,通过在高维空间嵌入路径来生成数据。它可以退化为PFGM或扩散模型,并允许通过选择额外维度D来平衡模型的鲁棒性和刚性。实验显示,特定D值的PFGM++模型在CIFAR-10和FFHQ数据集上的性能超越了现有的扩散模型,并对建模误差表现出更好的鲁棒性。
DNA-Diffusion - 扩散模型生成调控DNA序列的新方法
人工智能Github开源项目生成模型基因组学DNA Diffusion调控序列
DNA-Diffusion项目利用扩散概率模型生成调控DNA序列。该项目开发基于文本提示的模型,生成特定细胞类型或上下文相关的DNA序列。这些序列具有特定调控特性,如细胞特异性染色质状态、基因表达水平调控或转录因子结合位点。该研究旨在深化对正常发育和疾病中DNA调控序列特性的理解。
minddiffusion - 将AI生成模型项目整合至新仓库
Github开源项目GitHub生成模型minddiffusionmindone项目更新
minddiffusion项目停止更新,所有扩散模型和生成模型转移至新的mindone仓库。这一变化整合了AI生成模型资源,提供更集中的开发环境。通过迁移至mindone,项目有望获得更频繁的更新和功能优化,以适应AI生成技术的快速发展。
GenerativeModels - MONAI医学影像生成模型库推动AI医疗研究
人工智能Github开源项目深度学习生成模型MONAI医学图像
GenerativeModels是MONAI项目的子项目,致力于医学影像生成模型的研究。它提供多种生成模型架构,如扩散模型和自编码器,以及医学影像专用的损失函数和评估指标。项目包含与MONAI兼容的训练引擎和丰富教程,支持研究人员进行图像合成、异常检测和超分辨率重建等任务。这些工具和资源有助于推进医学AI领域的发展。
awesome-normalizing-flows - 归一化流 构建复杂概率分布的新兴统计工具
Github开源项目深度学习机器学习生成模型概率分布归一化流
这个项目汇集了归一化流相关的优质资源,包括论文、应用案例、视频讲解、软件包和代码库等。归一化流是一种新兴统计技术,能通过可训练的光滑可逆变换链将简单分布转化为复杂分布。该资源库为研究人员和实践者提供了全面的参考材料,有助于深入了解和应用这一强大工具。
best_AI_papers_2023 - 2023年人工智能领域重大突破性研究概览
Github开源项目AI深度学习计算机视觉生成模型diffusion模型
本项目整理了2023年人工智能领域的重大突破性研究,涵盖生成式AI、机器人技术等热点方向。汇总了语音合成、图像编辑、音乐生成、视频处理、多模态语言模型等前沿技术的代表性论文,并提供视频讲解、深度分析文章和代码实现(如有)。这份精选资料展示了AI技术的最新进展,为业内人士提供了宝贵的学习参考。