Project Icon

DeepLagrangianFluids

拉格朗日流体模拟的连续卷积神经网络方法

DeepLagrangianFluids项目实现了基于连续卷积的粒子流体模拟网络,源于ICLR 2020会议发表的研究成果。项目包含数据生成、模型训练和预训练模型运行的完整代码,支持PyTorch和TensorFlow框架,并集成Open3D等库实现高效模拟与可视化。这种新方法在流体动力学模拟的准确性和计算效率方面取得了显著进展。

StreamDiffusion - 高性能实时AI图像生成框架
AI绘图GithubStreamDiffusion图像处理实时生成开源项目深度学习
StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。
conditional-flow-matching - 连续正规化流模型的高效训练库
Flow MatchingGithubPyTorchTorchCFM开源项目生成模型连续正规化流
TorchCFM是一个专注于条件流匹配(CFM)方法的开源库,用于高效训练连续正规化流(CNF)模型。该库提供了多种CFM变体的实现,包括OT-CFM和[SF]2M,可用于图像生成、单细胞动力学和表格数据等任务。TorchCFM旨在帮助研究人员更便捷地使用和扩展这些先进的生成模型技术,缩小CNF与扩散模型之间的性能差距。
Learning-Scientific_Machine_Learning_Residual_Based_Attention_PINNs_DeepONets - 物理信息机器学习在科学计算中的应用与进展
DeepONetsGithubPIMLPINNsRBA开源项目物理信息机器学习
本项目聚焦物理信息神经网络(PINNs)、DeepONets和基于残差的注意力机制(RBA)等科学机器学习技术。内容涵盖从基础概念到高级应用的教程,包括函数逼近、ODE/PDE求解与发现等。项目呈现了PINNs领域的最新研究成果,尤其是RBA在提升性能方面的应用。这些资源对于物理信息机器学习领域的研究人员和工程师具有重要参考价值。
gmflow - 利用全球匹配提高光流估计的准确性与效率
GMFlowGithub光流估计全局匹配开源项目高效率高精度
GMFlow将光流重新定义为全球匹配问题,简化了光流估计流程。它提供灵活的模块化设计,可以轻松构建定制模型,并在高端GPU上显著加速。该项目在Sintel基准测试中表现出高准确性和效率,预训练模型适用于FlyingChairs、FlyingThings3D和KITTI等数据集。新更新扩展了GMFlow至立体和深度任务,并提供更多速度和准确性的选择。
videollm-online - 流式视频实时理解与交互的先进模型
GithubVideoLLM-online大语言模型实时交互开源项目流媒体视频视频处理
VideoLLM-online是一款针对流媒体视频的在线大语言模型。该模型支持视频流实时交互,可主动更新响应,如记录活动变化和提供实时指导。项目通过创新的数据合成方法将离线注释转化为流式对话数据,并采用并行化推理技术实现高速处理,在A100 GPU上处理速度可达10-15 FPS。VideoLLM-online在在线和离线环境中均表现出色,能高效处理长达10分钟的视频,为视频理解与交互领域带来新的可能性。
gflownet - 基于图神经网络的离散对象生成框架
GFlowNetGithub图生成开源项目机器学习神经网络组合优化
gflownet是一个实现Generative Flow Network的开源框架,专注于离散和组合对象的生成,尤其适用于图结构。该项目基于图神经网络,支持多种GFN算法,提供离线和在线训练功能。gflownet包含完整的训练环境、算法实现和示例代码,可用于分子设计等任务,是研究GFN在图生成领域应用的有力工具。
graphics - 深度学习与计算机图形学的融合框架
3D视觉GithubTensorFlow Graphics开源项目机器学习神经网络计算机图形学
TensorFlow Graphics是一个融合深度学习与计算机图形学的开源框架。它提供可微分的图形和几何层,包括相机模型、反射模型、空间变换和网格卷积等,同时支持3D可视化。这些工具可用于开发和优化3D视觉任务的机器学习模型,如物体姿态估计、材质分析和语义分割。该框架致力于帮助研究人员和开发者更高效地解决复杂的3D视觉问题。
OpenFLUX.1 - 可定制的高速图像生成开源模型
AI绘图GithubHuggingfaceOpenFLUX.1图像生成开源开源项目模型模型微调
OpenFLUX.1是FLUX.1-schnell模型的改进版本,移除了蒸馏限制,支持进一步微调。该模型采用经典CFG方法,可在1-4步内生成高质量图像,为开发者提供了灵活的图像生成解决方案。OpenFLUX.1使用Apache 2.0许可,目前处于beta 0.1.0阶段,正在持续优化中。
Diffusion_models_from_scratch - 完整实现扩散模型的开源框架与教程
Diffusion模型GithubImageNetU-Net图像生成开源项目预训练模型
该项目提供了一个完整的扩散模型实现框架,包含DDPM、DDIM和无分类器引导模型。项目特点包括:基于ImageNet 64x64数据集的预训练模型、详细的环境配置和数据准备指南、全面的训练和推理脚本,以及多种模型架构和优化策略。开发者可以利用此框架轻松训练自定义扩散模型或使用预训练模型生成图像。
oneflow - 用户友好且高效扩展的深度学习框架
CUDA支持GithubOneFlowPyTorch API分布式训练开源项目深度学习框架
OneFlow是一款深度学习框架,提供类似PyTorch的API,支持n维并行执行的全局张量以及图编译器用于加速和部署模型。最新版本1.0.0已发布,兼容Linux和多个Python版本。用户可以通过Docker或Pip轻松安装,并利用丰富的文档和模型库快速上手,适合大型变压器模型的并行训练和计算机视觉任务。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号