Project Icon

FourierKAN

基于傅里叶变换的PyTorch神经网络层

FourierKAN是一个基于傅里叶变换的PyTorch神经网络层,旨在替代传统的线性层和非线性激活组合。该项目受Kolmogorov-Arnold网络启发,采用一维傅里叶系数,提高了优化效率和数值稳定性。FourierKAN支持CPU和GPU运行,并提供了训练策略和正则化方法。其核心优势在于潜在的内存效率和性能提升,为深度学习模型设计开辟了新的可能性。

Nonstationary_Transformers - 创新时间序列预测方法应对非平稳数据
GithubNon-stationary Transformers开源项目时间序列预测模型架构注意力机制深度学习
Non-stationary Transformers项目开发了新型时间序列预测方法,采用系列平稳化和去平稳注意力机制处理非平稳数据。该方法在多个基准数据集上展现出优异性能,并能有效提升现有注意力模型的预测效果。项目开源了完整代码和实验脚本,为时间序列预测研究和应用提供了重要参考。
gpytorch - 基于PyTorch实现的灵活高斯过程建模工具
GPU加速GPyTorchGaussian processGithubKISS-GPPyTorch开源项目
GPyTorch是一个基于PyTorch实现的高斯过程库,旨在简便地创建可扩展、灵活的高斯过程模型。它通过数值线性代数技术实现了显著的GPU加速,并集成了如SKI/KISS-GP和随机Lanczos展开等先进算法,同时能与深度学习框架无缝结合。支持Python 3.8及以上版本。更多信息、示例和教程请参阅官方文档。
pytorch-fid - 生成对抗网络图像质量评估工具
FIDFréchet Inception DistanceGANsGithubPyTorchTensorflow开源项目
pytorch-fid是一款用于计算生成对抗网络(GAN)样本质量的Fréchet Inception Distance(FID)分数的工具。该工具将官方的Tensorflow实现移植到PyTorch,确保相似的准确性和方便性。用户可以自由选择特征层,适应不同的数据集,还支持GPU加速和保存原始数据集的统计信息,便于进行多模型比较,适合研究和开发高质量图像生成模型。
KAN-TTS - TTS语音合成训练框架
GithubKAN-TTSModelScope开源项目文本转语音模型语言支持
KAN-TTS能够提供从零开始训练个性化文本到语音模型的能力。支持包括sam-bert和hifi-GAN在内的多种模型,并持续进行模型更新。支持多种语言,包括普通话、英语等。详尽的培训教程和在线演示可在官方网站查阅。如有疑问,欢迎联系我们。
returnn - 多GPU优化的Theano/TensorFlow循环神经网络框架
GithubLSTMRETURNN多GPU环境开源项目神经网络训练速度
RETURNN是一个基于Theano和TensorFlow的现代循环神经网络框架,优化于多GPU环境下的快速可靠训练。其主要特点包括简便的配置与调试、支持多种实验模型,以及高效的训练和解码速度。项目还支持小批量训练、序列分块训练、长短期记忆网络、多维LSTM和大数据集内存管理,广泛应用于机器翻译和语音识别领域。RETURNN提供详尽的文档和使用教程,并通过StackOverflow标签提供社区支持。
ncps - NCP、LTC 和 CfC 有线神经模型的 PyTorch 和 TensorFlow 实现
CfCGithubLTCNeural Circuit PoliciesPyTorchTensorFlow开源项目
神经电路策略(NCPs)是一种设计稀疏递归神经网络的方法,灵感来源于秀丽隐杆线虫的神经系统。该开源项目提供与PyTorch和TensorFlow兼容的模块,增强可审计的自主性。其安装步骤简便,并且提供了丰富的文档和互动教程,帮助用户从基础到复杂模型的创建。多种示例和教程,包括在Google Colab上的演示,让用户快速掌握NCPs的应用。
vocos - 基于傅里叶变换的快速神经声码器
GithubVocos开源项目深度学习神经声码器语音技术音频合成
Vocos是一款创新的神经声码器,通过生成频谱系数而非时域样本来合成音频波形。它采用GAN训练,支持从梅尔频谱图和EnCodec令牌重建音频,实现了快速高效的音频合成。Vocos的独特设计弥合了时域和傅里叶域神经声码器之间的差距,为音频合成领域提供了新的解决方案。
Comprehensive-Transformer-TTS - 基于非自回归 Transformer 的 TTS
GithubPyTorchTTS开源项目持续时间建模语音合成非自回归变换器
该项目采用非自回归Transformer技术,集成多种最新状态转换模型。Comprehensive-Transformer-TTS不仅提供监督与非监督持续时间建模, 也支持多种数据集和SOTA技术,如Fastformer和Long-Short Transformer,力求在文本到语音转换领域取得领先成果。
Keras-GAN - 多种生成对抗网络(GAN)的Keras实现与教程
GithubKeras-GAN图像生成开源项目机器学习深度学习生成对抗网络
该项目包含多种Keras实现的生成对抗网络(GAN),如AC-GAN、CycleGAN、Pix2Pix等,基于研究论文,提供核心概念的实现与详细教程。欢迎社区贡献以扩展更多GAN变体。
EEG-ATCNet - 创新深度学习模型提升运动想象分类
ATCNetEEGGithub开源项目注意力机制深度学习脑机接口
EEG-ATCNet是一种创新的深度学习模型,专门用于脑机接口中EEG信号的运动想象分类。该模型融合卷积神经网络、自注意力机制和时间卷积网络,有效提取EEG信号时空特征。在BCI竞赛IV-2a数据集上,EEG-ATCNet准确率达81.10%,优于其他常用模型。项目还实现了多种注意力机制和数据处理方法,为EEG信号分析研究提供了实用工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

Project Cover

天工AI音乐

天工AI音乐平台支持音乐创作,特别是在国风音乐领域。该平台适合新手DJ和音乐爱好者使用,帮助他们启动音乐创作,增添生活乐趣,同时发现和分享新音乐。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号