Project Icon

mixture-of-experts

PyTorch实现的稀疏门控专家混合层

mixture-of-experts项目提供PyTorch版本的稀疏门控专家混合层实现,基于'Outrageously Large Neural Networks'论文。该实现支持自定义专家数量和输入输出维度,并提供训练和评估示例。项目包含CIFAR-10数据集应用实例,展示实际性能。作为深度学习工具,它有助于构建大规模高效的神经网络模型。

gen-efficientnet-pytorch - 泛型EfficientNet和其它高效PyTorch模型的实现
EfficientNetGithubMixNetMobileNetPyTorch开源项目模型
本项目实现了EfficientNet、MixNet、MobileNetV3等多种高效模型,利用通用架构定义支持多种计算高效的神经网络。所有模型均基于MobileNet V1/V2块序列设计,并支持字符串化架构配置。请注意,该项目现已停止维护,推荐使用`timm`库获取更多功能和权重兼容的模型。
mlp - 多层感知器实现n-gram语言模型的开源项目
GithubPyTorch多层感知器开源项目神经网络自动微分自然语言模型
该项目基于Bengio等人2003年的论文,实现了多层感知器(MLP)作为n-gram语言模型。项目提供C、NumPy和PyTorch三种实现,展示了从底层操作到高级抽象的不同层次。通过对比,突出了PyTorch在Tensor处理、自动微分和深度学习层构建方面的优势。相比传统n-gram模型,此方法以较少参数实现更低验证损失,但训练成本较高。
Deep-Learning-Experiments - 深度学习实验和课程指南,涵盖理论与实践
Deep LearningGithubLLMPyTorchSupervised LearningTransformer开源项目
本页面介绍2023版深度学习实验课程,包括理论与实践内容。涵盖监督学习、多层感知器、优化、正则化、卷积神经网络、变压器、自编码器、生成对抗网络和大型语言模型等主题,并提供开发环境、Python、Numpy、PyTorch及Gradio的实践指南。所有文档和代码示例在GitHub上提供,帮助学习者掌握深度学习技术。
bayesian-torch - 贝叶斯神经网络层和不确定性估计的PyTorch扩展库
Bayesian-TorchGithubPyTorch不确定性估计变分推断开源项目深度学习
Bayesian-Torch是PyTorch的扩展库,用于在深度学习模型中实现贝叶斯推理和不确定性估计。它提供贝叶斯层,支持将确定性神经网络转换为贝叶斯形式。库包含变分推理、MOPED、量化和AvUC损失等功能,适用于不确定性感知应用。研究人员和开发者可利用Bayesian-Torch构建更可靠、可解释的AI模型。
mmengine - 深度学习训练引擎支持大规模模型训练和多种策略
GithubMMEngineOpenMMLabPyTorch开源项目深度学习训练引擎
MMEngine是基于PyTorch的深度学习模型训练基础库,作为OpenMMLab代码库的训练引擎。它集成主流大规模模型训练框架,支持混合精度训练等多种策略,提供友好的配置系统和主流监控平台支持。MMEngine不仅适用于OpenMMLab项目,还可广泛应用于其他深度学习项目。
pytorch-dnc - PyTorch实现的差分神经计算机及相关模型库
DNCGithubSAMSDNC开源项目神经网络记忆增强
这个PyTorch库实现了差分神经计算机(DNC)、稀疏访问存储器(SAM)和稀疏差分神经计算机(SDNC)等模型。它提供灵活API用于构建和训练这些神经网络,支持多层控制器、共享内存等配置。库中还包含复制和加法等基准任务,以及内存可视化功能,有助于开发和评估基于外部存储的神经网络模型。
ESFT - 专家专门化微调提升稀疏大语言模型性能
ESFTGithub专家混合大语言模型开源项目效率提升模型微调
ESFT项目提出专家专门化微调方法,针对Mixture-of-Experts架构的大语言模型进行高效定制。通过仅调整任务相关部分,该方法提高了模型效率和性能,同时降低资源消耗。项目开源了训练代码和评估脚本,方便研究人员应用于自有模型和数据集。这一技术为大规模语言模型的个性化和优化提供了新思路。
LeNet5-MNIST-PyTorch - PyTorch实现LeNet-5识别MNIST数据集
GithubLeNet-5MNISTPyTorch图像识别开源项目深度学习
这是一个开源深度学习项目,使用PyTorch实现LeNet-5卷积神经网络识别MNIST数据集。项目采用MaxPooling和ReLU,测试集精度达99%。包含完整代码实现,涵盖数据处理、模型训练和评估。适合深度学习初学者学习卷积神经网络基础知识。
deepseek-moe-16b-base - 采用稀疏混合专家架构的开源大语言模型
DeepSeek MoEGithubHuggingface人工智能代码生成开源项目机器学习模型模型训练
DeepSeek MoE 16B Base是一个基于稀疏混合专家(MoE)架构的开源大语言模型,支持商业应用。模型使用bfloat16格式,可通过Transformers库调用,擅长文本生成和补全。它采用查询-键值对映射的注意力机制,高效处理自然语言处理任务。该项目遵循MIT许可,提供详细文档和示例代码,便于开发者集成使用。
multimodal - PyTorch多模态模型开发框架
GithubPyTorchTorchMultimodal多模态模型开源项目机器学习深度学习
TorchMultimodal是基于PyTorch的多模态模型开发框架,提供模块化构建块和预训练模型,支持ALBEF、BLIP-2、CLIP等多种架构。该框架包含训练、微调和评估示例,可用于构建内容理解和生成模型。TorchMultimodal整合了PyTorch生态系统,便于研究人员复现和开发先进的多模态多任务模型。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号