Project Icon

slimsam-77-uniform

Transformers.js中的ONNX模型兼容性和遮罩生成

该开源项目利用ONNX权重,使Transformers.js库兼容,实现AI模型在网页上的遮罩生成。允许通过JavaScript轻松进行图像处理,支持从模型中加载图像和处理器,使用2D定位点生成遮罩并计算IoU分数。项目提供在线演示,方便用户体验实时图像分割,建议将模型转换为ONNX格式以便于网页使用。

other - 高性能开源自然语言处理框架
GithubHuggingfacetransformers人工智能开源项目机器学习模型深度学习自然语言处理
Transformers是一个开源的自然语言处理框架,提供多种预训练模型和工具。支持文本分类、问答和生成等任务,适用于研究和生产环境。该框架易用且灵活,可处理多语言文本,支持迁移学习。Transformers定期更新,紧跟NLP领域最新进展,为用户提供丰富的API和优化的性能。
MobileSAM - 高效轻量化图像分割模型,适用于移动设备
AI模型GithubMobileSAM图像分割开源项目深度学习计算机视觉
MobileSAM是一种轻量级图像分割模型,专为移动应用优化。它保持了与原始SAM相当的性能,同时大幅减少了模型参数和推理时间。通过将ViT-H编码器替换为TinyViT,MobileSAM将参数量从615M降至9.66M,推理速度从456ms提升至12ms。该项目提供完整的训练和使用文档,支持ONNX导出,可轻松集成到现有SAM项目中。
generative-ai-js - 使用Google DeepMind的Gemini API进行多模态数据处理的工具
Gemini APIGithubGoogle AI SDKGoogle DeepMindJavaScriptmultimodal开源项目
Google AI JavaScript SDK让开发者方便地使用Google DeepMind的Gemini API进行多模态数据处理,包括文本、图像和代码。建议仅在服务器端调用API以保护API密钥安全。项目提供了详细的使用指南和示例代码,帮助快速上手Node.js应用。查看更多有关SDK的文档和贡献指南,以确保最佳使用体验。
openvision - 通过开源项目OpenVision体验无缝结合Midjourney美学的图像风格
AI生成BittensorGithubHuggingfaceMidjourney风格OpenVision图像增强开源项目模型
OpenVision项目融合了Midjourney的独特美学,生成的图像无需后期调整仍具风格和细节表现,尤其在人像图像的处理上更加出色。该项目通过Bittensor网络生成,支持构建去中心化的开源AI模型,可使用diffusers和StableDiffusionXLPipeline轻松实现图像创建。
mask2former-swin-large-cityscapes-semantic - Mask2Former大型语义分割模型 适用多种图像分割任务
GithubHuggingfaceMask2Former图像分割开源项目模型深度学习计算机视觉语义分割
Mask2Former是一款先进的语义分割模型,基于Swin骨干网络在Cityscapes数据集上训练。该模型采用统一的掩码预测方法,可同时处理实例、语义和全景分割任务。通过引入多尺度可变形注意力Transformer和带掩码注意力的Transformer解码器,Mask2Former在性能和效率上均超越了先前的最佳模型。它为研究人员和开发者提供了一个强大的工具,可用于各种图像分割应用。
transformer-models - MATLAB深度学习变换器模型实现库
BERTGithubMATLABTransformer开源项目深度学习自然语言处理
该项目提供MATLAB环境下的多种深度学习变换器模型实现,包括BERT、FinBERT和GPT-2。支持文本分类、情感分析、掩码标记预测和文本摘要等自然语言处理任务。项目特点包括预训练模型加载、模型微调、详细示例和灵活API,可用于研究和实际应用。
SpA-Former-shadow-removal - Transformer模型实现高效图像去阴影
GithubIJCNN 2023SpA-FormerTransformer图像阴影去除开源项目注意力机制
SpA-Former是一种基于Transformer的图像去阴影模型,采用空间注意力机制提取阴影特征。在ISTD数据集上,该模型在PSNR、SSIM和RMSE指标方面表现出色。SpA-Former具有参数量少、计算效率高的特点,适用于实际场景的阴影去除。该研究已在IJCNN 2023会议发表,并开源了预训练模型和测试结果,便于研究者复现和对比。
tfjs-examples - TensorFlow.js机器学习示例集 涵盖浏览器和Node.js应用
GithubJavaScriptTensorFlow.js开源项目机器学习浏览器深度学习
tfjs-examples是一个包含多种TensorFlow.js机器学习示例的项目。涵盖图像分类、文本生成、强化学习等领域,展示了TensorFlow.js在浏览器和Node.js环境中的应用。示例包括模型训练和推理部署,为开发者提供了实用的学习资源和参考案例。
attention-viz - 帮助理解Transformer模型在语言和视觉任务中的自注意力机制
GithubTransformerattention-viz可视化开源项目深度学习自然语言处理
此项目通过可视化技术帮助研究人员理解Transformer模型在语言和视觉任务中的自注意力机制,展示查询与关键向量的关系和整体模式。AttentionViz提供了交互式工具,支持多输入序列分析,提升了模型理解,并在多个应用场景中展现其实用性。
PixArt-XL-2-512x512 - 快速生成高分辨率图像的高效能模型
GithubHuggingfacePixart-α开源项目扩散模型文本到图像模型深度学习生成模型
PixArt-α是一个基于Transformer架构的文本到图像生成框架,能够从文本提示生成高分辨率图像,最高可达1024像素。相比于Stable Diffusion v1.5,其训练时间仅为10.8%,大幅降低成本与碳排放。用户偏好评估显示,PixArt-α在实现效率与图像质量方面表现卓越,适用于艺术创作、教育用途及生成模型研究。但需要注意的是,其在图像还原现实性和复杂任务的执行上尚有局限。查看其GitHub或arXiv以了解更多细节。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

Project Cover

天工AI音乐

天工AI音乐平台支持音乐创作,特别是在国风音乐领域。该平台适合新手DJ和音乐爱好者使用,帮助他们启动音乐创作,增添生活乐趣,同时发现和分享新音乐。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号