Project Icon

ivis

基于神经网络的高维数据降维和可视化算法

ivis是一种基于暹罗神经网络的数据降维算法,专门用于处理高维数据集。该算法支持无监督和有监督学习,能够有效保持数据的局部和全局结构。ivis适用于大规模数据集,支持多种数据格式,包括numpy数组、稀疏矩阵和hdf5文件。它在聚类、异常检测等任务中表现出色,为数据分析提供了强大的可视化工具。ivis算法采用基于三元组的神经网络结构,能够高效处理百万级数据点和上千维特征,在保持数据结构方面常常优于t-SNE等传统方法。支持新数据点的转换,可以轻松集成到sklearn管道中,在高维数据可视化、聚类分析和异常检测等领域具有广泛应用前景。

ScreenAI - 深度理解界面和信息图的视觉语言模型
GithubScreenAIUI理解信息图表理解多模态开源项目视觉语言模型
ScreenAI是一个开源的多模态视觉语言模型,专注于用户界面(UI)和信息图的理解。该模型集成了视觉变换器(ViT)、注意力机制和前馈网络,能够处理图像和文本输入。通过深度学习技术,ScreenAI实现了对复杂视觉信息的处理和文本整合分析,为UI设计、信息可视化和人机交互研究提供了新的工具和方法。
Vim - 基于双向状态空间模型的高效视觉表示学习
GithubVision Mamba图像分类开源项目深度学习状态空间模型视觉表示学习
Vision Mamba是一种基于双向Mamba块的新型视觉主干网络。该模型通过位置嵌入和双向状态空间模型处理图像序列,在ImageNet分类、COCO目标检测和ADE20k语义分割等任务上表现优异。与DeiT等视觉Transformer相比,Vision Mamba不仅性能更高,还大幅提升了计算和内存效率。其在高分辨率图像特征提取方面的出色表现,使其有潜力成为新一代视觉基础模型的核心架构。
big_vision - 基于Jax/Flax的大规模视觉模型训练框架
GithubJaxbig vision开源项目模型训练深度学习计算机视觉
Big Vision是一个用于训练大规模视觉模型的开源代码库。它基于Jax/Flax构建,支持在Cloud TPU VM和GPU上运行。该项目采用tf.data和TensorFlow Datasets实现高效的数据处理,可无缝扩展至2048个TPU核心的分布式环境。Big Vision涵盖了视觉Transformer、多模态学习、知识蒸馏等多个研究方向,为大规模视觉实验提供了可靠的基础。
ViTamin - 推动计算机视觉进入新时代的可扩展视觉语言模型
GithubViTamin图像处理开源项目深度学习视觉语言模型计算机视觉
ViTamin是一系列可扩展的视觉语言模型,在图像分类、开放词汇检测和分割等任务上取得突破。以436M参数量在DataComp-1B数据集训练,实现82.9%的ImageNet零样本准确率。在7个开放词汇分割基准测试中创新纪录,并提升大型多模态模型能力。获timm和OpenCLIP官方支持,提供简单接口。ViTamin为计算机视觉领域带来新的可能性。
NN-SVG - 高效自动生成神经网络架构图的工具
GithubNN-SVGSVG文件开源项目机器学习深度学习神经网络
NN-SVG是一款通过参数化方式创建神经网络架构图的工具,支持导出为SVG文件,适用于学术论文和网页。它能生成经典全连接神经网络、卷积神经网络和深度神经网络图形,使用D3和Three.js库,用户可自定义图形大小、颜色和布局。该工具旨在节省机器学习研究人员的时间,并可作为教学工具使用。
ISBNet - 高效准确的3D点云实例分割网络实现先进场景理解
3D点云GithubISBNet实例分割开源项目深度学习计算机视觉
ISBNet是一种创新的3D点云实例分割网络,采用实例感知采样和框感知动态卷积技术。通过多任务学习方法和轴对齐边界框预测,ISBNet在ScanNetV2、S3DIS和STPLS3D等数据集上实现了领先的分割精度,同时保持快速推理速度。该方法有效解决了密集场景中相同语义类别物体的分割问题,为3D场景理解提供了新的解决方案。
Vizly - 智能数据分析与可视化平台
AI工具AI模型可视化数据分析文件处理洞察力
Vizly是一个基于AI的数据分析平台,支持与数据对话,快速生成可视化和统计分析。这款AI数据分析工具兼容Excel、SPSS等多种文件格式,提供数据清理和机器学习功能。用户只需用简单语言提问,系统即可自动生成Python或R代码进行分析,提供实用见解。适用于数据科学、研究、教学和商业决策等领域,Vizly能高效将数据转化为有价值的信息。平台还具备分享和导出分析报告的功能,便于结果传播和应用,是Excel AI分析的理想选择。
csinva.github.io - 机器学习与神经科学的互动演示和详尽笔记资源
Githubcsinva因果推断开源项目机器学习研究笔记神经科学
提供机器学习、统计学及神经科学的全面笔记、演示文稿和研究概述,涵盖可解释性、因果推断、迁移学习和不确定性等主题。用户可以访问实用的备忘单和课程笔记,了解最新的研究进展。资源来源包括Chandan在UC Berkeley读博期间积累的丰富资料,适用于相关领域的研究和教学人员。
EVA - 推进大规模视觉表示学习的前沿
CLIPEVAGithub多模态学习开源项目自监督学习视觉表示
EVA是北京智源人工智能研究院开发的视觉表示学习模型系列。它包括多个子项目,如EVA-01和EVA-CLIP,致力于探索大规模掩码视觉表示学习的极限和改进CLIP训练技术。这些模型在主流平台上提供,为计算机视觉研究提供了有力支持。EVA项目涵盖基础模型、自监督学习和多模态学习等前沿领域。
NeuralFlow - Mistral 7B模型中间层输出可视化工具
GithubMistral 7BNeural Flow中间层输出开源项目微调模型可视化
NeuralFlow是一个Python工具,用于可视化Mistral 7B语言模型的中间层输出。它生成512x256的热图,展示模型每层的输出。该工具可用于分析模型结构和监控fine-tuning过程中的变化。NeuralFlow将4096维张量数据转化为直观的视觉表现,为AI模型开发提供新的分析方法。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号