Awesome-Low-Level-Vision-Research-Groups: 底层视觉研究团队汇总

计算机视觉底层视觉研究团队学术机构 Github 开源项目

Ray

Awesome-Low-Level-Vision-Research-Groups

底层视觉研究团队汇总：全球顶尖学者和机构一览

底层视觉是计算机视觉领域的重要分支,涉及图像处理、视频增强、超分辨率重建等多个研究方向。近年来,随着深度学习技术的快速发展,底层视觉研究取得了显著进展,吸引了大量优秀学者和研究机构的关注。本文对全球范围内从事底层视觉研究的顶尖团队进行了系统性的梳理和汇总,旨在为相关领域的研究者和学生提供一份全面而权威的参考资源。

中国团队引领底层视觉研究潮流

中国在底层视觉领域的研究实力近年来突飞猛进,涌现出一批世界顶尖的研究团队。其中,香港地区的研究机构表现尤为突出:

香港中文大学的贾佳亚团队在图像去雾、去雨等方向取得了突破性进展。贾佳亚教授是IEEE Fellow,曾获得CVPR、ICCV等顶会最佳论文奖,其团队开发的算法在多个公开数据集上创造了新的性能记录。

香港科技大学的陈启峰团队专注于图像/视频超分辨率重建研究。陈启峰教授曾获得CVPR最佳学生论文奖,其团队在单图像超分和视频超分领域均有重要贡献。

香港理工大学的张磊团队在图像去噪、去模糊等方向成果丰硕。张磊教授是IEEE Fellow,其团队开发的算法在工业界得到了广泛应用。

Image of Hong Kong research teams

在内地,北京大学、清华大学等顶尖高校也汇聚了一批优秀的底层视觉研究团队:

北京大学的施柏鑫团队在计算成像和照明估计方面有深入研究。施柏鑫教授是IEEE Fellow,其团队在CVPR、ICCV等顶会上发表了大量高水平论文。

清华大学的朱军团队在图像/视频压缩和传输领域颇有建树。朱军教授是IEEE Fellow,其团队与华为等企业有密切合作,多项技术已实现产业化应用。

此外,中科院自动化研究所、哈尔滨工业大学、南京理工大学等机构的研究团队也在底层视觉的不同方向做出了重要贡献。这些团队不仅在学术界发表了大量高水平论文,还与工业界保持密切合作,推动相关技术的落地应用。

美国高校引领底层视觉基础理论研究

美国高校在底层视觉的基础理论研究方面依然保持领先地位。以下几个团队尤为值得关注:

麻省理工学院的William T. Freeman团队在计算摄影学和视觉感知方面有深入研究。Freeman教授是计算机视觉领域的泰斗级人物,其团队在CVPR、SIGGRAPH等顶会上发表了大量开创性工作。

加州大学伯克利分校的Alexei A. Efros团队专注于图像合成与编辑。Efros教授是SIGGRAPH终身成就奖获得者,其团队开发的算法在图像生成和编辑领域广受关注。

卡内基梅隆大学的Srinivasa Narasimhan团队在计算摄影和多光谱成像方面颇有建树。Narasimhan教授是IEEE Fellow,其团队与多家科技公司有密切合作。

Image of US research teams

这些美国高校的研究团队不仅产出了大量高质量论文,还培养了众多优秀人才,为底层视觉领域的发展做出了重要贡献。

欧洲团队在特定方向保持优势

欧洲的一些研究机构在底层视觉的特定方向保持着领先优势:

苏黎世联邦理工学院的Luc Van Gool团队在3D视觉和场景理解方面有深入研究。Van Gool教授是计算机视觉领域的著名学者,其团队开发的算法在自动驾驶等领域得到了广泛应用。

德国维尔茨堡大学的Radu Timofte团队在图像超分辨率重建方向颇有建树。Timofte教授组织了多届NTIRE挑战赛,极大推动了该领域的发展。

英国布里斯托大学的David Bull团队专注于视频压缩和质量评估研究。Bull教授是IEEE Fellow,其团队与BBC等机构有密切合作。

这些欧洲团队虽然规模相对较小,但在各自的研究方向上均取得了突出成果,为底层视觉领域的多样化发展做出了重要贡献。

亚洲其他国家和地区的优秀团队

除中国外,亚洲其他国家和地区也有一些优秀的底层视觉研究团队值得关注:

新加坡国立大学的Robby T. Tan团队在恶劣天气下的图像增强方面有深入研究。Tan教授是IEEE Fellow,其团队开发的算法在智能驾驶等领域有重要应用。

韩国首尔国立大学的Kyoung Mu Lee团队在视频超分辨率重建和插帧方面颇有建树。Lee教授曾获得CVPR最佳论文奖,其团队与三星等企业有密切合作。

日本早稻田大学的Edgar Simo-Serra团队专注于图像编辑和修复研究。Simo-Serra教授是年轻有为的学者,其团队开发的算法在图像处理软件中得到了广泛应用。

Image of Asian research teams

这些亚洲团队近年来在国际顶级会议和期刊上发表了大量高质量论文,展现出强劲的研究实力,正逐步缩小与欧美顶尖团队的差距。

结语

通过对全球范围内从事底层视觉研究的顶尖团队进行系统梳理,我们可以清晰地看到该领域的研究热点和发展趋势。中国团队在多个方向上已经跻身世界一流行列,美国高校在基础理论研究方面依然保持领先,欧洲和亚洲其他国家的团队则在特定方向展现出独特优势。

未来,随着人工智能技术的进一步发展,底层视觉研究有望在更多领域发挥重要作用。对于有志于从事相关研究的学生和学者而言,本文汇总的这些顶尖团队无疑是极具参考价值的学习对象。同时,我们也期待看到更多优秀的研究团队涌现,推动底层视觉领域不断向前发展,为人类视觉感知和图像处理能力的提升做出更大贡献。

相关资源

这些资源汇总了近年来底层视觉领域的重要会议论文和研究团队,对相关研究者有很高的参考价值。

0

0

0

相关项目

Project Cover

vit-base-patch32-384

Vision Transformer（ViT）是一款图像分类模型，采用Transformer编码器架构，通过将图像分割为固定大小patch进行处理。模型在包含1400万张图像的ImageNet-21k数据集完成预训练，并在ImageNet-1k数据集上进行384x384分辨率的微调。提供预训练权重，可直接应用于图像分类或迁移学习任务。

Project Cover

yolov10n

YOLOv10n项目展示了对象检测的实时进展，结合计算机视觉与对象识别算法。其基于PyTorch的实现并支持COCO数据集用于训练与推理，保证了性能和应用的广泛性。简单的安装和模块调用，提供了快速的目标物体检测及识别功能，支持优化模型上传至相关平台，提升模型精度与效率。

Project Cover

detr-resnet-50-panoptic

DETR-ResNet-50是一种创新的目标检测模型，融合了Transformer和卷积神经网络技术。该模型在COCO数据集上训练，支持端到端的目标检测和全景分割。通过100个对象查询机制，DETR实现了高效准确的目标识别。在COCO 2017验证集上，模型展现出优秀性能：框AP为38.8，分割AP为31.1，全景质量(PQ)达43.4。这一模型为计算机视觉任务提供了新的解决方案。

Project Cover

llava-v1.6-34b

模型在大规模多模态模型和聊天机器人领域的研究中有重要应用，采用多样化的数据集提升不同任务表现，适合计算机视觉、自然语言处理及人工智能的研究者使用。

Project Cover

tiny-random-llava-1.5

tiny-random-llava-1.5是一个基于LLaVA-1.5架构的轻量级多模态模型配置工具。通过自定义配置参数，如减少隐藏层数量、缩小中间层大小和降低注意力头数，该工具显著缩减了模型规模。它支持快速原型开发和测试，并可将模型和处理器轻松推送至Hugging Face Hub。这个工具主要用于多模态AI应用的快速验证和实验，适合开发者进行初步测试和概念验证。

Project Cover

Tarsier-7b

Tarsier-7b是一个开放源代码的视频语言模型，专注于视频描述和理解。该模型使用两阶段的训练策略以增强性能，能够生成高质量的视频描述。训练过程包括多任务预训练和多粒度微调，并通过多种数据集进行评估，从而保证出色性能。适合从事计算机视觉与自然语言处理研究的研究人员和爱好者使用，可在相关平台获取更多信息。

Project Cover

vit-base-patch32-224-in21k

Vision Transformer (ViT) 是一种基于transformer架构的视觉模型，在ImageNet-21k数据集上预训练。该模型将图像转换为固定大小的patch序列，通过线性嵌入和位置编码输入transformer编码器。ViT可应用于图像分类等多种视觉任务，只需在预训练编码器上添加任务特定层。模型在224x224分辨率下训练，批量大小为4096，在多项图像分类基准测试中展现出优秀性能。

Project Cover

ddcolor_paper_tiny

DDColor的预训练模型通过双解码器为图像上色提供高质量的解决方案，确保照片级的真实感。页面提供了有关模型的详细信息，包括关键功能和优势，用户可查阅相关文献和GitHub代码库以获取更多技术细节。该技术在图像处理领域展示出显著潜力，是研究的重要资源。

Project Cover

siglip-base-patch16-512

SigLIP在CLIP架构基础上改进了损失函数设计，使用Sigmoid损失函数处理图像-文本对训练。该模型在WebLI数据集上预训练，支持512x512分辨率的图像输入，主要应用于零样本图像分类和图文检索。相比CLIP，新的损失函数无需全局相似度归一化，使模型在不同批量规模下都能保持稳定表现。

相关文章

Article Cover

人工智能顶级会议录用率分析:从数据看AI研究的发展趋势

Article Cover

SmartOpenCV: 增强Android端OpenCV图像预览功能的开源库

Article Cover

SmartOpenCV: Android端OpenCV增强库的革新之作

Article Cover

OpenCV:开源计算机视觉库的领军者

Article Cover

Supervision: 强大的计算机视觉工具库

Article Cover

CVAT:开源计算机视觉标注工具的领军者

Article Cover

FiftyOne: 构建高质量数据集和计算机视觉模型的开源工具

Article Cover

GluonCV: 先进的计算机视觉深度学习工具包

Article Cover

计算机视觉论文速递:每日更新的CV/AI优质论文资源库

最新项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号