#CLIP模型

photo-similarity-search - CLIP模型照片相似性搜索引擎

Embed-PhotosCLIP模型图像搜索相似图片Apple SiliconGithub开源项目

Embed-Photos是一个高效的照片相似性搜索引擎，利用CLIP模型根据文本描述寻找视觉相似的图像。该项目仅支持Apple Silicon平台，使用SQLite和Chroma实现图像嵌入的持久存储，提供便捷的网络接口以便用户进行交互和探索。其特点包括安全的图像处理、性能监控和可配置的设置，用户只需简单设置环境变量即可启动使用。

datacomp - 多模态预训练数据集构建的创新竞赛

DataCompCLIP模型数据集图像文本对机器学习Github开源项目

DataComp是一项聚焦于多模态预训练数据集设计的竞赛。参赛者需从海量未筛选的图像-文本对中构建高质量数据集，以提升CLIP模型在下游任务的表现。竞赛设有两个赛道和四个规模，适应不同计算资源需求。项目提供完整工具包，涵盖数据获取、模型训练和评估等环节，支持参与者进行数据集创新。

SAN - 轻量高效的开放词汇语义分割框架

开放词汇语义分割Side Adapter NetworkCLIP模型视觉语言模型语义分割Github开源项目

Side Adapter Network (SAN)是一个开放词汇语义分割框架，将分割任务建模为区域识别问题。它在冻结的CLIP模型旁附加轻量级侧网络，实现高效准确的分割。SAN在多个语义分割基准测试中表现优异，具有更少的可训练参数和更快的推理速度。这一方法为开放词汇语义分割领域提供了新的解决思路。

stable-diffusion-safety-checker - 基于CLIP模型的图像安全检查工具

模型CLIP模型安全检查器Github图像识别内容审核开源项目Huggingface机器学习

stable-diffusion-safety-checker是一个开源的图像内容审核工具。该项目利用CLIP模型技术,专注于识别和过滤不适宜内容。它不仅可用于研究计算机视觉模型的性能,还能揭示潜在的偏见问题。尽管在某些分类任务中表现优异,但仍存在局限性。推荐将其应用于学术研究,使用时需谨慎评估相关风险。

kandinsky-2-2-decoder-inpaint - Kandinsky 2.2的文本引导图像修复及生成新方法

扩散模型开源项目文本到图像图像合成模型HuggingfaceCLIP模型Kandinsky 2.2Github

Kandinsky 2.2结合Dall-E 2和潜在扩散技术，融入CLIP模型进行文本与图像编码，并实现跨CLIP模态空间的图像扩散映射，提升视觉表现力。支持文本引导的图像修复，并整合于diffusers库。用户可通过修改掩码格式进行编辑。本版本在解析性能上进行了优化，在COCO_30k数据集的零样本测试中表现出色，FID指标显示显著提升。

相关文章

Article Cover

LangSplat：开源AI目标识别系统，在视频中精准识别描述的物体

2024年08月03日

Article Cover

基于MLX和CLIP模型的照片相似度搜索应用

2024年09月04日

Article Cover

DataComp: 探索下一代多模态数据集的前沿

2024年09月05日

Article Cover

SAN: 一种创新的开放词汇语义分割网络

2024年09月05日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号