#图像分辨率

MidJourney风格和关键词参考指南 - AI艺术创作必备资源

3 个月前

MidJourney 风格比较页面参数图像分辨率 Github 开源项目

3 个月前

Monkey项目：提升大型多模态模型性能的创新之路

3 个月前

Monkey 多模态模型图像分辨率文本标签视觉问答 Github 开源项目

3 个月前

MidJourney风格和关键词参考指南：探索AI艺术创作的无限可能

2024年08月30日

MidJourney 风格比较页面参数图像分辨率 Github 开源项目

2024年08月30日

相关项目

MidJourney-Styles-and-Keywords-Reference

此项目作为MidJourney风格与关键词的详尽参考资源，提供丰富的指南和对比分析，支持用户从基础到高级所有层面的创作需求，包括风格细化、参数配置及其复杂比对等。

Monkey

Monkey是一个开源的多模态大模型项目，通过提高图像分辨率和优化文本标签来改善模型性能。该项目在MMBench、CCBench和MME等基准测试中表现优异。Monkey提供完整的模型定义、训练代码和演示系统，支持离线和在线部署。此外，项目还开源了多级描述生成数据集，并提供了针对多个视觉问答数据集的评估工具，方便研究人员进行实验和改进。

Pics Enhancer

Pics Enhancer是一款AI驱动的图像增强工具，能自动提升照片质量、增加分辨率、修复旧照片、降噪和平衡色彩。用户只需上传图片，几秒内即可获得增强效果。支持多种图像格式，适用于个人、摄影师和电商卖家。该工具免费使用，无需设计技能，助力创作高质量图像。

Upscalepics

Upscalepics是一款工具，专注于提升图像分辨率和品质，适合摄影师和设计师使用。通过现代机器学习技术，能够在不损失图像内容的前提下提升清晰度，支持多种图片格式。

siglip-so400m-14-980-flash-attn2-navit

项目提升视觉塔最大分辨率到980x980，结合NaViT策略，支持变分辨率及纵横比自适应的图像处理。这些更新确保与原模型的向后兼容性，同时扩展了视觉处理潜力。通过插值位置嵌入提升分辨率，NaViT策略实现灵活性。用户无需指定patch_attention_mask即可兼容旧版本，享受新功能的优势，确保模型在高效处理高分辨率图像时保持兼容性。

cogvlm2-llama3-chat-19B-int4

CogVLM2是一种先进的多语言文本生成模型，在多项基准测试中表现优异，如TextVQA和DocVQA。支持高达8K的文本长度和1344x1344的图像分辨率，并能在ZhipuAI开放平台上进行体验。该模型拥有高效的设计，占用较低的GPU内存，需在Linux系统下的Nvidia显卡上运行，适用于多语言环境中的各种场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com