#图像分辨率
MidJourney-Styles-and-Keywords-Reference
此项目作为MidJourney风格与关键词的详尽参考资源,提供丰富的指南和对比分析,支持用户从基础到高级所有层面的创作需求,包括风格细化、参数配置及其复杂比对等。
Monkey
Monkey是一个开源的多模态大模型项目,通过提高图像分辨率和优化文本标签来改善模型性能。该项目在MMBench、CCBench和MME等基准测试中表现优异。Monkey提供完整的模型定义、训练代码和演示系统,支持离线和在线部署。此外,项目还开源了多级描述生成数据集,并提供了针对多个视觉问答数据集的评估工具,方便研究人员进行实验和改进。
Pics Enhancer
Pics Enhancer是一款AI驱动的图像增强工具,能自动提升照片质量、增加分辨率、修复旧照片、降噪和平衡色彩。用户只需上传图片,几秒内即可获得增强效果。支持多种图像格式,适用于个人、摄影师和电商卖家。该工具免费使用,无需设计技能,助力创作高质量图像。
Upscalepics
Upscalepics是一款工具,专注于提升图像分辨率和品质,适合摄影师和设计师使用。通过现代机器学习技术,能够在不损失图像内容的前提下提升清晰度,支持多种图片格式。
siglip-so400m-14-980-flash-attn2-navit
项目提升视觉塔最大分辨率到980x980,结合NaViT策略,支持变分辨率及纵横比自适应的图像处理。这些更新确保与原模型的向后兼容性,同时扩展了视觉处理潜力。通过插值位置嵌入提升分辨率,NaViT策略实现灵活性。用户无需指定patch_attention_mask即可兼容旧版本,享受新功能的优势,确保模型在高效处理高分辨率图像时保持兼容性。
cogvlm2-llama3-chat-19B-int4
CogVLM2是一种先进的多语言文本生成模型,在多项基准测试中表现优异,如TextVQA和DocVQA。支持高达8K的文本长度和1344x1344的图像分辨率,并能在ZhipuAI开放平台上进行体验。该模型拥有高效的设计,占用较低的GPU内存,需在Linux系统下的Nvidia显卡上运行,适用于多语言环境中的各种场景。