#无需训练

FouriScale - 无需训练的高分辨率图像合成方法

FouriScale高分辨率图像生成扩散模型频域分析无需训练Github开源项目

FouriScale是一种基于频域分析的高分辨率图像生成方法。该技术在预训练扩散模型中引入膨胀技术和低通操作，解决了结构和尺度一致性问题。FouriScale可处理不同宽高比的文本到图像生成任务，平衡图像结构完整性和保真度，实现任意大小、高分辨率、高质量的图像生成。这种方法简单且兼容性强，为超高分辨率图像合成研究提供了新思路。

ChunkLlama - 双重块注意力技术实现大语言模型上下文窗口扩展

ChunkLlama大语言模型长上下文注意力机制无需训练Github开源项目

ChunkLlama项目开发了双重块注意力(DCA)技术，无需额外训练即可将大语言模型的上下文窗口扩展至原始长度的8倍以上。DCA可与主流外推技术和高效推理库兼容，支持Llama、Mistral等多种模型。实验表明，应用DCA后的Llama-2/3 70B模型能处理长达100k的上下文，并在长文本任务中表现出色。

BPO - 优化大语言模型对齐的创新黑盒方法

BPO大语言模型提示词优化模型对齐无需训练Github开源项目

Black-Box Prompt Optimization (BPO) 是一种新型大语言模型对齐技术，无需模型训练即可提升性能。项目通过创新方法缩小人类与AI模型间的差距，在Vicuna Eval评估中优于gpt-3.5-turbo和claude-2，并超越PPO和DPO方法。BPO提供完整的模型、数据集、演示和使用指南，为AI研究和开发提供全面支持。

相关文章

Article Cover

商业流程外包(BPO):提升企业效率的智能选择

Article Cover

商业流程外包(BPO)的全面解析:定义、优势与发展趋势

Article Cover

FouriScale: 突破预训练扩散模型的高分辨率图像生成

Article Cover

ChunkLlama: 突破大语言模型长上下文限制的无训练方法

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号