#上下文
libriheavy - 大规模语音识别数据集,50,000小时带标点和上下文
Github开源项目语音识别数据集Libriheavy标点符号上下文
Libriheavy是基于Librilight的大规模标注语音数据集,总时长达50,000小时。该数据集包含标点、大小写和上下文信息,适用于多种语音任务研究。Libriheavy提供完整版和ASR训练专用版本,支持多种数据格式。此外,项目还提供基线模型和性能排行榜,展示了在不同规模子集上的识别效果。研究人员可以通过简单步骤获取并使用这一丰富的语音识别资源。
Llama-3.1-Unhinged-Vision-8B-GGUF - 新的多模态内容处理AI模型
Github开源项目Meta Llama 3.1模型多模态LM StudioHuggingface上下文
此项目结合了Meta Llama 3.1 8B和mmprojector模型,具备128K上下文能力,可以在对话中准确区分多幅图像。这一模型已在LM Studio中应用,为复杂视觉数据处理提供了支持。
bigyi-15b - 合并模型技术的进步:探索创新设计
Github开源项目语言模型模型Huggingfacemergekit上下文合并方法bigyi-15b
Bigyi-15b融合了若干预训练语言模型,利用mergekit工具及passthrough合并方法,以01-ai/Yi-9B为核心,具备4k上下文处理能力。此模型增强了在多应用场景中的表现,比如复杂数值计算与自然语言生成,同时优化了信息匹配准确性。
Moonlight-L3-15B-v2-64k - 改进高效上下文处理增强模型稳定性
Github开源项目微调图像生成角色扮演模型Huggingface上下文MoonLight-L3-15B-V2-64K
新版本显著提升了上下文处理能力,并通过64K上下文微调和精细指令模板,输出更连贯和富有创意。新版本成功消除了幻觉问题,增强了对提示的准确理解,并在角色扮演数据集上进行了微调,适用于角色扮演和图像提示生成。用户可体验类似Character.ai的效果,并通过反馈机制推动进一步优化。