#上下文

libriheavy - 大规模语音识别数据集，50,000小时带标点和上下文

Github开源项目语音识别数据集Libriheavy标点符号上下文

Libriheavy是基于Librilight的大规模标注语音数据集，总时长达50,000小时。该数据集包含标点、大小写和上下文信息，适用于多种语音任务研究。Libriheavy提供完整版和ASR训练专用版本，支持多种数据格式。此外，项目还提供基线模型和性能排行榜，展示了在不同规模子集上的识别效果。研究人员可以通过简单步骤获取并使用这一丰富的语音识别资源。

Llama-3.1-Unhinged-Vision-8B-GGUF - 新的多模态内容处理AI模型

Github开源项目Meta Llama 3.1模型多模态LM StudioHuggingface上下文

此项目结合了Meta Llama 3.1 8B和mmprojector模型，具备128K上下文能力，可以在对话中准确区分多幅图像。这一模型已在LM Studio中应用，为复杂视觉数据处理提供了支持。

bigyi-15b - 合并模型技术的进步：探索创新设计

Github开源项目语言模型模型Huggingfacemergekit上下文合并方法bigyi-15b

Bigyi-15b融合了若干预训练语言模型，利用mergekit工具及passthrough合并方法，以01-ai/Yi-9B为核心，具备4k上下文处理能力。此模型增强了在多应用场景中的表现，比如复杂数值计算与自然语言生成，同时优化了信息匹配准确性。

Moonlight-L3-15B-v2-64k - 改进高效上下文处理增强模型稳定性

Github开源项目微调图像生成角色扮演模型Huggingface上下文MoonLight-L3-15B-V2-64K

新版本显著提升了上下文处理能力，并通过64K上下文微调和精细指令模板，输出更连贯和富有创意。新版本成功消除了幻觉问题，增强了对提示的准确理解，并在角色扮演数据集上进行了微调，适用于角色扮演和图像提示生成。用户可体验类似Character.ai的效果，并通过反馈机制推动进一步优化。

相关文章

Article Cover

LibriHeavy: 50,000小时的开源自动语音识别语料库

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号