#StripedHyena
StripedHyena-Nous-7B - 混合架构语言模型的突破性创新
Github开源项目模型Huggingface长文本处理AI语言模型Together ResearchStripedHyena混合架构
StripedHyena-Nous-7B是一款由Together Research开发的创新型混合架构语言模型。该模型结合了多头分组查询注意力和门控卷积技术,实现了恒定内存解码、低延迟和高吞吐量。支持处理长达32k的序列,采用混合精度设计,在短文本和长文本评估中表现出色,能够与同等规模的开源Transformer模型相媲美。这一突破性架构为自然语言处理领域带来了新的可能性。
evo-1-8k-base - 高效的生物长序列建模与设计的深度信号处理模型
Github开源项目模型架构模型Huggingface基因组学EvoStripedHyena深度信号处理
Evo是一个基于生物的基础模型,通过StripedHyena架构支持长序列建模与设计。Evo拥有7亿参数,可在单核苷酸和字节级别进行建模,并在计算和内存使用上实现接近线性的扩展。Evo-1-8k-base模型适用于8,192上下文长度的分子层面微调,是Evo家族中的第一款产品。此模型不仅支持高效的自动回归生成,还能快速处理长上下文训练和微调,在自然语言和生物序列的大规模数据处理中展示出色的扩展性。作为开源科学的组成部分,该项目提供15个阶段的中间预训练检查点以供研究使用。