#性能基准
Codec-SUPERB - 音频编解码模型性能评估基准平台
Codec-SUPERB语音处理性能基准音频编解码评估框架Github开源项目
Codec-SUPERB是一个综合性音频编解码模型评估平台,提供标准化测试环境和统一数据集。平台特色包括直观的编解码接口、多角度评估和在线排行榜。它旨在促进语音处理领域的发展,为研究人员提供便捷的模型集成和测试环境,支持快速迭代和实验。
generative-recommenders - 基于万亿参数序列转录器的生成式推荐系统框架
推荐系统深度学习HSTU序列模型性能基准Github开源项目
HSTU是一个基于万亿参数序列转录器的生成式推荐系统框架。该项目在MovieLens和Amazon Reviews等公开数据集上进行了实验,结果显示HSTU在各项指标上均优于现有方法。项目开源了实验代码、配置文件和高效推理所需的Triton内核实现,方便研究者复现结果和进行后续研究。
moondream2 - 小型高效的边缘设备视觉语言模型
图像问答模型开源项目Huggingface性能基准moondream2Github边缘设备视觉语言模型
moondream2是一款为边缘设备设计的小型视觉语言模型。该模型在VQAv2、GQA、TextVQA等多项基准测试中表现优异,支持图像编码和问答功能。开发者可通过pip轻松安装并集成到Python项目中。moondream2定期更新,同时提供版本固定选项,以满足不同的应用需求。
Qwen2-1.5B-Instruct-AWQ - 探索具备多语言能力和高性能的新一代语言模型
Qwen2Huggingface训练细节Github开源项目模型多语言能力性能基准语言模型
Qwen2系列大语言模型在语言理解、生成、多语言处理和推理等多个方面表现出色。Qwen2-1.5B-Instruct模型经过指令微调,相较主流开源和专有模型展现出强竞争力。基于SwiGLU激活和自适应分词器,支持多语言和代码应用。通过Hugging Face Transformers可轻松下载并使用。详细了解性能和速度基准测试的信息请查看相关资料。