#TinyLlama

TinyLlama：一个开源的小型语言模型

2 个月前

Cover of TinyLlama：一个开源的小型语言模型

TinyLlama项目致力于在3万亿个token上预训练一个仅有11亿参数的Llama模型，为受限计算和内存环境下的各种应用提供了一个紧凑而强大的语言模型选择。

TinyLlama 语言模型 AI预训练开源项目模型评估 Github

2 个月前

Cover of TinyLlama：一个开源的小型语言模型

OnnxStream: 轻量级ONNX推理引擎助力边缘设备运行大型AI模型

2 个月前

Cover of OnnxStream: 轻量级ONNX推理引擎助力边缘设备运行大型AI模型

OnnxStream是一个用C++编写的轻量级ONNX推理库,能够在树莓派Zero 2等边缘设备上运行Stable Diffusion XL等大型AI模型,同时也支持在桌面和服务器上运行Mistral 7B等大语言模型。

OnnxStream Stable Diffusion XL TinyLlama Mistral 7B 性能 Github 开源项目

2 个月前

Cover of OnnxStream: 轻量级ONNX推理引擎助力边缘设备运行大型AI模型

相关项目

Project Cover

OnnxStream专为优化内存使用而设计，支持在低资源设备上高效运行大型模型如Stable Diffusion和TinyLlama。在仅有512MB RAM的Raspberry Pi Zero 2上，实现图像生成和语言模型推理，而无需额外交换空间或磁盘写入。通过解耦推理引擎与模型权重组件，OnnxStream显著降低内存消耗，提供轻量且高效的推理解决方案。其静态量化和注意力切片技术增强了多种应用中的适应性和性能。

Project Cover

TinyLlama是一个使用3万亿token预训练的1.1B参数语言模型。它与Llama 2架构兼容,可集成到现有Llama项目中。TinyLlama体积小巧,适用于计算和内存受限的场景。该项目开源了预训练和微调代码,具有高效的训练和推理性能。TinyLlama可应用于推测解码、边缘计算和实时对话等领域。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号