#性能

LMFlow学习资料汇总 - 大模型微调与推理的可扩展工具箱

2024年09月10日
Cover of LMFlow学习资料汇总 - 大模型微调与推理的可扩展工具箱

tokenizers入门学习资料 - 快速高效的文本分词库

2024年09月10日
Cover of tokenizers入门学习资料 - 快速高效的文本分词库

Vespa学习资料汇总 - AI和数据的实时在线处理平台

2024年09月10日
Cover of Vespa学习资料汇总 - AI和数据的实时在线处理平台

ZLUDA: 让CUDA在AMD和Intel GPU上运行的开源项目

2024年09月05日
Cover of ZLUDA: 让CUDA在AMD和Intel GPU上运行的开源项目

JetMoE:以0.1百万美元成本达到Llama2性能的革命性大语言模型

2024年09月04日
Cover of JetMoE:以0.1百万美元成本达到Llama2性能的革命性大语言模型

MLeap: 一个强大的机器学习模型部署框架

2024年09月04日
Cover of MLeap: 一个强大的机器学习模型部署框架

数据集:机器学习的基石

2024年09月04日
Cover of 数据集:机器学习的基石

OnnxStream: 轻量级ONNX推理引擎助力边缘设备运行大型AI模型

2024年09月02日
Cover of OnnxStream: 轻量级ONNX推理引擎助力边缘设备运行大型AI模型

Whisper JAX: 最快的语音识别模型实现

2024年08月30日
Cover of Whisper JAX: 最快的语音识别模型实现

LMFlow: 一个用于大型基础模型微调和推理的可扩展工具包

2024年08月30日
Cover of LMFlow: 一个用于大型基础模型微调和推理的可扩展工具包
相关项目
Project Cover

tokenizers

tokenizers是一个高效的分词工具,旨在提供快速且多功能的文本处理解决方案。它可以迅速训练新的词汇库并进行分词,使用Rust语言编写以确保高性能。其接口设计简洁易用,适用于研究与生产,全面支持各种文本预处理需求。

Project Cover

RWKV-LM

RWKV是一个高性能的并行化RNN,具有变换器级别的性能。该模型实现了快速的推理和训练速度,不依赖于传统的注意力机制,而是通过隐藏状态进行计算,优化了VRAM的使用,并支持处理无限长度的文本上下文。RWKV的这些特点使其在进行句子嵌入和处理复杂文本任务时显示出优越的能力。

Project Cover

LMFlow

LMFlow为大型机器学习模型微调提供一个可扩展、便捷且高效的开源工具箱,支持多种优化功能,如自定义优化器训练、LISA算法等,已广泛应用于机器学习领域。

Project Cover

whatlang-rs

Rust实现的高效自然语言检测库,支持69种语言,识别语言和文字脚本(如拉丁文、西里尔文等),并提供可靠性评估。轻量、快速且简洁,适用于Sonic、Meilisearch等项目。

Project Cover

OnnxStream

OnnxStream专为优化内存使用而设计,支持在低资源设备上高效运行大型模型如Stable Diffusion和TinyLlama。在仅有512MB RAM的Raspberry Pi Zero 2上,实现图像生成和语言模型推理,而无需额外交换空间或磁盘写入。通过解耦推理引擎与模型权重组件,OnnxStream显著降低内存消耗,提供轻量且高效的推理解决方案。其静态量化和注意力切片技术增强了多种应用中的适应性和性能。

Project Cover

datasets

TensorFlow Datasets是一个公共数据集下载和准备的实用库,简化数据集加载与处理。通过其API,用户可以访问和使用多个预构建数据集,优化训练管道性能,并确保数据的确定性与可重复性。详情请参考官方教程、指南及API文档,支持在Colab笔记本中交互式操作。此工具适合快速集成数据集与进行机器学习模型训练的开发者。

Project Cover

mleap

MLeap提供高性能、便携、易于集成的生产库,支持将Spark和Scikit-learn的机器学习流水线导出为便携格式并执行。通过其执行引擎和序列化格式,数据科学家和工程师可以无需依赖Spark或Scikit-learn环境,将数据流水线和算法轻松部署到生产环境中。MLeap支持多种序列化格式(如JSON、Protobuf),并与现有技术高度集成,提供用户灵活定制数据类型和转换器的能力。

Project Cover

rust

Rust作为一种系统编程语言,在安全性和并发性方面表现突出。它通过独特的类型系统和所有权模型,在编译阶段就能保证内存和线程安全。Rust不仅提供了高性能和可靠性,还配备了完善的文档和工具链,如Cargo、rustfmt和Clippy。这使得Rust成为开发关键服务、嵌入式系统以及跨语言集成项目的理想选择。

Project Cover

vespa

Vespa 是一个高性能平台,专为大规模数据集的搜索、推荐和个性化任务设计。它支持向量、张量、文本和结构化数据的实时组织和推断,具备高可用性和可扩展性。Vespa 被广泛应用于大规模互联网服务,每秒处理数十万次查询。用户可以选择在云端或本地部署应用,平台提供详尽的文档和不断更新的博客,帮助用户开发和集成。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号