#性能

LMFlow学习资料汇总 - 大模型微调与推理的可扩展工具箱

1 个月前

LMFlow是一个可扩展、方便、高效的大型机器学习模型微调工具箱,旨在让整个社区都能方便地使用和训练大模型。本文汇总了LMFlow项目的学习资料和使用指南。

LMFlow finetuning 模型性能优化 Github 开源项目

1 个月前

Vespa学习资料汇总 - AI和数据的实时在线处理平台

1 个月前

Vespa是一个强大的开源搜索引擎和向量数据库,支持大规模实时处理AI和数据。本文汇总了Vespa的相关学习资源,包括官方文档、示例应用、博客等,帮助开发者快速上手和深入学习这一强大的平台。

Vespa 搜索机器学习模型高可用性性能 Github 开源项目

1 个月前

JetMoE：以0.1百万美元成本达到Llama2性能的革命性大语言模型

2 个月前

JetMoE-8B是一个突破性的大语言模型,以不到100万美元的成本达到了Llama2-7B的性能水平。这项研究展示了大语言模型训练可以比之前认为的更加经济高效,为AI研究和应用开辟了新的可能性。

JetMoE 大语言模型开源性能低成本 Github 开源项目

2 个月前

数据集：机器学习的基石

2 个月前

本文深入探讨了数据集在机器学习和人工智能领域的重要性,介绍了主流的数据集平台和工具,以及数据集的获取、处理和应用方法,为读者提供了全面的数据集知识体系。

TensorFlow Datasets tf.data.Dataset MNIST 性能定制化 Github 开源项目

2 个月前

Whisper JAX: 最快的语音识别模型实现

2 个月前

Whisper JAX是OpenAI Whisper模型的JAX实现,在TPU上可实现高达70倍的速度提升,是目前最快的Whisper实现。

Whisper JAX 模型音频转录并行处理性能 Github 开源项目

2 个月前

tokenizers入门学习资料 - 快速高效的文本分词库

1 个月前

tokenizers是Hugging Face开发的高性能文本分词库,专为研究和生产环境优化。本文整理了tokenizers的学习资源,帮助您快速上手这个强大的NLP工具。

Tokenizers 性能多语言绑定调优文本处理 Github 开源项目

1 个月前

ZLUDA: 让CUDA在AMD和Intel GPU上运行的开源项目

2 个月前

ZLUDA是一个开源项目,旨在让CUDA应用程序无需修改即可在AMD和Intel GPU上运行。本文介绍了ZLUDA的发展历程、技术原理、性能表现以及当前面临的挑战。

ZLUDA CUDA Intel GPU 性能替代方案 Github 开源项目

2 个月前

MLeap: 一个强大的机器学习模型部署框架

2 个月前

MLeap是一个开源的机器学习模型序列化和部署框架,支持Spark、Scikit-learn和TensorFlow等主流机器学习工具,可以将训练好的模型轻松部署到生产环境中,实现高效的模型推理。

MLeap Spark Scikit-learn 机器学习数据管道性能 Github 开源项目

2 个月前

OnnxStream: 轻量级ONNX推理引擎助力边缘设备运行大型AI模型

2 个月前

OnnxStream是一个用C++编写的轻量级ONNX推理库,能够在树莓派Zero 2等边缘设备上运行Stable Diffusion XL等大型AI模型,同时也支持在桌面和服务器上运行Mistral 7B等大语言模型。

OnnxStream Stable Diffusion XL TinyLlama Mistral 7B 性能 Github 开源项目

2 个月前

LMFlow: 一个用于大型基础模型微调和推理的可扩展工具包

2 个月前

LMFlow是一个开源的大型语言模型工具包,旨在为研究人员和开发者提供便捷、高效的模型微调和推理功能。它支持多种主流模型,并提供了全面的训练、评估和部署流程。

LMFlow finetuning 模型性能优化 Github 开源项目

2 个月前

相关项目

tokenizers

tokenizers是一个高效的分词工具，旨在提供快速且多功能的文本处理解决方案。它可以迅速训练新的词汇库并进行分词，使用Rust语言编写以确保高性能。其接口设计简洁易用，适用于研究与生产，全面支持各种文本预处理需求。

RWKV-LM

RWKV是一个高性能的并行化RNN，具有变换器级别的性能。该模型实现了快速的推理和训练速度，不依赖于传统的注意力机制，而是通过隐藏状态进行计算，优化了VRAM的使用，并支持处理无限长度的文本上下文。RWKV的这些特点使其在进行句子嵌入和处理复杂文本任务时显示出优越的能力。

LMFlow

LMFlow为大型机器学习模型微调提供一个可扩展、便捷且高效的开源工具箱，支持多种优化功能，如自定义优化器训练、LISA算法等，已广泛应用于机器学习领域。

whatlang-rs

Rust实现的高效自然语言检测库，支持69种语言，识别语言和文字脚本（如拉丁文、西里尔文等），并提供可靠性评估。轻量、快速且简洁，适用于Sonic、Meilisearch等项目。

OnnxStream

OnnxStream专为优化内存使用而设计，支持在低资源设备上高效运行大型模型如Stable Diffusion和TinyLlama。在仅有512MB RAM的Raspberry Pi Zero 2上，实现图像生成和语言模型推理，而无需额外交换空间或磁盘写入。通过解耦推理引擎与模型权重组件，OnnxStream显著降低内存消耗，提供轻量且高效的推理解决方案。其静态量化和注意力切片技术增强了多种应用中的适应性和性能。

datasets

TensorFlow Datasets是一个公共数据集下载和准备的实用库，简化数据集加载与处理。通过其API，用户可以访问和使用多个预构建数据集，优化训练管道性能，并确保数据的确定性与可重复性。详情请参考官方教程、指南及API文档，支持在Colab笔记本中交互式操作。此工具适合快速集成数据集与进行机器学习模型训练的开发者。

mleap

MLeap提供高性能、便携、易于集成的生产库，支持将Spark和Scikit-learn的机器学习流水线导出为便携格式并执行。通过其执行引擎和序列化格式，数据科学家和工程师可以无需依赖Spark或Scikit-learn环境，将数据流水线和算法轻松部署到生产环境中。MLeap支持多种序列化格式（如JSON、Protobuf），并与现有技术高度集成，提供用户灵活定制数据类型和转换器的能力。

rust

Rust作为一种系统编程语言，在安全性和并发性方面表现突出。它通过独特的类型系统和所有权模型，在编译阶段就能保证内存和线程安全。Rust不仅提供了高性能和可靠性，还配备了完善的文档和工具链，如Cargo、rustfmt和Clippy。这使得Rust成为开发关键服务、嵌入式系统以及跨语言集成项目的理想选择。

vespa

Vespa 是一个高性能平台，专为大规模数据集的搜索、推荐和个性化任务设计。它支持向量、张量、文本和结构化数据的实时组织和推断，具备高可用性和可扩展性。Vespa 被广泛应用于大规模互联网服务，每秒处理数十万次查询。用户可以选择在云端或本地部署应用，平台提供详尽的文档和不断更新的博客，帮助用户开发和集成。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com