#高性能

MNN - 高效轻量的深度学习框架,支持多设备推理和训练
MNN深度学习框架推理引擎轻量级高性能Github开源项目
MNN是一个高效轻量的深度学习框架,支持设备上的推理和训练。已被阿里巴巴30多个应用集成,覆盖直播、短视频、搜索推荐等70多种场景。MNN适用于嵌入式设备,支持TensorFlow、Caffe、ONNX等多种模型格式,并优化了ARM和x64 CPU及多种GPU的计算性能。通过MNN Workbench,用户可以下载预训练模型、进行可视化训练并一键部署到设备上。
HyperLPR - 高性能跨平台车牌识别框架
HyperLPR3车牌识别高性能跨平台快速部署Github开源项目
HyperLPR3是一个高性能车牌识别框架,支持Python、Windows、Mac、Linux和树莓派等平台。其识别速度快,准确率高,适用于多种场景。项目提供详细的安装、测试指南和多种API接口,方便开发者快速集成和使用。
caffe2 - 轻量级、模块化和可扩展的深度学习框架
Caffe2PyTorch深度学习框架模块化高性能Github开源项目
Caffe2是一个以表达力、速度和模块化为设计理念的轻量级、模块化和可扩展的深度学习框架。欲了解更多信息,请访问caffe2.ai。
MegEngine - 高效、可扩展且易于使用的深度学习框架
MegEngine深度学习框架训练与推理硬件需求高性能Github开源项目
MegEngine是一个高效、可扩展且易于使用的深度学习框架,具有统一的训练和推理框架、低硬件要求和跨平台高效推理的三大关键特性。支持x86、Arm、CUDA、RoCM等多种平台,兼容Linux、Windows、iOS、Android等系统。通过DTR算法和Pushdown内存规划器,大幅降低GPU内存使用。适用于模型开发到部署的各个环节,致力于构建开放友好的AI社区。
mosec - 云端机器学习模型服务框架
MOSEC模型服务高性能动态批处理云计算Github开源项目
Mosec是一个高效且灵活的模型服务框架,旨在简化云端机器学习模型的部署和服务构建。其采用Rust和Python,实现高速性能与易用性,支持动态批处理和流水线处理,适用于CPU和GPU的混合工作负载。Mosec还提供模型预热、优雅关闭和Prometheus监控,便于通过Kubernetes等系统进行管理。
xFasterTransformer - 高效的大规模语言模型推理优化方案
xFasterTransformer大语言模型Xeon高性能Python APIGithub开源项目
xFasterTransformer是一个为X86平台优化的大规模语言模型(LLM)推理解决方案,支持多插槽和节点的分布式运行,适用于大型模型推理。它提供C++和Python API,支持例如ChatGLM、Llama、Baichuan等流行的LLM模型,并可通过PyPI、Docker或从源代码进行安装。项目附带详细文档、API使用示例、基准测试代码和Web演示,确保用户能充分利用其高性能和高扩展性。
whisper.cpp - 跨平台自动语音识别模型推理工具
whisper.cpp语音识别Apple SiliconOpenAI Whisper高性能Github开源项目
whisper.cpp是基于OpenAI Whisper的C/C++自动语音识别(ASR)模型实施,针对Apple Silicon经过优化,并支持多平台部署。该项目以极低的内存消耗和CPU/GPU推理能力,覆盖Mac OS、iOS、Android等主流平台,提供灵活的API与多样的定制模型,使开发者能够轻松地融合语音功能。
feishu-openai - 飞书与AI助手的结合
飞书AI模型深度学习自动化高性能Github开源项目
集成GPT-4、DALL-E、Whisper等AI技术,飞书OpenAI提供多元化办公解决方案与安全部署选项,适合各规模企业。了解更多升级商业共创版的优势,助力企业步入智能办公新纪元。
rill-flow - 可扩展的分布式工作流管理服务
Rill Flow工作流调度高性能分布式系统云原生Github开源项目
Rill Flow 是一款高性能和可扩展的分布式工作流管理服务,支持每日处理数以千万计的任务,执行延迟低于100毫秒。核心功能包括易用的可视化流程编排、插件集成、云原生容器部署与函数编排,并支持快速集成大型语言模型服务,适用于异构分布式系统的编排与调度。
wink-nlp - 高性能和高精度的JavaScript自然语言处理库
winkNLP自然语言处理JavaScript文本分析高性能Github开源项目
这个JavaScript自然语言处理库优化了性能和精度,可显著提升NLP应用开发效率。它支持单词嵌入,代码无外部依赖,体积仅约10KB,并有近100%的测试覆盖率。主要功能包括多语言分词、句子边界检测、情感分析、词性标注和命名实体识别,适用于Node.js、浏览器和Deno环境。
RuntimeSpeechRecognizer - 基于OpenAI的Whisper的语音识别项目
Runtime Speech Recognizer语音识别OpenAI's WhisperUnreal Engine高性能Github开源项目
RuntimeSpeechRecognizer是一个高效的语音识别项目,基于OpenAI的Whisper技术,提供快速且准确的识别。支持英语和多语言(多达100种语言),提供从75 MB到2.9 GB多种模型尺寸。自动下载语言模型,支持将识别的语音翻译成英语,特性可定制,无需静态库或外部依赖,兼容多个平台(Windows、Mac、Linux、Android、iOS等)。
sensitive-word - 基于DFA算法的高性能敏感词检测工具,支持自定义与实时更新
sensitive-word敏感词DFA算法高性能工具Github开源项目
基于DFA算法的敏感词检测工具,具备6万多个词库和简洁的Fluent-API实现。支持敏感词的判断、返回和脱敏操作,可检测邮箱、网址等信息,并可实时更新用户自定义数据。还提供大小写、全角半角、繁简体转换等多种格式处理,确保高精度与灵活性。
flashlight - 用C++编写的机器学习库
Flashlight机器学习C++高性能神经网络Github开源项目
Flashlight是完全用C++编写的灵活高效的机器学习库,源自Facebook AI Research及其他知名项目。它包括内部接口可修改、核心小于10 MB以及高性能默认设置等特点,支持自动语音识别、图像分类、物体检测和语言建模等应用。提供简单的安装方式和全面的文档,适合研究者和开发者使用。
nnom - 适用于微控制器的神经网络库
Neural NetworkMicrocontrollerNNoM高性能灵活性Github开源项目
NNoM 是为微控制器设计的高层次神经网络推理库,支持如 Inception、ResNet 和 DenseNet 等复杂结构,可一键部署 Keras 模型并提供用户友好的界面。其高性能后端选择和预编译功能确保了运行时零损耗,同时提供完整的评估工具如运行时分析和混淆矩阵。最新的 v0.4.x 版本新增了循环层(RNN)支持,并切换到更适合机器处理的结构化接口。与 TensorFlow Lite 和 STM32Cube.AI 的对比显示,NNoM 在推理时间和内存占用方面表现出色。
zeta - 通过模块化组件提升AI模型开发速度
Zeta人工智能模型神经网络模块化高性能Github开源项目
Zeta项目提供模块化、高性能和可扩展的构建块,使AI模型开发速度提高80%。该项目的功能模块包括Flash Attention、SwiGLU激活函数和RelativePositionBias,这些组件大幅提升了模型的效率和性能。Zeta专注于可用性、模块化和性能,已被广泛应用于数百个模型中。用户可以通过简单的安装步骤,快速开始模型的原型设计、训练和优化。
zydis - 轻量的x86/x86-64反汇编和代码生成工具
zydisx86/x86-64 disassembler高性能多平台支持开源项目Github
Zydis是一款高性能、轻量级的x86和x86-64反汇编及代码生成工具,支持所有相关指令和扩展。它具备线程安全特性,并且不需要动态内存分配,文件体积小且性能优越。Zydis被广泛应用于x64dbg、Mozilla Firefox和Webkit等开源项目。该工具不依赖任何第三方库,能在多平台上顺利编译,提供详尽文档和多种示例程序,便于用户迅速上手。
ByteTransformer - 为BERT类Transformer优化的高性能推理库
ByteTransformerBERTTransformerNVIDIA GPU高性能Github开源项目
ByteTransformer是一个为BERT类Transformer优化的高性能推理库,支持Python和C++ API,兼容固定长度和可变长度Transformer。通过对BERT例程中的QKV编码、软最大值、前馈网络、激活、层归一化和多头注意力机制进行优化,ByteTransformer为字节跳动的内部推理系统提升了性能。基准测试结果显示,相较于PyTorch、TensorFlow、FasterTransformer和DeepSpeed,ByteTransformer在A100 GPU上的推理速度更快。
instructor-embedding - 指令微调的文本嵌入模型
INSTRUCTOR文本嵌入模型定制化任务高性能Github开源项目
INSTRUCTOR是一种指令微调的文本嵌入模型,无需额外训练即可生成定制化的文本嵌入,支持多种任务和领域,覆盖70项不同的嵌入任务,表现卓越。最新更新包括优化的代码结构和硬负样本检查点。用户可以通过本地或Colab轻松安装和使用INSTRUCTOR进行文本分类、信息检索和聚类等任务,并提供详细的安装及使用指南。
EdgeSAM - 边缘设备上快速的分割模型EdgeSAM
EdgeSAMSAMCNNiOS应用高性能Github开源项目
EdgeSAM通过优化的Prompt-In-the-Loop蒸馏方法,为边缘设备提供高效的分割模型。相较于原始SAM,EdgeSAM在速度上提升了40倍,并在iPhone 14上实现了超过30帧每秒的性能。此外,EdgeSAM在COCO和LVIS数据集上的mIoUs分别提升了2.3和3.2,性能优于MobileSAM。该项目支持ONNX和CoreML平台,并已经集成到多个开源工具中。用户还可以通过iOS App方便地使用EdgeSAM。
Agents.jl - 高效易学的Julia智能体建模框架
Agents.jlJulia代理建模SIMULATION高性能Github开源项目
Agents.jl是一个纯Julia框架,专为智能体建模(ABM)设计。其特点包括速度快、学习曲线短、代码简单、接口丰富,并支持在Open Street Maps上进行模拟。支持传统离散时间和连续时间基于事件队列的模拟,适用于多种应用场景。更多信息可查看在线文档。
impress - 企业级安全、高效扩展的Node.js应用服务器
Node.js企业应用服务器高性能多线程实时数据处理Github开源项目
impress是第一个采用多线程和负载隔离优化的Node.js服务器设计,专注于高强度数据交换、快速开发和清晰架构。适用于可靠高效的后端系统、网络通信、协议无关API、运行时类型验证以及实时和内存数据处理。尽管不适用于内容发布和无状态服务,但在企业级应用的安全性和架构方面具有显著优势,并且支持websocket长连接以减少加密握手开销。同时,不依赖第三方库,使其更加自主和安全。
MiniExcel - 轻量高效的 .NET Excel 处理工具
MiniExcelExcel处理.NET低内存消耗高性能Github开源项目
MiniExcel 是一款轻量级的 .NET Excel 处理工具,通过流式处理算法大幅降低内存占用,有效避免内存溢出问题。该库支持实时处理数据,兼容 LINQ 延迟执行,可实现低消耗、快速分页等复杂查询。MiniExcel 无需依赖 Microsoft Office,DLL 大小仅 150KB,API 简洁易用,适合处理大型 Excel 文件。其高效率和低内存消耗特性使其成为 .NET 平台上理想的 Excel 处理解决方案。
zed - 高性能实时协作代码编辑器 Zed 助力提升开发效率
Zed代码编辑器多人协作开源项目高性能Github
Zed是Atom和Tree-sitter创始团队开发的高性能实时协作代码编辑器。该工具支持macOS和Linux系统,可通过直接下载或包管理器安装。Zed以其出色性能和协作功能为开发团队提供效率提升。作为一个活跃的开源项目,Zed欢迎开发者参与贡献,目前正在开发Windows和Web版本。
jittor - 高性能实时编译深度学习框架,集成多种先进模型库
Jittor深度学习框架JIT编译Python高性能Github开源项目
Jittor是一个基于实时(JIT)编译和元操作符的高性能深度学习框架。它支持Python前端,CUDA和C++后端,能够生成针对不同模型的高效代码。Jittor提供了丰富的模型库,涵盖图像识别、检测、分割、生成、可微渲染、几何学习和强化学习等领域。安装方式多样,环境配置简便,并且包含详尽的教程和文档,帮助用户快速入门。
conference - Go语言在云原生和高性能架构中的应用实践
Golang云原生微服务容器化高性能Github开源项目
该项目收录了2023年上海和北京Go语言大会的演讲PPT,涵盖云原生技术、微服务架构和高性能系统设计等领域。来自知名互联网企业的技术专家分享了在分布式系统、Kubernetes扩展、服务稳定性和可观测性等方面的实践经验。这些资料展示了Go语言在大规模复杂系统中的应用,为开发者提供了有价值的学习参考。
parquet-go - Go语言高性能Parquet文件处理库
parquet-goGo语言库列式存储数据处理高性能Github开源项目
parquet-go是一个用Go语言开发的Parquet文件处理库。该项目由Twilio Segment初创,提供高级API用于读写Parquet文件,同时兼顾低计算和内存占用。支持Parquet格式规范,包括列式存储、模式演化、行组排序、行组合并和布隆过滤器等特性。parquet-go适合需要高效处理大规模数据集的场景,为Go开发者提供了实用的Parquet文件操作工具。
ksuid - Go语言高效全局唯一标识符生成库KSUID
KSUID全局唯一标识符Go库时间戳高性能Github开源项目
ksuid是一个Go语言库,用于生成和解析可排序的唯一标识符KSUID。该库提供自然排序、无冲突和无依赖的标识符,具有高度可移植性。经过生产环境验证和性能优化,ksuid提供丰富的接口和命令行工具,适用于多种场景的唯一标识需求。
gmft - 轻量级高性能PDF表格提取开源库
gmftPDF表格提取表格转换轻量级工具高性能Github开源项目
gmft是一个开源的PDF表格提取库,采用微软Table Transformers技术实现高质量表格识别和结构化。支持Pandas dataframe等多种输出格式,无需GPU即可高速运行。gmft依赖少、安装简单,提供模块化设计和灵活配置,在多种表格提取方案对比中表现优异。
netpoll - 非阻塞I/O网络框架Netpoll为RPC场景提供高性能支持
Netpoll网络框架高性能RPC非阻塞I/OGithub开源项目
Netpoll是一款专为RPC场景设计的高性能非阻塞I/O网络框架。该框架提供零拷贝API、高效的goroutine池和内存复用机制,支持连接活性检查以及客户端和服务器构建。Netpoll目前在Linux和macOS系统上支持TCP和Unix Domain Socket,未来计划支持io_uring和共享内存IPC等特性。作为CloudWeGo生态系统的核心组件,Netpoll为Kitex和Hertz等框架提供了性能支持。
alacritty - 高性能跨平台GPU加速终端模拟器
Alacritty终端模拟器跨平台OpenGL高性能Github开源项目
Alacritty是一款现代化终端模拟器,专注于性能和可配置性。它通过OpenGL实现GPU加速,支持BSD、Linux、macOS和Windows等多个平台。Alacritty提供合理默认设置,同时允许广泛自定义。它集成现有应用功能而非重新实现,从而保持高性能和灵活性。尽管处于beta阶段,Alacritty已成为许多开发者和系统管理员的首选工具,为用户提供高效的命令行体验。
html5-parser - 基于C语言的高性能HTML 5解析器 性能远超纯Python实现
HTML5解析器Python库高性能标准兼容C语言开发Github开源项目
html5-parser是一个基于C语言开发的HTML 5解析器,为Python提供高性能的HTML解析功能。该解析器比纯Python实现(如html5lib)的速度快30多倍,同时严格遵守HTML 5标准。项目提供详细文档,适合需要高效处理HTML内容的Python开发者。
liteio - 高性能云原生块存储服务 为Kubernetes集群提供卓越性能
LiteIO云原生块存储Kubernetes高性能Github开源项目
LiteIO是专为Kubernetes设计的云原生块存储服务,采用SPDK和LVM等存储引擎,在超融合架构中提供接近本地磁盘的性能。它支持跨集群块设备配置,易于部署,通过CSI与Kubernetes集成。LiteIO适用于高IO需求的分布式数据库和AI训练,可充分利用集群存储资源。
ppl.cv - 跨平台图像处理库 专为深度学习优化
ppl.cv图像处理深度学习高性能OpenCVGithub开源项目
ppl.cv是一款轻量级可定制的图像处理框架,针对深度学习应用优化设计。支持x86、CUDA、aarch64、RISC-V和OpenCL等多个平台,实现了算术运算、色彩空间转换、直方图等常用图像算法的高性能版本。该项目追求极致性能,功能与OpenCV对齐,同时保持独立性,便于开发和部署。
tigerbeetle - 专为OLTP设计的金融交易数据库
TigerBeetle数据库金融交易账户管理高性能Github开源项目
TigerBeetle是一款专注于金融交易的数据库,为OLTP应用提供高性能和可靠性。它支持快速部署、多节点集群和多语言客户端,实现高效的账户管理和转账操作。TigerBeetle的设计优先考虑性能和数据安全,适合需要高吞吐量和严格一致性的金融系统。该数据库旨在满足未来几十年金融交易的需求,为关键任务提供稳定支持。
polars - 多语言支持的高性能数据分析引擎
Polars数据处理多语言支持高性能DataFrameGithub开源项目
Polars是一个基于Rust开发的高性能数据处理引擎,提供Python、Node.js和R等多语言接口。它采用Apache Arrow列式内存模型,实现惰性/即时执行、多线程和SIMD等技术,高效处理大规模数据。Polars具有强大的表达式API和查询优化能力,支持流式处理超大数据集,在TPC-H基准测试中性能优异。此外,Polars还支持SQL查询和命令行操作,是一款轻量而强大的数据分析工具。
gpupixel - 跨平台高性能图像与视频滤镜库,轻松集成
GPUPixel实时滤镜高性能视频处理跨平台Github开源项目
GPUPixel是一个实时高性能图像和视频滤镜库,基于OpenGL/ES开发,支持iOS、Android、Mac、Windows和Linux平台。采用C++11编写,内置商用级美颜滤镜。GPUPixel体积小巧,易于编译和集成,适合需要跨平台滤镜功能的开发者。