Logo

#高性能

Logo of gpupixel
gpupixel
GPUPixel是一个实时高性能图像和视频滤镜库,基于OpenGL/ES开发,支持iOS、Android、Mac、Windows和Linux平台。采用C++11编写,内置商用级美颜滤镜。GPUPixel体积小巧,易于编译和集成,适合需要跨平台滤镜功能的开发者。
Logo of MegEngine
MegEngine
MegEngine是一个高效、可扩展且易于使用的深度学习框架,具有统一的训练和推理框架、低硬件要求和跨平台高效推理的三大关键特性。支持x86、Arm、CUDA、RoCM等多种平台,兼容Linux、Windows、iOS、Android等系统。通过DTR算法和Pushdown内存规划器,大幅降低GPU内存使用。适用于模型开发到部署的各个环节,致力于构建开放友好的AI社区。
Logo of feishu-openai
feishu-openai
集成GPT-4、DALL-E、Whisper等AI技术,飞书OpenAI提供多元化办公解决方案与安全部署选项,适合各规模企业。了解更多升级商业共创版的优势,助力企业步入智能办公新纪元。
Logo of sensitive-word
sensitive-word
基于DFA算法的敏感词检测工具,具备6万多个词库和简洁的Fluent-API实现。支持敏感词的判断、返回和脱敏操作,可检测邮箱、网址等信息,并可实时更新用户自定义数据。还提供大小写、全角半角、繁简体转换等多种格式处理,确保高精度与灵活性。
Logo of zydis
zydis
Zydis是一款高性能、轻量级的x86和x86-64反汇编及代码生成工具,支持所有相关指令和扩展。它具备线程安全特性,并且不需要动态内存分配,文件体积小且性能优越。Zydis被广泛应用于x64dbg、Mozilla Firefox和Webkit等开源项目。该工具不依赖任何第三方库,能在多平台上顺利编译,提供详尽文档和多种示例程序,便于用户迅速上手。
Logo of Agents.jl
Agents.jl
Agents.jl是一个纯Julia框架,专为智能体建模(ABM)设计。其特点包括速度快、学习曲线短、代码简单、接口丰富,并支持在Open Street Maps上进行模拟。支持传统离散时间和连续时间基于事件队列的模拟,适用于多种应用场景。更多信息可查看在线文档。
Logo of jittor
jittor
Jittor是一个基于实时(JIT)编译和元操作符的高性能深度学习框架。它支持Python前端,CUDA和C++后端,能够生成针对不同模型的高效代码。Jittor提供了丰富的模型库,涵盖图像识别、检测、分割、生成、可微渲染、几何学习和强化学习等领域。安装方式多样,环境配置简便,并且包含详尽的教程和文档,帮助用户快速入门。
Logo of gmft
gmft
gmft是一个开源的PDF表格提取库,采用微软Table Transformers技术实现高质量表格识别和结构化。支持Pandas dataframe等多种输出格式,无需GPU即可高速运行。gmft依赖少、安装简单,提供模块化设计和灵活配置,在多种表格提取方案对比中表现优异。
Logo of liteio
liteio
LiteIO是专为Kubernetes设计的云原生块存储服务,采用SPDK和LVM等存储引擎,在超融合架构中提供接近本地磁盘的性能。它支持跨集群块设备配置,易于部署,通过CSI与Kubernetes集成。LiteIO适用于高IO需求的分布式数据库和AI训练,可充分利用集群存储资源。
Logo of cytoolz
cytoolz
cytoolz是Python工具包toolz的Cython实现版本,为迭代器、函数和字典提供高性能实用工具。它完全兼容toolz的API,但运行速度通常提升2-5倍,并提供C API供其他Cython项目使用。支持Python 3.7+且无额外依赖,cytoolz特别适合处理大规模数据集。该库遵循函数式编程理念,可与itertools、functools等标准库无缝配合。
Logo of fastapi
fastapi
FastAPI是一款现代化的Python Web框架,专注于API开发。它利用Python的类型提示系统,提供直观的开发体验和优异的性能。该框架支持快速编码、错误减少和自动文档生成,适用于各种规模的项目。FastAPI兼容OpenAPI和JSON Schema等标准,为开发者提供了构建高效可靠API的有力工具。
Logo of xxHash
xxHash
xxHash是一个高性能的开源哈希算法库,包含XXH32、XXH64和XXH3等算法。它能以接近RAM速度的极快速度处理数据,并在所有平台上生成一致的哈希值。该库通过了SMHasher测试,保证了优秀的哈希质量。xxHash在处理大小数据时都表现出色,适用于哈希表和布隆过滤器等场景。库提供了简单的一次性和流式哈希API,并支持多种编译选项来优化性能和二进制大小。
Logo of aeron
aeron
Aeron是一个专注于高性能和低延迟的开源消息传输框架。它支持UDP单播、多播和IPC通信,提供Java、C和C++客户端实现。Aeron的核心功能包括跨机器高效消息交换、消息流存档和基于Raft算法的集群容错服务。通过集成Simple Binary Encoding技术,Aeron优化了消息编码和解码性能。该框架设计目标是在各类消息系统中实现最高吞吐量和最低延迟,适用于构建高性能通信系统。
Logo of MNN
MNN
MNN是一个高效轻量的深度学习框架,支持设备上的推理和训练。已被阿里巴巴30多个应用集成,覆盖直播、短视频、搜索推荐等70多种场景。MNN适用于嵌入式设备,支持TensorFlow、Caffe、ONNX等多种模型格式,并优化了ARM和x64 CPU及多种GPU的计算性能。通过MNN Workbench,用户可以下载预训练模型、进行可视化训练并一键部署到设备上。
Logo of mosec
mosec
Mosec是一个高效且灵活的模型服务框架,旨在简化云端机器学习模型的部署和服务构建。其采用Rust和Python,实现高速性能与易用性,支持动态批处理和流水线处理,适用于CPU和GPU的混合工作负载。Mosec还提供模型预热、优雅关闭和Prometheus监控,便于通过Kubernetes等系统进行管理。
Logo of rill-flow
rill-flow
Rill Flow 是一款高性能和可扩展的分布式工作流管理服务,支持每日处理数以千万计的任务,执行延迟低于100毫秒。核心功能包括易用的可视化流程编排、插件集成、云原生容器部署与函数编排,并支持快速集成大型语言模型服务,适用于异构分布式系统的编排与调度。
Logo of flashlight
flashlight
Flashlight是完全用C++编写的灵活高效的机器学习库,源自Facebook AI Research及其他知名项目。它包括内部接口可修改、核心小于10 MB以及高性能默认设置等特点,支持自动语音识别、图像分类、物体检测和语言建模等应用。提供简单的安装方式和全面的文档,适合研究者和开发者使用。
Logo of ByteTransformer
ByteTransformer
ByteTransformer是一个为BERT类Transformer优化的高性能推理库,支持Python和C++ API,兼容固定长度和可变长度Transformer。通过对BERT例程中的QKV编码、软最大值、前馈网络、激活、层归一化和多头注意力机制进行优化,ByteTransformer为字节跳动的内部推理系统提升了性能。基准测试结果显示,相较于PyTorch、TensorFlow、FasterTransformer和DeepSpeed,ByteTransformer在A100 GPU上的推理速度更快。
Logo of impress
impress
impress是第一个采用多线程和负载隔离优化的Node.js服务器设计,专注于高强度数据交换、快速开发和清晰架构。适用于可靠高效的后端系统、网络通信、协议无关API、运行时类型验证以及实时和内存数据处理。尽管不适用于内容发布和无状态服务,但在企业级应用的安全性和架构方面具有显著优势,并且支持websocket长连接以减少加密握手开销。同时,不依赖第三方库,使其更加自主和安全。
Logo of conference
conference
该项目收录了2023年上海和北京Go语言大会的演讲PPT,涵盖云原生技术、微服务架构和高性能系统设计等领域。来自知名互联网企业的技术专家分享了在分布式系统、Kubernetes扩展、服务稳定性和可观测性等方面的实践经验。这些资料展示了Go语言在大规模复杂系统中的应用,为开发者提供了有价值的学习参考。
Logo of netpoll
netpoll
Netpoll是一款专为RPC场景设计的高性能非阻塞I/O网络框架。该框架提供零拷贝API、高效的goroutine池和内存复用机制,支持连接活性检查以及客户端和服务器构建。Netpoll目前在Linux和macOS系统上支持TCP和Unix Domain Socket,未来计划支持io_uring和共享内存IPC等特性。作为CloudWeGo生态系统的核心组件,Netpoll为Kitex和Hertz等框架提供了性能支持。
Logo of ppl.cv
ppl.cv
ppl.cv是一款轻量级可定制的图像处理框架,针对深度学习应用优化设计。支持x86、CUDA、aarch64、RISC-V和OpenCL等多个平台,实现了算术运算、色彩空间转换、直方图等常用图像算法的高性能版本。该项目追求极致性能,功能与OpenCV对齐,同时保持独立性,便于开发和部署。
Logo of fiber
fiber
Fiber是一个高性能的Go Web框架,基于Fasthttp构建。它提供强大的路由功能、静态文件服务和中间件支持,适合快速开发API和Web应用。Fiber具有零内存分配和卓越性能的特点,同时保持易用性,是Go开发者构建高效Web服务的有力工具。
Logo of starship
starship
Starship是一款轻量、高速且高度可定制的命令行提示工具,适用于各种shell和操作系统。它能智能展示相关信息,支持多种主流开发工具,安装过程简单迅速。采用Rust语言开发,确保极快响应速度。用户可根据偏好自由配置,实现高度个性化。支持多种编程语言和版本控制系统,自动识别项目环境并显示相关信息,大大提高开发效率。Starship具备丰富功能,同时保持卓越性能,有效提升命令行使用体验。
Logo of valkey
valkey
Valkey是一个开源的高性能键值存储系统,支持多种数据结构和可扩展插件。它可在主流操作系统上运行,提供简单的编译安装方法,并支持TLS加密。Valkey适用于需要快速数据存取的各类应用场景。
Logo of JavaFastPFOR
JavaFastPFOR
JavaFastPFOR是一个高效的Java整数压缩库,实现了Binary Packing、NewPFD、OptPFD等多种先进编码算法。它能以每秒12亿整数的速度解压数据,广泛应用于数据库和信息检索系统等需要处理大量整数的场景。该库被LinkedIn Pinot和Apache NiFi等多个开源项目采用,提供简洁的API和Maven支持,是整数压缩的有力工具。
Logo of HyperLPR
HyperLPR
HyperLPR3是一个高性能车牌识别框架,支持Python、Windows、Mac、Linux和树莓派等平台。其识别速度快,准确率高,适用于多种场景。项目提供详细的安装、测试指南和多种API接口,方便开发者快速集成和使用。
Logo of xFasterTransformer
xFasterTransformer
xFasterTransformer是一个为X86平台优化的大规模语言模型(LLM)推理解决方案,支持多插槽和节点的分布式运行,适用于大型模型推理。它提供C++和Python API,支持例如ChatGLM、Llama、Baichuan等流行的LLM模型,并可通过PyPI、Docker或从源代码进行安装。项目附带详细文档、API使用示例、基准测试代码和Web演示,确保用户能充分利用其高性能和高扩展性。
Logo of wink-nlp
wink-nlp
这个JavaScript自然语言处理库优化了性能和精度,可显著提升NLP应用开发效率。它支持单词嵌入,代码无外部依赖,体积仅约10KB,并有近100%的测试覆盖率。主要功能包括多语言分词、句子边界检测、情感分析、词性标注和命名实体识别,适用于Node.js、浏览器和Deno环境。
Logo of nnom
nnom
NNoM 是为微控制器设计的高层次神经网络推理库,支持如 Inception、ResNet 和 DenseNet 等复杂结构,可一键部署 Keras 模型并提供用户友好的界面。其高性能后端选择和预编译功能确保了运行时零损耗,同时提供完整的评估工具如运行时分析和混淆矩阵。最新的 v0.4.x 版本新增了循环层(RNN)支持,并切换到更适合机器处理的结构化接口。与 TensorFlow Lite 和 STM32Cube.AI 的对比显示,NNoM 在推理时间和内存占用方面表现出色。
Logo of instructor-embedding
instructor-embedding
INSTRUCTOR是一种指令微调的文本嵌入模型,无需额外训练即可生成定制化的文本嵌入,支持多种任务和领域,覆盖70项不同的嵌入任务,表现卓越。最新更新包括优化的代码结构和硬负样本检查点。用户可以通过本地或Colab轻松安装和使用INSTRUCTOR进行文本分类、信息检索和聚类等任务,并提供详细的安装及使用指南。
Logo of MiniExcel
MiniExcel
MiniExcel 是一款轻量级的 .NET Excel 处理工具,通过流式处理算法大幅降低内存占用,有效避免内存溢出问题。该库支持实时处理数据,兼容 LINQ 延迟执行,可实现低消耗、快速分页等复杂查询。MiniExcel 无需依赖 Microsoft Office,DLL 大小仅 150KB,API 简洁易用,适合处理大型 Excel 文件。其高效率和低内存消耗特性使其成为 .NET 平台上理想的 Excel 处理解决方案。
Logo of parquet-go
parquet-go
parquet-go是一个用Go语言开发的Parquet文件处理库。该项目由Twilio Segment初创,提供高级API用于读写Parquet文件,同时兼顾低计算和内存占用。支持Parquet格式规范,包括列式存储、模式演化、行组排序、行组合并和布隆过滤器等特性。parquet-go适合需要高效处理大规模数据集的场景,为Go开发者提供了实用的Parquet文件操作工具。
Logo of alacritty
alacritty
Alacritty是一款现代化终端模拟器,专注于性能和可配置性。它通过OpenGL实现GPU加速,支持BSD、Linux、macOS和Windows等多个平台。Alacritty提供合理默认设置,同时允许广泛自定义。它集成现有应用功能而非重新实现,从而保持高性能和灵活性。尽管处于beta阶段,Alacritty已成为许多开发者和系统管理员的首选工具,为用户提供高效的命令行体验。
Logo of tigerbeetle
tigerbeetle
TigerBeetle是一款专注于金融交易的数据库,为OLTP应用提供高性能和可靠性。它支持快速部署、多节点集群和多语言客户端,实现高效的账户管理和转账操作。TigerBeetle的设计优先考虑性能和数据安全,适合需要高吞吐量和严格一致性的金融系统。该数据库旨在满足未来几十年金融交易的需求,为关键任务提供稳定支持。
Logo of KeyDB
KeyDB
KeyDB是Redis的高性能分支,专注多线程、内存效率和高吞吐量。它提供主动复制、FLASH存储等特性,保持与Redis完全兼容。KeyDB采用MVCC架构,可执行KEYS和SCAN查询而不阻塞数据库。在相同硬件上实现更高吞吐量,简化热备份,降低运营成本。KeyDB支持主动-主动复制、子键过期等创新特性,适用于需要高吞吐量、低延迟的大规模分布式系统。
Logo of moka
moka
Moka是一个快速、并发的Rust缓存库,基于哈希表实现。它支持高并发检索和更新,采用先进的缓存替换算法实现容量限制。Moka提供同步和异步缓存、基于数量或权重的边界、过期策略和驱逐监听等功能,适用于需要高性能缓存的Rust项目。
Logo of wc-flow-layout
wc-flow-layout
wc-waterfall 是基于 Web Components 开发的瀑布流布局组件,可在 React、Vue、SolidJs 等框架中使用。组件提供列数和间距自定义功能,适用于照片墙等场景。具有高性能和动画效果,为开发者提供灵活的布局方案。支持npm安装或CDN引入,使用简单,兼容性好。
Logo of caffe2
caffe2
Caffe2是一个以表达力、速度和模块化为设计理念的轻量级、模块化和可扩展的深度学习框架。欲了解更多信息,请访问caffe2.ai。
Logo of whisper.cpp
whisper.cpp
whisper.cpp是基于OpenAI Whisper的C/C++自动语音识别(ASR)模型实施,针对Apple Silicon经过优化,并支持多平台部署。该项目以极低的内存消耗和CPU/GPU推理能力,覆盖Mac OS、iOS、Android等主流平台,提供灵活的API与多样的定制模型,使开发者能够轻松地融合语音功能。
Logo of RuntimeSpeechRecognizer
RuntimeSpeechRecognizer
RuntimeSpeechRecognizer是一个高效的语音识别项目,基于OpenAI的Whisper技术,提供快速且准确的识别。支持英语和多语言(多达100种语言),提供从75 MB到2.9 GB多种模型尺寸。自动下载语言模型,支持将识别的语音翻译成英语,特性可定制,无需静态库或外部依赖,兼容多个平台(Windows、Mac、Linux、Android、iOS等)。
Logo of zeta
zeta
Zeta项目提供模块化、高性能和可扩展的构建块,使AI模型开发速度提高80%。该项目的功能模块包括Flash Attention、SwiGLU激活函数和RelativePositionBias,这些组件大幅提升了模型的效率和性能。Zeta专注于可用性、模块化和性能,已被广泛应用于数百个模型中。用户可以通过简单的安装步骤,快速开始模型的原型设计、训练和优化。
Logo of EdgeSAM
EdgeSAM
EdgeSAM通过优化的Prompt-In-the-Loop蒸馏方法,为边缘设备提供高效的分割模型。相较于原始SAM,EdgeSAM在速度上提升了40倍,并在iPhone 14上实现了超过30帧每秒的性能。此外,EdgeSAM在COCO和LVIS数据集上的mIoUs分别提升了2.3和3.2,性能优于MobileSAM。该项目支持ONNX和CoreML平台,并已经集成到多个开源工具中。用户还可以通过iOS App方便地使用EdgeSAM。
Logo of zed
zed
Zed是Atom和Tree-sitter创始团队开发的高性能实时协作代码编辑器。该工具支持macOS和Linux系统,可通过直接下载或包管理器安装。Zed以其出色性能和协作功能为开发团队提供效率提升。作为一个活跃的开源项目,Zed欢迎开发者参与贡献,目前正在开发Windows和Web版本。
Logo of ksuid
ksuid
ksuid是一个Go语言库,用于生成和解析可排序的唯一标识符KSUID。该库提供自然排序、无冲突和无依赖的标识符,具有高度可移植性。经过生产环境验证和性能优化,ksuid提供丰富的接口和命令行工具,适用于多种场景的唯一标识需求。
Logo of html5-parser
html5-parser
html5-parser是一个基于C语言开发的HTML 5解析器,为Python提供高性能的HTML解析功能。该解析器比纯Python实现(如html5lib)的速度快30多倍,同时严格遵守HTML 5标准。项目提供详细文档,适合需要高效处理HTML内容的Python开发者。
Logo of polars
polars
Polars是一个基于Rust开发的高性能数据处理引擎,提供Python、Node.js和R等多语言接口。它采用Apache Arrow列式内存模型,实现惰性/即时执行、多线程和SIMD等技术,高效处理大规模数据。Polars具有强大的表达式API和查询优化能力,支持流式处理超大数据集,在TPC-H基准测试中性能优异。此外,Polars还支持SQL查询和命令行操作,是一款轻量而强大的数据分析工具。
Logo of WuKongIM
WuKongIM
WuKongIM是一个开源的高性能通用通讯系统,适用于即时通讯、站内消息、消息中台等多种场景。系统特点包括大规模群聊支持、低资源消耗、高安全性和卓越性能。采用自研二进制协议和分布式架构,实现消息永久存储和多设备同步。WuKongIM部署简便,提供多平台SDK,是开发即时通讯应用的理想基础架构。
Logo of taffy
taffy
Taffy是用Rust编写的UI布局库,实现了CSS Block、Flexbox和Grid布局算法。它为Dioxus、Bevy等知名项目提供支持,具有高性能和跨平台特性。Taffy提供简洁API,便于创建复杂布局树和高效计算布局。在大规模布局计算中表现出色,适用于构建现代UI和GUI应用。
Logo of otter
otter
Otter是基于缓存和并发数据结构研究的Go语言高性能缓存库。它具有简单API、自动配置、泛型支持、TTL和基于成本的驱逐等特性。Otter使用S3-FIFO算法实现高命中率,可处理大量并发请求。这个库为需要高性能内存缓存的Go项目提供优秀的吞吐量和内存效率。