Project Icon

highway

多架构支持的高性能SIMD向量化库

Highway是一个跨平台C++向量化库,支持x86、ARM等多种CPU架构的SIMD指令。它提供统一API,实现一次编码多平台运行,支持静态编译和运行时动态调度。Highway适用于图像处理、数据压缩、密码学等领域,提供丰富的向量化操作,易用性和性能兼备,是开发高性能软件的理想选择。

hap - GPU加速视频编解码器
GPU解压GithubHAP开源项目视频处理视频编解码器
HAP是一个利用图形硬件进行视频解压缩的编解码器家族,能够显著降低CPU使用率。通过GPU加速技术,为实时视频处理和多路高分辨率视频播放提供了高效解决方案,适用于CPU密集型场景。HAP提供开源规范和参考源代码,支持多种编码工具。该项目为开发者提供了丰富的测试材料,可用于验证解码器实现。
frugally-deep - 在C++中运行Keras模型,无需依赖TensorFlow的小型的头文件库
C++GithubKerasTensorFlowfrugally-deep开源项目模型预测
frugally-deep是一个小型的头文件库,允许在C++中运行Keras模型进行预测而无需依赖TensorFlow。它依赖于FunctionalPlus、Eigen和json头文件库,支持复杂的模型拓扑,并显著减小二进制大小。项目特点包括支持多种层类型、节省RAM以及通过并行处理提高预测性能。frugally-deep在单核CPU上表现相对较快,适合内存敏感和需要快速部署的应用。
Phi-3-medium-128k-instruct-GGUF - Phi-3-medium-128k-instruct模型的多硬件平台适配与量化选项
GithubHuggingfacePhi-3-medium-128k-instructllama.cpp开源项目模型模型下载自然语言处理量化
Phi-3-medium-128k-instruct项目以llama.cpp最新版本为基础,提供多种量化模型以适应不同内存与性能需求,支持包括Nvidia的cuBLAS、AMD的rocBLAS、CPU及Apple Metal在内的多种硬件平台。推荐使用Q6_K_L和Q5_K_M版本以实现高精度场景需求。用户可利用huggingface-cli选择性下载所需模型,以达到速度与质量的最佳平衡。
LibtorchSegmentation - 高性能C++图像分割库
C++库GithubLibTorch图像分割开源项目神经网络预训练模型
LibtorchSegmentation是基于LibTorch的C++图像分割库,提供高级API和多种模型架构。支持15种预训练编码器,推理速度比PyTorch CUDA快35%。该库简单易用yet功能强大,适合快速开发和部署各类图像分割应用。
VideoProcessingFramework - GPU加速视频处理框架 提供编解码和格式转换功能
GPU加速GithubNVIDIAPyNvVideoCodecVideoProcessingFramework开源项目视频处理
VideoProcessingFramework是一个开源的视频处理框架,由C++库和Python绑定组成。它利用GPU硬件加速实现高效的视频解码、编码、转码以及色彩空间和像素格式转换。该框架支持将GPU内存中的视频帧直接导出为PyTorch张量,避免了额外的数据传输。适用于Linux和Windows平台,依赖NVIDIA驱动、CUDA和FFMPEG。目前正逐步被功能类似但API更简洁的PyNvVideoCodec库取代。
SmartSim - 为高性能计算环境优化的机器学习集成框架
GithubOrchestratorSmartRedisSmartSim开源项目机器学习高性能计算
SmartSim是为高性能计算(HPC)环境设计的工作流库,简化了PyTorch和TensorFlow等机器学习库在HPC模拟和应用中的使用。该框架能在HPC系统上启动机器学习基础设施,与用户工作负载并行运行。通过基础设施库和SmartRedis客户端,SmartSim实现了HPC应用与机器学习模型间的高效数据交换和远程执行,支持Fortran、C、C++和Python等多种语言,无需MPI即可实现运行时数据交换。
ad-rss-lib - 开源C++库实现自动驾驶责任敏感安全模型
C++库GithubRSS安全模型开源开源项目自动驾驶
ad-rss-lib是一个开源C++库,实现了自动驾驶责任敏感安全(RSS)模型。该库可处理多车道、交叉路口和非结构化道路场景,为自动驾驶系统提供安全约束。支持自动驾驶地图集成和Python开发,已在CARLA模拟器和百度Apollo平台中应用,为自动驾驶安全研究提供了有力工具。
tinyengine - 微控制器神经网络库优化内存和性能
GithubTinyEngine内存优化开源项目微控制器推理加速深度学习
TinyEngine是专为微控制器设计的神经网络库,通过原地深度卷积和基于块的推理等技术优化内存管理和推理性能。相比现有解决方案,TinyEngine将推理速度提升1.1-18.6倍,峰值内存减少1.3-3.6倍。作为微控制器AI应用的基础设施,TinyEngine在有限内存预算下实现了更高性能,为微控制器深度学习部署提供了有力支持。
CGraph - 基于C++的高效DAG调度框架
C++CGraphGithub图流程执行框架并发执行开源项目无依赖跨平台
CGraph是一个纯C++实现的跨平台DAG(有向无环图)执行框架,无第三方依赖。框架支持自定义算子构建和灵活的运行调度,包括依赖、并行和聚合等。CGraph提供流水线、节点、组、参数和切面等功能模块,以及多种工具和插件,可提高开发效率。该框架兼容MacOS、Linux和Windows等主流操作系统及IDE。
thundersvm - GPU加速的开源支持向量机库
GPU加速GithubThunderSVM并行计算开源项目支持向量机机器学习
ThunderSVM是一个开源的支持向量机库,通过GPU和多核CPU加速计算,显著提高SVM训练效率。该库实现了LibSVM的全部功能,支持一类SVM、SVC、SVR和概率SVM等多种模型。ThunderSVM提供Python、R、Matlab和Ruby等多种编程语言接口,跨平台兼容Linux、Windows和MacOS。采用与LibSVM一致的命令行参数,便于用户快速上手。作为高效的SVM实现,ThunderSVM为数据科学家和机器学习研究者提供了强大的工具支持。在某些大规模数据集上,ThunderSVM相比传统SVM实现可实现10-100倍的加速,已被多个知名机器学习项目采用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号