Project Icon

cuml

高性能GPU机器学习库

cuML是RAPIDS生态系统中的GPU加速机器学习库,提供与scikit-learn兼容的API。它支持在GPU上执行传统表格机器学习任务,无需深入CUDA编程。对大型数据集,cuML的性能可比CPU实现提升10-50倍。该库还支持多GPU和多节点多GPU操作,并通过Dask实现分布式计算。

mlc-llm - 通用大语言模型高性能部署引擎
AI模型优化GithubMLC LLMMLCEngine开源项目机器学习编译器高性能部署
MLC LLM是一款用于大语言模型的高性能部署引擎,支持用户在各种平台上开发、优化和部署AI模型。核心组件MLCEngine通过REST服务器、Python、JavaScript、iOS和Android等接口提供OpenAI兼容的API,支持AMD、NVIDIA、Apple和Intel等多种硬件平台。项目持续优化编译器和引擎,与社区共同发展。
ML-DL-scripts - 机器学习和深度学习的全面脚本库 从分类到部署的解决方案
GitHubGithubPython开源项目数据科学机器学习深度学习
ML-DL-scripts是一个综合性的机器学习和深度学习Python脚本库。这个项目涵盖了从分类、回归到聚类和时间序列分析等多个领域,同时提供了PyTorch、Fastai和Keras等主流深度学习框架的使用示例。项目还包括图像处理、自然语言处理和异常检测等实际应用案例,以及基于Docker的模型部署配置。这个代码库为数据科学研究和机器学习应用提供了丰富的技术参考资源。
llm.c - 纯C和CUDA实现的高效轻量级语言模型训练框架
CUDAC语言GPU训练GithubLLM开源项目
llm.c是一个使用纯C和CUDA实现的高效轻量级语言模型训练框架。该项目不依赖PyTorch或cPython等大型框架,通过简洁代码实现GPT-2和GPT-3系列模型的预训练。llm.c支持单GPU、多GPU和多节点训练,提供详细教程和实验示例。项目在保持代码可读性的同时追求高性能,适用于教育和实际应用。此外,llm.c支持多种硬件平台,并有多个编程语言的移植版本。
machine-learning - 机器学习与数据科学教程,深度学习、模型部署与强化学习
Githubmachine-learning开源项目强化学习时间序列模型部署深度学习
本项目持续更新,介绍了数据科学和机器学习各个主题。内容涵盖深度学习、模型部署、运筹学和强化学习等,提供Jupyter Notebook格式教程,结合Python科学栈(如numpy、pandas)和开源库(如scikit-learn、TensorFlow、PyTorch)进行教学示范,平衡数学符号与实际应用。
MatmulTutorial - CUDA矩阵乘法内核设计与性能优化实例
CUDAGPU性能优化GithubMLIRMatMulTensorOp开源项目
MatmulTutorial项目展示了CUDA矩阵乘法的多种高性能实现,包括自定义、CuBLAS和CUTLASS等。项目通过详细的性能对比,帮助CUDA初学者理解内核设计优化。在A100 GPU上,项目实现比Relay+CUTLASS平均快1.73倍,与CuBLAS性能相当。项目还研究了MLIR生成CUDA内核,性能达到手写内核的86%。
scikit-learn - Python机器学习的核心工具库
GithubPythonscikit-learn开源项目数据科学机器学习
scikit-learn是基于SciPy构建的Python机器学习库,提供高效的数据挖掘和分析工具。支持分类、回归、聚类等多种机器学习任务,自2007年启动以来由志愿者维护,已成为广受欢迎的开源项目。其特点包括易用性、高性能和完善的文档,在学术和工业领域得到广泛应用。
mleap - 快速部署机器学习流水线与算法的实用工具包
GithubMLeapScikit-learnSpark开源项目性能机器学习数据管道
MLeap提供高性能、便携、易于集成的生产库,支持将Spark和Scikit-learn的机器学习流水线导出为便携格式并执行。通过其执行引擎和序列化格式,数据科学家和工程师可以无需依赖Spark或Scikit-learn环境,将数据流水线和算法轻松部署到生产环境中。MLeap支持多种序列化格式(如JSON、Protobuf),并与现有技术高度集成,提供用户灵活定制数据类型和转换器的能力。
NeMo-Curator - 提供GPU加速的大型语言模型数据集优化与管理解决方案
GPU加速GithubNeMo CuratorPython库大语言模型开源项目数据集准备
NeMo Curator 是一款专为大型语言模型(LLM)设计的开源Python库,通过结合Dask和RAPIDS等技术,实现GPU加速的数据集准备与管理。其功能包括数据下载、语言识别、文本清理、质量过滤、文档去重和个人信息保护等模块,为多种LLM任务提供快速、灵活和可扩展的解决方案,显著提升数据处理效率与模型质量。
www.mlcompendium.com - 机器学习与深度学习资源大全,免费公开,便于学习与作者互动
CompendiumDeep LearningGitBookGitHubGithubMachine Learning开源项目
项目为免费非营利教育工具,包含约500个机器学习及深度学习主题,如算法、特征选择、深度学习、NLP、音频处理等,帮助用户节省搜索时间,连接优秀作者。项目持续更新,支持社区贡献,致力于知识共享和教育普及。
thundersvm - GPU加速的开源支持向量机库
GPU加速GithubThunderSVM并行计算开源项目支持向量机机器学习
ThunderSVM是一个开源的支持向量机库,通过GPU和多核CPU加速计算,显著提高SVM训练效率。该库实现了LibSVM的全部功能,支持一类SVM、SVC、SVR和概率SVM等多种模型。ThunderSVM提供Python、R、Matlab和Ruby等多种编程语言接口,跨平台兼容Linux、Windows和MacOS。采用与LibSVM一致的命令行参数,便于用户快速上手。作为高效的SVM实现,ThunderSVM为数据科学家和机器学习研究者提供了强大的工具支持。在某些大规模数据集上,ThunderSVM相比传统SVM实现可实现10-100倍的加速,已被多个知名机器学习项目采用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

问小白

问小白是一个基于 DeepSeek R1 模型的智能对话平台,专为用户提供高效、贴心的对话体验。实时在线,支持深度思考和联网搜索。免费不限次数,帮用户写作、创作、分析和规划,各种任务随时完成!

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

Trae

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号