Project Icon

MatmulTutorial

CUDA矩阵乘法内核设计与性能优化实例

MatmulTutorial项目展示了CUDA矩阵乘法的多种高性能实现,包括自定义、CuBLAS和CUTLASS等。项目通过详细的性能对比,帮助CUDA初学者理解内核设计优化。在A100 GPU上,项目实现比Relay+CUTLASS平均快1.73倍,与CuBLAS性能相当。项目还研究了MLIR生成CUDA内核,性能达到手写内核的86%。

Llama3-Tutorial - Llama 3模型实践教程 从部署到微调评测
GithubLlama 3大模型开源项目微调评测部署
Llama 3教程项目提供了从本地部署到高效部署和能力评测的全面指导。包含六个课程,涵盖XTuner个性化助手训练、LLaVA图像理解、LMDeploy高效部署和OpenCompass模型评估等核心内容。该教程为开发者提供了实践Llama 3大语言模型的完整流程和关键技能培训。
Meta-Llama-3-70B-Instruct-abliterated-v3.5-IMat-GGUF - 提升量化效率及IMatrix集成以增强文本生成性能
GithubHuggingfaceIMatrixMeta-Llama-3-70B-Instruct-abliterated-v3.5开源项目文本生成模型量化
本项目应用Llama.cpp的量化技术结合IMatrix数据集,对Meta-Llama-3-70B-Instruct-abliterated-v3.5模型进行优化。支持BF16到Q2_K等多种量化格式,用户可根据需求选择下载不同版本,适用于多种文本生成场景。IMatrix集成提升了低比特位的性能表现,适合现代高效计算需求。提供全面的下载指南和FAQ,帮助用户有效地理解和使用文件,实现文本生成任务的高效推理。
FasterTransformer - 基于NVIDIA平台的高性能Transformer编解码器实现与调优
BERTFasterTransformerGPTGithubNVIDIATensorRT-LLM开源项目
FasterTransformer不仅支持多框架集成,还针对NVIDIA新一代GPU优化了编解码性能,极大提升了操作效率和处理速度。包含模型支持、性能对比及API演示的详细文档,有助于用户深入了解并有效使用FasterTransformer。
Merlin - GPU加速推荐系统解决方案 助力大规模数据处理与模型训练
GPU加速GithubNVIDIA Merlin开源项目推荐系统深度学习特征工程
Merlin是NVIDIA开发的开源库,为推荐系统提供GPU加速解决方案。它包含多个组件如NVTabular和HugeCTR,支持大规模数据处理、特征工程、模型训练和部署。Merlin能处理数百TB数据,通过GPU加速提升系统性能。它兼容TensorFlow、PyTorch等框架,便于构建和优化推荐模型。
ComputeLibrary - 优化Arm架构的开源机器学习函数库
ARM架构Compute LibraryGithub开源软件开源项目性能优化机器学习
ComputeLibrary是一个专为Arm架构优化的机器学习函数库,支持Cortex-A、Neoverse处理器和Mali GPU。它提供100多个低级机器学习函数,覆盖多种数据类型和卷积算法,并采用微架构优化、内核融合等先进技术。作为开源项目,ComputeLibrary具有高性能、高度可配置的特点,为Arm平台的机器学习应用开发提供了强大支持。
llm-action - 提升AI模型训练与推理效率的高级技术与指南
GithubLLM实战LLM训练分布式训练参数高效微调开源项目微调技术
llm-action项目为NVIDIA GPU和Ascend NPU上的大模型训练提供简易工具,详细介绍了LLM训练技术的高效微调和分布式技术。深入探究LLM微调实战与技术原理,并提供实际代码示例以供学习和应用。涵盖普适性框架与多模态微调专项技术,适合开发者与研究人员优化和扩展其AI模型的能力。
pytorch-tutorial - 为深度学习研究人员提供了学习 PyTorch 的教程代码
GithubPyTorch代码开源项目教程深度学习神经网络
突破传统学习障碍,探索PyTorch深度学习教程。通过精炼的代码,快速构建从基础到高级的模型如线性回归及神经网络等,同时详述安装指导与环境配置。
tutorial - 机器学习和深度神经网络算法综合教程
Github人工智能开源项目机器学习深度学习神经网络算法
该教程全面介绍机器学习和深度学习算法,涵盖从基础到高级的内容。包括环境搭建、入门指南、框架介绍和核心概念。详细讲解BP神经网络、SVM、决策树等多种算法,以及回归、聚类和贝叶斯等模型。提供丰富的理论知识和实践指导,适合系统学习AI和算法的开发者参考。
ipex-llm-tutorial - 英特尔XPU上的低位大语言模型库教程
GithubIPEX-LLMIntelLLM应用开发开源项目教程
IPEX-LLM教程提供了在英特尔XPU上使用低位大语言模型库的全面指导。内容覆盖从环境配置到高级应用开发,包括中文支持、GPU加速和模型微调等主题。本教程适合希望在英特尔硬件上开发和优化大语言模型应用的开发者,帮助他们深入了解IPEX-LLM的功能和实际应用。
numerical-linear-algebra - 探讨如何使用Python及其科学计算库在Jupyter笔记本中进行高速度和高准确性的矩阵计算
GithubPython开源项目教程数值分解数据科学线性代数
本课程深入探讨如何使用Python及其科学计算库在Jupyter笔记本中进行高速度和高准确性的矩阵计算。从基础的矩阵运算到复杂的分解技术,全方位提升数据科学家处理大数据的能力。辅以丰富的视频教学和论坛讨论,构建完善的学习生态。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号