Project Icon

tracr

开源编译器实现RASP程序到Transformer权重的转换

tracr是一个开源编译工具,可将RASP程序转换为Transformer权重。它通过追踪程序、推断基向量和中间表示,最终生成Haiku模型。tracr支持类别和数值表示,使用BOS标记实现多种操作,并探索了残差流压缩嵌入。研究人员可以利用tracr编译RASP程序,查看中间激活值,深入分析模型行为,为Transformer可解释性研究提供实验平台。

iTransformer - 先进的时间序列预测模型,打造SOTA性能
GithubiTransformer人工智能开源项目时间序列预测注意力网络深度学习
iTransformer是一种基于注意力机制的时间序列预测模型,由清华大学和蚂蚁集团研究人员开发。该模型采用倒置Transformer结构,支持多变量和多步长预测。iTransformer引入了可逆实例归一化等技术,旨在提高预测准确性和处理长序列数据的能力。这个开源项目为时间序列分析提供了新的研究方向。项目提供Python实现,支持使用PyTorch框架。用户可通过pip安装并轻松集成到现有的时间序列分析工作流程中。该项目还包括实验性功能,如二维注意力和傅里叶变换增强版本,为研究人员提供了探索和改进的空间。
tesstrain - Tesseract 5训练流程自动化工具
GithubOCRTesseract图像处理开源项目机器学习模型训练
tesstrain是一个基于Makefile的Tesseract 5训练工作流工具。它提供完整的OCR模型训练流程,包括数据准备、训练、评估和可视化。支持自定义模型、微调和从头训练,具有灵活的配置选项。tesstrain能生成traineddata文件和错误率图表,适用于高效开发和优化Tesseract模型。
bpftrace - Linux eBPF高级跟踪语言助力系统性能分析与调试
GithubLinuxbpftraceeBPF开源项目性能分析系统跟踪
bpftrace是适用于Linux eBPF的高级跟踪语言,专为最新Linux内核设计。它通过LLVM将脚本编译为BPF字节码,并利用libbpf和bcc与Linux BPF系统交互。支持内核和用户级动态跟踪、跟踪点等功能,语法融合了awk、C和DTrace等工具的特点。bpftrace为系统性能分析和调试提供了强大而灵活的工具,适合系统管理员和开发人员使用。
robotic-transformer-pytorch - RT1机器人控制Transformer模型的PyTorch实现
GithubRT1人工智能开源项目机器人变形金刚深度学习计算机视觉
本项目是Google Robotics团队RT1(Robotic Transformer)的PyTorch实现版本。RT1是一个结合视觉和自然语言处理的机器人控制Transformer模型。该实现包含MaxViT视觉主干网络和RT1核心模型,支持视频输入和文本指令处理。项目提供简洁API,实现了条件采样和跨注意力等功能,可应用于多种机器人控制场景。
Megatron-LM - 优化GPU训练技术 加速大规模Transformer模型
GPU优化GithubMegatron-CoreMegatron-LM分布式训练大语言模型开源项目
Megatron-LM框架利用GPU优化技术实现Transformer模型的大规模训练。其Megatron-Core组件提供模块化API和系统优化,支持自定义模型训练。该项目可进行BERT、GPT、T5等模型预训练,支持数千GPU分布式训练百亿参数级模型,并提供数据预处理、模型评估和下游任务功能。
Trainer - 基于PyTorch的通用模型训练框架
GithubPyTorchTrainer多GPU训练实验日志开源项目模型训练
Trainer是一个基于PyTorch的开源模型训练框架,具有简洁的代码结构和灵活的优化控制。该框架支持自动优化、高级优化循环、批量大小查找、分布式训练和Accelerate集成。此外,Trainer提供回调功能、性能分析和多种实验日志记录选项,包括Tensorboard和ClearML等。这个框架适用于各类深度学习任务,能够简化训练流程并提升效率。
happy-transformer - 便捷调优与推理NLP Transformer模型
GithubHappy TransformerNLP开源项目文本分类文本生成词预测
Happy Transformer提供简单的方法来调优和推理NLP Transformer模型,主要功能包括DeepSpeed训练、Apple的MPS训练及推理、WandB训练追踪以及直接推送模型到Hugging Face的Model Hub。支持的任务涵盖文本生成、文本分类、单词预测、问答、文本到文本、下一句预测和标记分类。
T-MAC - 优化低比特量化LLM推理的CPU加速框架
CPU加速GithubLLM推理T-MAC低比特量化开源项目矩阵乘法
T-MAC是一个创新的内核库,采用查找表技术实现混合精度矩阵乘法,无需反量化即可加速CPU上的低比特LLM推理。该框架支持多种低比特模型,包括GPTQ/gguf的W4A16、BitDistiller/EfficientQAT的W2A16和BitNet的W1(.58)A8。T-MAC在多种设备上展现出显著性能提升,例如在Surface Laptop 7上,单核处理速度可达20 tokens/s,四核可达48 tokens/s,比llama.cpp快4~5倍。
transformer-explainer - 帮助理解Transformer模型与GPT-2预测的实时交互式工具
GPT-2Georgia Institute of TechnologyGithubMIT许可Transformer Explainer交互式可视化工具开源项目
Transformer Explainer 是一款互动可视化工具,帮助理解基于Transformer的模型如GPT的工作原理。该工具在浏览器中运行实时的GPT-2模型,允许实验自己的文本并实时观察Transformer内部组件的协同预测过程。适合技术人员与学习者深入探索Transformer模型机制与应用。
TransformerEngine - 用于在 NVIDIA GPU 上加速 Transformer 模型的库
FP8GithubHopper GPUNVIDIATransformer Engine开源项目深度学习
Transformer Engine是NVIDIA推出的一个库,专门用于在其GPU上加速Transformer模型。该库支持8位浮点(FP8)精度,使训练和推理性能大幅提升的同时,内存使用降低。TE提供了一系列优化的构建模块和混合精度API,适用于各种流行的深度学习框架,保证精度不受影响。通过与主流大型语言模型库的集成,简化了FP8支持的实现,使Transformer模型的训练和推理更加高效和便捷,适用于多种NVIDIA GPU架构。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号