#Github

dream-textures - 通过文本提示在Blender中生成无缝纹理和概念艺术,并支持本地运行
Dream TexturesBlenderStable DiffusionAI绘图纹理生成Github开源项目
Dream Textures是一款Blender插件,通过文本提示生成纹理、概念艺术和背景资产。支持无缝拼接、场景投影和动画再设计等功能,用户可本地运行模型,避免在线服务延迟。兼容CUDA和Apple Silicon GPU,适用于4GB以上显存设备。若硬件不支持,可使用DreamStudio进行云端处理。插件提供详细的安装指南和使用教程,并有活跃的社区支持,适合高效生成和处理图像资源的创意工作者。
adversarial-robustness-toolbox - 机器学习安全与对抗性威胁防护库
Adversarial Robustness Toolbox机器学习安全对抗性威胁模型防御Linux Foundation AI & DataGithub开源项目
Adversarial Robustness Toolbox (ART) 是由 Linux Foundation AI & Data Foundation 托管的 Python 库,为开发者和研究人员提供评估和防护机器学习模型的工具,以抵御规避、投毒、提取和推理等对抗性威胁。ART 支持所有流行的机器学习框架(如 TensorFlow、Keras、PyTorch 等),适用于各种数据类型(图像、表格、音频、视频等)和任务(分类、目标检测、语音识别等)。持续开发中,欢迎反馈和贡献。
Production-Level-Deep-Learning - 生产级深度学习系统的部署与优化工程指南
Deep LearningMachine LearningTFXTensorFlowPyTorchGithub开源项目
本项目提供全面的工程指南,指导在实际应用中部署生产级深度学习系统。涵盖数据管理、开发、训练、评估、测试和部署等关键模块,并推荐最佳实践和工具。内容借鉴Full Stack Deep Learning Bootcamp、TFX Workshop和Pipeline.ai的高级KubeFlow Meetup,确保用户应对从模型训练到生产部署的各种挑战。
Machine-Learning-Interviews - 机器学习工程师面试指南,大厂技术面试全攻略
Machine LearningAI Engineering面试准备FAANG大厂面试Github开源项目
该指南专为机器学习工程师和应用科学家职位的技术面试设计,特别适用于FAANG等大厂。内容包括算法与数据结构、机器学习编码、系统设计、基础知识和行为面试模块。作者基于自身的面试经验和笔记编写,分享如何有效准备常见面试模块。尽管不同公司的机器学习面试结构有所不同,本指南的模块对其他相关职位也有参考价值,帮助应聘者更好地应对机器学习领域的技术挑战。
paper-qa - 高效PDF与文本文件问答工具
PaperQAOpenAIlangchainLLMPDF解析Github开源项目
PaperQA是一款轻量级工具,专为从PDF和文本文件中进行问答设计,通过内嵌引用确保答案准确。默认使用OpenAI Embeddings,支持与langchain和开源模型结合。其流程包括文档向量化、查询向量化、文档搜索、摘要生成、相关摘要选择,并生成最终答案。PaperQA支持异步操作,兼容多种LLM,并提供多种自定义和扩展选项,如本地向量存储和Zotero数据库集成,是科研人员高效处理文档问答的理想选择。
argilla - AI数据集管理与优化工具
Argilla数据质量模型优化AI工程师数据集Github开源项目
Argilla是一款为AI工程师和领域专家设计的数据集管理工具,旨在通过高效的数据管理和标注流程提升AI项目的数据质量和模型效果。Argilla支持文本分类、命名实体识别和多模态模型等多种AI项目的数据收集和反馈,帮助用户快速迭代和优化数据与模型。该工具提供开源社区支持,用户可以参与并共享开源数据集和模型。通过与Hugging Face Spaces的集成,用户可以轻松部署和使用Argilla,提高AI项目的整体效率和质量。
metavoice-src - 1.2B参数开源TTS模型,支持情感语音合成和跨语言声音克隆
MetaVoice-1BTTS语音克隆情感语音开源Github开源项目
MetaVoice-1B是一个开源的1.2B参数TTS模型,经过10万小时的语音训练,支持英语情感语音合成和零样本的美式和英式语音克隆(仅需30秒参考音频)。该模型还支持跨语言声音克隆和任意长度文本的语音合成。可通过云端或本地部署使用,并提供Hugging Face和Google Colab的演示。
photoshot - 开源AI头像生成应用,生成独特虚拟形象
PhotoshotAI头像生成器Stable DiffusionNext.jsChakra UIGithub开源项目
Photoshot是一款开源AI头像生成应用,利用Stable Diffusion模型生成独特虚拟形象。应用由Next.js、Chakra UI、Prisma和Replicate等技术构建,支持AWS S3图片存储和Stripe支付。用户通过简单安装和配置环境变量快速启动,并使用Docker管理本地数据库和邮件服务器,轻松运行开发服务器生成和定制头像。
riffusion-hobby - 用于实时音乐和音频生成的开源稳定扩散库
Riffusion音乐生成音频处理稳定扩散实时生成Github开源项目
Riffusion是一个开源库,利用稳定扩散技术实现实时音乐和音频生成,并在图像和音频之间进行转换。该库提供扩散管道、命令行工具和互动应用,支持通过Flask服务器进行模型推理。支持CPU、CUDA和MPS后端,推荐使用CUDA支持的GPU以获得最佳性能。虽然项目已停止维护,但用户仍可参考相关资源和指南进行安装和使用。
dataherald - 企业级自然语言到SQL查询解决方案
Dataherald自然语言SQL引擎数据仓库APIGithub开源项目
Dataherald 提供企业级自然语言到SQL的查询解决方案,允许用户直接用英语查询数据仓库,获取洞察,无需数据分析师。Dataherald 支持在SaaS应用中实现生产数据库的问答功能,并能基于专有数据创建 ChatGPT 插件。该项目包含核心引擎、应用API层、前端管理控制台及Slackbot组件,支持完整的端到端部署。用户可通过Docker轻松本地运行和设置各服务,适合多种需求的企业用户。
stable-diffusion.cpp - 纯C/C++实现的Stable Diffusion推理,支持多种模型和内存优化
stable-diffusion.cppggmlPhotoMakerESRGANControl NetGithub开源项目
该项目基于ggml实现了轻量级纯C/C++的Stable Diffusion推理,支持SD1.x至SD3的多种模型,包括SD-Turbo和PhotoMaker。项目特色有16位和32位浮点支持、4至8位整数量化、CPU和GPU加速、Flash Attention内存优化及多平台兼容。用户可以下载可执行文件或选择手动构建,并且无需转换为.ggml或.gguf格式。
ADeus - 开源AI可穿戴设备,捕捉并存储用户语音数据
Adeus开源可穿戴设备AI助手数据存储Github开源项目
Adeus是开源的AI可穿戴设备,能捕捉并转录用户在现实生活中的语音数据,并将其存储在用户自有服务器上。通过移动或网页应用,用户可与Adeus互动,并获得个性化的AI体验。设备包含移动/网页应用、硬件设备和Supabase后端三部分,确保用户数据自主掌控。
reloadium - IDE热重载与性能分析工具
ReloadiumAI热重载调试IDE集成Github开源项目
Reloadium为IDE提供热重载、性能分析和AI功能,支持PyCharm和其他即将支持的IDE。可通过pip简单安装,适用于独立库和插件模式。提供即时反馈、错误管理和项目文件刷新功能。支持Django、Flask、SqlAlchemy和Pandas等框架,实现实时内容更新和数据库回滚,简化Web开发和数据科学操作。
Devon - 开源智能编程助手
Devon开源代码编辑多模型支持社区驱动Github开源项目
Devon是开源的智能编程助手,提供多模型支持、多文件编辑和代码探索功能。简单的安装步骤帮助用户快速上手,提供测试编写、配置写入和错误修复等多种功能。项目处于早期阶段,欢迎社区贡献和反馈,当前支持Anthropic和OpenAI API密钥,计划增加更多模型支持。
gptlink - 快速搭建AI对话环境
GPTLinkDocker部署API KeyPHPVueGithub开源项目
GPTLink是一个开源项目,通过简单步骤快速搭建AI对话平台。支持PHP与Vue的结合,推荐使用Docker进行高效部署,并提供移动端适配、开箱即用的控制台、自定义付费套餐等功能。还支持一键导出对话和任务拉新功能。项目包含前端源码和即将发布的管理端源码。使用GPTLINK Key,可以轻松获取API Key,无需审核和代理。更多配置和部署文档详见项目仓库,帮助用户快速构建和管理AI对话平台。
serving - 灵活且高效的机器学习模型推理平台
TensorFlow Serving模型部署机器学习高性能推理DockerGithub开源项目
TensorFlow Serving 是一个为生产环境设计的灵活且高性能的机器学习模型推理系统。它管理训练后的模型生命周期,通过高效查询表提供版本化访问,支持多模型和多版本同时部署。系统支持 gRPC 和 HTTP 推理端点,允许无缝部署新版本,支持金丝雀发布和 A/B 测试,并且延迟极低。调度器将推理请求分组以在 GPU 上联合执行,支持包括 TensorFlow 模型、嵌入、词汇表和特征转换在内的多种服务对象。
pytorch-metric-learning - 高级度量学习工具库,适用于深度学习
PyTorch Metric LearningTripletMarginLossloss函数嵌入模型训练Github开源项目
PyTorch Metric Learning提供多种损失函数、挖掘器和评估工具,支持自定义和无监督学习。该库适用于各种训练和测试需求,配有详细文档和示例,适合高效嵌入空间计算的应用场景。
gluon-cv - 计算机视觉领域的深度学习模型工具包,支持PyTorch和MXNet框架
GluonCV计算机视觉深度学习图像分类对象检测Github开源项目
GluonCV是一个面向工程师、研究人员和学生的计算机视觉深度学习工具包,支持快速原型设计。其主要功能包括可复现SOTA结果的训练脚本、对PyTorch和MXNet框架的支持、大量预训练模型,以及简化实现的API设计和社区支持。用户还可以通过AutoGluon执行图像分类和目标检测任务。
MONAI - 基于PyTorch的医疗影像深度学习开源平台
MONAIPyTorch医疗成像深度学习框架开源软件Github开源项目
MONAI是一个基于PyTorch的开源平台,专注于医疗影像的深度学习。它提供灵活的数据预处理、易于集成的API、领域特定的网络和评估指标,并支持多GPU和多节点数据并行。MONAI旨在为学术、工业和临床研究者提供优化和标准化的模型创建和评估工具,促进跨领域合作。
graph_nets - DeepMind的图神经网络库,支持TensorFlow和Sonnet
Graph NetsTensorFlowSonnet安装演示Github开源项目
Graph Nets是由DeepMind开发的图神经网络库,兼容TensorFlow和Sonnet。支持Linux和Mac OS X,以及Python 2.7和3.4+。该库适用于CPU和GPU版本的TensorFlow,但需要单独安装TensorFlow。Graph Nets提供了详细的安装指南、使用示例和多个演示,包括最短路径、排序和物理预测任务。用户可以通过Colaboratory在浏览器中运行这些演示,体验图神经网络的灵活性和强大功能。
DeepPavlov - 跨平台多功能的开源对话AI库
DeepPavlovPyTorchNLP对话系统开源Github开源项目
DeepPavlov是一个基于PyTorch的开源对话AI库,适用于生产级聊天机器人、复杂对话系统开发和自然语言处理研究。支持Linux、Windows和MacOS平台,兼容Python 3.6至3.11版本。提供丰富的预训练NLP模型,如命名实体识别、意图分类、文本问答和句子相似度等,支持CLI和Python接口,便于模型训练、评估和推断。通过REST API和Socket API实现与AWS等服务的无缝集成。
clearml - ML/DL 开发和生产套件
ClearML实验管理MLOps数据管理模型部署Github开源项目
ClearML是一个开源平台,集成了实验管理、MLOps/LLMOps、数据管理、模型服务和报告生成功能。支持云端和本地部署,帮助用户实现AI项目的高效管理和自动化,包括实验记录、数据版本控制、模型部署与监控等。ClearML支持多种机器学习和深度学习框架,并与Jupyter Notebook无缝集成,适合团队协作和远程任务执行,提升AI工作流效率。
OpenPrompt - 开源Prompt学习框架,兼容多种预训练模型和自定义模板
OpenPromptPrompt-learningNLPPre-trained Language ModelsPythonGithub开源项目
OpenPrompt是一个开源的Prompt学习框架,提供灵活且可扩展的解决方案,兼容Huggingface transformers等预训练模型。支持多种提示方法,如模板化和Verbalizer,简化Prompt学习和模型训练。支持UltraChat等新项目,广泛应用于各类NLP任务。
StabilityMatrix - Stability Matrix多平台包管理与推理UI
Stability MatrixStable Diffusion多平台包管理器推理界面模型浏览器Github开源项目
Stability Matrix提供一键安装和更新Stable Diffusion Web UI包,支持多种包和扩展插件管理。内置推理界面具有自动完成功能和语法高亮,多标签工作区支持项目文件的保存和加载。跨平台支持Windows、Linux和macOS,便于管理Python依赖,导入本地或在线模型,并提供便携使用体验。
pytorch-forecasting - 前沿的时间序列预测工具包,提供灵活的高层API
PyTorch Forecasting时间序列预测深度学习神经网络PyTorch LightningGithub开源项目
PyTorch Forecasting 是一个基于 PyTorch 的时间序列预测包,适用于实际应用和研究。它支持多种神经网络架构及自动日志记录,利用 PyTorch Lightning 实现多 GPU/CPU 的扩展训练,并内置模型解释功能。关键特性包括时间序列数据集类、基本模型类、增强的神经网络架构、多视角时间序列指标和超参数优化。安装简便,支持 pip 和 conda,文档详尽,并包含模型比较和使用案例。
olivia - 保护隐私和高度可定制化的开源Golang聊天机器人
OliviaGolangMachine Learning开源聊天机器人Progressive Web ApplicationGithub开源项目
Olivia是一个使用Golang和机器学习技术构建的开源聊天机器人,提供免费的替代方案。用户可以通过语音或文字与Olivia交流,获取文本或语音回复。项目支持用户通过GitHub克隆和自定义,网站为渐进式Web应用,适合移动设备使用。
chatbot - 可用自定义语料训练的中文聊天机器人
chatbotGPT模型MindSporeRLHFSeq2SeqGithub开源项目
该项目提供一个可用自定义语料训练的中文聊天机器人,并即将推出GPT版本,新增MindSpore支持。项目包含Seq2Seq和GPT两大分支,计划于2024年内实现类似mini-GPT4的图文多模态对话功能,并增强分布式集群训练能力。用户可下载小黄鸡语料进行实践,项目支持TensorFlow和PyTorch。
tensorwatch - 数据科学和机器学习的实时可视化与调试工具
TensorWatchMicrosoft机器学习数据可视化Jupyter NotebookGithub开源项目
TensorWatch是由微软研究院开发的调试和可视化工具,专为数据科学、深度学习和强化学习设计。它运行在Jupyter Notebook中,提供实时的机器学习训练可视化和分析功能。其灵活的架构允许创建自定义的可视化、界面和仪表板,并支持独特的Lazy Logging模式进行实时查询和流式数据处理。TensorWatch支持多种图表类型和并行流可视化,是一个易于使用且可扩展的调试平台。
webots - 跨平台机器人模拟开发环境,支持安装与源码编译
Webots机器人模拟器Cyberbotics开源软件机器人编程Github开源项目
Webots是一款开源机器人模拟软件,提供用于建模、编程和模拟机器人、车辆及机械系统的完整开发环境。支持Linux、Windows和macOS平台安装,并可从源代码编译。Webots由EPFL于1996年设计,Cyberbotics自1998年起持续开发,并于2018年开源,适用于工业和学术研究,提供丰富的应用案例和竞赛活动。
ragapp - 简单配置的企业级Agentic RAG方案
RAGappDockerLlamaIndexOpenAI云基础设施Github开源项目
RAGapp是一款企业级Agentic RAG解决方案,配置简单如OpenAI的自定义GPT,可通过Docker部署在云基础设施中。基于LlamaIndex构建,支持OpenAI和Gemini托管AI模型以及本地Ollama模型。提供Docker Compose和即将推出的Kubernetes部署选项。访问Admin UI进行配置,详情请参阅各端点和安全信息。
core - 高效构建AI原生开发环境框架
OpenSumiAI Native IDE代码编辑器开发框架开源项目Github
OpenSumi是一个高效的框架,用于快速构建AI原生的IDE产品,适用于云端和桌面应用。它支持多种开发环境,显著提升开发效率和用户体验。提供详细的文档、贡献指南和丰富的示例项目,全方位支持开发者。
sql-explorer - 数据查询和共享资源管理器
SQL ExplorerDjango数据查询SQL编辑器AI助手Github开源项目
SQL Explorer是一款Django应用,旨在简化和加速数据流动。它支持多种SQL数据库连接,用户可上传JSON或CSV文件进行查询,并内置AI SQL助手协助编写和调试查询。该工具提供查询历史、日志、定期数据快照,以及浏览器内统计和图表功能。SQL Explorer采用MIT许可证,既适合集成到现有Django站点,也可独立使用。
riffusion-app-hobby - 基于稳定扩散技术的实时音乐开源应用
Riffusion音乐生成实时稳定扩散Next.jsGithub开源项目
Riffusion是一款基于稳定扩散技术的实时音乐生成应用程序,支持Next.js、React、Typescript、three.js、Tailwind和Vercel技术栈。用户可通过安装Node v18或更高版本运行开发服务器,并在本地浏览器中查看应用。项目需要配置推理服务器来快速生成模型输出,适用于大GPU用户。请在二次开发时引用相关工作。
courses - AI课程和资源精选合集
AI courses人工智能深度学习自然语言处理机器学习Github开源项目
本仓库汇集了各种人工智能课程和资源链接,适合不同学习阶段的用户。涵盖生成式AI、深度学习、自然语言处理等多个主题的免费课程,资源来自麻省理工学院、斯坦福大学、哈佛大学等知名机构。欢迎贡献和建议,共同打造优质的AI学习平台。
sketch-code - 手绘线框图转HTML代码的深度学习工具
SketchCode深度学习HTML生成手绘线框图图像字幕Github开源项目
SketchCode使用深度学习将手绘网站线框图转换为工作HTML代码。该项目通过图像字幕架构生成HTML标记,实现手绘线框图的前端代码自动生成。目前作为概念验证,其性能依赖于与核心数据集相似的线框图,但展示了自动化前端开发的潜力。了解更多关于依赖安装、预训练模型使用和模型训练的详细信息。
bytom - 高度可扩展的区块链协议,实现数字资产的管理与交易
区块链数字资产多资产共享账本Go语言Github开源项目Bytom
Bytom是一种区块链协议,支持用户定义、发行和转移数字资产。其官方golang实现提供关键管理、账户及资产管理、交易发送等功能,可通过Homebrew或源码安装。项目正在积极开发中,提供详细的安装和运行指南,并欢迎社区贡献。