#Github

dream-textures - 通过文本提示在Blender中生成无缝纹理和概念艺术，并支持本地运行

Dream TexturesBlenderStable DiffusionAI绘图纹理生成Github开源项目

Dream Textures是一款Blender插件，通过文本提示生成纹理、概念艺术和背景资产。支持无缝拼接、场景投影和动画再设计等功能，用户可本地运行模型，避免在线服务延迟。兼容CUDA和Apple Silicon GPU，适用于4GB以上显存设备。若硬件不支持，可使用DreamStudio进行云端处理。插件提供详细的安装指南和使用教程，并有活跃的社区支持，适合高效生成和处理图像资源的创意工作者。

adversarial-robustness-toolbox - 机器学习安全与对抗性威胁防护库

Adversarial Robustness Toolbox机器学习安全对抗性威胁模型防御Linux Foundation AI & DataGithub开源项目

Adversarial Robustness Toolbox (ART) 是由 Linux Foundation AI & Data Foundation 托管的 Python 库，为开发者和研究人员提供评估和防护机器学习模型的工具，以抵御规避、投毒、提取和推理等对抗性威胁。ART 支持所有流行的机器学习框架（如 TensorFlow、Keras、PyTorch 等），适用于各种数据类型（图像、表格、音频、视频等）和任务（分类、目标检测、语音识别等）。持续开发中，欢迎反馈和贡献。

Production-Level-Deep-Learning - 生产级深度学习系统的部署与优化工程指南

Deep LearningMachine LearningTFXTensorFlowPyTorchGithub开源项目

本项目提供全面的工程指南，指导在实际应用中部署生产级深度学习系统。涵盖数据管理、开发、训练、评估、测试和部署等关键模块，并推荐最佳实践和工具。内容借鉴Full Stack Deep Learning Bootcamp、TFX Workshop和Pipeline.ai的高级KubeFlow Meetup，确保用户应对从模型训练到生产部署的各种挑战。

Machine-Learning-Interviews - 机器学习工程师面试指南，大厂技术面试全攻略

Machine LearningAI Engineering面试准备FAANG大厂面试Github开源项目

该指南专为机器学习工程师和应用科学家职位的技术面试设计，特别适用于FAANG等大厂。内容包括算法与数据结构、机器学习编码、系统设计、基础知识和行为面试模块。作者基于自身的面试经验和笔记编写，分享如何有效准备常见面试模块。尽管不同公司的机器学习面试结构有所不同，本指南的模块对其他相关职位也有参考价值，帮助应聘者更好地应对机器学习领域的技术挑战。

paper-qa - 高效PDF与文本文件问答工具

PaperQAOpenAIlangchainLLMPDF解析Github开源项目

PaperQA是一款轻量级工具，专为从PDF和文本文件中进行问答设计，通过内嵌引用确保答案准确。默认使用OpenAI Embeddings，支持与langchain和开源模型结合。其流程包括文档向量化、查询向量化、文档搜索、摘要生成、相关摘要选择，并生成最终答案。PaperQA支持异步操作，兼容多种LLM，并提供多种自定义和扩展选项，如本地向量存储和Zotero数据库集成，是科研人员高效处理文档问答的理想选择。

argilla - AI数据集管理与优化工具

Argilla数据质量模型优化AI工程师数据集Github开源项目

Argilla是一款为AI工程师和领域专家设计的数据集管理工具，旨在通过高效的数据管理和标注流程提升AI项目的数据质量和模型效果。Argilla支持文本分类、命名实体识别和多模态模型等多种AI项目的数据收集和反馈，帮助用户快速迭代和优化数据与模型。该工具提供开源社区支持，用户可以参与并共享开源数据集和模型。通过与Hugging Face Spaces的集成，用户可以轻松部署和使用Argilla，提高AI项目的整体效率和质量。

metavoice-src - 1.2B参数开源TTS模型，支持情感语音合成和跨语言声音克隆

MetaVoice-1BTTS语音克隆情感语音开源Github开源项目

MetaVoice-1B是一个开源的1.2B参数TTS模型，经过10万小时的语音训练，支持英语情感语音合成和零样本的美式和英式语音克隆（仅需30秒参考音频）。该模型还支持跨语言声音克隆和任意长度文本的语音合成。可通过云端或本地部署使用，并提供Hugging Face和Google Colab的演示。

photoshot - 开源AI头像生成应用，生成独特虚拟形象

PhotoshotAI头像生成器Stable DiffusionNext.jsChakra UIGithub开源项目

Photoshot是一款开源AI头像生成应用，利用Stable Diffusion模型生成独特虚拟形象。应用由Next.js、Chakra UI、Prisma和Replicate等技术构建，支持AWS S3图片存储和Stripe支付。用户通过简单安装和配置环境变量快速启动，并使用Docker管理本地数据库和邮件服务器，轻松运行开发服务器生成和定制头像。

riffusion-hobby - 用于实时音乐和音频生成的开源稳定扩散库

Riffusion音乐生成音频处理稳定扩散实时生成Github开源项目

Riffusion是一个开源库，利用稳定扩散技术实现实时音乐和音频生成，并在图像和音频之间进行转换。该库提供扩散管道、命令行工具和互动应用，支持通过Flask服务器进行模型推理。支持CPU、CUDA和MPS后端，推荐使用CUDA支持的GPU以获得最佳性能。虽然项目已停止维护，但用户仍可参考相关资源和指南进行安装和使用。

dataherald - 企业级自然语言到SQL查询解决方案

Dataherald自然语言SQL引擎数据仓库APIGithub开源项目

Dataherald 提供企业级自然语言到SQL的查询解决方案，允许用户直接用英语查询数据仓库，获取洞察，无需数据分析师。Dataherald 支持在SaaS应用中实现生产数据库的问答功能，并能基于专有数据创建 ChatGPT 插件。该项目包含核心引擎、应用API层、前端管理控制台及Slackbot组件，支持完整的端到端部署。用户可通过Docker轻松本地运行和设置各服务，适合多种需求的企业用户。

stable-diffusion.cpp - 纯C/C++实现的Stable Diffusion推理，支持多种模型和内存优化

stable-diffusion.cppggmlPhotoMakerESRGANControl NetGithub开源项目

该项目基于ggml实现了轻量级纯C/C++的Stable Diffusion推理，支持SD1.x至SD3的多种模型，包括SD-Turbo和PhotoMaker。项目特色有16位和32位浮点支持、4至8位整数量化、CPU和GPU加速、Flash Attention内存优化及多平台兼容。用户可以下载可执行文件或选择手动构建，并且无需转换为.ggml或.gguf格式。

ADeus - 开源AI可穿戴设备，捕捉并存储用户语音数据

Adeus开源可穿戴设备AI助手数据存储Github开源项目

Adeus是开源的AI可穿戴设备，能捕捉并转录用户在现实生活中的语音数据，并将其存储在用户自有服务器上。通过移动或网页应用，用户可与Adeus互动，并获得个性化的AI体验。设备包含移动/网页应用、硬件设备和Supabase后端三部分，确保用户数据自主掌控。

reloadium - IDE热重载与性能分析工具

ReloadiumAI热重载调试IDE集成Github开源项目

Reloadium为IDE提供热重载、性能分析和AI功能，支持PyCharm和其他即将支持的IDE。可通过pip简单安装，适用于独立库和插件模式。提供即时反馈、错误管理和项目文件刷新功能。支持Django、Flask、SqlAlchemy和Pandas等框架，实现实时内容更新和数据库回滚，简化Web开发和数据科学操作。

Devon - 开源智能编程助手

Devon开源代码编辑多模型支持社区驱动Github开源项目

Devon是开源的智能编程助手，提供多模型支持、多文件编辑和代码探索功能。简单的安装步骤帮助用户快速上手，提供测试编写、配置写入和错误修复等多种功能。项目处于早期阶段，欢迎社区贡献和反馈，当前支持Anthropic和OpenAI API密钥，计划增加更多模型支持。

gptlink - 快速搭建AI对话环境

GPTLinkDocker部署API KeyPHPVueGithub开源项目

GPTLink是一个开源项目，通过简单步骤快速搭建AI对话平台。支持PHP与Vue的结合，推荐使用Docker进行高效部署，并提供移动端适配、开箱即用的控制台、自定义付费套餐等功能。还支持一键导出对话和任务拉新功能。项目包含前端源码和即将发布的管理端源码。使用GPTLINK Key，可以轻松获取API Key，无需审核和代理。更多配置和部署文档详见项目仓库，帮助用户快速构建和管理AI对话平台。

serving - 灵活且高效的机器学习模型推理平台

TensorFlow Serving模型部署机器学习高性能推理DockerGithub开源项目

TensorFlow Serving 是一个为生产环境设计的灵活且高性能的机器学习模型推理系统。它管理训练后的模型生命周期，通过高效查询表提供版本化访问，支持多模型和多版本同时部署。系统支持 gRPC 和 HTTP 推理端点，允许无缝部署新版本，支持金丝雀发布和 A/B 测试，并且延迟极低。调度器将推理请求分组以在 GPU 上联合执行，支持包括 TensorFlow 模型、嵌入、词汇表和特征转换在内的多种服务对象。

pytorch-metric-learning - 高级度量学习工具库，适用于深度学习

PyTorch Metric LearningTripletMarginLossloss函数嵌入模型训练Github开源项目

PyTorch Metric Learning提供多种损失函数、挖掘器和评估工具，支持自定义和无监督学习。该库适用于各种训练和测试需求，配有详细文档和示例，适合高效嵌入空间计算的应用场景。

gluon-cv - 计算机视觉领域的深度学习模型工具包，支持PyTorch和MXNet框架

GluonCV计算机视觉深度学习图像分类对象检测Github开源项目

GluonCV是一个面向工程师、研究人员和学生的计算机视觉深度学习工具包，支持快速原型设计。其主要功能包括可复现SOTA结果的训练脚本、对PyTorch和MXNet框架的支持、大量预训练模型，以及简化实现的API设计和社区支持。用户还可以通过AutoGluon执行图像分类和目标检测任务。

MONAI - 基于PyTorch的医疗影像深度学习开源平台

MONAIPyTorch医疗成像深度学习框架开源软件Github开源项目

MONAI是一个基于PyTorch的开源平台，专注于医疗影像的深度学习。它提供灵活的数据预处理、易于集成的API、领域特定的网络和评估指标，并支持多GPU和多节点数据并行。MONAI旨在为学术、工业和临床研究者提供优化和标准化的模型创建和评估工具，促进跨领域合作。

graph_nets - DeepMind的图神经网络库，支持TensorFlow和Sonnet

Graph NetsTensorFlowSonnet安装演示Github开源项目

Graph Nets是由DeepMind开发的图神经网络库，兼容TensorFlow和Sonnet。支持Linux和Mac OS X，以及Python 2.7和3.4+。该库适用于CPU和GPU版本的TensorFlow，但需要单独安装TensorFlow。Graph Nets提供了详细的安装指南、使用示例和多个演示，包括最短路径、排序和物理预测任务。用户可以通过Colaboratory在浏览器中运行这些演示，体验图神经网络的灵活性和强大功能。

DeepPavlov - 跨平台多功能的开源对话AI库

DeepPavlovPyTorchNLP对话系统开源Github开源项目

DeepPavlov是一个基于PyTorch的开源对话AI库，适用于生产级聊天机器人、复杂对话系统开发和自然语言处理研究。支持Linux、Windows和MacOS平台，兼容Python 3.6至3.11版本。提供丰富的预训练NLP模型，如命名实体识别、意图分类、文本问答和句子相似度等，支持CLI和Python接口，便于模型训练、评估和推断。通过REST API和Socket API实现与AWS等服务的无缝集成。

clearml - ML/DL 开发和生产套件

ClearML实验管理MLOps数据管理模型部署Github开源项目

ClearML是一个开源平台，集成了实验管理、MLOps/LLMOps、数据管理、模型服务和报告生成功能。支持云端和本地部署，帮助用户实现AI项目的高效管理和自动化，包括实验记录、数据版本控制、模型部署与监控等。ClearML支持多种机器学习和深度学习框架，并与Jupyter Notebook无缝集成，适合团队协作和远程任务执行，提升AI工作流效率。

OpenPrompt - 开源Prompt学习框架，兼容多种预训练模型和自定义模板

OpenPromptPrompt-learningNLPPre-trained Language ModelsPythonGithub开源项目

OpenPrompt是一个开源的Prompt学习框架，提供灵活且可扩展的解决方案，兼容Huggingface transformers等预训练模型。支持多种提示方法，如模板化和Verbalizer，简化Prompt学习和模型训练。支持UltraChat等新项目，广泛应用于各类NLP任务。

StabilityMatrix - Stability Matrix多平台包管理与推理UI

Stability MatrixStable Diffusion多平台包管理器推理界面模型浏览器Github开源项目

Stability Matrix提供一键安装和更新Stable Diffusion Web UI包，支持多种包和扩展插件管理。内置推理界面具有自动完成功能和语法高亮，多标签工作区支持项目文件的保存和加载。跨平台支持Windows、Linux和macOS，便于管理Python依赖，导入本地或在线模型，并提供便携使用体验。

pytorch-forecasting - 前沿的时间序列预测工具包，提供灵活的高层API

PyTorch Forecasting时间序列预测深度学习神经网络PyTorch LightningGithub开源项目

PyTorch Forecasting 是一个基于 PyTorch 的时间序列预测包，适用于实际应用和研究。它支持多种神经网络架构及自动日志记录，利用 PyTorch Lightning 实现多 GPU/CPU 的扩展训练，并内置模型解释功能。关键特性包括时间序列数据集类、基本模型类、增强的神经网络架构、多视角时间序列指标和超参数优化。安装简便，支持 pip 和 conda，文档详尽，并包含模型比较和使用案例。

olivia - 保护隐私和高度可定制化的开源Golang聊天机器人

OliviaGolangMachine Learning开源聊天机器人Progressive Web ApplicationGithub开源项目

Olivia是一个使用Golang和机器学习技术构建的开源聊天机器人，提供免费的替代方案。用户可以通过语音或文字与Olivia交流，获取文本或语音回复。项目支持用户通过GitHub克隆和自定义，网站为渐进式Web应用，适合移动设备使用。

chatbot - 可用自定义语料训练的中文聊天机器人

chatbotGPT模型MindSporeRLHFSeq2SeqGithub开源项目

该项目提供一个可用自定义语料训练的中文聊天机器人，并即将推出GPT版本，新增MindSpore支持。项目包含Seq2Seq和GPT两大分支，计划于2024年内实现类似mini-GPT4的图文多模态对话功能，并增强分布式集群训练能力。用户可下载小黄鸡语料进行实践，项目支持TensorFlow和PyTorch。

tensorwatch - 数据科学和机器学习的实时可视化与调试工具

TensorWatchMicrosoft机器学习数据可视化Jupyter NotebookGithub开源项目

TensorWatch是由微软研究院开发的调试和可视化工具，专为数据科学、深度学习和强化学习设计。它运行在Jupyter Notebook中，提供实时的机器学习训练可视化和分析功能。其灵活的架构允许创建自定义的可视化、界面和仪表板，并支持独特的Lazy Logging模式进行实时查询和流式数据处理。TensorWatch支持多种图表类型和并行流可视化，是一个易于使用且可扩展的调试平台。

webots - 跨平台机器人模拟开发环境，支持安装与源码编译

Webots机器人模拟器Cyberbotics开源软件机器人编程Github开源项目

Webots是一款开源机器人模拟软件，提供用于建模、编程和模拟机器人、车辆及机械系统的完整开发环境。支持Linux、Windows和macOS平台安装，并可从源代码编译。Webots由EPFL于1996年设计，Cyberbotics自1998年起持续开发，并于2018年开源，适用于工业和学术研究，提供丰富的应用案例和竞赛活动。

ragapp - 简单配置的企业级Agentic RAG方案

RAGappDockerLlamaIndexOpenAI云基础设施Github开源项目

RAGapp是一款企业级Agentic RAG解决方案，配置简单如OpenAI的自定义GPT，可通过Docker部署在云基础设施中。基于LlamaIndex构建，支持OpenAI和Gemini托管AI模型以及本地Ollama模型。提供Docker Compose和即将推出的Kubernetes部署选项。访问Admin UI进行配置，详情请参阅各端点和安全信息。

core - 高效构建AI原生开发环境框架

OpenSumiAI Native IDE代码编辑器开发框架开源项目Github

OpenSumi是一个高效的框架，用于快速构建AI原生的IDE产品，适用于云端和桌面应用。它支持多种开发环境，显著提升开发效率和用户体验。提供详细的文档、贡献指南和丰富的示例项目，全方位支持开发者。

sql-explorer - 数据查询和共享资源管理器

SQL ExplorerDjango数据查询SQL编辑器AI助手Github开源项目

SQL Explorer是一款Django应用，旨在简化和加速数据流动。它支持多种SQL数据库连接，用户可上传JSON或CSV文件进行查询，并内置AI SQL助手协助编写和调试查询。该工具提供查询历史、日志、定期数据快照，以及浏览器内统计和图表功能。SQL Explorer采用MIT许可证，既适合集成到现有Django站点，也可独立使用。

riffusion-app-hobby - 基于稳定扩散技术的实时音乐开源应用

Riffusion音乐生成实时稳定扩散Next.jsGithub开源项目

Riffusion是一款基于稳定扩散技术的实时音乐生成应用程序，支持Next.js、React、Typescript、three.js、Tailwind和Vercel技术栈。用户可通过安装Node v18或更高版本运行开发服务器，并在本地浏览器中查看应用。项目需要配置推理服务器来快速生成模型输出，适用于大GPU用户。请在二次开发时引用相关工作。

courses - AI课程和资源精选合集

AI courses人工智能深度学习自然语言处理机器学习Github开源项目

本仓库汇集了各种人工智能课程和资源链接，适合不同学习阶段的用户。涵盖生成式AI、深度学习、自然语言处理等多个主题的免费课程，资源来自麻省理工学院、斯坦福大学、哈佛大学等知名机构。欢迎贡献和建议，共同打造优质的AI学习平台。

sketch-code - 手绘线框图转HTML代码的深度学习工具

SketchCode深度学习HTML生成手绘线框图图像字幕Github开源项目

SketchCode使用深度学习将手绘网站线框图转换为工作HTML代码。该项目通过图像字幕架构生成HTML标记，实现手绘线框图的前端代码自动生成。目前作为概念验证，其性能依赖于与核心数据集相似的线框图，但展示了自动化前端开发的潜力。了解更多关于依赖安装、预训练模型使用和模型训练的详细信息。

bytom - 高度可扩展的区块链协议，实现数字资产的管理与交易

区块链数字资产多资产共享账本Go语言Github开源项目Bytom

Bytom是一种区块链协议，支持用户定义、发行和转移数字资产。其官方golang实现提供关键管理、账户及资产管理、交易发送等功能，可通过Homebrew或源码安装。项目正在积极开发中，提供详细的安装和运行指南，并欢迎社区贡献。

相关文章

Article Cover

Mem0: 为个性化AI打造智能记忆层

Article Cover

Mem0: 革新AI交互的智能记忆层

Article Cover

AutoGPT:开创AI代理新纪元的开源项目

Article Cover

Mem0: 革新个性化AI的智能记忆层

Article Cover

AutoGPT:开创自主AI助手的新时代

Article Cover

funNLP: 中文自然语言处理工具和资源大全

Article Cover

Streamer-Sales: 革新电商直播的AI卖货主播大模型

Article Cover

CycleGAN: 无配对图像到图像转换的革命性技术

Article Cover

NucliaDB: 专为AI搜索和RAG设计的开源向量数据库

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号