#开源项目

VideoPipe 是一个用 C++ 编写的开源视频分析和结构化框架，依赖少且易于上手。适用于视频结构化、图片搜索、人脸识别、交通和安防领域的行为分析。支持多种视频流协议和解码方式，集成深度学习和传统图像算法，具备目标检测、图像分类、特征提取等功能。插件化设计允许根据需求灵活组合，适用于多种平台，性能优良，广泛适用于各类应用场景。

trieve - 用于构建混合向量搜索、推荐和 RAG 的一体化基础设施

Trieve搜索引擎推荐系统RAG API自托管Github开源项目

Trieve 提供自托管解决方案，支持语义密集向量搜索、拼写容错搜索、子句高亮显示、推荐、RAG API 路由等功能。用户可自定义模型并优化混合搜索，Trieve 还支持流行度排名、重复检测等，适用于本地或公司VPC的高效搜索基础设施搭建。

distilabel - AI数据合成与反馈框架

DistilabelAI反馈数据合成高质量数据开源社区Github开源项目

Distilabel是专为AI工程师设计的开源框架，用于数据合成和反馈。该框架提供高质量输出、数据所有权和高效性，适用于预测和生成模型。通过提升数据质量和整合多种LLM反馈，Distilabel提高AI输出质量。支持与最新研究的整合，确保灵活性、可扩展性和容错能力。欢迎加入开源社区，参与数据集和模型的构建，享受社区资源和支持。

gpupixel - 跨平台高性能图像与视频滤镜库，轻松集成

GPUPixel实时滤镜高性能视频处理跨平台Github开源项目

GPUPixel是一个实时高性能图像和视频滤镜库，基于OpenGL/ES开发，支持iOS、Android、Mac、Windows和Linux平台。采用C++11编写，内置商用级美颜滤镜。GPUPixel体积小巧，易于编译和集成，适合需要跨平台滤镜功能的开发者。

book - Podwise产品开发全周期指南

Podwise硬地骇客产品生命周期AI知识管理超级个体Github开源项目

本书详细记录了Podwise产品从灵感到实现变现的全过程。Podwise是一款专为播客听友设计的AI知识管理应用，通过转录、提取、总结等功能帮助高效管理播客内容。书中涵盖灵感、构建、发布、增长和复盘五个阶段，适合关注前沿科技、创业故事和产品增长的读者。加入硬地骇客社区，与Hacker们一起探讨技术、产品和商业，寻找利基市场，构建小而美的生意。

keras - 多后端支持的深度学习框架，兼容JAX、TensorFlow和PyTorch

Keras 3深度学习框架JAXTensorFlowPyTorchGithub开源项目

Keras 3 提供高效的模型开发，支持计算机视觉、自然语言处理等任务。选择最快的后端（如JAX），性能提升高达350%。无缝扩展，从本地到大规模集群，适合企业和初创团队。安装简单，支持GPU，兼容tf.keras代码，避免框架锁定。

DeepFaceLab - 多功能深度换脸软件

DeepFaceLab深度伪造面部替换面部去老化视频编辑Github开源项目

DeepFaceLab是一款广泛使用的深度换脸软件，支持面部替换、年轻化、头部替换等多种操作。超过95%的深度伪造视频都是通过DeepFaceLab制作，受到YouTube和TikTok创作者的欢迎。该软件支持多种平台，并提供丰富的教程和指南，适合视频编辑爱好者和专业人士。通过学习工作流程和提升技能，用户可以在AfterEffects或Davinci Resolve等视频编辑软件中获得最佳效果。

GFPGAN - 提升图像细节和自然效果的实用人脸修复算法

GFPGAN面部修复AI绘图图像处理生成式对抗网络Github开源项目

GFPGAN利用预训练的StyleGAN2等人脸生成网络进行盲人脸修复。项目提供多种在线演示，包括Huggingface Gradio和Colab，支持增强背景区域，适用于各种质量的图像输入。最新1.4版本生成更多细节并保持身份一致性。无需CUDA扩展的清洁版本适用于多平台运行。

CLIP - CLIP是一种在各种（图像、文本）对上训练的神经网络

CLIPPyTorch图像识别自然语言处理模型训练Github开源项目

CLIP通过对比学习训练神经网络，结合图像和文本，实现自然语言指令预测。其在ImageNet零样本测试中的表现与ResNet50相当，无需使用原始标注数据。安装便捷，支持多种API，适用于零样本预测和线性探针评估，推动计算机视觉领域发展。

EasyOCR - 支持80多种语言文字识别工具

EasyOCROCRPytorchCRNNDBnetGithub开源项目

EasyOCR是一款支持80多种语言和主要书写系统（如拉丁文、中文、阿拉伯文等）的光学字符识别（OCR）工具。它提供简单的安装和使用指南，帮助快速实现文本检测与识别，适用于多种场景。最新版本增加了Apple Silicon支持并修复了兼容性问题。未来版本将支持手写文本识别，进一步增强其功能。

deep-learning-for-image-processing - 涵盖使用Pytorch和Tensorflow进行网络结构搭建和训练的介绍深度学习在图像处理中的应用的教程

深度学习图像处理PytorchTensorflow图像分类Github开源项目

本教程介绍深度学习在图像处理中的应用，涵盖使用Pytorch和Tensorflow进行网络结构搭建和训练。课程内容包括图像分类、目标检测、语义分割、实例分割和关键点检测，适合研究生和深度学习爱好者。所有PPT和源码均可下载，助力学习和研究。

supervision - 可重复的计算机视觉工具

Supervision计算机视觉模型连接器数据集工具图像标注Github开源项目

Supervision 是一个模型无关的计算机视觉工具包，支持分类、检测和分割模型的集成。用户可以加载数据集、可视化检测结果并进行区域统计。该工具包提供了丰富的注释和数据集处理功能，适用于零售和交通管理等领域。了解更多关于使用 Supervision 加速计算机视觉应用开发的信息。

Qix - 包含深度学习、Golang和数据库系统的全面学习资源

WeiBoTwitternode-mysqlMachine LearningGolangGithub开源项目

页面提供丰富的深度学习、机器学习、Golang、PostgreSQL数据库、分布式系统和数据库系统的学习资源。用户可找到相关文档的中文翻译和详细章节链接。项目欢迎PR贡献，如发现错误信息，请通过反馈联系作者。

ax - 支持多模态与流式验证功能的智能代理构建框架

AxVectorDBsLLMsprompt签名多模态DSPyGithub开源项目

Ax项目根据Stanford DSPy研究与Agentic workflows概念，实现智能代理快速开发。支持多种大型语言模型（LLM）、向量数据库，具备自动化提示生成、文档格式转换以及多模态DSPy和流式输出验证。该框架适用于Typescript生产级部署，低依赖性，满足现代软件开发需求。

DeepLearningExamples - 优化深度学习训练和部署的最佳实践

NVIDIADeep LearningCUDA-XTensor CoresNGCGithub开源项目

提供最新的深度学习示例，使用NVIDIA CUDA-X软件栈在Volta、Turing和Ampere GPU上运行，确保最佳的可重复精度和性能。示例通过NGC容器注册表每月更新，包含最新的NVIDIA贡献和深度学习软件库，支持计算机视觉、自然语言处理、推荐系统、语音识别、文本到语音转换、图神经网络和时间序列预测模型。

chatgpt-comparison-detection - 双语人类与ChatGPT对比语料集及检测工具

ChatGPTHC3检测器语料集开源Github开源项目

HC3项目推出了首个Human vs. ChatGPT对比语料集，提供多个版本的ChatGPT检测器。项目通过开源模型工具高效检测ChatGPT生成内容，并收集中英双语问答语料助力学术研究。HC3数据集已在Huggingface和ModelScope发布，检测器包括问答版、独立文本版和语言学版，支持中英文检测。

bing-chat - 非官方微软Bing Chat Node.js封装库

Bing Chat APINode.jsBingMicrosoftAPIGithub开源项目

此Node.js库为微软Bing Chat的非官方封装，提供简单接口实现与Bing Chat的交互。支持流式响应与多种AI模式，但由于是逆向工程，可能存在长期稳定性问题。适用于需要Node.js 18或更高版本及有效Bing Chat cookie的后端API集成。

AutoGroq - 动态生成AI团队，包括专家生成、自然对话、代码片段提取等功能

AutoGroqAI助手动态代理生成自然语言处理代码片段提取Github开源项目

AutoGroq根据用户需求动态生成AI团队，优化工作流程和项目管理。无需手动配置，即可实现专家生成、自然对话、代码片段提取等功能，并支持多种LLM整合。该工具已被近8000名开发者采用。

chatgpt-exporter - 简便的ChatGPT聊天记录导出脚本

ChatGPT ExporterTampermonkey导出聊天记录脚本格式支持Github开源项目

通过GreasyFork安装的脚本，支持导出ChatGPT聊天记录为文本、HTML、Markdown、PNG和JSON格式。需先安装Tampermonkey扩展程序，适合存档和管理多个对话，支持从API获取记录，并提供导出和删除功能。

diffusers - 模块化的预训练扩散模型库，支持图像、音频和3D结构生成

HuggingFaceDiffusers预训练扩散模型图像生成音频生成Github开源项目

🤗 Diffusers 是一个生成图像、音频和3D结构的预训练扩散模型库，提供易用的推理管道和可定制的模型组件。它支持多种调度器和预训练模型，适用于多种任务和应用场景，并兼容 PyTorch 和 Flax 框架。用户可以简单生成内容或训练自定义扩散模型。

labelImg - Python图像标注工具，兼容PASCAL VOC和YOLO格式

Label StudioLabelImg数据标注工具图像注释PythonGithub开源项目

一款用Python编写的开源图像标注工具，适用于深度学习数据集的创建。支持PASCAL VOC、YOLO和CreateML等多种标注格式，可在Linux、macOS、Windows等平台上运行，并提供详细的安装和使用指南。用户可以通过直观的界面创建矩形框标注，支持预定义类、热键操作和Docker部署，是机器学习和计算机视觉项目的数据标注利器。

tfjs - 支持浏览器和Node.js的硬件加速JavaScript机器学习库

TensorFlow.js机器学习JavaScriptAPI模型转换Github开源项目

TensorFlow.js 是开源的硬件加速JavaScript库，专用于训练和部署机器学习模型。开发者能利用灵活直观的API在浏览器和Node.js环境中创建和运行模型，包括从头开始构建模型、运行现有模型和使用传感器数据重新训练模型。支持多种后端和平台，满足不同项目的需求。

labelme - Python图像标注工具，支持多种格式导出

Labelme图像标注Python实例分割语义分割Github开源项目

Labelme是一个Python图像标注工具，使用Qt构建界面，支持多边形、矩形、圆形、线条和点的标注，适用于图像分类、语义分割、实例分割和视频标注。提供GUI自定义功能，并支持导出VOC和COCO格式数据集。兼容Windows、macOS和Linux平台，安装简单，资源丰富，易于使用。

pix2code - 利用深度学习技术从界面截图自动生成代码

pix2code深度学习代码生成图形用户界面Uizard TechnologiesGithub开源项目

本项目演示了使用深度学习技术从单个界面截图生成代码，适用于iOS、Android和网页平台，生成准确率超过77%。系统虽然具有实验性和教育目的，但提供了未来机器智能研究的重要数据和源码支持。

allennlp - 基于PyTorch的Apache 2.0自然语言处理研究库

AllenNLPAI2 TangoPyTorchNLPOptunaGithub开源项目

AllenNLP是一个基于PyTorch的Apache 2.0自然语言处理研究库，专注于开发先进的深度学习模型。该项目已进入维护模式，并将在2022年12月16日前继续修复问题和响应用户提问。推荐的替代项目包括AI2 Tango、allennlp-light、flair和torchmetrics，以帮助用户更好地管理实验和使用预训练模型。

turicreate - 简化机器学习模型开发的工具

Turi Create机器学习模型图像分类物体检测Core MLGithub开源项目

Turi Create是一款简化机器学习模型开发的工具，适合非专业人士使用。它支持添加推荐、目标检测、图像分类、图像相似度和活动分类等功能。工具兼容文本、图像、音频、视频和传感器数据，提供内置可视化和快速扩展性，并支持导出模型到Core ML，用于iOS、macOS、watchOS和tvOS应用。

stanford-tensorflow-tutorials - CS 20课程的TensorFlow深度学习代码示例和课程进度

stanford-tensorflow-tutorialsTensorFlowCS 20深度学习PythonGithub开源项目

提供斯坦福CS 20课程的TensorFlow代码示例和详细课程笔记，涵盖Python 3.6与TensorFlow 1.4.1，实时更新课程进度，包含前一年课程的资源。详细信息见课程大纲和设置指南。

pix2pix - 利用条件对抗网络的图像到图像翻译实现

pix2pixImage-to-Image TranslationConditional Adversarial NetworksCycleGANPyTorchGithub开源项目

使用条件对抗网络实现图像到图像翻译，支持从建筑立面生成到日夜转换等多种任务。该项目能在小数据集上快速产生良好结果，并提供改进版的PyTorch实现。支持多种数据集和模型，并附有详细的安装、训练和测试指南。

sonnet - 基于TensorFlow的高灵活性机器学习模块库，支持自定义与分布式训练

SonnetTensorFlow 2DeepMind机器学习神经网络Github开源项目

Sonnet是由DeepMind开发的TensorFlow 2扩展库，提供简单且可组合的抽象模型，核心概念为snt.Module，支持自定义和预定义模块。Sonnet不限制训练框架，适合监督、非监督和强化学习，并支持分布式训练和高级的TensorFlow功能。

Pytorch-UNet - PyTorch实现的高效U-Net语义分割模型

U-NetPyTorch语义分割深度学习CarvanaGithub开源项目

Pytorch-UNet项目提供定制的U-Net实现，支持多类别分割任务，包括车体遮罩、肖像分割和医学图像分割。兼容PyTorch 1.13及以上版本，提供Docker镜像和预训练模型，便于集成和使用。模型在高分辨率图像上训练，取得了0.988的Dice系数，并支持自动混合精度，可通过Weights & Biases实时监控训练进度。

attention-is-all-you-need-pytorch - PyTorch版Transformer模型，采用自注意力机制

Transformer modelPyTorch自注意力机制WMT 2014 英德翻译BPEGithub开源项目

本项目基于《Attention is All You Need》论文实现了PyTorch版Transformer模型，利用自注意力机制替代传统的卷积和循环结构，在WMT 2014英德翻译任务中表现出色。项目支持模型训练和翻译，部分字节对编码相关部分尚未完全测试，仍在开发中。提供详细的教程，包括数据预处理、模型训练和测试步骤，为用户提供全面指导。

hands-on-ml-zh - Sklearn和TensorFlow机器学习指南

Python数据分析Github开源项目SklearnTensorFlow机器学习

本指南详细介绍了如何使用Sklearn和TensorFlow进行机器学习，包括在线阅读、Docker镜像、PYPI包和NPM包的多种下载方式，并提供了完整的编译和安装步骤。通过该指南，读者能够学习和掌握数据分析及机器学习的实用技能。

autotrain-advanced - 机器学习模型的训练与部署的无代码训练

AutoTrainHugging FaceColab机器学习部署Github开源项目

AutoTrain Advanced 是一款无代码解决方案，只需几次点击即可训练机器学习模型。需要上传正确格式的数据以创建项目，关于数据格式和定价的详细信息请查阅文档。AutoTrain 免费使用，只需为使用的资源付费。支持在 Colab 和 Hugging Face Spaces 上运行，也可以通过 PIP 本地安装。适用于 Python 3.10 及以上版本，推荐在 Conda 环境中运行。更多信息请访问项目文档页面。

JARVIS - 介绍JARVIS项目的最新研究与开发进展

JARVISHuggingGPTAI任务任务自动化GPT-4Github开源项目

JARVIS项目专注于人工通用智能(AGI)的研究，提供最新的技术和工具。最新发布的EasyTool简化了工具的使用，TaskBench用于评估大型语言模型的任务自动化能力。项目支持本地、远程和混合模式的部署，满足不同配置需求。通过ChatGPT进行任务规划、模型选择、任务执行和响应生成，整合多个专业模型解决复杂的AI任务。

korvus - 高效开源搜索SDK，简化Postgres中的RAG流程

KorvusPostgresRAGPythonJavaScriptGithub开源项目

Korvus是一款开源搜索SDK，将整个RAG（检索增强生成）流程整合在单个数据库查询中。基于Postgres，支持Python、JavaScript和Rust等编程语言，提供高性能且可定制的搜索功能，减少基础设施的复杂性。它结合了LLMs、向量存储、嵌入生成、重排和摘要等功能，简化搜索架构，提升性能。

bytom - 高度可扩展的区块链协议，实现数字资产的管理与交易

区块链数字资产多资产共享账本Go语言Github开源项目Bytom

Bytom是一种区块链协议，支持用户定义、发行和转移数字资产。其官方golang实现提供关键管理、账户及资产管理、交易发送等功能，可通过Homebrew或源码安装。项目正在积极开发中，提供详细的安装和运行指南，并欢迎社区贡献。

PS将要被淘汰？一键拖拽就能编辑图片，让图片动态改变

2024年08月03日

IDM-VTON：刚开源就有1.8K星星，最新的照片AI换装项目，可用于虚拟试穿，附试用链接

2024年08月03日

NucliaDB: 专为AI搜索和RAG设计的开源向量数据库

AutoGPT:开创AI代理新纪元的开源项目

LaVague：这个项目必火，开源动作模型框架，用AI自动操控浏览器

2024年08月03日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com