#开源项目

comfyui-portrait-master-zh-cn - ComfyUI人物肖像生成优化插件

ComfyUI肖像生成提示词人工智能工作流Github开源项目

ComfyUI Portrait Master 简体中文版是一个优化AI人物肖像生成的开源插件。该工具提供丰富的参数选项，包括镜头类型、性别、国籍等，便于创建多样化的人物肖像。支持SD1.5、SDXL等模型，提供多种工作流示例和使用建议，有助于提高生成效果的控制性。插件支持自定义扩展，适合需要精细调整AI人物肖像生成的用户。

ConfZ - Python配置管理库ConfZ提供多源加载和验证功能

ConfZ配置管理PydanticPython环境变量Github开源项目

ConfZ是一个Python配置管理库，基于Pydantic构建。它支持从配置文件、环境变量和命令行参数等多种源加载配置，并提供数据转换、验证和类似数据类的访问方式。ConfZ适用于多环境配置、单例模式和单元测试等场景，也支持自定义配置源。最新的ConfZ 2版本兼容Pydantic 2，并优化了命名规范。

echo-editor - 现代化WYSIWYG富文本编辑器基于tiptap

富文本编辑器tiptapVueMarkdownshadcn-vueGithub开源项目

Echo Editor是一款现代化WYSIWYG富文本编辑器，基于tiptap和shadcn-vue组件构建。支持Markdown、TypeScript和国际化，允许创建自定义扩展。集成Tailwind CSS，安装使用简便，为开发者提供强大且易于集成的富文本编辑解决方案。

mtail - 高效日志数据提取与时序数据库集成工具

mtail日志监控指标提取时间序列数据库应用程序日志Github开源项目

mtail是一款开源的日志数据提取工具，专为系统运营者设计。它能从应用程序日志中提取指标数据，并将其导出至时序数据库或分析工具，用于监控和警报。mtail通过简单的程序定义提取规则，无需修改原应用即可实现监控。支持JSON和Prometheus等多种数据格式，可与collectd、StatsD和Graphite等系统无缝集成。mtail为监控需求提供了灵活高效的解决方案，弥补了应用程序自身缺乏内部状态导出功能的空白。

tokenizer - Go语言实现的自然语言处理分词库

TokenizerGo语言NLP预训练模型分词Github开源项目

Tokenizer是一个纯Go语言实现的自然语言处理分词库，支持Word level、Wordpiece和BPE等多种分词模型。该项目可用于训练新模型或微调现有模型，并兼容HuggingFace预训练模型。Tokenizer为Go开发者提供了构建NLP应用所需的工具，助力高效生产级软件开发。

beyondllm - RAG系统开发与部署的一站式工具包

BeyondLLMRAG系统大语言模型开源项目AI教育Github

BeyondLLM是一个面向检索增强生成(RAG)系统的综合开发工具包。它集成了自动化流程、可定制评估指标和多种大型语言模型支持，简化RAG系统的实验、评估和部署过程。该工具有助于减少LLM幻觉，提升系统可靠性，支持RAG应用的快速迭代和监控。BeyondLLM兼容Python 3.8-3.11版本，为开发者提供简洁高效的API接口。

ChunkLlama - 双重块注意力技术实现大语言模型上下文窗口扩展

ChunkLlama大语言模型长上下文注意力机制无需训练Github开源项目

ChunkLlama项目开发了双重块注意力(DCA)技术，无需额外训练即可将大语言模型的上下文窗口扩展至原始长度的8倍以上。DCA可与主流外推技术和高效推理库兼容，支持Llama、Mistral等多种模型。实验表明，应用DCA后的Llama-2/3 70B模型能处理长达100k的上下文，并在长文本任务中表现出色。

unitable - 整合表格识别任务的统一框架

UniTable表格识别自监督预训练Transformer表格结构Github开源项目

UniTable是一个创新的表格识别框架，统一了训练范式、目标和模型架构。它利用自监督预训练和语言建模，有效处理表格结构、单元格内容和边界框识别。该项目在四个大型数据集上展现最先进性能，并提供完整的推理流程Jupyter Notebook，支持多数据集微调和全面表格识别。

runpod-worker-comfy - 将ComfyUI作为无服务器API部署在RunPod平台

ComfyUIRunPodDockerAPIAI绘图Github开源项目

runpod-worker-comfy是一个将ComfyUI部署为无服务器API的开源项目。它能在RunPod平台上运行任意ComfyUI工作流,支持base64编码输入图像,可选将生成图像上传至AWS S3。项目提供三种Docker镜像,允许自定义模型和节点,基于Ubuntu和NVIDIA CUDA构建。通过RunPod API,用户可方便地与部署的端点交互,实现图像生成等功能。

Graphite - 创新的开源图形编辑软件集成节点图合成技术

Graphite图形编辑软件开源项目节点图合成引擎矢量图编辑器Github

Graphite是一款开发中的开源图形软件，结合栅格和矢量编辑功能。其创新的节点图合成引擎实现了图层与节点的融合，提供无损编辑体验。目前作为基于浏览器的轻量级矢量图形编辑器，Graphite支持图像效果应用和AI辅助创作。未来计划扩展至照片编辑、数字绘画等领域，致力于成为全面的创意内容制作平台。

blender_vscode - VS Code扩展助力Blender插件和脚本开发

BlenderVS Code插件开发脚本工具调试Github开源项目

blender_vscode是一个VS Code扩展，为Blender开发者提供插件创建、管理和脚本编写工具。它集成了Blender与VS Code，支持实时重载和调试，简化了开发流程。该扩展适用于各级开发者，提供直观的界面和实用功能，有助于提高Blender插件开发效率。

adetailer - Stable Diffusion WebUI自动掩码和修复增强扩展

ADetailerStable Diffusion图像处理AI绘图自动遮罩Github开源项目

ADetailer是Stable Diffusion WebUI的扩展插件，提供自动掩码和修复功能。它支持人脸、手部和人物等多种检测模型，允许自定义检测阈值和掩码处理。该工具兼容ControlNet，支持多种修复模式，可有效提升图像细节。ADetailer简化了图像处理流程，是一个功能强大的AI辅助图像编辑工具。

StanfordQuadruped - 四足机器人项目进入新阶段全新版本即将问世

Stanford Quadruped四足机器人Pupper v3开源项目机器人控制Github

StanfordQuadruped项目宣布停止支持Pupper v1，转而开发Pupper v3。新版本将采用400W无刷电机、树莓派5和深度摄像头，并集成强化学习运动策略。该项目此前开发的四足机器人能够奔跑、行走和跳跃，引起广泛关注。尽管停止对旧版支持，项目团队表示Pupper v3将继续保持开源，并计划在未来数月内发布详细构建指南。新版本预计材料成本约1000美元，为爱好者和开发者提供了可负担的高性能四足机器人平台。

fetch-github-hosts - 开源GitHub Hosts同步工具提升访问效率

GitHub Hostshosts同步工具网络加速开源项目跨平台Github

fetch-github-hosts是一个开源的GitHub Hosts同步工具，通过自主部署服务器获取最新hosts信息，解决GitHub访问速度慢的问题。该工具支持图形界面和命令行操作，兼容Windows、Linux和MacOS系统。它提供自动更新配置和私有部署选项，适用于需要优化GitHub访问体验的开发者和研究人员。

comfy-cli - 功能强大的ComfyUI命令行管理工具

ComfyUI命令行工具AI绘图模型管理自定义节点Github开源项目

comfy-cli是一款专为ComfyUI开发的命令行工具。它提供了快速安装、包管理、自定义节点管理等功能，支持跨平台使用。该工具还具备下载检查点、保存模型哈希等特性，并提供详细文档和示例。comfy-cli简化了ComfyUI的管理流程，适用于各级用户。

ComfyUI_stable_fast - 整合了stable-fast和TensorRT技术，旨在提高AI图像生成的速度和效率

ComfyUITensorRTstable-fastAI绘图性能优化Github开源项目

ComfyUI_stable_fast是一个实验性项目，整合了stable-fast和TensorRT技术，旨在提高AI图像生成的速度和效率。该项目支持SD1.5、SDXL和SSD-1B等主流模型，兼容Lora和ControlNet功能。通过性能优化和灵活配置，用户可根据硬件条件选择最佳运行方式，实现更快速的AI图像生成。

augmentoolkit - AI开源领域特定数据生成解决方案

Augmentoolkit数据生成LLM训练开源AI自定义数据集Github开源项目

Augmentoolkit是一款开源AI工具,专门用于创建领域特定数据。它能将原始文本高效转化为高质量自定义数据集,适用于训练语言模型和分类器。该工具利用开源AI技术,无需依赖OpenAI,提供了易用、可定制和经济的数据生成方案。Augmentoolkit致力于简化LLM数据创建,使其成为模型开发中的便捷环节。

Chinese-Vicuna - 中文LLaMA模型的低资源指令微调方案

Chinese-VicunaLLaMALoRAAI模型自然语言处理Github开源项目

Chinese-Vicuna项目旨在低资源环境下训练中文LLaMA模型。该方案可在单个RTX-2080TI上进行指令微调，在RTX-3090上实现长上下文多轮对话。具有参数效率高、显卡友好和易部署等特点，支持7B和13B模型微调及垂直领域应用。项目提供完整的训练、推理和部署代码，以及多种优化工具。

ComfyUI-I2VGenXL - I2VGenXL 模型为 ComfyUI 带来高清视频生成新体验

I2VGenXLComfyUI视频生成AI模型图像转视频Github开源项目

ComfyUI-I2VGenXL 项目将 I2VGenXL 模型集成到 ComfyUI 中，实现高质量视频生成。该项目支持 1280*704 分辨率输出，通过正负提示词控制生成过程。其自然动效和优质光影效果使其成为当前表现出色的高清视频模型。项目设计了标准工作流，支持文生视频和图生视频，并集成自动补帧功能，为视频创作提供完整解决方案。

next-drizzle-lucia-sqlite-template - 集成多种技术的全功能身份认证模板

Next.js身份认证模板ORMOAuthGithub开源项目

这是一个集成Next.js、Drizzle ORM、Lucia Auth和SQLite的开源项目。该模板提供多种身份认证方式，包括OAuth、魔法链接和传统登录。它还实现了密码重置、账户注册确认等功能，并采用分层架构设计。项目整合了服务器端验证和邮件发送功能，为开发者提供了一个完整的身份认证解决方案，帮助快速搭建安全可靠的认证系统。

markdowner - 高效将网站内容转换为LLM适用的Markdown数据

Markdowner网站转换MarkdownLLMCloudflareGithub开源项目

Markdowner是一款开源工具，可将网站内容快速转换为Markdown格式，适用于大型语言模型处理。它具备详细转换模式、自动爬虫和LLM过滤功能，支持文本及JSON输出。该工具部署简便，免费使用，通过API调用即可获取结构化网页内容，有助于提高AI应用的响应质量。

duck-duck-scrape - 提供DuckDuckGo搜索功能和多种API的访问的Node.js库

duck-duck-scrapeDuckDuckGoAPI搜索Node.jsGithub开源项目

duck-duck-scrape是一个Node.js库，提供DuckDuckGo搜索功能和多种API的访问。支持常规、图片、视频和新闻搜索，集成股票、天气、货币转换等API。兼容JavaScript和TypeScript，便于开发者实现搜索和数据获取功能。

gpt-prompt-engineer - 智能提示工程优化系统

GPT提示工程AI测试ELO评分系统Github开源项目

gpt-prompt-engineer是一款自动化提示工程工具，能够根据任务描述和测试用例生成、评估和排序多个提示。该工具支持多种先进AI模型，包括GPT-4、GPT-3.5-Turbo和Claude 3 Opus。通过ELO评分系统、分类功能和专门的Claude 3版本，gpt-prompt-engineer显著提升了提示工程的效率和质量。

jfr-flame-graph - 将Java Flight Recorder剖析数据转换为FlameGraph格式的开源工具

FlameGraphJava Flight Recorder性能分析JFR转换堆栈跟踪Github开源项目

jfr-flame-graph是一个开源工具，用于将Java Flight Recorder（JFR）的方法剖析数据转换为FlameGraph兼容格式。它支持CPU、内存分配、I/O等多种事件类型分析，提供灵活的输出选项。该工具有助于开发者直观分析Java应用性能，识别代码热点。jfr-flame-graph构建简单，使用方便，可与Brendan Gregg的FlameGraph项目无缝集成，是Java性能分析的实用工具。

gotch - Go语言深度学习框架基于PyTorch C++ API的高性能实现

深度学习张量操作神经网络GPU支持PytorchGithub开源项目

Gotch是基于PyTorch C++ API (Libtorch)开发的Go语言深度学习框架。它实现了全面的张量操作、动态计算图、JIT接口和预训练模型加载等功能,同时支持CPU和GPU。Gotch采用纯Go API设计,便于构建和训练神经网络模型,适合深度学习研究和应用开发。

precognition.nvim - Neovim智能缓冲区导航助手

precognition.nvimNeovim插件缓冲区导航代码提示可视化辅助Github开源项目

precognition.nvim是一款Neovim插件，专注于提升缓冲区导航效率。它通过智能识别并显示垂直和水平导航提示，帮助用户更快速、精确地在文本中移动。该插件支持自定义配置，包括调整提示优先级、修改显示样式和针对特定文件类型禁用功能。precognition.nvim为Neovim用户带来了更高效的编辑体验和直观的交互方式。

aiosqlite - Python异步SQLite数据库接口库

aiosqliteAsyncIOSQLitePython库数据库操作Github开源项目

aiosqlite是一个Python异步SQLite数据库接口库。它在标准sqlite3模块的基础上提供异步版本的连接和游标方法，支持上下文管理器自动关闭连接和游标。通过使用共享线程，aiosqlite能在AsyncIO事件循环中与SQLite数据库交互，避免阻塞其他协程。该库支持Python 3.8及以上版本，可从PyPI安装。

TexTeller - 端到端公式识别模型支持多种输入格式

TexTeller公式识别OCR机器学习图像处理Github开源项目

TexTeller是一个基于TrOCR的公式识别模型，可将图像转换为LaTeX公式。该模型使用8000万对图像-公式数据训练，具备优秀的泛化能力和准确度。TexTeller支持多种输入格式，包括扫描图像、手写公式和中英文混合公式，还提供中英文印刷体OCR功能。此外，项目集成了公式检测、段落识别和Web演示界面，便于与其他项目整合。

feishu2md - 将飞书文档高效转换为Markdown格式的工具

feishu2md飞书Markdown文档转换Go语言Github开源项目

feishu2md是一款开源工具，用于将飞书文档转换为Markdown格式。支持单文档和批量文件夹转换，提供命令行、Docker和在线版本。用户通过简单配置即可获取API Token，实现文档快速下载和转换。该工具简化了飞书文档的处理流程，适用于需要Markdown格式文档的场景。

motionshop - 视频角色3D化身替换应用让创意无限

MotionShop视频替换3D头像人物动画AI视频处理Github开源项目

MotionShop是一个开源应用程序，可将视频中的真实人物替换为3D虚拟化身。该应用可用于视频创作、虚拟现实内容制作等领域，为创作者提供新的表现形式。项目已在ModelScope上线体验demo，计划在HuggingFace推出。开发团队持续优化项目，鼓励用户体验并分享创作成果。

geometry-script - Blender几何节点的Python编程接口

Geometry ScriptBlender几何节点Python API3D建模Github开源项目

Geometry Script是一个用于Blender几何节点的Python编程接口。它能将复杂的节点树转换为Python代码，便于管理和编辑。该工具保留了几何节点的全部功能，同时提高了大型项目的开发效率。用户可以将脚本直接转换回节点树，方便团队协作和后续调整。

MVDream - 多视角扩散模型实现高质量3D内容生成

MVDream多视角扩散模型3D生成AI视觉深度学习Github开源项目

MVDream是一个开源的多视角扩散模型项目，用于3D内容生成。项目在GitHub上提供两个代码仓库：多视角扩散模型（https://github.com/bytedance/MVDream）和集成SDS技术的3D生成（https://github.com/bytedance/MVDream-threestudio）。由字节跳动研究团队开发，为计算机视觉和3D生成领域提供新的工具和方法。

HPSv2 - 文本到图像生成模型评估的全面基准测试框架

HPS v2图像生成模型人类偏好评分基准测试文本到图像合成Github开源项目

HPSv2是一个评估文本到图像生成模型的先进基准测试框架。该框架基于大规模人类偏好数据集HPDv2训练,可准确预测人类对生成图像的偏好。HPSv2提供公平、稳定且易用的评估方法,涵盖动画、概念艺术、绘画和照片四种风格。研究人员可利用HPSv2比较不同模型性能或评估自研模型。项目提供PyPI包和在线演示,便于快速上手使用。

ControlNetPlus - 多条件控制的AI图像生成与编辑工具

ControlNet++AI绘图图像生成图像编辑SDXLGithub开源项目

ControlNetPlus是一款支持多种控制条件的AI图像生成和编辑工具。该项目采用创新架构，可处理10多种控制条件并生成高分辨率图像，同时支持多条件输入而不增加计算负载。经SDXL全面实验，ControlNetPlus在控制能力和图像质量方面表现出色。ProMax版本还提供图块去模糊、变化和超分辨率等高级编辑功能。此外，ControlNetPlus可与其他开源SDXL模型和Lora模型兼容，为图像生成和编辑提供了灵活的解决方案。

ComfyUI_VisualStylePrompting - ComfyUI视觉风格提示工具优化AI图像生成

ComfyUI视觉风格提示自注意力交换参考图像工作流Github开源项目

ComfyUI_VisualStylePrompting是ComfyUI的一个扩展工具，实现了Visual Style Prompting技术。该工具通过交换自注意力机制，从参考图像中提取视觉风格并应用到新生成的图像中。它提供多项可调参数，包括去噪、输入块、中间块和输出块设置，用于精细控制风格转移过程。这个工具主要适用于1.5基础模型，可以提高AI生成图像的质量和风格一致性。

sd_civitai_extension - Automatic1111 SD Web UI的Civitai模型管理插件

Civitai ExtensionStable DiffusionAI绘图模型下载资源管理Github开源项目

sd_civitai_extension是一个为Automatic1111 Stable Diffusion Web UI开发的插件。它实现了模型预览图自动下载、基于哈希值的模型自动获取、元数据中包含资源哈希值等功能。插件集成了Civitai Link，支持在浏览Civitai网站时对SD实例进行实时资源管理。这些功能优化了模型管理流程，为Stable Diffusion用户提供了便利。

相关文章

Article Cover

Visual-Chinese-LLaMA-Alpaca 学习资料汇总 - 多模态中文大语言模型

Article Cover

LLM-groundedDiffusion学习资料汇总 - 用大语言模型增强文本到图像扩散模型的提示理解

Article Cover

awesome-llm-agents学习资料汇总 - 大语言模型智能体精选列表

Article Cover

ChatLLM学习资料汇总 - 轻松玩转LLM兼容OpenAI与LangChain

Article Cover

ollama-grid-search学习资料汇总-自动化评估和比较LLM模型的桌面应用

Article Cover

awesome-llm-role-playing-with-persona学习资料汇总 - 大语言模型角色扮演与人格赋予技术综述

Article Cover

NeMo-Curator学习资料汇总 - GPU加速的大语言模型数据处理工具包

Article Cover

pykoi-rlhf-finetuned-transformers学习资料汇总 - 开源RLHF统一接口

Article Cover

ChainFury入门指南 - 开源生产级LLM链式引擎

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号