#开源项目

comfyui-portrait-master-zh-cn - ComfyUI人物肖像生成优化插件
ComfyUI肖像生成提示词人工智能工作流Github开源项目
ComfyUI Portrait Master 简体中文版是一个优化AI人物肖像生成的开源插件。该工具提供丰富的参数选项,包括镜头类型、性别、国籍等,便于创建多样化的人物肖像。支持SD1.5、SDXL等模型,提供多种工作流示例和使用建议,有助于提高生成效果的控制性。插件支持自定义扩展,适合需要精细调整AI人物肖像生成的用户。
ConfZ - Python配置管理库ConfZ提供多源加载和验证功能
ConfZ配置管理PydanticPython环境变量Github开源项目
ConfZ是一个Python配置管理库,基于Pydantic构建。它支持从配置文件、环境变量和命令行参数等多种源加载配置,并提供数据转换、验证和类似数据类的访问方式。ConfZ适用于多环境配置、单例模式和单元测试等场景,也支持自定义配置源。最新的ConfZ 2版本兼容Pydantic 2,并优化了命名规范。
echo-editor - 现代化WYSIWYG富文本编辑器 基于tiptap
富文本编辑器tiptapVueMarkdownshadcn-vueGithub开源项目
Echo Editor是一款现代化WYSIWYG富文本编辑器,基于tiptap和shadcn-vue组件构建。支持Markdown、TypeScript和国际化,允许创建自定义扩展。集成Tailwind CSS,安装使用简便,为开发者提供强大且易于集成的富文本编辑解决方案。
mtail - 高效日志数据提取与时序数据库集成工具
mtail日志监控指标提取时间序列数据库应用程序日志Github开源项目
mtail是一款开源的日志数据提取工具,专为系统运营者设计。它能从应用程序日志中提取指标数据,并将其导出至时序数据库或分析工具,用于监控和警报。mtail通过简单的程序定义提取规则,无需修改原应用即可实现监控。支持JSON和Prometheus等多种数据格式,可与collectd、StatsD和Graphite等系统无缝集成。mtail为监控需求提供了灵活高效的解决方案,弥补了应用程序自身缺乏内部状态导出功能的空白。
tokenizer - Go语言实现的自然语言处理分词库
TokenizerGo语言NLP预训练模型分词Github开源项目
Tokenizer是一个纯Go语言实现的自然语言处理分词库,支持Word level、Wordpiece和BPE等多种分词模型。该项目可用于训练新模型或微调现有模型,并兼容HuggingFace预训练模型。Tokenizer为Go开发者提供了构建NLP应用所需的工具,助力高效生产级软件开发。
beyondllm - RAG系统开发与部署的一站式工具包
BeyondLLMRAG系统大语言模型开源项目AI教育Github
BeyondLLM是一个面向检索增强生成(RAG)系统的综合开发工具包。它集成了自动化流程、可定制评估指标和多种大型语言模型支持,简化RAG系统的实验、评估和部署过程。该工具有助于减少LLM幻觉,提升系统可靠性,支持RAG应用的快速迭代和监控。BeyondLLM兼容Python 3.8-3.11版本,为开发者提供简洁高效的API接口。
ChunkLlama - 双重块注意力技术实现大语言模型上下文窗口扩展
ChunkLlama大语言模型长上下文注意力机制无需训练Github开源项目
ChunkLlama项目开发了双重块注意力(DCA)技术,无需额外训练即可将大语言模型的上下文窗口扩展至原始长度的8倍以上。DCA可与主流外推技术和高效推理库兼容,支持Llama、Mistral等多种模型。实验表明,应用DCA后的Llama-2/3 70B模型能处理长达100k的上下文,并在长文本任务中表现出色。
unitable - 整合表格识别任务的统一框架
UniTable表格识别自监督预训练Transformer表格结构Github开源项目
UniTable是一个创新的表格识别框架,统一了训练范式、目标和模型架构。它利用自监督预训练和语言建模,有效处理表格结构、单元格内容和边界框识别。该项目在四个大型数据集上展现最先进性能,并提供完整的推理流程Jupyter Notebook,支持多数据集微调和全面表格识别。
runpod-worker-comfy - 将ComfyUI作为无服务器API部署在RunPod平台
ComfyUIRunPodDockerAPIAI绘图Github开源项目
runpod-worker-comfy是一个将ComfyUI部署为无服务器API的开源项目。它能在RunPod平台上运行任意ComfyUI工作流,支持base64编码输入图像,可选将生成图像上传至AWS S3。项目提供三种Docker镜像,允许自定义模型和节点,基于Ubuntu和NVIDIA CUDA构建。通过RunPod API,用户可方便地与部署的端点交互,实现图像生成等功能。
Graphite - 创新的开源图形编辑软件 集成节点图合成技术
Graphite图形编辑软件开源项目节点图合成引擎矢量图编辑器Github
Graphite是一款开发中的开源图形软件,结合栅格和矢量编辑功能。其创新的节点图合成引擎实现了图层与节点的融合,提供无损编辑体验。目前作为基于浏览器的轻量级矢量图形编辑器,Graphite支持图像效果应用和AI辅助创作。未来计划扩展至照片编辑、数字绘画等领域,致力于成为全面的创意内容制作平台。
blender_vscode - VS Code扩展助力Blender插件和脚本开发
BlenderVS Code插件开发脚本工具调试Github开源项目
blender_vscode是一个VS Code扩展,为Blender开发者提供插件创建、管理和脚本编写工具。它集成了Blender与VS Code,支持实时重载和调试,简化了开发流程。该扩展适用于各级开发者,提供直观的界面和实用功能,有助于提高Blender插件开发效率。
adetailer - Stable Diffusion WebUI自动掩码和修复增强扩展
ADetailerStable Diffusion图像处理AI绘图自动遮罩Github开源项目
ADetailer是Stable Diffusion WebUI的扩展插件,提供自动掩码和修复功能。它支持人脸、手部和人物等多种检测模型,允许自定义检测阈值和掩码处理。该工具兼容ControlNet,支持多种修复模式,可有效提升图像细节。ADetailer简化了图像处理流程,是一个功能强大的AI辅助图像编辑工具。
StanfordQuadruped - 四足机器人项目进入新阶段 全新版本即将问世
Stanford Quadruped四足机器人Pupper v3开源项目机器人控制Github
StanfordQuadruped项目宣布停止支持Pupper v1,转而开发Pupper v3。新版本将采用400W无刷电机、树莓派5和深度摄像头,并集成强化学习运动策略。该项目此前开发的四足机器人能够奔跑、行走和跳跃,引起广泛关注。尽管停止对旧版支持,项目团队表示Pupper v3将继续保持开源,并计划在未来数月内发布详细构建指南。新版本预计材料成本约1000美元,为爱好者和开发者提供了可负担的高性能四足机器人平台。
fetch-github-hosts - 开源GitHub Hosts同步工具 提升访问效率
GitHub Hostshosts同步工具网络加速开源项目跨平台Github
fetch-github-hosts是一个开源的GitHub Hosts同步工具,通过自主部署服务器获取最新hosts信息,解决GitHub访问速度慢的问题。该工具支持图形界面和命令行操作,兼容Windows、Linux和MacOS系统。它提供自动更新配置和私有部署选项,适用于需要优化GitHub访问体验的开发者和研究人员。
comfy-cli - 功能强大的ComfyUI命令行管理工具
ComfyUI命令行工具AI绘图模型管理自定义节点Github开源项目
comfy-cli是一款专为ComfyUI开发的命令行工具。它提供了快速安装、包管理、自定义节点管理等功能,支持跨平台使用。该工具还具备下载检查点、保存模型哈希等特性,并提供详细文档和示例。comfy-cli简化了ComfyUI的管理流程,适用于各级用户。
ComfyUI_stable_fast - 整合了stable-fast和TensorRT技术,旨在提高AI图像生成的速度和效率
ComfyUITensorRTstable-fastAI绘图性能优化Github开源项目
ComfyUI_stable_fast是一个实验性项目,整合了stable-fast和TensorRT技术,旨在提高AI图像生成的速度和效率。该项目支持SD1.5、SDXL和SSD-1B等主流模型,兼容Lora和ControlNet功能。通过性能优化和灵活配置,用户可根据硬件条件选择最佳运行方式,实现更快速的AI图像生成。
augmentoolkit - AI开源领域特定数据生成解决方案
Augmentoolkit数据生成LLM训练开源AI自定义数据集Github开源项目
Augmentoolkit是一款开源AI工具,专门用于创建领域特定数据。它能将原始文本高效转化为高质量自定义数据集,适用于训练语言模型和分类器。该工具利用开源AI技术,无需依赖OpenAI,提供了易用、可定制和经济的数据生成方案。Augmentoolkit致力于简化LLM数据创建,使其成为模型开发中的便捷环节。
Chinese-Vicuna - 中文LLaMA模型的低资源指令微调方案
Chinese-VicunaLLaMALoRAAI模型自然语言处理Github开源项目
Chinese-Vicuna项目旨在低资源环境下训练中文LLaMA模型。该方案可在单个RTX-2080TI上进行指令微调,在RTX-3090上实现长上下文多轮对话。具有参数效率高、显卡友好和易部署等特点,支持7B和13B模型微调及垂直领域应用。项目提供完整的训练、推理和部署代码,以及多种优化工具。
ComfyUI-I2VGenXL - I2VGenXL 模型为 ComfyUI 带来高清视频生成新体验
I2VGenXLComfyUI视频生成AI模型图像转视频Github开源项目
ComfyUI-I2VGenXL 项目将 I2VGenXL 模型集成到 ComfyUI 中,实现高质量视频生成。该项目支持 1280*704 分辨率输出,通过正负提示词控制生成过程。其自然动效和优质光影效果使其成为当前表现出色的高清视频模型。项目设计了标准工作流,支持文生视频和图生视频,并集成自动补帧功能,为视频创作提供完整解决方案。
next-drizzle-lucia-sqlite-template - 集成多种技术的全功能身份认证模板
Next.js身份认证模板ORMOAuthGithub开源项目
这是一个集成Next.js、Drizzle ORM、Lucia Auth和SQLite的开源项目。该模板提供多种身份认证方式,包括OAuth、魔法链接和传统登录。它还实现了密码重置、账户注册确认等功能,并采用分层架构设计。项目整合了服务器端验证和邮件发送功能,为开发者提供了一个完整的身份认证解决方案,帮助快速搭建安全可靠的认证系统。
markdowner - 高效将网站内容转换为LLM适用的Markdown数据
Markdowner网站转换MarkdownLLMCloudflareGithub开源项目
Markdowner是一款开源工具,可将网站内容快速转换为Markdown格式,适用于大型语言模型处理。它具备详细转换模式、自动爬虫和LLM过滤功能,支持文本及JSON输出。该工具部署简便,免费使用,通过API调用即可获取结构化网页内容,有助于提高AI应用的响应质量。
duck-duck-scrape - 提供DuckDuckGo搜索功能和多种API的访问的Node.js库
duck-duck-scrapeDuckDuckGoAPI搜索Node.jsGithub开源项目
duck-duck-scrape是一个Node.js库,提供DuckDuckGo搜索功能和多种API的访问。支持常规、图片、视频和新闻搜索,集成股票、天气、货币转换等API。兼容JavaScript和TypeScript,便于开发者实现搜索和数据获取功能。
gpt-prompt-engineer - 智能提示工程优化系统
GPT提示工程AI测试ELO评分系统Github开源项目
gpt-prompt-engineer是一款自动化提示工程工具,能够根据任务描述和测试用例生成、评估和排序多个提示。该工具支持多种先进AI模型,包括GPT-4、GPT-3.5-Turbo和Claude 3 Opus。通过ELO评分系统、分类功能和专门的Claude 3版本,gpt-prompt-engineer显著提升了提示工程的效率和质量。
jfr-flame-graph - 将Java Flight Recorder剖析数据转换为FlameGraph格式的开源工具
FlameGraphJava Flight Recorder性能分析JFR转换堆栈跟踪Github开源项目
jfr-flame-graph是一个开源工具,用于将Java Flight Recorder(JFR)的方法剖析数据转换为FlameGraph兼容格式。它支持CPU、内存分配、I/O等多种事件类型分析,提供灵活的输出选项。该工具有助于开发者直观分析Java应用性能,识别代码热点。jfr-flame-graph构建简单,使用方便,可与Brendan Gregg的FlameGraph项目无缝集成,是Java性能分析的实用工具。
gotch - Go语言深度学习框架 基于PyTorch C++ API的高性能实现
深度学习张量操作神经网络GPU支持PytorchGithub开源项目
Gotch是基于PyTorch C++ API (Libtorch)开发的Go语言深度学习框架。它实现了全面的张量操作、动态计算图、JIT接口和预训练模型加载等功能,同时支持CPU和GPU。Gotch采用纯Go API设计,便于构建和训练神经网络模型,适合深度学习研究和应用开发。
precognition.nvim - Neovim智能缓冲区导航助手
precognition.nvimNeovim插件缓冲区导航代码提示可视化辅助Github开源项目
precognition.nvim是一款Neovim插件,专注于提升缓冲区导航效率。它通过智能识别并显示垂直和水平导航提示,帮助用户更快速、精确地在文本中移动。该插件支持自定义配置,包括调整提示优先级、修改显示样式和针对特定文件类型禁用功能。precognition.nvim为Neovim用户带来了更高效的编辑体验和直观的交互方式。
aiosqlite - Python异步SQLite数据库接口库
aiosqliteAsyncIOSQLitePython库数据库操作Github开源项目
aiosqlite是一个Python异步SQLite数据库接口库。它在标准sqlite3模块的基础上提供异步版本的连接和游标方法,支持上下文管理器自动关闭连接和游标。通过使用共享线程,aiosqlite能在AsyncIO事件循环中与SQLite数据库交互,避免阻塞其他协程。该库支持Python 3.8及以上版本,可从PyPI安装。
TexTeller - 端到端公式识别模型 支持多种输入格式
TexTeller公式识别OCR机器学习图像处理Github开源项目
TexTeller是一个基于TrOCR的公式识别模型,可将图像转换为LaTeX公式。该模型使用8000万对图像-公式数据训练,具备优秀的泛化能力和准确度。TexTeller支持多种输入格式,包括扫描图像、手写公式和中英文混合公式,还提供中英文印刷体OCR功能。此外,项目集成了公式检测、段落识别和Web演示界面,便于与其他项目整合。
feishu2md - 将飞书文档高效转换为Markdown格式的工具
feishu2md飞书Markdown文档转换Go语言Github开源项目
feishu2md是一款开源工具,用于将飞书文档转换为Markdown格式。支持单文档和批量文件夹转换,提供命令行、Docker和在线版本。用户通过简单配置即可获取API Token,实现文档快速下载和转换。该工具简化了飞书文档的处理流程,适用于需要Markdown格式文档的场景。
motionshop - 视频角色3D化身替换应用 让创意无限
MotionShop视频替换3D头像人物动画AI视频处理Github开源项目
MotionShop是一个开源应用程序,可将视频中的真实人物替换为3D虚拟化身。该应用可用于视频创作、虚拟现实内容制作等领域,为创作者提供新的表现形式。项目已在ModelScope上线体验demo,计划在HuggingFace推出。开发团队持续优化项目,鼓励用户体验并分享创作成果。
geometry-script - Blender几何节点的Python编程接口
Geometry ScriptBlender几何节点Python API3D建模Github开源项目
Geometry Script是一个用于Blender几何节点的Python编程接口。它能将复杂的节点树转换为Python代码,便于管理和编辑。该工具保留了几何节点的全部功能,同时提高了大型项目的开发效率。用户可以将脚本直接转换回节点树,方便团队协作和后续调整。
MVDream - 多视角扩散模型实现高质量3D内容生成
MVDream多视角扩散模型3D生成AI视觉深度学习Github开源项目
MVDream是一个开源的多视角扩散模型项目,用于3D内容生成。项目在GitHub上提供两个代码仓库:多视角扩散模型(https://github.com/bytedance/MVDream)和集成SDS技术的3D生成(https://github.com/bytedance/MVDream-threestudio)。由字节跳动研究团队开发,为计算机视觉和3D生成领域提供新的工具和方法。
HPSv2 - 文本到图像生成模型评估的全面基准测试框架
HPS v2图像生成模型人类偏好评分基准测试文本到图像合成Github开源项目
HPSv2是一个评估文本到图像生成模型的先进基准测试框架。该框架基于大规模人类偏好数据集HPDv2训练,可准确预测人类对生成图像的偏好。HPSv2提供公平、稳定且易用的评估方法,涵盖动画、概念艺术、绘画和照片四种风格。研究人员可利用HPSv2比较不同模型性能或评估自研模型。项目提供PyPI包和在线演示,便于快速上手使用。
ControlNetPlus - 多条件控制的AI图像生成与编辑工具
ControlNet++AI绘图图像生成图像编辑SDXLGithub开源项目
ControlNetPlus是一款支持多种控制条件的AI图像生成和编辑工具。该项目采用创新架构,可处理10多种控制条件并生成高分辨率图像,同时支持多条件输入而不增加计算负载。经SDXL全面实验,ControlNetPlus在控制能力和图像质量方面表现出色。ProMax版本还提供图块去模糊、变化和超分辨率等高级编辑功能。此外,ControlNetPlus可与其他开源SDXL模型和Lora模型兼容,为图像生成和编辑提供了灵活的解决方案。
ComfyUI_VisualStylePrompting - ComfyUI视觉风格提示工具 优化AI图像生成
ComfyUI视觉风格提示自注意力交换参考图像工作流Github开源项目
ComfyUI_VisualStylePrompting是ComfyUI的一个扩展工具,实现了Visual Style Prompting技术。该工具通过交换自注意力机制,从参考图像中提取视觉风格并应用到新生成的图像中。它提供多项可调参数,包括去噪、输入块、中间块和输出块设置,用于精细控制风格转移过程。这个工具主要适用于1.5基础模型,可以提高AI生成图像的质量和风格一致性。
sd_civitai_extension - Automatic1111 SD Web UI的Civitai模型管理插件
Civitai ExtensionStable DiffusionAI绘图模型下载资源管理Github开源项目
sd_civitai_extension是一个为Automatic1111 Stable Diffusion Web UI开发的插件。它实现了模型预览图自动下载、基于哈希值的模型自动获取、元数据中包含资源哈希值等功能。插件集成了Civitai Link,支持在浏览Civitai网站时对SD实例进行实时资源管理。这些功能优化了模型管理流程,为Stable Diffusion用户提供了便利。