#Github
ComfyUI_stable_fast - 整合了stable-fast和TensorRT技术,旨在提高AI图像生成的速度和效率
ComfyUITensorRTstable-fastAI绘图性能优化Github开源项目
ComfyUI_stable_fast是一个实验性项目,整合了stable-fast和TensorRT技术,旨在提高AI图像生成的速度和效率。该项目支持SD1.5、SDXL和SSD-1B等主流模型,兼容Lora和ControlNet功能。通过性能优化和灵活配置,用户可根据硬件条件选择最佳运行方式,实现更快速的AI图像生成。
augmentoolkit - AI开源领域特定数据生成解决方案
Augmentoolkit数据生成LLM训练开源AI自定义数据集Github开源项目
Augmentoolkit是一款开源AI工具,专门用于创建领域特定数据。它能将原始文本高效转化为高质量自定义数据集,适用于训练语言模型和分类器。该工具利用开源AI技术,无需依赖OpenAI,提供了易用、可定制和经济的数据生成方案。Augmentoolkit致力于简化LLM数据创建,使其成为模型开发中的便捷环节。
Chinese-Vicuna - 中文LLaMA模型的低资源指令微调方案
Chinese-VicunaLLaMALoRAAI模型自然语言处理Github开源项目
Chinese-Vicuna项目旨在低资源环境下训练中文LLaMA模型。该方案可在单个RTX-2080TI上进行指令微调,在RTX-3090上实现长上下文多轮对话。具有参数效率高、显卡友好和易部署等特点,支持7B和13B模型微调及垂直领域应用。项目提供完整的训练、推理和部署代码,以及多种优化工具。
ComfyUI-I2VGenXL - I2VGenXL 模型为 ComfyUI 带来高清视频生成新体验
I2VGenXLComfyUI视频生成AI模型图像转视频Github开源项目
ComfyUI-I2VGenXL 项目将 I2VGenXL 模型集成到 ComfyUI 中,实现高质量视频生成。该项目支持 1280*704 分辨率输出,通过正负提示词控制生成过程。其自然动效和优质光影效果使其成为当前表现出色的高清视频模型。项目设计了标准工作流,支持文生视频和图生视频,并集成自动补帧功能,为视频创作提供完整解决方案。
next-drizzle-lucia-sqlite-template - 集成多种技术的全功能身份认证模板
Next.js身份认证模板ORMOAuthGithub开源项目
这是一个集成Next.js、Drizzle ORM、Lucia Auth和SQLite的开源项目。该模板提供多种身份认证方式,包括OAuth、魔法链接和传统登录。它还实现了密码重置、账户注册确认等功能,并采用分层架构设计。项目整合了服务器端验证和邮件发送功能,为开发者提供了一个完整的身份认证解决方案,帮助快速搭建安全可靠的认证系统。
markdowner - 高效将网站内容转换为LLM适用的Markdown数据
Markdowner网站转换MarkdownLLMCloudflareGithub开源项目
Markdowner是一款开源工具,可将网站内容快速转换为Markdown格式,适用于大型语言模型处理。它具备详细转换模式、自动爬虫和LLM过滤功能,支持文本及JSON输出。该工具部署简便,免费使用,通过API调用即可获取结构化网页内容,有助于提高AI应用的响应质量。
duck-duck-scrape - 提供DuckDuckGo搜索功能和多种API的访问的Node.js库
duck-duck-scrapeDuckDuckGoAPI搜索Node.jsGithub开源项目
duck-duck-scrape是一个Node.js库,提供DuckDuckGo搜索功能和多种API的访问。支持常规、图片、视频和新闻搜索,集成股票、天气、货币转换等API。兼容JavaScript和TypeScript,便于开发者实现搜索和数据获取功能。
gpt-prompt-engineer - 智能提示工程优化系统
GPT提示工程AI测试ELO评分系统Github开源项目
gpt-prompt-engineer是一款自动化提示工程工具,能够根据任务描述和测试用例生成、评估和排序多个提示。该工具支持多种先进AI模型,包括GPT-4、GPT-3.5-Turbo和Claude 3 Opus。通过ELO评分系统、分类功能和专门的Claude 3版本,gpt-prompt-engineer显著提升了提示工程的效率和质量。
jfr-flame-graph - 将Java Flight Recorder剖析数据转换为FlameGraph格式的开源工具
FlameGraphJava Flight Recorder性能分析JFR转换堆栈跟踪Github开源项目
jfr-flame-graph是一个开源工具,用于将Java Flight Recorder(JFR)的方法剖析数据转换为FlameGraph兼容格式。它支持CPU、内存分配、I/O等多种事件类型分析,提供灵活的输出选项。该工具有助于开发者直观分析Java应用性能,识别代码热点。jfr-flame-graph构建简单,使用方便,可与Brendan Gregg的FlameGraph项目无缝集成,是Java性能分析的实用工具。
gotch - Go语言深度学习框架 基于PyTorch C++ API的高性能实现
深度学习张量操作神经网络GPU支持PytorchGithub开源项目
Gotch是基于PyTorch C++ API (Libtorch)开发的Go语言深度学习框架。它实现了全面的张量操作、动态计算图、JIT接口和预训练模型加载等功能,同时支持CPU和GPU。Gotch采用纯Go API设计,便于构建和训练神经网络模型,适合深度学习研究和应用开发。
precognition.nvim - Neovim智能缓冲区导航助手
precognition.nvimNeovim插件缓冲区导航代码提示可视化辅助Github开源项目
precognition.nvim是一款Neovim插件,专注于提升缓冲区导航效率。它通过智能识别并显示垂直和水平导航提示,帮助用户更快速、精确地在文本中移动。该插件支持自定义配置,包括调整提示优先级、修改显示样式和针对特定文件类型禁用功能。precognition.nvim为Neovim用户带来了更高效的编辑体验和直观的交互方式。
aiosqlite - Python异步SQLite数据库接口库
aiosqliteAsyncIOSQLitePython库数据库操作Github开源项目
aiosqlite是一个Python异步SQLite数据库接口库。它在标准sqlite3模块的基础上提供异步版本的连接和游标方法,支持上下文管理器自动关闭连接和游标。通过使用共享线程,aiosqlite能在AsyncIO事件循环中与SQLite数据库交互,避免阻塞其他协程。该库支持Python 3.8及以上版本,可从PyPI安装。
TexTeller - 端到端公式识别模型 支持多种输入格式
TexTeller公式识别OCR机器学习图像处理Github开源项目
TexTeller是一个基于TrOCR的公式识别模型,可将图像转换为LaTeX公式。该模型使用8000万对图像-公式数据训练,具备优秀的泛化能力和准确度。TexTeller支持多种输入格式,包括扫描图像、手写公式和中英文混合公式,还提供中英文印刷体OCR功能。此外,项目集成了公式检测、段落识别和Web演示界面,便于与其他项目整合。
feishu2md - 将飞书文档高效转换为Markdown格式的工具
feishu2md飞书Markdown文档转换Go语言Github开源项目
feishu2md是一款开源工具,用于将飞书文档转换为Markdown格式。支持单文档和批量文件夹转换,提供命令行、Docker和在线版本。用户通过简单配置即可获取API Token,实现文档快速下载和转换。该工具简化了飞书文档的处理流程,适用于需要Markdown格式文档的场景。
motionshop - 视频角色3D化身替换应用 让创意无限
MotionShop视频替换3D头像人物动画AI视频处理Github开源项目
MotionShop是一个开源应用程序,可将视频中的真实人物替换为3D虚拟化身。该应用可用于视频创作、虚拟现实内容制作等领域,为创作者提供新的表现形式。项目已在ModelScope上线体验demo,计划在HuggingFace推出。开发团队持续优化项目,鼓励用户体验并分享创作成果。
geometry-script - Blender几何节点的Python编程接口
Geometry ScriptBlender几何节点Python API3D建模Github开源项目
Geometry Script是一个用于Blender几何节点的Python编程接口。它能将复杂的节点树转换为Python代码,便于管理和编辑。该工具保留了几何节点的全部功能,同时提高了大型项目的开发效率。用户可以将脚本直接转换回节点树,方便团队协作和后续调整。
MVDream - 多视角扩散模型实现高质量3D内容生成
MVDream多视角扩散模型3D生成AI视觉深度学习Github开源项目
MVDream是一个开源的多视角扩散模型项目,用于3D内容生成。项目在GitHub上提供两个代码仓库:多视角扩散模型(https://github.com/bytedance/MVDream)和集成SDS技术的3D生成(https://github.com/bytedance/MVDream-threestudio)。由字节跳动研究团队开发,为计算机视觉和3D生成领域提供新的工具和方法。
HPSv2 - 文本到图像生成模型评估的全面基准测试框架
HPS v2图像生成模型人类偏好评分基准测试文本到图像合成Github开源项目
HPSv2是一个评估文本到图像生成模型的先进基准测试框架。该框架基于大规模人类偏好数据集HPDv2训练,可准确预测人类对生成图像的偏好。HPSv2提供公平、稳定且易用的评估方法,涵盖动画、概念艺术、绘画和照片四种风格。研究人员可利用HPSv2比较不同模型性能或评估自研模型。项目提供PyPI包和在线演示,便于快速上手使用。
ControlNetPlus - 多条件控制的AI图像生成与编辑工具
ControlNet++AI绘图图像生成图像编辑SDXLGithub开源项目
ControlNetPlus是一款支持多种控制条件的AI图像生成和编辑工具。该项目采用创新架构,可处理10多种控制条件并生成高分辨率图像,同时支持多条件输入而不增加计算负载。经SDXL全面实验,ControlNetPlus在控制能力和图像质量方面表现出色。ProMax版本还提供图块去模糊、变化和超分辨率等高级编辑功能。此外,ControlNetPlus可与其他开源SDXL模型和Lora模型兼容,为图像生成和编辑提供了灵活的解决方案。
ComfyUI_VisualStylePrompting - ComfyUI视觉风格提示工具 优化AI图像生成
ComfyUI视觉风格提示自注意力交换参考图像工作流Github开源项目
ComfyUI_VisualStylePrompting是ComfyUI的一个扩展工具,实现了Visual Style Prompting技术。该工具通过交换自注意力机制,从参考图像中提取视觉风格并应用到新生成的图像中。它提供多项可调参数,包括去噪、输入块、中间块和输出块设置,用于精细控制风格转移过程。这个工具主要适用于1.5基础模型,可以提高AI生成图像的质量和风格一致性。
sd_civitai_extension - Automatic1111 SD Web UI的Civitai模型管理插件
Civitai ExtensionStable DiffusionAI绘图模型下载资源管理Github开源项目
sd_civitai_extension是一个为Automatic1111 Stable Diffusion Web UI开发的插件。它实现了模型预览图自动下载、基于哈希值的模型自动获取、元数据中包含资源哈希值等功能。插件集成了Civitai Link,支持在浏览Civitai网站时对SD实例进行实时资源管理。这些功能优化了模型管理流程,为Stable Diffusion用户提供了便利。
self-rewarding-lm-pytorch - 自我奖励语言模型训练框架的开源实现
Self-Rewarding Language ModelSPINAI深度学习自然语言处理Github开源项目
self-rewarding-lm-pytorch是一个开源项目,实现了MetaAI提出的自我奖励语言模型训练框架。该项目包含SPIN算法实现,提供灵活的微调配置选项,支持自定义奖励提示、任意顺序的微调策略和批量采样。这个工具能帮助研究人员探索和改进语言模型的自我学习能力。
Paper - 优化Minecraft服务器性能及游戏机制
PaperMinecraft服务器高性能插件开发开源项目Github
Paper是一款广受欢迎的开源Minecraft服务器软件,基于官方服务端开发,专注于优化性能并解决游戏机制问题。它支持最新的Minecraft 1.21.1版本,特点包括易于安装、完善的API支持和活跃的社区。Paper为服务器管理员提供高性能环境,同时为插件开发者提供丰富的API资源。作为持续更新的项目,Paper致力于提升Minecraft多人游戏体验。
ComfyUI-PuLID-ZHO - ComfyUI插件实现多风格迁移和ID混合功能
ComfyUIPuLIDAI绘图风格迁移ID混合Github开源项目
ComfyUI-PuLID-ZHO是基于PuLID项目的非官方ComfyUI插件,提供多风格迁移和ID混合功能。支持单图多图处理,自动下载模型,可调节ID强度,具有两种模式选择。当前V0.9版本已可用,持续优化中。该插件简单易用,为AI图像创作提供更多可能性。
mvp-boilerplate - 一体化全栈开发MVP样板
FlutterNextJSSupabaseStripe全栈开发Github开源项目
mvp-boilerplate是一个生产级MVP样板,整合了Flutter移动应用、NextJS网页应用和Supabase后端。项目内置Stripe支付、Supabase认证和Posthog分析等功能,并配备自动化部署流程。这一样板能显著缩短项目初期配置时间,适合希望快速开发全栈应用的创业团队和开发者。
mandark - 轻量级AI助手,简化代码开发流程
MandarkAI助手代码处理命令行工具开源项目Github
Mandark是一个轻量级(约80kb)的AI辅助工具,无需安装即可运行。它能够执行多种任务,包括回滚更改、回答代码问题、编辑多个文件、验证差异和安装新包。Mandark支持多种AI模型,提供执行前的令牌和成本估算,适用于各种代码库。这个工具简化了开发流程,提高了编码效率。
studio - 基于浏览器的React和TailwindCSS应用可视化UI编辑工具
Onlook可视化编辑器ReactTailwindCSS开源项目Github
Onlook是一款基于浏览器的可视化编辑器,专门用于React和TailwindCSS应用的UI开发。该工具支持实时预览和代码生成,让开发者能够直观地构建界面,无需手动编写全部代码。Onlook提供多种集成方式,旨在简化开发流程,提升效率。这款编辑器适用于各类React项目,为开发者提供了更灵活的UI设计选择。
diktat - 严格的Kotlin代码规范与自动修复工具
diKTatKotlin代码风格静态分析CI/CDGithub开源项目
diKTat是一款严格的Kotlin代码规范工具,基于KTlint开发。它提供100多项代码风格检查和自动修复功能,可集成到CI/CD流程中检测和修复代码异味。diKTat具有独特的检查项、高度可配置性和详细的代码风格指南,适合需要执行统一编码标准的团队使用。工具支持Maven、Gradle等构建系统,并能与GitHub Actions集成,提供原生问题报告。
likwid - 开源高性能计算性能分析工具
LIKWID性能分析硬件计数器多线程系统监控Github开源项目
Likwid是一个开源的高性能计算性能分析工具套件,支持多种处理器和GPU,运行于Linux系统。它提供硬件拓扑分析、性能计数器监控、能耗测量等功能,帮助开发者分析和优化应用性能。Likwid以命令行工具和库的形式提供,使用简单,功能强大,是高性能计算领域重要的性能分析工具。
text-generation-webui-telegram_bot - 功能丰富的Telegram AI聊天机器人扩展
llm_telegram_bot文本生成聊天机器人API集成人工智能Github开源项目
text-generation-webui的Telegram机器人扩展,支持多种语言模型和丰富功能。具备按钮交互、角色扮演和图像生成能力,可独立运行或作为扩展使用。提供独立用户会话、历史记录保存和防刷屏等实用特性,支持Google Colab运行。安装配置简便,适合个人和群组聊天使用。
zsh-vi-mode - Zsh Vi模式插件 提升命令行操作体验
ZshVi模式插件命令行快捷键Github开源项目
zsh-vi-mode是专为Zsh开发的Vi模式插件,提供接近原生vim的使用体验。该插件采用纯Zsh脚本实现,具有低延迟、高响应、光标样式指示、文本对象操作、历史搜索等功能。无需第三方依赖,安装便捷,兼容多种Zsh包管理器,有助于提高命令行操作效率。
Adam-mini - 减少内存消耗并提升模型效能的高效优化器
Adam-mini优化器内存效率深度学习分布式训练Github开源项目
Adam-mini是一种新型优化器,通过创新的参数分块和学习率分配方法,将内存占用比AdamW降低45%到50%,同时维持或提高模型性能。它支持多种分布式框架,可用于预训练、监督微调和RLHF等任务。Adam-mini基于Hessian结构相关原则,为大规模模型训练提供了高效解决方案。
parseq - 创新的场景文本识别统一模型
场景文本识别PARSeq深度学习计算机视觉ECCVGithub开源项目
PARSeq是一种创新的场景文本识别模型,采用置换自回归序列方法,实现了上下文无关和上下文感知推理及迭代预测细化。该模型统一了现有STR解码方法,无需独立语言模型,在多个基准数据集上展现出优异性能,同时保持较低计算成本。PARSeq支持灵活的字符集训练和多种评估配置,为OCR应用提供了高效而强大的解决方案。
poutyne - 简化PyTorch开发 加速神经网络训练
PoutynePyTorch深度学习神经网络模型训练Github开源项目
Poutyne是一个简化的PyTorch深度学习框架,能够处理神经网络训练中的大量样板代码。该框架提供简洁的模型训练接口、丰富的回调函数及自动检查点保存功能,显著提升开发效率。Poutyne兼容最新版PyTorch和Python 3.8+,适合需要快速构建和训练神经网络的研究人员及开发者。
enhancr - 基于AI的多功能视频增强软件
enhancr视频增强人工智能图形用户界面TensorRTGithub开源项目
enhancr是一款开源的视频增强软件,集成了AI驱动的帧插值和超分辨率功能。它支持NVIDIA TensorRT和NCNN推理引擎,兼容NVIDIA、AMD和Apple Silicon等多种GPU。软件提供图形界面,具备实时预览、批量处理和自定义模型等特性,可满足不同用户的视频增强需求。
live_view_native - 使用Elixir和Phoenix LiveView构建跨平台原生应用
LiveView NativeElixirPhoenix LiveView跨平台开发原生应用Github开源项目
LiveViewNative平台利用Elixir和Phoenix LiveView技术,实现了Web和原生应用的统一开发。它可以将特定平台的模板转换为原生UI,支持iOS、Android等多种设备。这种方法优化了跨平台开发流程,提升了开发效率,同时为开发者提供了更多UI设计的可能性。
相关文章