#Gradio

gradio - 高效构建和共享机器学习Web应用的开源Python库
Github开源项目Python机器学习APIGradio网页应用
Gradio是一个开源Python库,能够快速构建机器学习模型、API或任意Python函数的演示或Web应用。其内置的共享功能允许在几秒钟内生成链接,无需JavaScript、CSS或Web托管经验。支持Python 3.8以上版本,提供多种组件和灵活布局,适用于各种应用场景。
simple-llm-finetuner - 在NVIDIA GPU上使用LoRA方法轻松微调语言模型
Github开源项目GradioSimple LLM FinetunerLoRAPEFTNVIDIA GPU
Simple LLM Finetuner项目提供了初学者友好的界面,利用LoRA方法和PEFT库在常见的NVIDIA GPU上微调语言模型。用户可以轻松管理数据集、定制参数,并评估模型推理能力。支持在UI中粘贴数据集,提供参数调整和详细说明。尽管项目已停止维护,建议使用替代工具如LLaMA-Factory、unsloth或text-generation-webui。
Gradio - 构建和分享机器学习应用程序的平台
Python模型训练机器学习热门AI工具AI开发Gradio友好的Web界面Hugging Face Spaces
通过Gradio,用户可以通过简洁的Web界面快速展示机器学习模型,任何人都能轻松接入。在几行代码的帮助下,即可构建交互式界面,无论是在Gradio平台上还是作为嵌入Python笔记本的形式。Gradio还能长期托管于Hugging Face Spaces,提供公共分享链接,简化远程协作和模型展示过程。
ChatTTS-Forge - 文本到语音转换平台
Github开源项目GradioWebUIChatTTS-ForgeTTS生成模型API Server
ChatTTS-Forge是一个集成API服务和Gradio WebUI的文本到语音转换平台。通过一键Colab启动、Docker部署及本地安装等多样化方式,用户可轻松应用并体验其技术。该项目不仅支持多种语音模型与定制选项,如风格化控制和长文本生成,还适用于多种应用场景,为声音合成、音色调整与语音增强提供了专业的技术支持。
promptlib - 调整大型语言模型的指令库
Github开源项目ChatGPTGPT-4GradioPromptLib自然语言程序
本项目提供一系列经过精炼和优化的高价值提示,专为调整大型语言模型如GPT-4和ChatGPT的指令。项目展示了语言输入质量对模型输出的显著影响,旨在帮助新用户和开发者更有效地利用这些模型。用户可以在项目库中找到多种自然语言程序,并通过提供的工具和实用程序进行扩展,进而提升用户体验并为未来探索提供基础。
stable-diffusion-2-gui - Stable Diffusion v2.1的Gradio应用,支持多种图像生成和处理功能
Github开源项目Stability AIStable DiffusionHugging FaceGradioDiffusers
该页面介绍了一个适用于Stable Diffusion v2.1的Gradio应用,支持文本到图像、图像到图像、图像修复、图像放大和深度到图像等多种功能。此项目由Stability AI和Hugging Face提供支持,可在Colab平台上运行。
Fooocus-API - 基于FastAPI的图像生成接口
Github开源项目GradioFooocusFastAPIFooocus-API图片生成软件
Fooocus API是一个基于FastAPI的REST接口,允许用户在多种编程语言中使用其强大功能。该项目支持通过Replicate和自托管两种运行方式,并提供详细的文档和示例代码。Fooocus API的设计借鉴了Stable Diffusion和Midjourney,简化了操作,使用户专注于图像生成。项目开源,提供多种运行和安装方式,适合不同开发者的需求。
image-matching-webui - 高效图像匹配软件,支持多种算法
Github开源项目Hugging FaceGradioImage Matching WebUI图像匹配众多算法
该工具利用多个著名的图像匹配算法高效匹配图像对,拥有基于gradio设计的图形用户界面,用户可以轻松选择两张图像和匹配算法,并获得精确匹配结果。支持本地图像和摄像头图像输入,以及众多流行的图像匹配算法,如MASt3R、DUSt3R和OmniGlue等。可以通过HuggingFace和Lightning AI平台直接使用,也可以本地部署。欢迎外部贡献,并现已支持多个功能扩展和优化方案。
Whisper-WebUI - 多功能字幕生成和翻译工具,支持多种Whisper实现
Github开源项目翻译语音转文字GradioWhisper-WebUI字幕生成器
Whisper-WebUI是基于Gradio的浏览器界面,支持从文件、YouTube和麦克风生成字幕,并提供多语言翻译。用户可以选择不同的Whisper实现,如openai/whisper、faster-whisper和insanely-fast-whisper,支持SRT、WebVTT、txt等多种字幕格式。功能包括语音转文字翻译、音频预处理(Silero VAD)和说话人分离(pyannote)。提供详细的安装指南与自动安装脚本,并且兼容Docker运行,提升VRAM利用率和转录速度。
flowty-realtime-lcm-canvas - LCM驱动的实时草图到图像转换演示
Github开源项目AI图像生成GradioLCM实时绘图GPU性能
flowty-realtime-lcm-canvas是一个基于LCM和Gradio库的开源项目,实现了实时草图到图像的转换。用户可以在一侧绘制草图,另一侧即时显示生成的图像。项目支持多种模型和GPU,适用于不同硬件环境。这个演示为图像生成技术提供了一个直观的应用实例,展示了AI在创意领域的潜力。
awesome-demos - Gradio构建的AI演示和应用集合
Github开源项目自然语言处理机器学习计算机视觉Gradio演示
该项目汇集了使用Gradio构建的多样化AI演示和应用。涵盖自然语言处理、计算机视觉等领域,包括文本生成、图像处理、语音合成等功能。展示了AI技术的多样性和实用性,为开发者提供参考和灵感。
frp - 基于FRP的Gradio应用分享服务器
Github开源项目网络应用Gradio自定义域名FRPShare Server
frp是一个基于Fast Reverse Proxy的开源项目,为Gradio应用提供分享服务。该工具支持创建自定义公共链接,实现本地Gradio应用的远程访问。frp具有灵活的配置选项,包括自定义域名设置、链接有效期延长和安全性增强。通过简单步骤,开发者可以搭建独立的Share服务器,获得更多自定义和控制能力。
pytorch_mgie - 多模态大语言模型驱动的图像编辑指导系统
Github开源项目大语言模型AI绘图图像编辑GradioMGIE
pytorch_mgie是一个基于多模态大语言模型的图像编辑指导系统,采用Apple开源的ml-mgie技术。该项目通过自然语言指令实现图像编辑,并提供Gradio演示界面展示LLaVA-7B模型在图像编辑任务中的应用。项目包含预训练模型和环境配置指南,为研究和开发提供了实验平台。
rag-chatbot - RAG聊天机器人 支持多PDF智能对话和灵活部署
Github开源项目本地运行GradioRAGHuggingfacePDF聊天
rag-chatbot项目采用检索增强生成(RAG)技术,实现了与多个PDF文档的智能交互。系统支持本地运行和Kaggle环境,可灵活选择Huggingface或Ollama的各类模型。其特色功能包括多PDF并行处理、跨语言对话潜力和简易部署流程。项目持续优化中,未来将引入高级文档管理和ReAct Agent等功能,适用于研究、教育和企业等多种场景。
bigvgan_v2_24khz_100band_256x - 大规模训练的通用神经声码器
Github开源项目PyTorch音频合成模型GradioHuggingface神经声码器BigVGAN
该项目通过大规模训练为神经声码器领域带来了新的发展。其自定义的CUDA内核实现了1.5至3倍的推理速度提升,满足高效应用需求。利用多尺度的子频段判别器和梅尔谱损失进行训练,适应多种音频环境,涵盖多语言语音和环境音等。项目还集成至Hugging Face Hub,提供预训练模型和交互式演示,支持最高24 kHz的采样率和多种频段配置,为语音合成领域的研究者和开发者提供便利。