Logo

#AI绘图

Logo of 造梦日记
造梦日记
造梦日记,西湖心辰与西湖大学联合开发的AI绘画工具,可以将文字描述转化为图形图像。涵盖多模态模型训练(即同时处理文本、图像等不同类型数据的AI训练方式)与图像生成技术,支持生成二次元头像和个性化图像设计,适用于动漫、游戏开发、电商及营销推广领域。
Logo of deep-daze
deep-daze
Deep Daze是一款基于OpenAI的CLIP和Siren技术的命令行工具,可将文本转化为图像。用户可以通过自然语言描述生成图像,并调整图层数量、图像分辨率和学习率等参数以优化效果。工具还支持结合图像和文本进行生成,及使用初始图像进行生成器网络训练。Deep Daze需要Nvidia或AMD GPU,推荐16GB显存。
Logo of imaginAIry
imaginAIry
imaginAIry是一个先进的AI工具,支持生成高稳定性的图像和视频。项目适用于Linux和macOS操作系统,支持Nvidia GPUs,可通过Python轻松集成。它集成了最新的视频帧插值技术和多种控制模式,如深度图、正常图和控制网图等。此外,imaginAIry还引入了视频输出支持多种格式,如MP4、WebP和GIF,用户可按需生成高质量媒体内容。
Logo of Pic Copilot
Pic Copilot
Pic Copilot是一款AI驱动的电商设计工具,提供去背景、图片翻译、视频翻译和AI时尚模特等功能,有效提升广告点击率和节省设计成本,适应全球市场需求。
Logo of Alpaca
Alpaca
Alpaca为数字艺术家和创意人士提供AI辅助画布,支持即时风格化和详细渲染。其功能包括颜色精确控制和线条整理,增强艺术创作的效率。同时,Alpaca采用非破坏性工作流,支持作品的多次迭代,适用于从个人艺术家到专业工作室的多种使用场景。
Logo of PromptBase
PromptBase
PromptBase提供超过130,000种精选AI创作提示,支持多种AI模型如Midjourney、ChatGPT、DALL·E和Stable Diffusion,助您节省时间及API成本。浏览、购买或销售各类AI创作提示,释放创意潜能。
Logo of glm-free-api
glm-free-api
GLM AI Free服务提供多种AI功能,包括流式输出、多轮对话、智能体对话、视频生成、AI绘图、联网搜索、长文档解读和图像解析。其特性包括零配置部署、多路token支持和自动清理会话痕迹。该项目与ChatGPT接口兼容,并支持多种部署方式,如Docker、Render和Vercel,非常适合不同的开发和部署需求。
Logo of ai-cli
ai-cli
ai-cli 是一个以GPT3为核心的命令行接口,旨在通过OpenAI的强大技术增强自动化和效率。用户可通过简单的命令即可查询、管理API密钥和自动补全指令,极大地提升工作效率。此外,可以询问GPT3技术的具体实现细节,提供对特定功能的深入了解。安装简便,兼容多种操作系统,根据不同需求调整回应模型,使每次使用都符合预期效果。
Logo of FlagEmbedding
FlagEmbedding
FlagEmbedding是开源的多语言文本嵌入模型集,涵盖从视觉嵌入到长上下文支持的全面技术,稳定领先多项国际基准测试。
Logo of LLM-Prompt-Library
LLM-Prompt-Library
LLM-Prompt-Library 提供各类大型语言模型的提示集合,实现文本操作、医疗助手及代码生成等多场景应用。该项目以其实用性和活跃的社区支持为开发者提供价值,促进技术交流。
Logo of clip-guided-diffusion
clip-guided-diffusion
CLIP Guided Diffusion项目提供文本生成图像功能,支持多种参数和提示词权重设置。此项目采用高效扩散模型,通过命令行或Python接口操作,支持GPU加速,提供丰富的图像尺寸和调校选项,适合生成高质量多样化的视觉内容。
Logo of Feishu-OpenAI-Stream-Chatbot
Feishu-OpenAI-Stream-Chatbot
Feishu-OpenAI-Stream-Chatbot项目整合了飞书和OpenAI,提供流式文本输出模拟真实打字机效果,支持多话题对话、场景预设和角色扮演,增加讨论的趣味性。具有自动结束对话和富文本卡片功能。项目可用于私人和群聊,通过本地部署、Serverless云函数或Railway平台快速实现。未来改进包括历史对话回档、话题内容转换PPT、Prompt优化及群聊历史消息分析等功能,进一步提升Chatbot的能力。
Logo of Stable-Diffusion-Android
Stable-Diffusion-Android
Stable Diffusion AI是一款可以快速从文本或图片生成高质量图像的应用,支持AI Horde、Stable-Diffusion-WebUI、SwarmUI、Hugging Face Inference API、OpenAI、Stability AI等多种服务器环境以及本地模式,提供丰富的生成参数和图片管理功能。
Logo of GFPGAN
GFPGAN
GFPGAN利用预训练的StyleGAN2等人脸生成网络进行盲人脸修复。项目提供多种在线演示,包括Huggingface Gradio和Colab,支持增强背景区域,适用于各种质量的图像输入。最新1.4版本生成更多细节并保持身份一致性。无需CUDA扩展的清洁版本适用于多平台运行。
Logo of photoprism
photoprism
PhotoPrism是一个基于AI技术的照片应用,为分散式网络环境提供照片和视频的高效管理。用户可以便捷地在家中、私有服务器或云端运行此应用,轻松浏览、搜索并整理图库,无需担心RAW转换、重复文件或视频格式问题。凭借其独立自主资金支持,确保用户隐私安全,不与第三方分享数据。
Logo of midjourney-proxy
midjourney-proxy
midjourney-proxy是一个高效的Discord通道代理工具,用于实现MidJourney API的调用,支持Imagine命令、图像融合、实时任务进度跟踪等功能。此外,该项目支持中文提示翻译,敏感词预检测,以及多账户配置,适合需要在不同平台上快速部署并使用AI画图功能的用户。兼容多种部署方式,包括Railway、Zeabur和Docker,并提供API密钥管理,任务存储方案可选。
Logo of 画宇宙
画宇宙
画宇宙是一家以人工智能为核心的创作平台,集成了多种AI模型,支持文本到图像、图像编辑等功能。用户可以在此平台上自由创作,实时图像生成,将灵感即刻转化为视觉作品。网站还提供企业解决方案,API服务,并拥有丰富的教程和资源帮助用户轻松上手。支持开源贡献与个人本地部署,方便开发者自定义使用。
Logo of AMiner
AMiner
AMiner,由清华大学开发,不仅集成超过3.2亿份学术论文和1.33亿学者资料的科技图谱,还提供高效的学术搜索和论文专利检索服务。网站特色包括独特的分析工具和创新功能,如AI对话和实时数据追踪,旨在提供更精准的趋势分析和学者画像。
Logo of aidea-server
aidea-server
该开源服务端由Golang开发,集成了多种主流AI语言模型和绘图模型,包括OpenAI GPT-3.5、GPT-4等。支持文生图、图生图、超分辨率等功能。用户可以通过Docker自助部署或寻求协助进行私有化部署,并享受持续的技术交流与支持。项目框架采用Glacier和Eloquent ORM,提供模块化的依赖注入和数据库操作,适用于多种AI应用场景。
Logo of stable-diffusion-webui-colab
stable-diffusion-webui-colab
stable-diffusion-webui-colab 在Google Colab上提供一个完备的深度学习环境,支持生成图像等多种AI应用。本项目拥有丰富的自定义功能和扩展,支持多语言操作,适合各类用户在云端便捷地管理和应用稳定扩散模型。
Logo of mandarin-tts
mandarin-tts
mandarin-tts是一个模块化的中文文本到语音合成框架,适用于加速科研和产品开发。它的主要特点包括模块化配置、多样的声码器支持以及丰富的嵌入选项,如说话人、韵律和文本嵌入。此外,该框架还支持预测语音的持续时间、音调和能量变化,通过开源合作进一步拓展其功能。框架提供多数据集的音频样本和预训练模型,方便用户使用和进一步开发。此外通过正确使用专有名词,如YAML配置文件,并加入客观描述,提供高效的开发工具给研究人员和开发者。
Logo of GPT-Prompts
GPT-Prompts
GPT-Prompts项目提供多款突破性的GPT生成工具,包括Midjourney Prompt Generator,专为加快创意内容的生成而设计。持续更新,适合广泛用户群体。
Logo of langchain-alpaca
langchain-alpaca
LangChain-Alpaca项目允许在本地环境中运行Alpaca LLM,提供详细的示例代码和参数支持。用户可以通过预编译二进制文件和简单命令快速进行自然语言处理任务。参考官方文档可搭建个性化AI工作流,提升效率。项目支持多种自定义参数配置,并解决Windows系统的兼容性问题,是构建本地AI应用的理想选择。
Logo of TerraMours_Gpt_Web
TerraMours_Gpt_Web
项目基于Vue 3.0、TypeScript、Naive UI和Vite构建,支持用户登录、多语言模型聊天与AI绘图功能。包含数据看板、聊天记录管理、用户管理、系统配置等模块,提供全面的前端解决方案。支持GPT和Stable Diffusion等多种模型,API配置灵活,适用于搭建智能化的聊天与图片生成平台。详细介绍了通过Docker Compose和Docker命令的快速搭建方法,以及多种管理功能,如邮件服务配置、Key池管理和订单管理等。
Logo of turbopilot
turbopilot
TurboPilot是一个自托管的Copilot克隆,使用llama.cpp和Salesforce Codegen模型提供本地代码补全功能。虽然该项目已被归档且目前只是概念验证阶段,自动补全速度较慢,但支持多个先进的本地模型,如StableCode 3B Instruct、Wizardcoder、Starcoder和Santacoder。用户可以通过下载预处理模型或自行转换模型来尝试TurboPilot,该项目还支持Docker和CUDA加速。基于fauxpilot,代码已重构和简化,便于扩展和添加新模型。
Logo of Designer
Designer
该工具应用先进AI技术,能根据文本输入迅速生成高质量图像。操作简便,完全免费,让图像创作几秒钟内完成,提升视觉效果和创意表现。
Logo of dream-textures
dream-textures
Dream Textures是一款Blender插件,通过文本提示生成纹理、概念艺术和背景资产。支持无缝拼接、场景投影和动画再设计等功能,用户可本地运行模型,避免在线服务延迟。兼容CUDA和Apple Silicon GPU,适用于4GB以上显存设备。若硬件不支持,可使用DreamStudio进行云端处理。插件提供详细的安装指南和使用教程,并有活跃的社区支持,适合高效生成和处理图像资源的创意工作者。
Logo of IOPaint
IOPaint
IOPaint是一款基于最新AI模型技术,提供免费且开源的图像修复与扩展工具。该项目支持多种AI模型,如Erase模型和Diffusion模型等,助力用户轻松移除图片中不想要的对象或缺陷。全面支持CPU、GPU以及苹果硅片,并提供丰富的插件,满足各种图片处理需求。用户可通过简易的Web界面操作,编辑和批处理图片,体验逼真的图像处理效果。
Logo of understand-prompt
understand-prompt
本文深入探讨了 AI 在编程、绘画和写作领域的应用,分享了通过各种工具和平台集成,如 GitHub Copilot、Stable Diffusion 和 ChatGPT,来增强创意和效率的经验。详解了在实际应用中如何利用 AI 处理复杂任务,提高项目的执行效率,并探索了 Prompt 编程,即如何更精确地通过文本提示来引导 AI 行为,以打通低代码的最后一公里,实现从自然语言到直接代码的转换。
Logo of Clipdrop
Clipdrop
Clipdrop将手绘草图快速转化为高质量图像。利用领先的AI技术,帮助任何人根据自己的绘画创建逼真的场景和细节插图,满足各种个人和专业需求。
Logo of 灵构笔记
灵构笔记
Lingo灵构笔记,集成AI辅助创作与动态知识管理,提供包括文本、表格、图片在内的丰富内容编辑和云端同步功能,助力团队高效协作与信息管理。支持创意工作与生产力提升。
Logo of markdown-crawler
markdown-crawler
markdown-crawler是一个高效的多线程网站爬虫,能快速创建Markdown文档,支持中断恢复、深度配置以及多媒体内容识别。采用BeautifulSoup解析HTML,具备完整CLI操作界面,适用于文档解析及机器学习模型训练等场景。
Logo of ShellGPT
ShellGPT
ShellGPT是一个多功能的免费人工智能应用,支持Windows、MacOS、Linux、Android等多平台。基于最新的AI技术如ChatGPT、GPT4、NewBing、Claude,能进行语音对话、文本创作及语言理解。该应用为用户带来高效且精准的交互体验,不仅无需翻墙即可在国内使用,还新增了自动节点选择、插件系统等实用功能。适合日常聊天、学术研究到商业应用等广泛场景。
Logo of YandexStation
YandexStation
Yandex Station项目通过Home Assistant平台实现多品牌扬声器的高效管理和Yandex扬声器的本地控制。功能亮点包括文本到语音(TTS)和丰富的媒体操作,用户可以自定义智能家居体验。
Logo of Awesome-LLM4RS-Papers
Awesome-LLM4RS-Papers
Awesome-LLM4RS-Papers是一套精选论文集,聚焦于大型语言模型在推荐系统中的应用研究。本集合包含自2023至2024年期间发布的期刊文章和会议论文,覆盖了隐私保护、个性化方案、效率提升等诸多创新领域。该项目为研究人员和技术开发者提供关于如何利用大型语言模型增强推荐系统的全面资料。
Logo of booster
booster
Large Model Booster利用Golang和C++技术构建高性能且可扩展的LLM推理加速器,适用于生产环境中的GPTs大规模部署和独立模型实验。支持多种现代CPU和GPU,包括Intel、AMD、ARM64、Apple Silicon及Nvidia CUDA等,支持大模型切分及FP16/FP32和量化版本。涵盖LLaMA、Mistral、Gemma等主流LLM架构,提供SOTA Janus Sampling实现。项目提供详细的编译到部署指南,并支持OpenAI和Ollama的兼容API端点。
Logo of Hugai-chatgpt
Hugai-chatgpt
HugAi项目是一个基于Springboot和openAI SDK开发的开源智能AI知识库,支持GPT对话和AI绘图功能。项目特点包括支持不同版本的GPT模型、多功能配置中心、可配置API地址和密钥池、以及多用户登录和云端存储对话记录等。项目采用最新的Java技术栈,是提升技术水平的理想选择,欢迎体验和贡献。
Logo of carefree-creator
carefree-creator
`carefree-creator`是一个开源的AI创作工具,集成了多种生成模型,基于`carefree-learn`构建,支持Python>=3.8和pytorch>=1.12.0。项目提供多种节省GPU RAM的加载方式,并支持CLI和Docker安装。详细的硬件要求与使用指南请见Wiki页面。
Logo of ArtLine
ArtLine
ArtLine项目旨在自动生成精美的肖像线条艺术。整合了ControlNet与ArtLine,该模型不仅能识别面部特征,还能根据指令调整图像风格。项目采用自注意力机制、渐进式缩放和感知损失技术,使其在不同姿态和背景下表现出色。项目持续改进,将解决背景和阴影识别问题,提供更好的用户体验。
Logo of novel
novel
Novel是一个开源的Notion风格在线WYSIWYG编辑器,配备AI驱动的自动完成技术。用户可以轻松部署到Vercel,支持个性化本地设置。此外,Novel还支持多种框架,包括React、Svelte和Vue,且具有VSCode扩展插件。旨在提高文本编辑效率并优化用户体验。
Logo of Decktopus AI
Decktopus AI
Decktopus AI,先进的AI演示文稿工具,能迅速生成演示文稿。只需输入标题,即可为专业人士和团队提供完备材料,提升会议效率。
Logo of Vectorizer.AI
Vectorizer.AI
Vectorizer.AI是一个使用AI技术将PNG、JPG转换为SVG的在线平台。它支持多种语言、全色彩跟踪,能自动处理图片并支持多种文件格式输出,非常适合专业人士和对高质量矢量图有需求的用户。Vectorizer.AI不仅快速高效,而且支持实时预览,确保满足不同专业需求。
Logo of AI Prompt Genius
AI Prompt Genius
AI Prompt Genius助力用户自定义AI提示,打造个性化代码库。支持流程自动化和协作,提升开发效率。平台便于GitHub上的开源贡献和协作,推动软件开发革新。
Logo of qwen-free-api
qwen-free-api
该API支持高速流式输出、无水印AI绘图、长文档解读和图像解析等功能,完全兼容ChatGPT接口,且无需复杂配置即可部署。项目注重高速响应和自动清理会话痕迹,适用于多种使用场景。提供Docker、Render、Vercel等多种部署方式。项目不接受资金捐助,旨在用于研究和学习交流。
Logo of project_ai_mern_image_generation
project_ai_mern_image_generation
了解如何构建和部署类似MidJourney与DALL-E功能的全栈MERN人工智能图片生成应用。通过本项目,开发者将掌握Next.js 13等先进技术,并获得实际项目经验,助力职业发展。
Logo of llm-paper-daily
llm-paper-daily
llm-paper-daily是专注于LLM研究的日常论文更新和分类平台,提供最新研究论文,支持arxiv直链和GPT-4简要总结。该平台分类详尽,涵盖推理、代理、检索等多个领域,易于用户导航与发现相关研究。加入讨论小组,可与研究同好一起交流学习,共同探索大模型落地和学术前沿。
Logo of gp.nvim
gp.nvim
gp.nvim是一个AI驱动的Neovim插件,基于GPT模型提升编程功能,支持即时响应、扩展性极强的钩子函数、聊天式会话、文本和代码的自动操作、语音转文本及图像生成,有效增强开发者效率。
Logo of azure-openai-samples
azure-openai-samples
本项目提供了使用Azure OpenAI提供的GPT的基础资源,包括快速上手指南、实际使用案例以及端到端的解决方案。通过这些资源,用户可以了解GPT在聊天机器人、客户服务、内容生成、问答系统、文本摘要和情感分析等应用中的实际使用情况,并通过贡献和更新保持与技术发展的同步。项目基于GPT 3.5,并将在GPT-4可用时更新。
Logo of awesome-ai-tools
awesome-ai-tools
获取全面的AI工具列表,涵盖图片生成、写作、编程、商务、视频编辑、设计、文本与语音、聊天机器人、研究与教育、头像生成、音频处理、团队协作、社交媒体、娱乐、SEO与搜索、职业发展、学习笔记、音乐、电子邮件、问答、儿童故事、创意构思、电子商务、游戏、家居、建筑、绘画及金融等多个领域。无论是个人创作还是团队合作,总有适合的AI工具满足需求。探索更多可能性!
Logo of ComfyUI-PhotoMaker-ZHO
ComfyUI-PhotoMaker-ZHO
ComfyUI-PhotoMaker 是 PhotoMaker 的非官方实现,支持 lora、多批次处理和通用提示词输入。用户可以下载或本地加载模型,并应用多种风格模板生成高质量图像。适合需要快速生成多样风格图像的设计师和开发者,版本 V2.5 新增了对 Disney-Character 和 DragNUWA 工作流的支持,提升了生成速度和操作便捷性。