Awesome 生成式 AI
精选的现代生成式人工智能项目和服务列表。
生成式人工智能是一种通过使用在大量数据上训练的机器学习算法创建原创内容(如图像、声音和文本)的技术。与其他形式的 AI 不同,它能够创造出独特且前所未见的输出,例如照片级真实感图像、数字艺术、音乐和写作。这些输出通常具有独特的风格,有时甚至难以与人类创作的作品区分开来。生成式 AI 在艺术、娱乐、营销、学术和计算机科学等领域有着广泛的应用。
欢迎为此列表做出贡献。在提交建议之前,请查看贡献指南以确保您的条目符合标准。通过pull requests添加链接,或创建一个issue以开始讨论。更多项目可以在发现列表中找到,我们在此展示了各种新兴的生成式 AI 项目。
目录
推荐阅读
- 大型语言模型如何将变革科学、社会和 AI - 总结 GPT-3 模型的能力和局限性及其对社会潜在影响的文章。作者:Alex Tamkin 和 Deep Ganguli,2021年2月5日。
- 生成式 AI:一个创意新世界 - 对生成式 AI 行业的全面审视,提供了历史视角和行业生态系统的深入分析。作者:Sonya Huang、Pat Grady 和 GPT-3,2022年9月19日。
- 生成式 AI 的出道派对,硅谷的新狂热 - 关于生成式 AI 的兴起,尤其是 Stable Diffusion 图像生成器的成功及相关争议的文章。纽约时报,2022年10月21日。
- AI 的新创意浪潮引发硅谷淘金热 - 关于生成式 AI 初创公司日益增长的炒作和投资的文章,各行业正在探索其潜在应用。Wired,2022年10月27日。
- ChatGPT 预示着一场知识革命 - 亨利·基辛格、埃里克·施密特和丹尼尔·哈特滕洛赫的评论文章。华尔街日报,2023年2月24日。
里程碑
- OpenAI API - 基于 GPT-3 的通用文本到文本 AI 模型的 OpenAI API 发布公告。OpenAI 博客,2020年6月11日。
- GitHub Copilot - 发布 Copilot 的公告,这是一个帮助你编写更好代码的 AI 对编程助手。GitHub 博客,2021年6月29日。
- DALL·E 2 - 发布 DALL·E 2 的公告,这是一种先进的图像生成系统,具有更高的分辨率、扩展的图像创建能力和各种安全措施。OpenAI 博客,2022年4月6日。
- Stable Diffusion 公共发布 - Stable Diffusion 的公共发布公告,这是一种基于 AI 的图像生成模型,经过广泛的互联网抓取训练,并根据 Creative ML OpenRAIL-M 许可发布。Stable Diffusion 博客,2022年8月22日。
- ChatGPT - ChatGPT 发布公告,这是一种对话模型,训练用于回答后续问题,承认错误,挑战不正确的前提,并拒绝不当请求。OpenAI 博客,2022年11月30日。
- Bing 搜索 - 微软宣布其搜索引擎 Bing 的新版本,基于下一代 OpenAI 模型。微软博客,2023年2月7日。
- GPT-4 - GPT-4 发布公告,这是一种大型多模态模型。OpenAI 博客,2023年3月14日。
- Sora - Sora 的展示,这是一个大型视频生成模型。OpenAI,2024年2月15日。
文本
模型
- OpenAI API - OpenAI 的 API 提供对 GPT-3 和 GPT-4 模型的访问,这些模型执行各种自然语言任务,以及将自然语言翻译成代码的 Codex。
- Gopher - DeepMind 的 Gopher 是一个 2800 亿参数的语言模型。
- OPT - Facebook 的开放预训练变压器 (OPT) 是一套仅解码器的预训练变压器。 公告。OPT-175B 文本生成 由 Alpa 提供托管。
- Bloom - Hugging Face 的 BLOOM 是一个类似于 GPT-3 的模型,训练了 46 种不同语言和 13 种编程语言。#opensource
- LLaMA - Meta 的一个基础性、650 亿参数的大型语言模型。#opensource
- Llama 2 - Meta 下一代开源大型语言模型。#opensource
- Claude - 与 Anthropic 的 AI 助手 Claude 对话。
- Vicuna-13B - 一个开源聊天机器人,通过在用户共享的对话上微调 LLaMA 进行训练。#opensource
- Mixtral 8x7B - 一个高质量稀疏专家混合模型,具有开源权重。#opensource
- Grok - 由 xAI 开发的 LLM,具有开源和开放权重。#opensource
聊天机器人
- ChatGPT - OpenAI 的 ChatGPT 是一个以对话方式交互的大型语言模型。
- Copilot - 微软推出的日常 AI 伴侣。
- Gemini - Google Deepmind 开发的一组多模态大型语言模型。
- Character.AI - Character.AI 允许你创建角色并与其聊天。
- ChatPDF - 与任何 PDF 进行对话。
- ChatSonic - 一个 AI 驱动的助手,支持文本和图像创建。
- Pi - 一个个性化的 AI 平台,作为数字助手使用。
定制界面
- LibreChat - LibreChat 是一个免费的开源 AI 助手聊天界面。源代码。
- Chatbot UI - 一个开源的
- GitHub Copilot - GitHub Copilot使用OpenAI Codex在编辑器中实时建议代码和整个函数。
- OpenAI Codex - 由OpenAI开发的将自然语言翻译为代码的AI系统。
- Ghostwriter - 由Replit开发的AI驱动的编程助手。
- Amazon Q - AWS生成式AI助理,帮助解答问题、编写代码和自动化任务。
- tabnine - 使用整行和完整函数代码补全功能更快编写代码。
- Stenography - 自动代码文档生成工具。
- Mintlify - AI驱动的文档编写工具。
- Debuild - AI驱动的低代码Web应用开发工具。
- AI2sql - 使用AI2sql,工程师和非工程师都可以轻松编写高效、无错误的SQL查询,无需了解SQL。
- CodiumAI - 使用CodiumAI,你可以在IDE中获取复杂的测试建议,确保代码提交时的信心。
- PR-Agent - AI驱动的工具,用于自动化PR分析、反馈、建议等。
- MutableAI - AI加速的软件开发。
- TurboPilot - 一个自托管的Copilot克隆,使用支持llama.cpp的库在4GB内存中运行6亿参数的Salesforce Codegen模型。
- GPT-Code UI - 开源实现的OpenAI ChatGPT代码解释器。
- MetaGPT - 多代理框架:给定一个需求,返回PRD、设计、任务、代码库。
- Open Interpreter - 在终端中本地运行的OpenAI代码解释器。
开发者工具
- co:here - Cohere提供访问高级大语言模型和NLP工具的接口。
- Haystack - 构建NLP应用(如代理、语义搜索、问答)的框架,使用语言模型。
- LangChain - 开发语言模型驱动的应用程序的框架。
- gpt4all - 训练在大量干净的助手数据(包括代码、故事和对话)上的聊天机器人。
- LLM App - 用于构建实时LLM启用的数据管道的开源Python库。
- LMQL - LMQL是一种针对大语言模型的查询语言。
- LlamaIndex - 一个数据框架,用于构建基于外部数据的LLM应用。
- Phoenix - Arize开发的ML可观察性开源工具,在笔记本环境中运行,监控并微调LLM、CV和表格模型。
- Cursor - 下一代IDE,为AI协同编程而设计。
- SymbolicAI - 一个神经符号框架,用于构建以LLM为核心的应用程序。
- Ollama - 在本地快速启动和运行大语言模型。
- Vanna.ai - 一个开源Python RAG框架,用于SQL生成及相关功能。#opensource
代理
自主代理
- Auto-GPT - 一个实验性的开源项目,旨在使GPT-4完全自主运行。
- babyagi - 一种AI驱动的任务管理系统。
- AgentGPT - 在浏览器中组装、配置和部署自主AI代理。
- GPT Engineer - 指定你想构建的内容,AI会进行澄清并构建它。
- GPT Prompt Engineer - 自动提示工程。生成、测试和排名提示以找到最佳的提示。
- MetaGPT - 多代理框架:给定一个需求,返回PRD、设计、任务、代码库。
- AutoGen - AutoGen是一个框架,允许开发多代理LLM应用程序,这些代理可以相互交流以解决任务。
- GPT Pilot - 从头开始编写可扩展应用程序的开发工具,同时开发者监督实施过程。
- Devin - Cognition Labs开发的自主AI软件工程师。
- OpenDevin - 一个自主代理,旨在应对软件工程的复杂性。#opensource
- Davika - 一个自主的AI软件工程师。#opensource
自定义助手
- Poe - Poe提供了访问各种机器人。
- GPT Builder - 用于创建基于GPT的助手的工具。
- GPTStore - 查找有用的GPT助手。分享你自己的GPT助手。
图像
模型
- DALL·E 2 - 由OpenAI开发的DALL·E 2是一个新的AI系统,可以根据自然语言描述创建逼真的图像和艺术作品。
- Stable Diffusion - 由Stability AI开发的Stable Diffusion是一个尖端的文本到图像模型,可以从文本生成图像。#opensource
- Midjourney - Midjourney是一个独立的研究实验室,探索新的思维媒介,扩展人类物种的想象力。
- Imagen - 由Google开发的Imagen是一个文本到图像的扩散模型,具有前所未有的真实感和深度语言理解能力。
- Make-A-Scene - 由Meta开发的Make-A-Scene是一个多模态生成AI方法,通过允许用户通过文本描述和自由绘图来描述和描绘他们的愿景,将创造性控制权交到用户手中。
- DragGAN - 拖拽你的GAN:基于交互式点的生成图像流形操纵。
服务
- Craiyon - Craiyon,前身为DALL-E mini,是一个可以从任何文本提示生成图像的AI模型。
- DreamStudio - DreamStudio是一个易于使用的界面,用于使用Stable Diffusion图像生成模型创建图像。
- Artbreeder - Artbreeder是一种新的创意工具,通过使协作和探索变得更容易来激发用户的创造力。
- GauGAN2 - GauGAN2是一个强大的工具,可以使用文本和绘图组合创建逼真的艺术作品,因为它集成了分割映射、图像修复和文本到图像生成在一个模型中。
- Magic Eraser - 几秒钟内移除图像中的不需要的物体。
- Imagine by Magic Studio - 由Magic Studio开发的工具,通过简单描述你的想法来表达自己。
- Alpaca - Stable Diffusion的Photoshop插件。
- Patience.ai - Patience.ai是一个使用由Stability.AI开发的尖端AI创建图像
- Diagram - 设计产品的神奇新方式。
- PromptBase - 一个用于买卖优质提示词的市场,支持DALL·E、GPT-3、Midjourney、Stable Diffusion等。
- This Image Does Not Exist - 测试你判断图像是人类还是计算机生成的能力。
- Have I Been Trained? - 检查你的图像是否被用于训练流行的AI艺术模型。
- AI Dungeon - 一个文字冒险故事游戏,由你指挥(并出演),同时AI将其生动呈现。
- Clickable - 使用AI在几秒钟内生成广告。为所有营销渠道生成美观、一致且高转化率的广告。
- Scale Spellbook - 使用Scale Spellbook构建、比较和部署大型语言模型应用程序。
- Scenario - AI生成的游戏资产。
- Teleprompter - 你的会议设备上的AI,监听你并提供具有吸引力的引用建议。
- FinChat - 使用AI,FinChat生成关于上市公司和投资者的问题答案。
- Morpher AI - Morpher AI为任何市场提供实时洞察和分析。
- Whimsical AI - GPT驱动的思维导图、流程图和可视化工具,用于快速的创意开发和流程组织。
学习资源
- Learn Prompting - 一个免费的开源课程,关于如何与人工智能沟通。
- Prompt Engineering Guide - 提示词工程指南和资源。
- ChatGPT prompt engineering for developers - 由Isa Fulford(OpenAI)和Andrew Ng(DeepLearning.AI)提供的短期课程。
- OpenAI Cookbook - 使用OpenAI API的示例和指南。
- OpenAI Prompt Engineering Guide - 获取更好语言模型结果的策略和方法。
- [PromptPerfect] - 用于提示词工程的工具。
更多列表
- Tools and Resources for AI Art - 由@pharmapsychotic整理的生成性AI的Google Colab笔记本的大量列表。
- The Generative AI Application Landscape - Sequioa Capital的Sonya Huang整理的生成性AI生态系统的信息图。
- Startups - @builtwithgenai - 由@builtwithgenai整理的Airtable列表。
- The Generative AI Index - 由Scale Venture Partners整理的Airtable列表。
- Generative AI for Games - a16z整理的游戏生成性AI公司市场图。
- Generative Deep Art - 由@filipecalegario整理的生成性深度学习工具、作品、模型等的精选列表,用于艺术创作。
- GPT-3 Demo - GPT-3示例、演示、应用展示和NLP使用案例展示。
- GPT-4 Demo - GPT-4应用程序和使用案例展示。
- The Generative AI Landscape - 一个优秀生成性AI应用程序的集合。
- Molecular design - 使用生成性AI和深度学习进行分子设计的列表。
- Open LLMs - 可供商业使用的开源LLMs列表。
ChatGPT相关列表
- Awesome ChatGPT - 由@jordn整理的ChatGPT和GPT-3的优秀工具、演示、文档精选列表。
- Awesome ChatGPT Prompts - 一个用于ChatGPT模型的提示词示例集合。
- FlowGPT - 通过最佳提示词提升你的工作流程。
- ChatGPT Prompts for Data Science - 一个实用的数据科学提示词存储库,用于ChatGPT。
- Awesome ChatGPT - 另一个ChatGPT的精选列表。