Logo

#AI模型

Logo of onnx
onnx
ONNX是一个开放生态系统,提供AI模型的开源格式,支持深度学习和传统机器学习。通过定义可扩展的计算图模型和内置操作符及标准数据类型,ONNX增强了不同框架间的互操作性,加速了从研究到生产的转化。ONNX广泛支持各种工具和硬件,助力AI社区快速创新。了解ONNX的文档、教程和预训练模型,加入社区,共同推动ONNX的发展。
Logo of dalai
dalai
Dalai项目允许用户在Linux、Mac和Windows系统上运行LLaMA和Alpaca模型,提供用户友好的Web应用和JavaScript API。通过简单的安装步骤即可在本地使用这些模型,支持多种模型尺寸,适应不同计算机配置。详细的安装和故障排除指南帮助用户快速上手。
Logo of litgpt
litgpt
LitGPT为开发者提供超过20种高性能的大型语言模型(LLMs),具备从头开始的实现、无抽象层和企业级的性能优化。适合于训练、微调和部署大规模应用,支持新手入门,简化企业级部署流程。提供全面的Python API文档和优化教程,使得部署AI模型更快速、更经济、更有效率。
Logo of Augment Code
Augment Code
Augment Code是一款专门为大型代码库设计的AI开发辅助平台,它可以显著提高开发速度和代码质量。这一平台采用最新GPU技术,提速3倍于竞争对手,且拥有自定AI模型,专注于代码质量提升。平台支持多开发者协作,并强化内部最佳实践的应用。同时,平台特别注重知识产权保护,实施严格的IP保护措施、SOC-2 Type 1 compliance和pen-test验证,确保企业资源与数据安全。
Logo of Deepgram Voice AI
Deepgram Voice AI
Deepgram Voice AI平台,采用最新Nova-2语音识别模型,提供实时、高效和低成本的语音转文字与文字转语音APIs,适用于医疗转录、客户服务与媒体字幕制作等多种场景。
Logo of awesome-stable-diffusion
awesome-stable-diffusion
awesome-stable-diffusion是一个针对Stable Diffusion人工智能模型的综合性资源和软件集合,提供一系列从GUI到CLI界面的安装指南,并支持NVIDIA GPU、Apple Silicon和AMD GPU等多平台。项目不仅提供必要的模型权重文件,还详述如何运行模型,同时提供多种经过更新和维护的分支版本,满足用户对功能和性能的不同需求。
Logo of gp.nvim
gp.nvim
gp.nvim是一个AI驱动的Neovim插件,基于GPT模型提升编程功能,支持即时响应、扩展性极强的钩子函数、聊天式会话、文本和代码的自动操作、语音转文本及图像生成,有效增强开发者效率。
Logo of GPT_Vuln-analyzer
GPT_Vuln-analyzer
GPT_Vuln-analyzer是一个用于漏洞分析的智能工具,支持网络扫描、DNS枚举和子域名检测,通过CLI和GUI接口进行操作。集成OpenAI、Bard API、Llama AI等多种AI模型,以及nmap和dnsresolver等Python模块,提供高效且准确的分析。详细的使用指南和模块集成指导,支持多操作系统,能够满足多种安全测试需求。
Logo of llm.ts
llm.ts
llm.ts通过单一API接口,支持同时发送多个提示至30多种语言模型,并在一个响应中获取结果。该项目零依赖、体积小于10kB,支持自带API密钥,适用于Node.js、Deno和浏览器环境。支持的模型包括OpenAI、Cohere和HuggingFace等,实现高效灵活的语言模型调用。
Logo of responsible-ai-toolbox
responsible-ai-toolbox
Responsible AI Toolbox是一个集合,包含多个工具和库,旨在通过提供模型和数据探索及评估界面,帮助开发者和利益相关者更好地理解和监控AI系统。该工具集包括Responsible AI dashboard、Error Analysis dashboard、Interpretability dashboard、Fairness dashboard等,还涵盖数据处理、数据平衡分析与性别偏见测量等模块。用户可自定义工作流,以优化模型调试和数据驱动决策,确保AI系统的安全性、可靠性和公平性。
Logo of carefree-learn
carefree-learn
carefree-learn项目致力于简化深度学习流程,特别是基于PyTorch的训练与推理。采用模块优先、原生兼容的设计原则,支持AI模型推理,符合现代AI的发展趋势,并遵循MIT许可证。项目提供易于使用的接口和高性能模块,适合开发者与使用者。
Logo of Phi-3CookBook
Phi-3CookBook
本项目提供Microsoft Phi-3模型家族的全面实践指南,包括环境设置、快速入门、推理、微调和评估等教程。涵盖iOS、Jetson和AI PC等多种硬件设备上的端到端解决方案构建说明。另外还包含实际应用案例和实验室样本,助力开发者深入理解和应用Phi-3模型。
Logo of SimpleTuner
SimpleTuner
SimpleTuner是一个开源的AI模型训练优化脚本集。它以简单易用为设计理念,支持多GPU训练、方面比例分桶等功能。适用于Flux、PixArt Sigma和Stable Diffusion等多种AI模型的训练。项目提供详细教程和快速入门指南,适合各级用户。作为开源平台,SimpleTuner鼓励学术交流和代码贡献。
Logo of PaddleHub
PaddleHub
PaddleHub提供超过400种高质量AI模型,覆盖计算机视觉、自然语言处理和语音识别等领域。用户仅需3行代码即可进行模型预测,同时支持模型即服务,通过简单命令即可部署。最新版本v2.3.0引入了ERNIE-ViLG、Disco Diffusion和Stable Diffusion等模型,并支持在HuggingFace平台上发布。PaddleHub兼容Linux、Windows和MacOS,适合多平台开发。
Logo of BentoML
BentoML
BentoML是一个开源模型服务框架,简化了AI和ML模型的生产部署。可以将任何模型推理脚本轻松转化为REST API服务器,并通过简单配置文件管理环境、依赖和模型版本。BentoML支持高性能推理API的构建,利用动态批处理、模型并行化和多阶段流水线等优化功能,最大化CPU/GPU利用率。此外,还支持自定义AI应用、异步推理任务和定制化前后处理逻辑。通过Docker容器或BentoCloud可轻松部署至生产环境,适用于各种机器学习框架和推理运行时。
Logo of big-AGI
big-AGI
big-AGI是一个为专业人士设计的AI套件,集成了12家供应商的最新模型和开源服务器,提供聊天、Beam、和Calls等多功能服务。该平台以简洁、快速和高效的用户体验,帮助用户保持领先地位。通过big-AGI,用户在同一平台上即可享受丰富的视觉化、编程、绘图和多任务交流功能,满足不同的工作和娱乐需求。big-AGI还支持自定义的AI人格和语音模式,让交互更加生动有趣。
Logo of Obviously AI
Obviously AI
Obviously AI 提供易于使用的一站式服务,允许用户通过单一操作完成整个数据科学过程:从建立机器学习算法、解释结果到预测未来。这一切无需任何编程背景,同时支持快速构建、部署顶尖AI模型,有效缩减开发周期,支持模型实时监控与集成。
Logo of giskard
giskard
Giskard是一个开源的Python库,旨在自动检测AI应用中的性能、偏差和安全问题。支持LLM和传统的ML模型,功能涵盖自动生成评估数据集、评估RAG应用答案、检测幻觉、生成有害内容及敏感信息泄露等问题。Giskard可无缝集成到各种环境中,并提供详细文档和示例代码,适用于各类AI开发者。
Logo of Final2x
Final2x
Final2x是一个开源的跨平台图片超分辨率工具,提供多种模型包括RealCUGAN、RealESRGAN和Waifu2x,旨在无损质量地提升图片清晰度。支持各主要操作系统如Windows、MacOS和Linux,并允许用户自定义输出尺寸,适配多语言环境。
Logo of feishu-openai
feishu-openai
集成GPT-4、DALL-E、Whisper等AI技术,飞书OpenAI提供多元化办公解决方案与安全部署选项,适合各规模企业。了解更多升级商业共创版的优势,助力企业步入智能办公新纪元。
Logo of chatbot
chatbot
MongoDB Chatbot框架基于MongoDB与Atlas Vector Search,支持检索增强生成(RAG)。从原型到生产无缝过渡,通过内置数据摄取流程、聊天机器人服务器和Web UI,快速启动定制化AI聊天机器人应用。框架灵活支持多种AI模型与复杂提示策略,并提供编程评估工具。
Logo of unsaged
unsaged
unsaged是一款聊天套件,支持用户与多种AI模型进行对话,并在不同设备间同步。该工具结合了Next.js和Supabase,提供多用户管理、模型切换、系统提示和消息模板等功能,支持OpenAI的GPT系列、Anthropic的Claude系列和Google的Chat Bison等模型,适合整合多种AI服务的使用场景。
Logo of WeChatRobot
WeChatRobot
基于WeChatFerry的微信机器人示例,提供详细的安装步骤与配置指南,快速启动并集成ChatGPT、Tigerbot、ChatGLM和讯飞星火等AI模型。项目支持文档、视频教程与常见问题解答,指导用户实现群聊自动响应与智能交互。包含Python依赖的安装和HTTP接口参考,实现微信机器人的高效开发与应用。
Logo of AlphaZero_Gomoku
AlphaZero_Gomoku
AlphaZero-Gomoku项目通过自我对弈训练,实现了五子棋(Gomoku)的AI开发。该项目专注于展示AlphaZero算法在相对简单的棋类游戏中的表现,可在数小时内使用单台PC训练出高水平AI模型。支持TensorFlow和PyTorch进行训练,提供实例游戏和操作指南,适合学习AI自我对弈算法和深度学习框架的开发者。
Logo of ailia-models
ailia-models
ailia SDK 是一款跨平台高速AI推理工具,适用于Windows、Mac、Linux、iOS、Android、Jetson和Raspberry Pi平台,并支持Unity (C#)、Python、Rust、Flutter (Dart) 和 JNI。该SDK通过Vulkan和Metal利用GPU增强计算性能。用户可通过pip3安装并使用丰富的预训练模型库,包括动作识别、异常检测和音频处理等领域。最新更新增加了mahalanobis-ad和t5_base_japanese_ner模型。
Logo of cog-face-to-many
cog-face-to-many
face-to-many项目可以将任何面部图像转换为3D、像素艺术、电子游戏、粘土动画和玩具效果。该项目可在Replicate和ComfyUI上运行,提供了必要的自定义节点,如ComfyUI Controlnet Aux、InstantID和IPAdapter Plus等。通过克隆仓库、创建虚拟环境并安装依赖项,用户可以在本地运行该项目。详细的安装和运行指南帮助用户快速启动并体验项目功能。
Logo of LibreChat
LibreChat
LibreChat是一个开源AI聊天平台,提供类似ChatGPT的用户界面,支持暗黑模式和流媒体功能。用户可以选择使用OpenAI、Azure、Google等多种AI模型,并可在远程和本地AI服务之间切换。平台支持多语言界面,提供图像分析、多模态聊天、对话分支和插件等功能。LibreChat允许创建、保存和分享自定义预设,支持多用户安全认证和社区驱动开发,并提供本地和云端部署选项。
Logo of generative-ai
generative-ai
此资源库提供关于在Google Cloud上使用Generative AI的指南和示例,包括笔记本、代码样本和应用程序示例,帮助用户开发和管理生成式AI工作流。
Logo of Efficient-AI-Backbones
Efficient-AI-Backbones
Efficient-AI-Backbones 项目涵盖了由华为诺亚方舟实验室研发的一系列先进的人工智能模型,包括 GhostNet, TNT, AugViT, WaveMLP, 和 ViG 等。这些模型通过创新的结构设计和优化,有效提升了计算效率和性能,广泛应用于各种智能处理任务。最新发布的 ParameterNet 在 CVPR 2024 会议上被接受,展现了华为在人工智能技术领域的持续领先。
Logo of Replicate
Replicate
Replicate提供了一个云API服务,用户仅需一行代码即可启动、调优以及部署自定义机器学习模型。网站集合了数千种开源模型,支持图像生成、语音合成等多种功能。通过Replicate,企业和开发者能快速将AI模型集成到应用中,无需担心底层基础设施和维护问题。
Logo of floneum
floneum
Floneum项目提供了一个简便的开发接口,适用于本地预训练的AI模型,包括Kalosm和Floneum Editor。Kalosm在Rust中为语言、音频和图像模型提供了简单接口,支持多种模型和加速选项。Floneum Editor是一个用于本地AI工作流的图形编辑器。这些工具让开发者能够轻松实现AI模型交互、音频转录和图像生成等功能。更多信息和使用案例请参阅项目文档和示例。
Logo of gpt4free
gpt4free
gpt4free项目是一个功能强大的API包,用于方便地管理多个提供商的请求和特性,包括超时、负载平衡和流量控制。它还支持百分百的本地推断,确保用户享受快速安全的计算体验。全面的文档和Docker容器指南使得项目易于使用,适合各级开发者。通过加入我们的Telegram或Discord社区,可以实时获得更新和支持。
Logo of ShareGPT4Video
ShareGPT4Video
ShareGPT4Video项目通过应用高精度字幕显著提升视频理解与生成的效果。该项目提供功能强大的文本至视频模型,支持多种视频时长和分辨率,并设有两种优化效率与质量的推断模式。该项目的目标是通过高质量视频字幕数据集改善文本到视频的转换效果,从而提升大型视频语言模型的理解能力。
Logo of gpt-translate
gpt-translate
该GitHub Action工具使用多种AI模型,支持将Markdown文件翻译成多种语言,提升文档的国际化便利性。主要功能包括支持多种文件格式、提供详细的设置指南以及自动生成翻译文件。此工具仅供具有写权限的用户使用,以防止API滥用,并提供社区讨论和问题反馈渠道。
Logo of MultiModalMamba
MultiModalMamba
MultiModalMamba 是一个结合 Vision Transformer 和 Mamba 的高性能多模态 AI 模型,基于简洁强大的 Zeta 框架。它可以同时处理文本和图像数据,适用于各种 AI 任务,并支持定制化设置。MultiModalMamba 提供高效数据处理和多种数据类型融合,优化您的深度学习模型表现。
Logo of LyCORIS
LyCORIS
LyCORIS项目提供了一系列针对Stable Diffusion的高效参数调优算法,包括LoRA、LoHa、LoKr和DyLoRA等。项目支持多种接口(如ComfyUI和InvokeAI)和训练方案(如kohya-ss和Naifu-Diffusion),并能与PyTorch模块无缝整合。通过不同算法的比较,LyCORIS在保真度、灵活性和训练速度上表现出色。用户可以通过简便的pip安装,探索多样的网络配置和训练方式,实现图像生成的定制化。
Logo of mmdeploy
mmdeploy
MMDeploy是一个开源的深度学习模型部署工具,支持OpenMMLab的各类模型库。该工具集成了多种推理后端,兼容Linux、Windows、macOS和Android等操作系统。提供灵活可扩展的C/C++ SDK框架,支持模型转换、配置编写、性能剖析和量化。详尽文档指导简化了模型部署过程,使其更加高效。
Logo of VideoCrafter
VideoCrafter
VideoCrafter2是一个开源的视频生成和编辑工具,致力于克服数据限制,提高视频扩散模型质量。它支持文本到视频和图像到视频的生成,在有限数据条件下实现了更好的动态效果和概念组合。该工具提供高分辨率输出和更高的一致性,为研究人员和创作者提供了实用的视频内容制作方案。
Logo of mistral-inference
mistral-inference
该项目提供了简洁高效的代码库,支持Mistral 7B、8x7B和8x22B模型的部署和运行。通过命令行界面和Python接口,可以方便地下载、安装和测试模型,并与其互动。项目包含详细的使用示例和多GPU环境的部署指南,为开发者和研究人员提供了可靠的支持。
Logo of ludwig
ludwig
Ludwig是一个低代码深度学习框架,用于构建定制的人工智能模型,如LLMs和其他深度神经网络。它支持多任务和多模态学习,优化了批量大小选择,分布式训练和模型微调,确保高效处理大规模数据集。Ludwig的模块化设计允许用户轻松实验不同的模型架构,支持超参数优化和丰富的度量可视化,适用于生产环境,并整合了Docker和Ray等工具,支持模型导出到Torchscript和Triton,一键上传至HuggingFace。
Logo of gaianet-node
gaianet-node
gaianet-node项目允许用户在Mac、Linux或Windows WSL上通过一条命令快速安装默认的节点软件栈。用户可以初始化节点,自定义配置,下载模型文件和向量数据库文件,进而启动AI代理节点。此外,项目提供详细的安装向导和对多种语言的支持,帮助全球用户轻松部署和管理自己的AI模型。
Logo of DomoAI
DomoAI
DomoAI,一款高端的AI艺术生成工具,致力于突破人工智能研究与创新思维。它能将任意文本、视频和图像转化为迷人的艺术作品,适用于社会媒体、演示文稿等多种场合,助你轻松满足各类创意需求。
Logo of node-llama-cpp
node-llama-cpp
node-llama-cpp是一个可以在本地机器上运行文本生成AI模型的开源项目,支持Metal和CUDA。提供预构建二进制文件,并在需要时可从源代码构建。用户可以通过命令行界面与模型交互,无需编写代码。项目兼容最新版本的llama.cpp,并支持强制生成解析格式输出,如JSON。
Logo of docGPT-langchain
docGPT-langchain
docGPT项目允许用户无需API密钥即可查询文档内容,支持多种文件格式如PDF、Word和CSV。用户可以简单上传文件或直接输入文档URL进行交互。平台整合了两种模型:完全免费的gpt4free和需API密钥的openai模型。docGPT的易用性强,支持本地及Docker部署,是一个理想的文档交互工具。
Logo of lechat-pro
lechat-pro
LeChat是一个基于UniAI开发、受KimiChat启发的开源聊天工具,支持Moonshot、OpenAI GPT和百度文心等多种AI模型。与KimiChat不同,LeChat完全由个人维护且代码开源。项目功能覆盖文档上传解析、图像识别、图像生成和图表绘制,并允许用户灵活选择和集成多种模型,适合不使用商业模型的开源爱好者。
Logo of Awesome-Open-AI-Sora
Awesome-Open-AI-Sora
Sora是由OpenAI推出的AI模型,能根据文本指令生成生动的场景,视频时长可达60秒,包括详细场景、相机运动和多角色演绎。Sora还可应用于虚拟现实和电影制作等领域。尽管Sora项目尚处于早期阶段,其资源列表会定期更新,涵盖GitHub项目、文章、博客、在线课程、书籍、研究论文和视频等多方面内容,提供全面的信息和学习路径。
Logo of Transformer-in-Vision
Transformer-in-Vision
本页面收录并介绍了最新的基于Transformer的计算机视觉研究和相关资源,内容涵盖机器人应用、视频生成、文本-图像检索、多模态预训练模型等领域。用户可访问开源代码和论文链接,如ChatGPT在机器人领域的应用、DIFFUSIONDB、LAION-5B、LAVIS、Imagen Video和Phenaki等。页面会不定期更新,提供Transformer在视觉领域应用的全面信息和资源汇总。
Logo of chatty
chatty
Chatty利用WebGPU在浏览器中本地运行大型语言模型,保障数据隐私。其特点包括离线使用、聊天记录管理、支持多种开源模型、响应式设计和直观的用户界面。用户还可以加载本地文件、生成并保存聊天记录,并使用语音输入。此AI支持光明和暗模式,适用于所有支持WebGL的设备,极大地丰富了浏览器内的AI体验。
Logo of GPTRouter
GPTRouter
GPTRouter解决大语言模型的主要问题,通过智能切换和自动重试,确保服务稳定不中断。支持OpenAI、Azure OpenAI、Anthropic等多种语言和图像生成模型,降低响应延迟,提供高效用户体验。利用通用API,便捷集成多模型,是构建稳健AI系统的理想选择。
Logo of Make-Your-Video
Make-Your-Video
Make-Your-Video是一个结合文本和深度信息的视频生成模型。它继承了图像潜在扩散模型的丰富视觉概念,支持长视频推理。该模型可将真实场景和3D建模场景转化为视频,并支持视频重渲染。相比其他方法,Make-Your-Video在视觉质量和动作控制方面表现优异,为视频创作提供了新的可能性。