generative-ai-js

使用Google DeepMind的Gemini API进行多模态数据处理的工具

Google AI SDK JavaScript Gemini API Google DeepMind multimodal Github 开源项目

Google AI JavaScript SDK让开发者方便地使用Google DeepMind的Gemini API进行多模态数据处理，包括文本、图像和代码。建议仅在服务器端调用API以保护API密钥安全。项目提供了详细的使用指南和示例代码，帮助快速上手Node.js应用。查看更多有关SDK的文档和贡献指南，以确保最佳使用体验。

访问官网

Github

介绍相关项目

generative-ai-workbook - 生成式AI学习与实战的综合资源库

Generative AIGithub工具开源项目生成式AI用例项目

展示生成式AI相关的课程学习、个人项目和示例。该项目涵盖工具与框架的学习，如LangChain、Autogen等，包括实际应用示例和使用案例，如搜索、分类、聚类、数据生成、文本生成、代码生成、总结、重写、提取、校对、数据查询等。用户可以通过此项目深入探索生成式AI的各个方面，获取详细的学习资源和实践经验。

openai-node - 便捷的接入OpenAI REST API的途径

API文档GithubJavaScriptOpenAI Node APITypeScript开源项目异步操作

该库为开发者提供了便捷的接入OpenAI REST API的途径，包括TypeScript类型定义，加快了代码实现。主要特点包括流响应、文件上传和错误处理，适合需要集成AI的各类应用。为各级开发者提供加快项目进度，实现智能化的有效工具。

gemma-2-2b - 轻量级文本生成模型，支持多任务应用

GemmaGithubHuggingface开源项目文本生成机器学习模型语言模型谷歌

Gemma是Google推出的开源文本生成模型，专用于问答、文本总结和推理等任务。其模型小巧，易于在笔记本或云基础设施等资源有限的环境中部署。支持多种应用场景，例如内容生成、聊天机器人、自然语言处理研究和语言学习。模型使用多样化来源的数据进行训练，覆盖广泛的语言风格和主题。

gemma-2-2b-it-GGUF - 一种专为低功耗设备优化，适合多种语言和代码生成的模型

GemmaGithubHuggingface多语言开源项目模型生成模型自动补全谷歌

Gemma 2 2b是Google推出的一款模型，基于Gemini技术，能有效处理多种语言、编程和数学文本。其2b参数设计适合用于低功耗边缘设备，通过优化词汇量和训练比例，提升模型性能，利用量化技术降低计算需求。适合作为自动完成功能和草稿生成工具，支持在LM Studio平台上使用。感谢Georgi Gerganov及团队的技术支持。

GPTPortal - 多模态LLM API全能聊天门户

Anthropic ClaudeChat-Bot PortalGPT-4 APIGithubGoogle GeminiMistral AI开源项目

GPTPortal是一个基于Node.js的全功能网页应用，集成了多种LLM API，包括OpenAI的GPT-4、Anthropic Claude、Mistral AI和Google Gemini等。用户可以通过平台与对话机器人互动，支持文本、语音和图像生成功能。平台提供友好的用户界面、自定义指令、对话历史记录、简单设置和多模型选择。适用于需要高级AI和多模态交互的用户，支持技术应用和研发。

AI Generators - 提供全面的AI生成器探索平台

AI工具AI生成器图像生成文本生成视频生成语音生成

该平台汇集了多种AI生成器，涵盖文本、图像、视频、音乐和代码生成等，帮助用户探索这些技术在艺术、商业等领域的应用。

face-api - AI人脸检测与识别、年龄性别情感预测，适用于浏览器和NodeJS

FaceAPIGithubNodeJSTensorFlow/JS人脸识别开源项目浏览器

该项目基于TensorFlow/JS，提供高级人脸检测、旋转跟踪、识别人脸、预测年龄、性别和情感功能，适用于浏览器和NodeJS环境。项目提供在线演示、详细文档和教程，以及多种使用场景的示例代码，帮助开发者快速上手和集成。无论是静态图片还是实时摄像头数据处理，均能提供精准高效的结果。

gemma - Google DeepMind开源的Gemma大语言模型

GemmaGithubGoogle DeepMindJAX大语言模型开源权重开源项目

Gemma是Google DeepMind推出的开源大语言模型系列，基于Gemini技术开发。项目提供Flax和JAX框架的推理实现和示例，支持CPU、GPU和TPU等多种硬件平台。包括模型权重下载、入门指南、示例代码和教程，便于开发者学习和应用。Gemma共有2B和7B两种参数规模的模型可供选择。

Generative-AI - 多模态图像合成与编辑技术及其分类

Data ModalityGenerative AIGithubMultimodal Image Synthesis and EditingTaxonomyVisual AIGC开源项目

该项目附有一篇综述论文，全面分析了多模态图像合成与编辑（MISE）和视觉AIGC的发展情况，并根据数据模态和模型架构进行了分类研究。通过此项研究，科研人员和技术开发者可以深入了解神经渲染、扩散方法、自回归方法及对抗生成网络（GAN）等不同技术及其应用，帮助更好地掌握多模态图像合成技术的前沿进展与实际应用。

gemma-2-2b-it - Google开发的2B参数轻量级语言模型用于多种文本生成

GemmaGithubHuggingface人工智能大语言模型开源项目机器学习模型自然语言处理

gemma-2-2b-it是Google基于Gemini技术开发的轻量级开源语言模型。这个2B参数的指令微调模型适用于问答、摘要和推理等文本生成任务。模型体积小巧，可在资源受限环境部署，为开发者提供AI能力。采用英语训练并支持开放权重，有助于促进AI技术创新和应用。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号