Logo

TalkWithGemini: 一键部署你的私人 Gemini AI 助手

TalkWithGemini

TalkWithGemini: 打造你的专属 AI 助手

在人工智能快速发展的今天,拥有一个私人 AI 助手已经成为许多人的需求。Google 推出的 Gemini 模型以其强大的多模态能力和准确的对话表现,吸引了众多开发者和用户的关注。然而,如何便捷地部署和使用 Gemini 模型,却是不少人面临的难题。TalkWithGemini 项目应运而生,为这个问题提供了一个优雅的解决方案。

什么是 TalkWithGemini?

TalkWithGemini 是一个开源项目,旨在让用户能够一键免费部署私人 Gemini 应用。该项目支持多种 Gemini 模型,包括 Gemini 1.5 Pro、Gemini 1.5 Flash、Gemini Pro 和 Gemini Pro Vision。它不仅提供了简洁的 Web 界面,还开发了跨平台的桌面应用,让用户可以在各种环境下方便地使用 Gemini 的强大功能。

TalkWithGemini 界面截图

TalkWithGemini 的主要特性

  1. 一键部署: 用户可以在不到 1 分钟的时间内,通过 Vercel 平台一键部署自己的 Gemini 应用。

  2. 跨平台客户端: 提供体积仅约 4MB 的 Windows、MacOS 和 Linux 客户端,可常驻菜单栏,提高办公效率。

  3. 多模态支持: 能够理解并处理图片、视频、音频和部分文本文档,充分发挥 Gemini 模型的多模态能力。

  4. 语音交互: 支持语音模式,允许用户直接与 Gemini 进行语音对话。

  5. 视觉识别: 具备图像内容理解能力,可以"看懂"用户上传的图片。

  6. 丰富的助理市场: 内置数百个精选系统指令,满足不同场景的需求。

  7. 完整的 Markdown 支持: 支持 LaTex 公式、代码高亮等高级格式。

  8. 智能上下文管理: 自动压缩聊天记录,在节省 Token 的同时支持超长对话。

  9. 隐私保护: 所有数据均保存在用户浏览器本地,确保信息安全。

  10. PWA 支持: 可以作为独立应用运行,提供类似原生 App 的体验。

  11. 响应式设计: 精心设计的 UI,支持深色模式,适配各种设备。

  12. 快速响应: 极快的首屏加载速度,支持流式响应,提供流畅的对话体验。

  13. 灵活部署: 支持静态部署,可以部署在任何支持静态页面的服务上。

  14. 多语言支持: 支持包括中文、英语、日语、韩语等在内的多种语言。

如何开始使用 TalkWithGemini?

使用 TalkWithGemini 非常简单,只需要以下几个步骤:

  1. 获取 Gemini API Key: 首先,你需要在 Google AI Studio 申请一个 Gemini API Key。

  2. 一键部署: 点击项目提供的 "Deploy with Vercel" 按钮,即可快速部署你的私人 Gemini 应用。

  3. 开始使用: 部署完成后,你就可以开始使用你的专属 AI 助手了!

Gemini 1.5 Flash 模型界面

深入了解 TalkWithGemini

环境变量配置

TalkWithGemini 提供了多个环境变量,让你能够更灵活地配置你的应用:

  • GEMINI_API_KEY: 你的 Gemini API 密钥,用于启用服务器 API。
  • GEMINI_API_BASE_URL: 可以自定义 Gemini API 请求的基础 URL。
  • NEXT_PUBLIC_GEMINI_MODEL_LIST: 自定义模型列表。
  • ACCESS_PASSWORD: 设置访问密码,增加安全性。
  • HEAD_SCRIPTS: 可以注入自定义脚本,用于统计或错误跟踪。

部署选项

除了 Vercel 一键部署,TalkWithGemini 还支持多种部署方式:

  1. Docker 部署: 推荐使用 Docker 进行部署,简单快捷。
docker pull xiangfa/talk-with-gemini:latest
docker run -d --name talk-with-gemini -p 5481:3000 xiangfa/talk-with-gemini
  1. 静态部署: 你可以构建静态页面版本,然后将生成的文件上传到任何支持静态页面的服务上。

跨平台客户端

TalkWithGemini 提供了跨平台的桌面客户端,支持 Windows、MacOS 和 Linux 系统。这些客户端可以常驻菜单栏,让你随时随地都能快速访问 Gemini AI 助手。

TalkWithGemini 客户端

使用技巧和注意事项

  1. API 代理: 如果你所在的地区无法直接访问 Google 服务,可以考虑使用 API 代理。项目提供了使用 Cloudflare Worker 作为 API 代理的教程。

  2. 文件上传限制: 由于 Vercel 和 Netlify 对上传文件大小有限制,如果需要上传大文件,可以考虑使用 Cloudflare Worker 作为 API 代理。

  3. 语音对话功能: 语音识别功能依赖于浏览器的 SpeechRecognition 接口,在不支持该接口的浏览器中会隐藏语音对话功能。

  4. 文档支持: 目前 Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型支持大部分图片、音频、视频和部分文本文件,但对于 doc、excel、pdf 等常见文档格式的支持还在开发中。

  5. 网络访问: 如果你使用 Vercel 部署的网站在某些地区无法正常访问,可能需要考虑使用其他部署方式或设置代理。

TalkWithGemini 的未来发展

TalkWithGemini 项目团队有着明确的开发计划,未来将会实现以下功能:

  1. 重构话题广场,引入 Prompt 列表。
  2. 使用 Tauri 技术重新打包桌面应用,提供更好的性能和用户体验。
  3. 实现基于 functionCall 的插件系统,进一步扩展 AI 助手的功能。
  4. 支持对话列表管理,方便用户组织和回顾多个对话。

结语

TalkWithGemini 为个人和小团队提供了一个便捷、强大的 AI 助手解决方案。通过简单的部署步骤,你就能拥有一个基于 Gemini 模型的私人 AI 助手,助力你的工作和学习。无论是日常对话、图像识别,还是复杂的多模态任务,TalkWithGemini 都能胜任。

随着项目的不断发展和完善,我们可以期待 TalkWithGemini 在未来会带来更多惊喜。如果你对 AI 助手感兴趣,不妨试试 TalkWithGemini,开启你的 AI 辅助生活和工作新篇章。

🔗 项目地址: TalkWithGemini on GitHub

💡 提示: 记得给项目点个 Star,支持开发者的努力!

相关项目

Project Cover
generative-ai-go
Go SDK让开发者可以使用Google先进的生成式人工智能模型(如Gemini)开发AI功能。功能包括从文本或图文中生成文本、构建多轮对话和嵌入等。获取API Key并添加SDK即可开始,详细文档和示例请访问pkg.go.dev。
Project Cover
GPT-Telegramus
GPT-Telegramus是一个免费的Telegram机器人,集成了ChatGPT、Microsoft Copilot和Gemini等功能,支持流写作、图像请求、管理员控制和数据记录,并提供多语言支持和社区协作。
Project Cover
chatAir
ChatAir是一款支持ChatGPT、Gemini和Claude的原生Android应用,提供更流畅和快速的聊天体验。具备高效性能、Markdown与代码高亮支持、自定义设置和多语言支持。用户可以选择自定义服务器地址如OpenRouter、One-api和Ollama,还提供暗模式和主题定制功能,提升使用舒适度。立即下载体验专业、个性化的聊天服务。
Project Cover
hello-ai
提供丰富的AI资源,如ChatGPT中文指南、全球AI网站导航、AI信息交流等。推荐稳定优质的国外AI服务,包括coze.com、chat.openai.com、gemini.google.com等,旨在帮助用户轻松接触高质量的AI服务。
Project Cover
openai-gemini
openai-gemini项目提供一个免费且兼容OpenAI的API端点,无需服务器维护,可在多个云服务商上部署。需要Google API密钥并可以通过VPN获取。支持Vercel、Netlify和Cloudflare平台的快速部署,适合本地开发。API支持多种软件工具的配置,提供多样的模型选择。
Project Cover
Gemini
Gemini项目实现了一个可处理文本、音频、图像和视频输入的多模态变换器,具备特殊解码功能来生成图像。其架构类似于Fuyu,但扩展至多种模态,并通过直接将图像嵌入输入变换器来处理。组件Codi也采用条件生成策略,初步实现图像嵌入,后续将集成音频和视频嵌入。
Project Cover
amfora
Amfora是一款终端版Gemini客户端,支持Windows、Linux、macOS和Termux平台。其特色包括多标签浏览、ANSI颜色代码支持、书签、内置搜索和代理支持。该项目强调跨平台兼容,即便在Windows终端也能完整运行所有功能。项目现处于维护模式,欢迎社群贡献代码。安装方式多样,包括预编译二进制文件、Homebrew和源代码构建。
Project Cover
TalkWithGemini
免费一键部署支持多模态的Gemini应用,兼容Gemini 1.5 Pro、Flash和Vision型号,具备图片识别、语音对话和跨平台客户端功能。支持多国语言,提供隐私安全和优质用户界面。适用于Github Page和Vercel等静态网站服务,提高办公效率。
Project Cover
generative-ai
此资源库提供关于在Google Cloud上使用Generative AI的指南和示例,包括笔记本、代码样本和应用程序示例,帮助用户开发和管理生成式AI工作流。

最新项目

Project Cover
豆包MarsCode
豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。
Project Cover
AI写歌
Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。
Project Cover
美间AI
美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。
Project Cover
商汤小浣熊
小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。
Project Cover
有言AI
有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。
Project Cover
Kimi
Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。
Project Cover
吐司
探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。
Project Cover
SubCat字幕猫
SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。
Project Cover
AIWritePaper论文写作
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号