Project Icon

Verbi

灵活的开源语音助手框架 支持多模型实验与对比

Verbi是一个开源的模块化语音助手框架,允许在语音转文字、响应生成和文字转语音等组件中灵活切换不同模型。项目集成了OpenAI、Groq和Deepgram等API,并支持本地模型接入。其易于配置的特性和模块化结构,使Verbi成为测试、比较不同语音助手技术的理想平台,适用于开发者、研究人员和技术爱好者。

openai-whisper-talk - 多功能语音对话应用
Chat CompletionsEmbeddingsGithubOpenAIWhisperopenai-whisper-talk开源项目
openai-whisper-talk 是一个集成多项 OpenAI 技术的语音对话应用,组合了 Whisper 自动语音识别、Chat Completions 模拟对话、Text-to-Speech 语音合成功能。最新版本引入了时间表管理与长期记忆功能,能添加、修改、删除和检索事件,并保存信息供未来参考。基于 Vue.js 和 Nuxt 构建,实现了个性化互动,让对话更自然流畅。
Aria - 多语言AI语音助手助力语言学习和日常交流
AI助手AI工具个性化体验可视化多语言支持语言学习
Aria是基于GPT引擎的多语言AI语音助手应用,支持日常对话、语言练习和信息查询。功能包括天气预报、书籍介绍和地图导航等。用户可自定义AI声音,提高语言学习乐趣和效率。Aria适合语言学习者和需要日常协助的用户,有助于提升沟通技能和生活便利性。该应用支持多语言交流,能够有效提升沟通技能和生活质量。
Linguflex - 智能AI助手,支持语音对话与智能家居控制
AI助手GithubLinguflex 2.0安装教程开源项目智能家居语音交互
Linguflex是一款模拟真实人类互动的AI助手,支持语音对话、自定义角色、智能家居控制、音乐播放、网络搜索、邮件收取、天气和新闻显示、日程安排等功能。本地操作确保了隐私和快速响应,适合用户和开发者共同参与和贡献。
polyglot - 跨平台AI语言练习应用,支持智能语音合成与自定义功能
AI练习AzureChatGPTGithubPolyglot开源项目语言学习
Polyglot是一款使用ChatGPT和Azure AI技术的跨平台语言练习应用,适用于桌面端和Web。功能包括智能语音合成、聊天、暗黑模式和用户自定义,大幅提升语言训练体验。支持多种AI角色、语音识别和高亮功能,兼容macOS、Windows和Linux。
AIHub - 多模型支持的AI助手客户端,具备丰富自定义功能
AIHubChatGPT PlusGithub大模型开源项目知识库自定义插件
AIHub是一款集成多个大模型API的客户端,用户可以轻松构建自定义AI助手。它支持文本对话、图片对话、AI绘画和丰富的自定义插件,还可以搭建个人知识库和生成智能报告。支持多语言和多主题配置,并兼容OpenAI、Ollama、谷歌 Gemini、讯飞星火、百度文心等平台,扩展了AI的应用场景。
AI-Waifu-Vtuber - 多语言虚拟助手与VTuber开源技术
AI Waifu VtuberDeepLGithubSeliro TTSVoiceVoxVtubeStudio开源项目
AI Waifu Vtuber & Assistant项目集合多种技术如VoiceVox、DeepL和Whisper OpenAI,支持多语言TTS功能,并提供Twitch直播支持。其支持语言包括日语、英语、俄语和西班牙语等,适合多种应用场景。
beebot - 多功能自主AI助手项目
AI助手BeeBotGithub工具选择开源项目持久化自主任务
BeeBot是一个开源的自主AI助手项目,设计用于执行多样化实际任务。该项目集成了工具选择、持久性和REST API等功能,并支持动态历史记录操作和缓存。尽管当前开发处于暂停状态,BeeBot未来可能随LLM技术进步或特定任务需求而重启。项目注重功能性、灵活性和可靠性,采用工具导向和LLM专业化方法,致力于推动AI助手技术创新。
assistant-ui - 多模型支持的AI聊天React组件库
AI聊天GithubReact组件assistant-ui开源项目模型提供商支持
assistant-ui是一个集成多种AI模型的React聊天组件库。它支持OpenAI、Anthropic、Mistral等提供商,并允许自定义API集成。该项目提供快速启动模板,简化AI聊天应用的开发过程。assistant-ui为开发者提供了灵活的AI聊天界面构建工具,集成了Langchain和Vercel AI SDK等技术。
Bridge-TTS - 创新方法提升文本转语音合成效果
Bridge-TTSGithubSchrodinger Bridge开源项目文本转语音机器学习语音合成
Bridge-TTS是一个革新性的文本转语音(TTS)项目,利用人工智能和机器学习技术,通过创新的数据处理方法优化语音合成。无论在简单还是复杂的应用场景中,它都显著优于传统的扩散模型。这一突破不仅提升了TTS技术水平,还为语音合成和相关人工智能领域开辟了新的研究方向。项目详情、研究方法和结果可在官方网站查阅,完整源代码将在论文被学术界正式接受后公开发布。
RealtimeSTT - 实时语音转文本库 适用于低延迟应用
GithubRealtimeSTT唤醒词实时转录开源项目语音助手语音转文本
RealtimeSTT是一个为实时应用设计的语音转文本库。它集成了语音活动检测、实时转录和唤醒词激活等功能,适合开发语音助手和需要快速精确语音转文本的应用。该库采用WebRTCVAD和SileroVAD进行语音检测,Faster_Whisper执行转录,Porcupine或OpenWakeWord负责唤醒词检测,体现了当前语音识别技术的先进水平。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号