#语音聊天
myGPTReader
myGPTReader是一个革新性的AI阅读助手,支持网页、文档和视频内容的智能阅读。用户可以通过语音与其交流,进行多语种对话,有效提高外语水平。此外,它还集成了最新热点新闻的自动摘要功能,使得用户能迅速掌握当下热门话题。加入超过5000名成员的Slack频道,免费体验myGPTReader的全部功能。
Facemoji
Facemoji是一个专为Android开发的Unity项目,实现了面部表情追踪和AI语音聊天的结合。利用OpenCV和Dlib技术,检测并转换用户面部表情为Live2D模型,并支持动态GIF录制。该项目整合了图灵机器人和科大讯飞的语音技术,允许用户以中文进行语音或文本对话,提供沉浸式AI交互体验。
FunAudioLLM-APP
FunAudioLLM-APP是一个开源项目,包含Voice Chat和Voice Translation两个应用。Voice Chat提供AI驱动的对话系统,实现自然的语音交互。Voice Translation提供实时语音翻译功能,帮助不同语言使用者进行沟通。项目整合了CosyVoice和SenseVoice技术,旨在提升语音交互和翻译体验。
speechgpt
SpeechGPT是一个开源的网络应用,支持用户与ChatGPT进行语音对话。该应用支持超过100种语言,集成了语音识别和合成技术,可用于提升语言口语能力或进行AI对话。SpeechGPT注重数据隐私,将所有信息存储在本地。作为一个免费的开源项目,它为用户提供了一个便捷的AI语音交互平台,适用于语言学习和日常交流。
Q
Q是一款融合GPT-4o-mini和GPT-4o AI模型的多功能应用,提供语音聊天、图像生成与识别、交互式讲故事等服务。支持个性化设置,采用灵活的按需付费模式。Q不仅能进行智能对话,还展现独特个性,为用户创造全新的AI互动体验。
Dates.ai
Dates.ai是一款创新的混合现实在线约会应用,采用先进的人工智能匹配算法,帮助用户找到理想伴侣。平台提供虚拟头像聊天、语音交互和安全加密功能,让社交互动更加便捷有趣。Dates.ai注重个性化匹配,定期更新虚拟头像,并实时监控用户体验。这款应用revolutionize了传统约会方式,为用户带来更有意义的社交体验和潜在的爱情机会。
univoice
UniVoice是一个为Unity开发的开源语音聊天框架。该项目支持多人群组语音聊天,提供即插即用功能,无需编写复杂的音频和网络代码。UniVoice具有高度可定制性,支持PUN2和WLAN等多种网络类型。开发者可自定义音频输入、输出和网络传输方式,以适应不同应用场景。该框架简化了Unity项目中实时语音通信的实现过程。
mumble
Mumble是一个开源的低延迟语音聊天程序,基于Qt和Opus技术构建。它由客户端(mumble)和服务器(murmur)组成,支持多种操作系统。Mumble的主要特点包括高音质、跨平台兼容性和插件扩展能力,适合各类用户和团队进行稳定、可靠的语音通信。
Qwen2-Audio-7B-Instruct
Qwen2-Audio-7B-Instruct是一个开源的大规模音频语言模型,具备语音聊天和音频分析能力。该模型可处理多种音频输入,执行音频分析或回应语音指令。它支持批量推理,并提供Python代码示例,方便开发者集成语音交互和音频分析功能。这个模型为音频理解和处理任务提供了实用的解决方案。