Project Icon

univoice

Unity开源语音聊天框架

UniVoice是一个为Unity开发的开源语音聊天框架。该项目支持多人群组语音聊天,提供即插即用功能,无需编写复杂的音频和网络代码。UniVoice具有高度可定制性,支持PUN2和WLAN等多种网络类型。开发者可自定义音频输入、输出和网络传输方式,以适应不同应用场景。该框架简化了Unity项目中实时语音通信的实现过程。

UniVoice

Unity的可扩展语音聊天/VoIP解决方案。

特性

  • 👥 群组语音聊天

    • 多个用户可以加入聊天室并交换音频。
    • 提供按用户静音音频的API
  • 📦 即插即用

    • 大多数用例无需编写音频和网络代码
    • 支持多种网络类型,包括PUN2和WLAN
  • 🎛️ 可定制

    • UniVoice本质上是一系列接口的集合,你可以自行实现
    • 更多信息请参见下方的自定义部分

安装

推荐通过npmjs.org上名为com.adrenak.univoice的UniVoice UPM包进行安装

  1. 添加带有UniVoice作用域的NPM注册表。为此,请转到编辑/项目设置/包管理器,添加URL为https://registry.npmjs.org的NPM作用域注册表,并添加com.adrenak.univoice作为作用域。

  2. 从NPM注册表安装包。为此,请转到窗口/包管理器并刷新包。在我的注册表视图中选择(位于左上角,默认选择是Unity注册表),找到UniVoice并点击安装。安装后,该包也会显示在项目中视图中。

使用方法

创建聊天室代理

要能够托管和加入语音聊天室,你需要一个ChatroomAgent实例。

var agent = new ChatroomAgent(IChatroomNetwork network, IAudioInput audioInput, IAudioOutputFactory audioOutputFactory);

托管和加入聊天室

agent.Network是使用UniVoice最常访问的对象。

// 托管聊天室
agent.Network.HostChatroom(optional_data);

// 加入现有聊天室
agent.Network.JoinChatroom(optional_data);

// 离开聊天室
agent.Network.LeaveChatroom(optional_data);

// 关闭聊天室
agent.Network.CloseChatroom(optional_data);

可以通过agent.Network.CurrentMode访问ChatroomAgent的当前模式,这将返回一个ChatroomAgentMode枚举对象,可能的值有:

  • Unconnected:代理既不是主机,也不是聊天室的客人
  • Host:代理当前正在托管聊天室
  • Guest:代理当前是聊天室的客人

与用户交互

聊天室中的每个人都由主机分配一个ID。每个人都有一个包含其他用户ID的列表。UniVoice中的ID是一个C#short类型,在聊天室中对每个成员都是唯一的。

获取你的ID:

short myID = agent.Network.OwnID;

获取聊天室中其他用户的列表:

short others = agent.Network.PeerIDs

要将聊天室中的所有人静音,使用agent.MuteOthers = true;,设置为false取消静音。这将停止聊天室中每个用户的音频。

要对聊天室中的所有人将自己静音,使用agent.MuteSelf = true;,设置为false取消静音。这将停止向聊天室中的用户发送你的音频。

要静音特定用户,首先获取该用户的设置对象:

agent.PeerSettings[id].muteThem = true; // 其中id属于你想要静音的用户

如果你想对特定用户将自己静音,使用:

agent.PeerSettings[id].muteSelf = true; // 其中id属于你不想让他听到你的用户

事件

agent.Network提供了几个网络相关的事件。请参考API参考了解它们。

⚙️ 自定义

UniVoice是一个即插即用的解决方案,带有几个预先存在的模块。最常见的用例(可能是3D/空间音频群组聊天)不需要你自己编写任何音频或网络代码。

但它也为你提供了扩展和修改的方法。

🎤 音频输入

UniVoice对音频输入源不做限制。这意味着它不关心从哪里获取音频。它只关心获取音频数据,让你可以自由地更改它获取音频的来源。

  • 传输实时麦克风输入
  • 通过读取磁盘上的mp3文件发送音频
  • 发送视频文件的音轨
  • 发送游戏内音频

最常见的输入源是实时麦克风输入。如果这是你所需要的,这里有一个基于UniMic的官方输入实现可用

IAudioInput接口API参考在这里

🔊 音频输出

UniVoice也对音频输出不做限制。这意味着它不关心你如何处理从其他用户接收到的音频。它只是给你数据然后忘记它,由你决定如何使用它。

  • 你可以使用AudioSource在Unity中播放它
  • 你可以将它保存到磁盘
  • 你可以将它用作语音转文本的输入
  • 将它流式传输到服务器

最常见的输出源是在你的应用程序内播放。这里有一个官方输出实现,可以在Unity AudioSource上播放用户音频可用

创建音频输出需要实现两个接口。它们是IAudioOutputIAudioOutputFactory

🌐 网络

你猜对了。UniVoice对网络不做限制。这意味着它不关心音频如何在用户之间交换。它只需要一个实现了IChatroomNetwork接口的网络实现,这允许你将其适配到不同类型的网络基础设施。

  • 你可以通过WLAN发送音频
  • 或者webrtc
  • 或者流行的网络解决方案提供商,如Photon
  • 或者你自己的自定义后端解决方案

创建你自己的网络需要你实现IChatroomNetwork接口

文档和示例

目前没有手册。API参考请访问http://www.vatsalambastha.com/univoice

这里有一个示例应用

许可和支持

本项目采用MIT许可

不保证更新和维护,项目由原开发者在空闲时间维护。欢迎社区贡献。

可以安排商业咨询和开发,但取决于时间安排和可用性。

联系方式

开发者Vatsal Ambastha可以通过以下链接联系:

网站 LinkedIn GitHub Twitter

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号