Project Icon

agents

实时语音代理构建框架,支持大规模并发处理

Agent Framework用于创建实时、可编程的服务器端参与者,能够构建具备视觉、听觉和理解能力的多模态语音代理。框架与LiveKit服务器无缝集成,免除额外排队基础设施需求,易于本地代码扩展到支持大规模并发会话。目前,SDK处于开发预览阶段,欢迎在LiveKit Community Slack上提供反馈和贡献。

项目介绍:Agents

什么是Agents?

Agents是一个框架,用于构建由人工智能驱动的服务器程序,能够实时地"看"、"听"和"说"。在用户的设备上发起LiveKit会话后,Agents可以处理从用户设备传来的文字、音频、图像或视频,并通过AI模型产生相应形式的输出,然后将这些输出流回给用户。

这个框架的使用场景十分广泛。无论是文字转换为语音、音频转录,再到复杂的多模态交互,Agents都能提供解决方案。

主要功能

  1. 插件支持:框架中支持许多流行的LLM、转录和语音合成服务插件,以及相关的RAG数据库。通过这些插件,可以容易地处理流媒体输入或生成输出。

  2. 高级抽象:适合用于构建语音代理或助手应用,提供自动转录检测、打断处理、函数调用等功能。

  3. 电话网络兼容:兼容LiveKit的电话网络,可以让Agent发起或接收电话。

  4. 负载均衡系统:集成的负载均衡系统管理着边缘节点的代理池,提供监控和透明的故障转移机制。

  5. 灵活的环境支持:无论是在本地、私有云还是LiveKit Cloud上部署,运行Agents的体验都是一致的。

开始使用

用户可以通过以下命令安装Agents库的核心模块:

pip install livekit-agents

同时,还可以选择安装不同的插件,例如OpenAI的插件,可以用以下命令安装:

pip install livekit-plugins-openai

插件列表

目前,用户可以选择以下插件:

  • livekit-plugins-anthropic:支持LLM
  • livekit-plugins-assemblyai:提供STT服务
  • livekit-plugins-azure:支持STT和TTS
  • livekit-plugins-deepgram:支持STT
  • livekit-plugins-cartesia:提供TTS服务
  • livekit-plugins-elevenlabs:提供TTS服务
  • livekit-plugins-playht:提供TTS服务
  • livekit-plugins-google:支持STT和TTS
  • livekit-plugins-nltk:提供文本处理工具
  • livekit-plugins-rag:支持RAG功能
  • livekit-plugins-silero:提供语音活动检测(VAD)

实例示例

Agents框架提供多个实例示例,帮助用户更好地理解和应用框架功能。例如:

  • 使用OpenAI实时API的语音代理。
  • 利用Cerebras提供的Llama 3.1运行超快速语音代理。
  • 使用Cartesia的Sonic模型构建的语音代理。
  • 基于RAG的查询语音代理。

参与贡献

Agents框架正处于积极开发中,欢迎任何形式的贡献。无论是反馈、bug修复、功能扩展还是改进文档,社区都非常欢迎。

总之,Agents提供了一个强大而灵活的平台,能够帮助开发者轻松构建面对多模式用户交互的AI驱动应用。通过强大的插件支持和灵活的环境适应性,Agents成为了实时AI应用开发的坚实选择。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号