项目介绍:Audioflare
Audioflare 是一个集成了多种功能的AI音频游乐场,利用Cloudflare AI Workers实现音频文件的转录、分析、总结和翻译。项目的灵感来自于作者在Smol AI的探索,旨在展示Cloudflare AI Workers的实际应用。此项目主要处理最长30秒的音频文件,并实现以下核心功能:
主要功能
-
音频转录:
- 使用Cloudflare的语音转文本工作者,该功能基于OpenAI的
whisper
API,实现对音频文件的文字转录。
- 使用Cloudflare的语音转文本工作者,该功能基于OpenAI的
-
文本总结:
- 利用Cloudflare的LLM AI工作者进行文本总结,该功能使用的是Meta的
llama-2-7b-chat-int8
模型。
- 利用Cloudflare的LLM AI工作者进行文本总结,该功能使用的是Meta的
-
情感分析:
- 通过Cloudflare的文本分类AI工作者完成情感分析,使用的是Huggingface的
distilbert-sst-2-int8
模型。
- 通过Cloudflare的文本分类AI工作者完成情感分析,使用的是Huggingface的
-
多语言翻译:
- 将转录文本翻译为九种语言,使用Cloudflare的翻译AI工作者,采用的是Meta的
m2m100-1.2b
模型。
- 将转录文本翻译为九种语言,使用Cloudflare的翻译AI工作者,采用的是Meta的
-
性能指标:
- 计算和展示每个请求的处理时间,以直观地了解性能表现。
-
可观察性和监控:
- 使用Cloudflare AI Gateway提升AI工作者的可观察性和监控能力,包括分析、日志记录、缓存和速率限制。
主要特点
-
音频处理:
- 用户可以上传音频文件进行处理,支持拖放本地文件或使用预设音频文件。文件超过30秒则只转录前30秒。
-
学习和探索:
- Audioflare不仅是学习Cloudflare AI工作者的一个绝佳模板,还能够探索不同AI工作者的功能,但目前没有集成图像分类或文本嵌入工作者。
构建技术
Audioflare项目使用了以下技术构建:
- React
- Next.js
- Cloudflare
- Vercel
- TailwindCSS
- Bun
- shadcn/ui
使用指南
要在本地运行Audioflare,按照以下步骤即可:
-
克隆代码库
git clone https://github.com/seanoliver/audioflare.git
-
安装依赖
cd audioflare bun install
-
创建Cloudflare账户并安装Wrangler
-
重命名
.env.example
为.env
并配置相关密钥 -
启动应用
bun dev
浏览器中访问http://localhost:3000
体验应用。
贡献
Audioflare欢迎大家一起交流学习,任何新功能或问题都可以提交到项目中。您可以通过创建分支、提交改动后推送并发起Pull Request的方式参与到项目中来。
联系信息
如有疑问或建议,可以通过以下方式与开发者Sean Oliver联系:
- Email: helloseanoliver@gmail.com
- Twitter:@SeanOliver
许可证
项目采用MIT License进行分发。