audioflare - AI音频转录、分析与多语言翻译工具

项目介绍：Audioflare

Audioflare 是一个集成了多种功能的AI音频游乐场，利用Cloudflare AI Workers实现音频文件的转录、分析、总结和翻译。项目的灵感来自于作者在Smol AI的探索，旨在展示Cloudflare AI Workers的实际应用。此项目主要处理最长30秒的音频文件，并实现以下核心功能：

主要功能

音频转录：
- 使用Cloudflare的语音转文本工作者，该功能基于OpenAI的whisper API，实现对音频文件的文字转录。
文本总结：
- 利用Cloudflare的LLM AI工作者进行文本总结，该功能使用的是Meta的llama-2-7b-chat-int8模型。
情感分析：
- 通过Cloudflare的文本分类AI工作者完成情感分析，使用的是Huggingface的distilbert-sst-2-int8模型。
多语言翻译：
- 将转录文本翻译为九种语言，使用Cloudflare的翻译AI工作者，采用的是Meta的m2m100-1.2b模型。
性能指标：
- 计算和展示每个请求的处理时间，以直观地了解性能表现。
可观察性和监控：
- 使用Cloudflare AI Gateway提升AI工作者的可观察性和监控能力，包括分析、日志记录、缓存和速率限制。

主要特点

音频处理：
- 用户可以上传音频文件进行处理，支持拖放本地文件或使用预设音频文件。文件超过30秒则只转录前30秒。
学习和探索：
- Audioflare不仅是学习Cloudflare AI工作者的一个绝佳模板，还能够探索不同AI工作者的功能，但目前没有集成图像分类或文本嵌入工作者。

构建技术

Audioflare项目使用了以下技术构建：

React
Next.js
Cloudflare
Vercel
TailwindCSS
Bun
shadcn/ui

使用指南

要在本地运行Audioflare，按照以下步骤即可：

克隆代码库

git clone https://github.com/seanoliver/audioflare.git

安装依赖
```
 cd audioflare
 bun install
```
创建Cloudflare账户并安装Wrangler
重命名.env.example为.env并配置相关密钥
启动应用
```
 bun dev
```

浏览器中访问http://localhost:3000体验应用。

贡献

Audioflare欢迎大家一起交流学习，任何新功能或问题都可以提交到项目中。您可以通过创建分支、提交改动后推送并发起Pull Request的方式参与到项目中来。

联系信息

如有疑问或建议，可以通过以下方式与开发者Sean Oliver联系：

Email: helloseanoliver@gmail.com
Twitter：@SeanOliver

许可证

项目采用MIT License进行分发。