ScribeWizard 项目介绍
项目概述
ScribeWizard 是一个使用 Streamlit 构建的应用程序,旨在通过转录的音频讲座生成结构化的笔记。它利用了 Groq 的 Whisper API 进行音频转录,并通过 Llama3 模型生成笔记内容。应用程序在生成笔记结构时,使用 Llama3-8b 和 Llama3-70b,两者结合快速生成内容与高质量的结构间的平衡。
项目特色
- 🎧 结构化笔记生成:通过 Whisper-large 提供的音频转录和 Llama3 模型生成文本,以创建组织良好的笔记。
- ⚡ 极速:使用 Groq 技术进行快速的音频转录和文本生成。
- 📖 平衡速度与质量:策略性地在 Llama3-70b 和 Llama3-8b 之间切换,确保速度与生成内容质量的均衡。
- 🖊️ 美观的 Markdown 样式:在 Streamlit 应用上生成美观的笔记,可以包含表格和代码。
- 📂 文件下载功能:用户可以下载包含完整笔记内容的文本或 PDF 文件。
生成笔记示例
示例 | YouTube 链接 |
---|---|
Google Cloud Tech 讲述 Transformers | https://www.youtube.com/watch?v=SZorAJ4I-sA |
3Blue1Brown 的微积分精髓 | https://www.youtube.com/watch?v=WUvTyaaNkzM |
由于所有生成式 AI 的特性,内容可能包括不准确或占位符信息。ScribeWizard 当前处于测试阶段,欢迎提出任何反馈意见!
快速开始
为了使用 ScribeWizard,用户可以选择在 scribewizard.streamlit.app 上使用托管版本,也可以按照快速启动说明在本地运行该应用。
本地运行步骤
-
首先,在环境变量中设置 Groq API 密钥:
export GROQ_API_KEY="gsk_yA..."
-
配置虚拟环境并安装依赖项:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt
-
运行 Streamlit 应用程序:
python3 -m streamlit run main.py
技术细节
- 使用技术: Streamlit, Groq 云端的 Llama3 和 Whisper-large
- 限制: ScribeWizard 可能会生成不准确的信息或占位内容,主要用于生成笔记作为娱乐用途。
贡献
欢迎通过拉取请求(PR)来进行改进!
更新日志
版本 v0.1.0
- 生成结构化笔记,使用 Whisper-large 的音频转录和 Llama3 的文本生成
- 极速音频转录及文本生成,通过 Groq 实现
- 通过在 Llama3-70b 和 Llama3-8b 之间的平衡切换,确保速度与质量
- 使用 Markdown 样式生成美观的笔记,支持表格和代码
- 允许用户下载内容完整的文本或 PDF 文件
未来功能
- 创建转录摘要版本,按字符数批量分段
- 允许上传多个音频文件