Project Icon

aTrain

本地化多语言语音转录工具 支持主流质性分析软件

aTrain是格拉茨大学研究人员开发的本地化语音转录工具,采用先进机器学习模型实现快速准确转录和说话人检测。支持57种语言,兼容MAXQDA、ATLAS.ti和NVivo等主流质性分析软件。该工具在本地设备处理数据,确保隐私安全和GDPR合规。适用于Windows系统,可通过Microsoft应用商店安装,为研究人员提供高效的访谈转录解决方案。

Logo

访谈的无障碍转录

aTrain是一款利用最先进的机器学习模型自动转录语音录音的工具,无需上传任何数据。它由格拉茨大学商业分析和数据科学中心的研究人员开发,并由格拉茨Know-Center的研究人员进行测试。

重大新闻!介绍aTrain的论文已在《行为与实验金融学杂志》上发表。如果您在研究中使用了aTrain,请引用已发表的论文:乘坐aTrain。介绍一个用于访谈无障碍转录的界面。

Windows(10和11)用户可以通过Microsoft应用商店(链接)安装aTrain,或从BANDAS中心网站下载安装程序(链接)。

对于Linux用户,请按照我们Wiki中的说明进行操作。

安装和演示视频可以在这里找到。

aTrain提供以下优势:

快速准确 🚀 aTrain为OpenAI的Whisper模型faster-whisper实现提供了用户友好的访问,确保了一流的转录质量(参见Wollin-Geiring等人2023),同时在您的本地计算机上实现更高的速度。在选择最高质量模型的情况下,在当前中端商务笔记本电脑常见的移动CPU(如第12代Core i5、Ryzen 6000系列)上,转录时间仅为音频长度的约三倍。

说话人检测 🗣️ aTrain具有基于pyannote.audio的说话人检测模式,可以分析每个文本段落以确定其所属的说话人。

隐私保护和GDPR合规 🔒 aTrain在您自己的设备上完全离线处理提供的语音录音,不会将录音或转录内容发送到互联网。这有助于研究人员遵守道德准则或法律要求(如GDPR)所产生的数据隐私要求。

多语言支持 🌍 aTrain可以处理以下57种语言的语音录音:南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚语、保加利亚语、加泰罗尼亚语、中文、克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、加利西亚语、德语、希腊语、希伯来语、印地语、匈牙利语、冰岛语、印度尼西亚语、意大利语、日语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语、毛利语、尼泊尔语、挪威语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、斯瓦希里语、瑞典语、他加禄语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语、越南语和威尔士语。

兼容MAXQDA、ATLAS.ti和NVivo的输出 📄 aTrain提供的转录文件可以无缝导入最流行的定性分析工具ATLAS.ti、MAXQDA和NVivo。这使您可以通过点击时间戳直接播放相应文本段落的音频。请查看教程

Nvidia GPU支持 🖥️ aTrain可以在CPU或NVIDIA GPU上运行(需要安装CUDA工具包)。支持CUDA的NVIDIA GPU显著提高了转录和说话人检测的速度,在当前入门级游戏笔记本电脑上可将转录时间缩短至音频长度的20%。

截图1截图2
截图1截图2

基准测试

为了测试aTrain-core的处理时间,我们转录了Christine Lagarde和Andrea Enria在2023年第五届欧洲央行银行监管论坛上的对话,该视频由欧洲中央银行在YouTube上以创意共享许可发布,下载为320p MP4视频文件。该文件的持续时间正好为22分钟,并在启用说话人检测的情况下在不同的计算设备上进行了转录。下图显示了每次转录的处理时间。

00:22:00文件的转录时间:

计算设备large-v3Distil large-v3
CPU: Ryzen 6850U00:33:0200:13:30
CPU: Apple M100:33:1500:21:40
CPU: Intel i9-10940X00:10:2500:04:36
GPU: RTX 2080 Ti00:01:4400:01:06

系统要求

完全支持Windows。

Debian支持手动安装Wiki说明

目前不支持MacOS。

如果您想使用Windows Server,请确保安装了WebView2: https://developer.microsoft.com/en-us/microsoft-edge/webview2/#download

用户安装 😎

只需从Microsoft应用商店获取安装程序 https://apps.microsoft.com/store/detail/atrain/9N15Q44SZNS2

开发者安装 ⚙️

您需要Python >=3.10 如果您需要帮助安装,请查看以下资源: https://www.python.org/downloads/release/python-31011/

设置虚拟环境

python -m venv venv

激活虚拟环境

.\venv\Scripts\activate

安装aTrain

pip install aTrain@git+https://github.com/JuergenFleiss/aTrain.git --extra-index-url https://download.pytorch.org/whl/cu118

使用控制台脚本下载ffmpeg和Whisper及pyannote.audio的所有必需模型 注意:Microsoft商店中的用户版本已包含这些资产。

aTrain init

使用控制台脚本运行应用程序

aTrain start

如何构建独立可执行文件 📦

我们使用pyinstaller来冻结aTrain的代码并创建独立可执行文件。 如果您想创建自己的代码包,请按照以下步骤操作:

克隆并以可编辑模式安装aTrain

git clone https://github.com/JuergenFleiss/aTrain.git
cd aTrain
pip install -e . --extra-index-url https://download.pytorch.org/whl/cu118

使用控制台脚本下载ffmpeg和Whisper及pyannote.audio的所有必需模型

aTrain init

安装pyinstaller

pip install pyinstaller

使用文件"build.spec"中提供的说明构建可执行文件

pyinstaller build.spec

恭喜!您刚刚为aTrain构建了一个独立可执行文件。

要打开这个版本的aTrain,只需转到输出文件夹(./dist/aTrain)并打开可执行文件(例如Windows下的aTrain.exe)。

如果您想更进一步,为aTrain创建MSIX安装程序,可以使用Advanced Installer Express。 有关如何使用Advanced Installer Express的信息,请参阅其文档

致谢

aTrain中的GIF和图标来自tenorflaticon

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号