Project Icon

cheetah

实时本地化语音转文字引擎

Cheetah是一款本地化实时语音转文字引擎,具有隐私保护、高精度和跨平台特性。该引擎支持Linux、macOS、Windows、Android、iOS和主流浏览器等多种平台。Cheetah为开发者提供多种编程语言的SDK和演示应用,支持实时麦克风输入和音频文件处理,是一个灵活的语音识别解决方案。

leopard - 本地运行的跨平台语音转文字引擎
GithubLeopardPicovoice开源项目离线处理语音转文字跨平台
Leopard是一款本地运行的语音转文字引擎,具有高精度、隐私保护和跨平台特性。该引擎支持多种编程语言和平台,包括iOS、Android和Web等。Leopard提供简单易用的API,便于集成到各类应用中,实现优质的语音识别功能。其紧凑高效的设计适用于多种设备,为开发者提供灵活强大的语音转文字解决方案。
cheetah - 提升软件工程面试表现的AI驱动macOS应用
AI辅助CheetahGithubmacOS应用实时指导开源项目热门软件工程面试
Cheetah是一款针对macOS的AI驱动应用,旨在通过实时语音转写和代码提示帮助用户提升远程软件工程面试表现。应用集成了最新的Whisper技术和GPT-4智能,需使用OpenAI API密钥。支持M1或M2型号的Mac以获得最佳性能。Cheetah通过提供即时编程指导,提高面试成功率,无需长时间备考。
stt - 高效离线本地语音识别工具,基于fast-whisper模型,支持多种输出格式
CUDA加速Githubfast-whisper开源项目文本输出本地部署热门语音识别
这款语音识别工具可在本地离线运行,基于开源的fast-whisper模型,可将视频和音频中的人声快速转换为文字。支持输出json、srt及纯文本格式,无需联网,确保隐私安全,与openai语音识别接口准确率相当。用户可便捷下载预编译版本,或自行部署源码,支持多种操作系统。此外,还提供API接口,适合开发者使用。支持CUDA加速,优化处理速度。
sherpa-ncnn - 轻量级多平台实时语音识别工具
AndroidGithubsherpa-ncnn多平台实时开源项目语音识别
sherpa-ncnn 是一个开源的实时语音识别项目,支持 Linux、macOS、Windows 及嵌入式设备。基于 ncnn 框架开发,无需依赖 PyTorch,具有轻量化和高效性特点。项目提供详细文档、演示视频和 Android 应用开发指南。支持多语言识别和背景噪音处理,适用于各种语音识别应用场景。
whisper - 跨平台音频转文本开源项目
FFMPEGGithubWhisperWhisper.cppopen source开源项目音频转文字
Whisper是OpenAI开发的开源项目,使用whisper.cpp和FFMPEG将音频转换为WAV格式并提取文本。项目支持客户端和服务器端运行,无需互联网。目前代码和文档正在优化,接受捐赠以支持持续更新。适用于Android、Linux、Windows、iOS和macOS系统,安装和使用便捷,提供详尽文档和丰富资源。
speech-to-text - 实时音频转录系统,兼容多种格式,具备高级配置
GithubNVIDIA GeForce RTX 3060PythonSilero VADfaster-whisper实时转录开源项目
该开源项目使用Silero VAD技术检测静音部分,并结合Faster-Whisper将音频数据转录为文本。支持多种音频格式(如wav、mp3、ogg)和高级设置,如重复惩罚和无重复ngram大小。其HTML界面允许进行详细配置,并能同步显示转录结果,支持CUDA环境运行,兼容最新的Faster-Whisper版本(1.0.3),提升转录速度和准确性。
WhisperUI - 多语言支持的高效语音转文字工具
AI工具API密钥OpenAI Whisper多语言支持语音转文字转录
WhisperUI是一款基于先进语音识别技术的转文字工具。支持多种音频格式,可快速将语音转换为文本和SRT字幕。具备多语言转录功能,转录准确度高,抗干扰能力强。提供免费基础功能和付费高级特性。适用于多种场景的音频转文字需求,是一个便捷、经济的语音识别解决方案。
Stage-Whisper - 跨平台免费开源音频转录工具
GithubStage-WhisperWhisper应用程序开源开源项目音频转录
Stage Whisper是一款免费开源的音频转录应用,基于OpenAI的Whisper模型,提供精确的音频文件转录。它拥有直观的图形界面,用户可以轻松存储和编辑转录内容。该项目旨在让非技术用户也能方便地使用Whisper的强大功能。适用于MacOS、Windows和Linux多平台,目前正进行重大改进,测试版即将发布。
Cockatoo - 高效音视频转文字工具 支持多语言准确转录
AI工具AI转录Cockatoo多语言支持文件导出语音转文字
Cockatoo是一款高效的音视频转文字工具,支持90多种语言转录。该工具以99.8%的准确率,在2-3分钟内完成1小时音频的转录。支持多种音视频格式上传,可导出多种文本格式。注重用户隐私和数据安全,为各行业提供便捷的语音转文字解决方案。
ChatTTS-ui - 多语种文字语音合成工具,支持中英数字混合及本地API接入
API接口CUDA加速ChatTTSGithubffmpeg开源项目语音合成
ChatTTS-webUI为用户提供文字到语音合成服务,支持中英文及数字,可本地运行或通过API接入。采用GPU加速优化处理速度,适合个人及企业使用,提供多种部署方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号