#端到端模型

Athena入门学习资料 - 开源端到端语音处理引擎

1 个月前

Cover of Athena入门学习资料 - 开源端到端语音处理引擎

Athena是一个开源的端到端语音处理引擎,本文汇总了Athena的相关学习资源,帮助大家快速入门和使用这个强大的语音处理工具。

Athena 语音处理自动语音识别语音合成端到端模型 Github 开源项目

1 个月前

Cover of Athena入门学习资料 - 开源端到端语音处理引擎

CARLA Garage: 揭示端到端自动驾驶模型的隐藏偏差

2 个月前

Cover of CARLA Garage: 揭示端到端自动驾驶模型的隐藏偏差

CARLA Garage是一个开源项目,旨在探索和解决端到端自动驾驶模型中的隐藏偏差问题,为自动驾驶研究提供强大的基准和工具。

CARLA 自动驾驶端到端模型计算机视觉深度学习 Github 开源项目

2 个月前

Cover of CARLA Garage: 揭示端到端自动驾驶模型的隐藏偏差

Sherpa: 强大的开源语音识别框架

2 个月前

Cover of Sherpa: 强大的开源语音识别框架

Sherpa是一个基于PyTorch的开源语音识别框架,专注于端到端模型,提供C++和Python API,适用于语音转文本任务的部署。

语音识别深度学习开源框架 PyTorch 端到端模型 Github 开源项目

2 个月前

Cover of Sherpa: 强大的开源语音识别框架

BEV-Planner: 推动端到端自动驾驶研究的新基准

2 个月前

Cover of BEV-Planner: 推动端到端自动驾驶研究的新基准

BEV-Planner是一个开源项目,旨在探索端到端自动驾驶中仅依赖车辆自身状态信息进行路径规划的可行性。该项目提出了新的评估指标和基准方法,为自动驾驶规划领域的研究提供了新的思路。

自动驾驶端到端模型 ego状态开环评估路径规划 Github 开源项目

2 个月前

Cover of BEV-Planner: 推动端到端自动驾驶研究的新基准

WeTTS: 面向生产的端到端语音合成工具包

2 个月前

Cover of WeTTS: 面向生产的端到端语音合成工具包

WeTTS是一个专注于端到端、生产级和设备端语音合成的开源工具包,旨在提供高效、灵活且易于部署的TTS解决方案。

WeTTS 语音合成端到端模型开源数据集多平台支持 Github 开源项目

2 个月前

Cover of WeTTS: 面向生产的端到端语音合成工具包

Athena: 开源序列到序列语音处理引擎的革新之作

2 个月前

Cover of Athena: 开源序列到序列语音处理引擎的革新之作

Athena是一个开源的序列到序列语音处理引擎实现，为语音识别、语音合成等任务提供了强大而灵活的解决方案。本文深入探讨Athena的特性、应用场景及其在语音技术领域的重要意义。

Athena 语音处理自动语音识别语音合成端到端模型 Github 开源项目

2 个月前

Cover of Athena: 开源序列到序列语音处理引擎的革新之作

相关项目

Project Cover

一款基于Tensorflow构建的开源端到端语音处理平台，旨在提升语音处理技术的研究与实际应用。支持自动语音识别、语音合成、关键词检测等多项功能，配备多GPU训练和无Kaldi的Python特征提取，实现了多种模型结构如FastSpeech和Conformer，适用于各类研究和应用需求。该平台在最新更新中加入了FastSpeech2和Conformer-CTC模型以优化处理速度和准确性。

Project Cover

sherpa是基于PyTorch的开源E2E语音识别框架，专注于转录器和CTC模型。提供C++和Python API，适用于部署预训练模型进行语音转写。此外，sherpa-onnx和sherpa-ncnn等相关项目支持iOS、Android和嵌入式系统，无需依赖PyTorch。用户可通过浏览器直接体验sherpa的语音识别功能。

Project Cover

WeTTS是一个开源的端到端文本转语音(TTS)工具包，专注于生产级和设备端应用。它支持多语言处理，提供预训练模型，并可在x86、Android和树莓派等多种平台上运行。WeTTS采用VITS等先进的端到端模型，结合WeTextProcessing进行文本规范化，并使用基于BERT的统一前端处理中文语音合成。该工具包支持多个开源数据集，为研究者和开发者提供高质量、易用的TTS解决方案。

Project Cover

基于CARLA仿真器的端到端自动驾驶研究开源项目。提供可配置代码、文档和高性能预训练模型，揭示了端到端驾驶模型的隐藏偏差。在多个基准测试中表现优异，支持数据生成、模型训练和评估，有助于研究人员探索自动驾驶前沿问题。

Project Cover

BEV-Planner项目研究端到端自动驾驶中的关键问题。研究发现在nuScenes数据集上,模型过度依赖车辆状态而忽视感知信息。项目提出新的评估指标和基准方法,全面评估规划质量。研究结果质疑当前自动驾驶研究方向,建议重新审视现有方法。项目为自动驾驶领域提供新思路,包括道路遵循性评估和简单但有效的基线模型。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号