#语言识别

whatlang-rs - 自然语言检测库,关注简洁高效
WhatlangRust自然语言检测语言识别性能Github开源项目
Rust实现的高效自然语言检测库,支持69种语言,识别语言和文字脚本(如拉丁文、西里尔文等),并提供可靠性评估。轻量、快速且简洁,适用于Sonic、Meilisearch等项目。
lingua - 多语言文本检测库,低配置需求,高精度
Lingua语言识别自然语言处理文本分类拼写检查Github开源项目
此库可检测文本数据的语言,适用于自然语言处理如文本分类和拼写检查。与其他开源库相比,该库无需复杂配置,适用于长文本和短文本,甚至单词和短语。支持75种语言,高精度检测,完全离线运行,无需外部API或服务,适用于社交媒体和电子邮件自动分拣等应用。
franc - 多语言文本检测工具,适用于多种编程环境
franc语言识别CLIISO 639-3Node.jsGithub开源项目
franc是一款多语言文本检测工具,支持从82种到419种语言。提供命令行接口,适用于Node.js、Deno和现代浏览器。适用大文档检测以提高准确性,确保检测结果可靠。
lingua-go - 准确识别文本语言的灵活工具,适用于多种自然语言处理场景
AIGithub开源项目Lingua语言识别自然语言处理文本分类
Lingua-go 是一款能够准确识别文本语言的开源工具,适用范围广泛,包括长文本、单个词语和短语等。相比其他库,它在处理短文本时表现更佳,无需依赖外部API,支持75种语言,完全离线使用,适合预处理、文本分类和拼写检查等自然语言处理任务。
sherpa-onnx - 多平台本地运行的语音处理开源项目
Sherpa语音识别语音合成语言识别音频标记Github开源项目
Sherpa-onnx是一个支持多平台、多功能的语音处理开源项目,涵盖语音识别、语音合成、说话人验证、语言识别等功能,兼容安卓、iOS、Windows、macOS、Linux等系统。支持多种编程语言如C++、C、Python、Go、C#、Java、Kotlin、JavaScript、Swift和Dart,提供预构建的APK和Flutter应用,以及开源预训练模型,便于语音处理开发和部署。
lang-id-commonlanguage_ecapa - 基于ECAPA-TDNN的多语言语音识别模型
ECAPA-TDNN模型语言识别开源项目Huggingface语音处理SpeechBrainGithub多语言
该项目开发了一个基于ECAPA-TDNN架构和SpeechBrain框架的语言识别模型,能够从语音输入中识别45种不同语言。模型在CommonLanguage数据集上预训练,达到85%的识别准确率。系统采用ECAPA模型结合统计池化技术,并在其上应用分类器。模型支持处理16kHz采样率的音频,并能自动进行音频标准化。项目提供了简洁的Python接口,方便研究者和开发者进行语言识别实验和应用开发。
bert-base-multilingual-cased-finetuned-langtok - 基于多语言BERT的语言识别模型实现99.03%准确率
BERT语言识别Github开源项目微调自然语言处理Huggingface多语言模型模型
这是一个基于bert-base-multilingual-cased的语言识别微调模型。模型在评估集上的准确率为99.03%,F1分数达到0.9087。模型采用Adam优化器和线性学习率调度器,经过3轮训练完成。开发框架使用Transformers 4.44.2和PyTorch 2.4.1,可应用于语言识别相关任务。
fasttext-zh-vectors - fastText库:支持中文文本分类与词向量学习
Github模型文本分类开源项目fastText词向量Huggingface训练数据语言识别
fastText是开源且易于使用的库,可在标准硬件上快速进行文本表示学习和分类。此库支持157种语言,并包含预训练模型,适用于文本分类与语言识别,且能在多核CPU上快速训练、并适合移动设备应用。
voxlingua107-epaca-tdnn - 全新多语言识别模型,覆盖107种语言,实现精确分类
数据集语言识别Github开源项目SpeechBrainHuggingfaceVoxLingua107模型
该多语言识别模型基于SpeechBrain训练于VoxLingua107数据集,采用ECAPA-TDNN架构,可识别多达107种语言的语音。模型可用于独立的语言识别或作为嵌入特征提取器,助力开发自定义语言识别系统。训练数据源于自动采集的YouTube视频,总计6628小时的语音样本。模型在评测数据集上的误差率为7%,但在处理小众语言及带口音的语音时性能可能受限。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号