#印尼语
indobert-base-p2 - IndoBERT:印尼语自然语言处理的先进模型
自然语言处理开源项目IndoBERTGithub机器学习Huggingface模型印尼语语言模型
IndoBERT是一个基于BERT的尖端模型,专为印度尼西亚语言设计。它通过遮蔽语言模型和句子预测进行预训练。使用Indo4B数据集,该模型在Base和Large架构中实现,参数从11.7M到335.2M不等,适用于多种自然语言处理任务。用户可以使用Transformers库轻松加载IndoBERT,提取上下文表示,增强印尼语处理的准确性和效率,广泛适用于研究和实践。
indobert-base-uncased - 印尼语BERT模型提升NLP任务表现
语言模型情感分析IndoBERT印尼语模型Github开源项目句法分析Huggingface
IndoBERT是为印尼语开发的BERT模型,经过2.4百万步的训练,使用了超过2.2亿字的数据来源于印尼维基百科与新闻和网络语料库。该模型在词性标注、命名实体识别等印尼语NLP任务中表现优异,表现高于其他模型。IndoBERT的卓越性能在印尼语基准测试IndoLEM中得到验证,并可通过transformers库加载使用。
wav2vec2-indonesian-javanese-sundanese - 印尼、爪哇和巽他语的多语言语音识别模型
Github开源项目模型多语言Huggingface印尼语自动语音识别语音识别Wav2Vec2
利用优化的Wav2Vec2模型,专注于印尼、爪哇和巽他语的多语言语音识别,数据来自Common Voice和TTS数据集,拥有较低字错误率并提供在线演示,工具无需语言模型,适合16kHz语音输入,帮助研究人员和开发者探索多语言识别技术。