热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Byte-Pair Encoding
bpemb - 基于BPE技术的多语言预训练子词嵌入,用于自然语言处理
BPEmb
子词嵌入
自然语言处理
Byte-Pair Encoding
神经网络
Github
开源项目
BPEmb使用Byte-Pair Encoding (BPE)技术,为275种语言提供训练好的子词嵌入,训练数据来自Wikipedia。该项目为神经网络在自然语言处理任务中提供输入。用户可以通过pip安装BPEmb,并自动下载所需的嵌入和SentencePiece模型。BPEmb支持子词分段和预训练子词嵌入,适用于多种语言处理任务,具有多种词汇表大小选择,以满足不同应用需求。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号