热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#floret
floret - 将fastText和Bloom嵌入结合的紧凑词向量生成工具
fastText
floret
词向量
文本分类
子词嵌入
Github
开源项目
floret是fastText的扩展版本,结合fastText的子词技术和Bloom嵌入,为任意词生成紧凑的全覆盖向量。通过将词和子词哈希存储在同一表中,大幅减少存储空间。支持训练词嵌入和文本分类模型,提供Python接口,生成的向量可轻松导入spaCy等NLP库。作为一个高效的文本处理工具,floret在保持fastText优点的同时,提供了更紧凑的词向量表示方法。
1
1
相关文章
Floret: 结合fastText和Bloom嵌入的紧凑全覆盖向量
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号