热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Tokenization
Tokenizer: 高效的文本分词利器
2 个月前
Tokenizer是一款功能强大的文本分词工具,支持多种编程语言,为自然语言处理和机器学习任务提供了高效的文本预处理解决方案。
Tokenizer
OpenAI
Typescript
C#
Tokenization
Github
开源项目
2 个月前
相关项目
Tokenizer
该项目提供了TypeScript和C#版的字节对编码(BPE)tokenizer,主要用于OpenAI LLMs,并基于开源的Rust实现。适用于Node.js和.NET环境,在传递提示词给LLM前进行tokenization处理。建议C#用户从Microsoft.DeepDev.TokenizerLib迁移至性能更优的Microsoft.ML.Tokenizers。欢迎开发者贡献代码和意见。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号