Project Icon

rust-bert

基于Rust语言开发的高效自然语言处理库

rust-bert是基于Rust语言开发的高效自然语言处理库,支持问答、命名实体识别、翻译和摘要生成等多种任务。此库支持多线程分词和GPU推断,具备丰富的API,便于开发者和研究人员快速部署使用多种预训练模型。

tokenizers - 文本分词处理工具
GithubTokenizers多语言绑定开源项目性能文本处理调优
tokenizers是一个高效的分词工具,旨在提供快速且多功能的文本处理解决方案。它可以迅速训练新的词汇库并进行分词,使用Rust语言编写以确保高性能。其接口设计简洁易用,适用于研究与生产,全面支持各种文本预处理需求。
rust-protobuf - Rust语言的高效Protobuf库实现
GithubProtobufRust代码生成序列化开源项目跨语言通信
rust-protobuf是一个纯Rust实现的Protobuf库,支持Protobuf 2和3版本。它能生成Rust代码,提供运行时支持,并具备反射、JSON和文本格式处理、动态消息等功能。该开源项目目前正寻求贡献者参与完善文档、测试和API设计。
tiktoken-rs - OpenAI模型专用的Rust分词和计数库
GPTGithubOpenAIRusttiktoken-rstokenizer开源项目
tiktoken-rs是一个Rust实现的文本分词库,特别为OpenAI的GPT和其他相关模型设计,具备分词和计数的功能。支持多种OpenAI编码格式如GPT-3和GPT-4,用户可以通过Cargo轻松安装并使用,并在开源库中找到完整的示例。适用于需要高效、准确文本处理的开发者。
whatlang-rs - 自然语言检测库,关注简洁高效
GithubRustWhatlang开源项目性能自然语言检测语言识别
Rust实现的高效自然语言检测库,支持69种语言,识别语言和文字脚本(如拉丁文、西里尔文等),并提供可靠性评估。轻量、快速且简洁,适用于Sonic、Meilisearch等项目。
arrow-rs - Rust实现的Apache Arrow和Parquet高性能数据处理库
Apache ArrowGithubParquetRust开源项目数据处理
arrow-rs是Apache Arrow和Apache Parquet的Rust原生实现,提供高效的列式内存格式和数据处理功能。项目包含Arrow核心数据结构、Flight IPC协议、对象存储、Parquet文件格式等组件。每月发布更新,支持高性能数据分析和处理,适用于构建各类大数据应用。
bert-base-multilingual-uncased - BERT多语言预训练模型支持102种语言的自然语言处理
BERTGithubHuggingface多语言模型开源项目机器学习模型自然语言处理预训练
bert-base-multilingual-uncased是基于102种语言的维基百科数据预训练的BERT模型。它采用掩码语言建模进行自监督学习,可支持多语言自然语言处理任务。该模型不区分大小写,适用于序列分类、标记分类和问答等下游任务。通过在大规模多语言语料库上预训练,模型学习了多语言的双向语义表示,可通过微调适应特定任务需求。
tch-rs - Rust语言的PyTorch C++ API接口
GithubPyTorchRustlibtorchnn::Moduletch-rs开源项目
tch-rs是Rust语言对PyTorch C++ API的绑定,通过简洁的封装实现高效的深度学习模型训练和推理。支持系统全局libtorch安装、手动安装和Python PyTorch安装,兼容CUDA并支持静态链接。提供详细的安装说明和丰富的示例代码,包括基础张量操作、梯度下降训练、神经网络构建和迁移学习等,适合不同水平的开发者。
bert_score - 先进的自然语言生成评估工具
BERTScoreGithub开源项目文本生成评估机器学习自然语言处理预训练模型
BERTScore是一种创新的自然语言生成评估工具,基于BERT预训练模型的上下文嵌入技术。它通过计算候选句和参考句中单词的余弦相似度,得出精确度、召回率和F1分数。研究表明,BERTScore在句子级和系统级评估中与人工判断具有高度相关性。该项目支持130多种预训练模型,适用于多种语言的文本生成评估。BERTScore提供Python接口和命令行工具,操作简便,是自然语言处理领域的有力辅助工具。
openai-api-rs - Rust开发的OpenAI API非官方客户端库
CargoGithubOpenAI APIRustopenai-api-rs开源项目聊天补全
此Rust库提供了访问OpenAI API的便捷方式,支持如聊天、完成、编辑、图像、嵌入、音频和文件等主要功能。通过简单的配置和使用示例,用户可以快速集成OpenAI API到Rust应用中,并使用环境变量管理API密钥和基础URL。该项目遵循MIT许可证,详情请参考官方文档和示例。
spark-nlp - 高效自然语言处理与大规模语言模型开源库
Apache SparkGithubSpark NLP开源项目机器学习自然语言处理预训练模型
Spark NLP 是一个基于 Apache Spark 的开源库,提供高效且准确的自然语言处理注释,支持机器学习管道的分布式扩展。该库包含超过 36000 个预训练管道和模型,支持 200 多种语言,涵盖分词、词性标注、嵌入、命名实体识别、文本分类、情感分析、机器翻译等任务。兼容 BERT、RoBERTa 等主流变压器模型,支持 Python、R、Java、Scala 和 Kotlin。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号