Project Icon

textdistance

Python文本距离和相似度计算库

TextDistance是一个计算序列距离和相似度的Python库。它实现了30多种算法,包括编辑距离、基于令牌、基于序列、基于压缩和语音等类型。该库支持纯Python实现,可比较多个序列,并提供NumPy加速选项。TextDistance接口简单灵活,适用于各种文本分析和字符串比较任务。

thefuzz - Python模糊字符串匹配库 基于Levenshtein距离算法
GithubLevenshtein距离Python库TheFuzz字符串相似度开源项目模糊字符串匹配
thefuzz是一个Python模糊字符串匹配库,基于Levenshtein距离算法。它提供简单比率、部分比率、令牌排序比率等多种匹配方法。该库支持Python 3.8及以上版本,可计算字符串相似度并从选项列表中提取最匹配结果。thefuzz适用于文本处理和搜索等多种场景,是一个功能强大且易用的开源工具。
small-text - Small-Text:Python中的文本分类主动学习工具
GithubPythonsklearnsmall-text开源项目文本分类积极学习
Small-Text 是一个前沿的文本分类主动学习工具,支持多种查询策略、初始化策略和停止准则,用户可以灵活组合使用。工具支持 GPU 加速的 Pytorch 模型和 transformers 集成,适用于复杂文本分类任务,同时也支持 CPU 的轻量安装。科学验证的组件和详细文档使无论是试验还是实际应用,都变得更简单。要求 Python 3.7 或更高版本,支持 CUDA 10.1 或更新版本。如需了解更多,请访问其文档和安装指南。
texthero - 全面的文本数据处理和可视化工具
GithubTexthero开源项目文本可视化文本表示文本预处理自然语言处理
Texthero是一个专为现代程序员设计的Python工具包,致力于快速高效地处理和可视化文本数据。其功能包括文本预处理、自然语言处理、文本表示、向量空间分析和文本可视化。Texthero与Pandas具有相同的表达能力,并提供全面的文档支持,对语言学知识要求较低。该项目免费开源,鼓励社区贡献,共同提升多语言支持。
similarity - 用于度量学习的库,支持自监督和对比学习
GithubTensorFlow Similarity对比学习度量学习开源项目相似性学习自监督学习
TensorFlow Similarity 是一个用于度量学习的库,支持自监督和对比学习。该库提供先进的算法,可用于研究、训练、评估和部署基于相似性和对比的模型,包含模型、损失函数、指标、采样器、可视化工具和索引子系统。最新版本支持分布式训练,增加了多模态嵌入和新的检索指标。可在未标记数据上进行预训练以提高准确性,或构建模型找到并聚类相似示例。了解更多请查看文档和示例。
interpret-text - 基于Interpret的开源NLP模型解释工具,支持文本模型分析
GithubInterpret-TextNLP互动可视化仪表板可解释性技术开源项目文本解释
Interpret-Text是一个开源工具包,基于Interpret Python包,扩展了对文本模型的支持,提供SDK和示例Jupyter笔记本。用户可以使用全球和局部解释工具,分析和解释机器学习模型的预测结果。核心功能包括社区驱动的创新技术、统一API和互动式可视化仪表盘,适用于开发者、数据科学家、业务高管和研究人员,通过多种解释器和NLP应用场景,简化模型解释和审计过程。
PolyFuzz - 多功能模糊字符串匹配与评估框架
GithubPolyFuzz字符串匹配开源项目模糊匹配相似度计算自然语言处理
PolyFuzz是一个综合性Python库,整合了多种字符串匹配技术,包括编辑距离、TF-IDF、词嵌入和Transformer模型。该框架提供模糊字符串匹配、分组和评估功能,支持自定义模型和生产环境部署。PolyFuzz还具备可视化能力,通过精确率-召回率曲线展示不同模型的性能比较。其简洁API设计使得开发者能够轻松实现复杂的字符串处理任务。
similarity - 文本相似度计算工具,支持多种算法及情感分析
GithubJavasimilarityword2vec开源项目情感分析文本相似度
similarity是一个用Java编写的相似度计算工具包,适用于词语、短语、句子和段落的相似度计算及情感分析。其特点包括高效的词林编码法和余弦相似度算法,以及基于词向量模型的近义词推荐功能。该工具包架构清晰,模型惰性加载,词典明文发布,便于用户训练自定义语料,满足多种自然语言处理需求。
deepl-python - DeepL Python库 多功能的机器翻译接口
APIDeepLGithubPython库开源项目机器翻译语言翻译
DeepL Python Library是一个功能丰富的Python接口,用于访问DeepL的机器翻译服务。该库支持文本和文档翻译、自定义术语表和多语言处理。适用于Python 3.6及以上版本,安装简便,API调用直观。开发者可借助此库轻松集成DeepL的翻译功能,实现多样化的语言处理应用。
PyShortTextCategorization - Python短文本分类和挖掘库
GithubPython开源项目文本分类机器学习短文本挖掘自然语言处理
PyShortTextCategorization是一个专门用于短文本分类和挖掘的Python库。它集成了多种文本表示方法,如主题建模和词嵌入,支持有监督和无监督学习。该库提供文本预处理、预训练词嵌入、多种分类算法和短语相似度计算等功能,为短文本分析提供了全面的工具集。适用于Python 3.8-3.11版本,具备示例数据集、文本预处理、预训练词嵌入支持等特性。它整合了多种主题模型和神经网络分类器,并提供短语差异度量和字符级序列到序列学习等高级功能。
SimSIMD - 快速高效的向量相似度计算库
GithubSIMD优化SimSIMD向量计算开源项目距离度量跨平台
SimSIMD是一个高性能向量相似度计算库,为机器学习和科学计算提供快速的距离和相似度计算。支持欧几里得、余弦等多种距离函数,可处理浮点和整型数据。通过SIMD优化,性能显著优于NumPy和SciPy。提供Python、Rust等语言绑定,并具有广泛的平台兼容性。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号