#文本分类

外交安全培训中心(FASTC)：美国外交人员安全培训的新标杆

3 个月前

fastc 文本分类机器学习自然语言处理嵌入模型 Github 开源项目

3 个月前

Floret: 结合fastText和Bloom嵌入的紧凑全覆盖向量

3 个月前

fastText floret 词向量文本分类子词嵌入 Github 开源项目

3 个月前

fastText: 高效的文本表示和分类库

3 个月前

fastText 词向量文本分类机器学习自然语言处理 Github 开源项目

3 个月前

情感分析:解读文本中的情绪密码

3 个月前

Sentiment Analysis 情感分析自然语言处理文本分类深度学习 Github 开源项目

3 个月前

LLaMA模型在文本分类任务中的应用与实践

3 个月前

LLaMA 文本分类代码库实验设置预处理 Github 开源项目

3 个月前

相关项目

llama-classification

这个代码库提供了使用LLaMA进行文本分类的基础代码。用户可以通过该项目设置实验环境并运行在Nvidia V100 GPU上，用于与Huggingface数据集进行文本分类实验。项目介绍了Direct、Channel和Pure Generation三种方法，并提供了预处理、推理和校准的具体示例。

Keras-TextClassification

为中文用户提供高效的文本分类解决方案，支持FastText、BERT、Albert等多种预训练模型，涵盖词、字、句子嵌入。详细介绍数据处理与模型训练流程，通过下载与调用数据，实现多标签分类和文本相似度计算，简化复杂的自然语言处理任务。

lingua

此库可检测文本数据的语言，适用于自然语言处理如文本分类和拼写检查。与其他开源库相比，该库无需复杂配置，适用于长文本和短文本，甚至单词和短语。支持75种语言，高精度检测，完全离线运行，无需外部API或服务，适用于社交媒体和电子邮件自动分拣等应用。

NLP_Quickbook

本开源项目聚焦于帮助工程师快速掌握自然语言处理技术。从文本分类、文本清洗到深度学习和聊天机器人构建，提供详细的代码示例和实操指南。这些按主题划分的手册采用代码优先的方式讲解，便于工程师直接应用于实际项目。无论是初学者还是有经验的工程师，都能从中受益，提升自然语言处理技能。

small-text

Small-Text 是一个前沿的文本分类主动学习工具，支持多种查询策略、初始化策略和停止准则，用户可以灵活组合使用。工具支持 GPU 加速的 Pytorch 模型和 transformers 集成，适用于复杂文本分类任务，同时也支持 CPU 的轻量安装。科学验证的组件和详细文档使无论是试验还是实际应用，都变得更简单。要求 Python 3.7 或更高版本，支持 CUDA 10.1 或更新版本。如需了解更多，请访问其文档和安装指南。

lingua-py

该工具能够高效检测文本所属语言，适用于自然语言处理中的文本分类和拼写检查等预处理步骤。这款灵活的小库在长文本和短文本上都能保持高准确率，不依赖外部API或服务，可完全离线使用。相比其他开源库，具有更高的精度和更低的内存占用，尤其适合处理短文本如微博信息。

underthesea

越南语自然语言处理开源 Python 工具包，提供简便的 API 和预训练模型，支持词语分割、词性标注、命名实体识别、文本分类和依存句法分析。工具包遵循 GNU 通用公共许可证 v3.0，包含数据集和教程，适用于科研和开发。最新版本支持 LLMs 和基于提示的文本分类功能，用户可以通过 pip 安装。教程涵盖从句子分割到情感分析和语言检测等多种功能。

transformers-interpret

Transformers-interpret是一款为Transformer模型设计的解释工具，只需简单代码即可实现。支持文本和计算机视觉模型，并可在笔记本中展示或保存为PNG和HTML文件。通过导入预训练模型和tokenizer，用户能快速获得预测分类解释，并提供可视化功能。此项目基于Captum库构建，支持多标签分类等功能，帮助开发者深入理解模型决策。

Introduction-NLP

本项目详细解析《自然语言处理入门》，涵盖中文分词、词性标注、命名实体识别等NLP核心技术，为初学者及爱好者提供清晰的学习路径和实用的笔记。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com