#分类任务
Multimodal-Toolkit - 通用多模态数据与文本特征融合工具包
Github开源项目PythonMultimodal TransformersHuggingFace Transformers分类任务回归任务
一个用于分类和回归任务的工具包,结合HuggingFace Transformers的文本特征与表格数据,生成多模态特征以提高模型性能。该工具包支持多种模型和组合方法,提供详尽的示例和数据集,包括BERT、ALBERT等模型,以及电商评论、Airbnb数据和宠物领养预测等实际应用。
bge-base-en - 英语文本嵌入模型在多任务基准测试中展现优异性能
Github开源项目模型HuggingfaceMTEB分类任务检索任务聚类任务排序任务
bge-base-en是一个英语文本嵌入模型,在MTEB多任务评估基准中表现优异。该模型在分类、检索、聚类等多种自然语言处理任务中均取得良好结果,尤其在问答和语义相似度任务上表现突出。作为一个多功能的文本表示工具,bge-base-en可应用于多种自然语言处理场景。
GPT-JT-6B-v1 - 优化文本分类的先进语言模型
Github开源项目文本生成模型Huggingface分类任务开放数据集UL2GPT-JT
GPT-JT-6B-v1采用去中心化训练和开放数据集,提升文本分类表现。结合UL2训练目标等先进技术,使其在计算效率上具有优势,优于大多数百亿参数模型。在多样化数据集如自然指令和P3上,GPT-JT利用标记和双向上下文学习,增强推断能力和语言处理功能。
ja_classification - 准确率达98.47%的日语文本分类模型
Github开源项目模型训练机器学习模型Huggingface分类任务超参数优化Adam
该日语文本分类模型经过优化训练,在评估数据集上取得98.47%的综合性能指标,包括准确率、精确率、召回率和F1值。模型采用Adam优化器训练,经过10轮迭代后性能稳定,可用于各类日语文本分类任务。