#预处理

llama-classification - 利用LLaMA的文本分类代码库概述与使用指南
LLaMA文本分类代码库实验设置预处理Github开源项目
这个代码库提供了使用LLaMA进行文本分类的基础代码。用户可以通过该项目设置实验环境并运行在Nvidia V100 GPU上,用于与Huggingface数据集进行文本分类实验。项目介绍了Direct、Channel和Pure Generation三种方法,并提供了预处理、推理和校准的具体示例。
pysentimiento - 社交NLP任务的高级Python工具包
pysentimiento情感分析NLP任务Transformer预处理Github开源项目
pysentimiento是一个Python工具包,专为情感分析和社交NLP任务设计。它支持多种语言,包括西班牙语、英语、意大利语和葡萄牙语,可以进行情感分析、仇恨言论检测、讽刺检测及情感分析等。使用简单,只需通过pip安装并调用预设模型即可。适用于研究者和开发者的强大开源工具。
HorizonNet - 基于1D表示和全景拉伸数据增强的房间布局学习
HorizonNet布局预测室内数据集预处理深度学习Github开源项目
HorizonNet项目通过1D表示和全景拉伸数据增强实现了房间布局学习,能够生成立方体或一般形状的房间布局。该项目提供纯Python实现,支持图像推断、3D布局查看、姿态校正、全景拉伸增强、2D和3D布局定量评估以及数据集准备和训练。支持PanoContext、Stanford2D3D、Structured3D和Zillow Indoor等数据集,提供预训练模型。详细的安装、推断和可视化教程使用户能够高效地使用该工具。
opus-mt-ur-en - 乌尔都语与英语之间的翻译工具
English翻译Huggingface模型Github开源项目Urdu预处理
项目基于transformer-align模型,专注于将乌尔都语翻译为英语,采用了标准化的语言处理和SentencePiece技术(spm32k)。在Tatoeba测试集中,该模型获得了23.2的BLEU分数和0.435的chr-F分数,对于语言转换效率具有贡献。适合需要精准理解乌尔都语文本的研究人员、翻译人员及软件开发者。
opus-mt-sq-en - 中立且精准的阿尔巴尼亚语到英语翻译工具
数据集Github开源项目Huggingface预处理翻译opus-mt-sq-en模型
项目提供了一种中立的阿尔巴尼亚语到英语翻译工具,基于transformer-align模型,并通过正规化和SentencePiece预处理,以opus数据集为基础。模型方便下载和评估,在Tatoeba.sq.en测试集中取得了58.4的BLEU得分和0.732的chr-F分数,适用于各种翻译需求。
opus-mt-en-sq - 英语到阿尔巴尼亚语的开源翻译模型
句子片段opus-mt-en-sq翻译Huggingface模型Github开源项目预处理
该项目利用transformer-align模型实现英语到阿尔巴尼亚语的翻译,基于opus数据集,并结合正规化与SentencePiece进行预处理。该模型在Tatoeba.en.sq数据集上的BLEU得分达到46.5,可用于研究及应用于其他语言处理任务,支持下载原始权重及测试结果。
opus-mt-de-es - 德语到西班牙语的智能翻译工具,支持更高的翻译准确性
翻译模型开源项目模型Githubopus-mt-de-esHuggingface预处理BLEU评分语言对
该开源项目通过使用transformer-align模型,将德语翻译为西班牙语,依托opus数据集,进行标准化和SentencePiece的预处理,提升翻译的准确性。用户可以下载模型的原始权重并查看相应的翻译测试集及评分,以了解其性能。在Tatoeba.de.es测试集中获得了48.5分的BLEU评分和0.676的chr-F得分,其高效性能在翻译领域具备一定的竞争力。
opus-mt-ca-es - 加泰罗尼亚语至西班牙语的开源翻译工具
opus-mt-ca-esGithub模型开源项目预处理Huggingface基准测试翻译
这是一个开放源代码的加泰罗尼亚语到西班牙语翻译模型,采用transformer-align架构,具备良好性能。通过OPUS数据集和SentencePiece进行预处理,提供高质量且一致的翻译结果。支持下载模型权重和测试集,方便评估应用于语言转换需求。
opus-mt-yo-en - 约鲁巴语和英语之间的开源翻译模型及其评估
翻译开源项目opus-mt-yo-en模型Huggingface预处理数据集Github
该项目介绍了一个将约鲁巴语翻译为英语的开源模型。使用transformer-align架构并进行SentencePiece预处理。模型已在OPUS数据集上训练,并通过BLEU和chr-F评分评估其翻译能力,提供详细的权重下载和实施指南。