#模型应用
labse_bert - 多语言BERT句子嵌入模型及其应用
句子嵌入Github开源项目LABSE BERT模型应用自然语言处理Huggingface多语言处理模型
LaBSE BERT是一种语言无关的句子嵌入模型,由Fangxiaoyu Feng等人开发并在TensorFlow Hub上提供。该模型能够将文本转换为高效的向量表示,适用于多语言文本处理。利用AutoTokenizer和AutoModel加载模型,并通过mean_pooling方法获取句子嵌入,以增强文本分析和信息检索等领域的性能。使用PyTorch实现编码和处理,多语言文本分析更加轻松。
GLiNER_PII_ITA - 意大利语文本中的个人信息识别与分类通用模型
隐私合规PII开源项目模型信息识别Huggingface模型应用GlinerGithub
GLiNER的模型专为识别和分类文本中的个人识别信息(PII)而设计,特别适用于法律、财务和行政文档中的隐私保护合规需求。该模型经过大规模多样化的标签数据训练,能够识别客户姓名、出生地、住址与财务信息等多种PII。此外,该模型在非结构化数据或稀有标签识别时,准确性可能会有所降低。