#PII
Octopii - 个人信息泄露检测工具,自动识别和提取敏感数据
Github开源项目OCRNLPOctopiiPIIRedHunt Labs
Octopii是一款基于OCR和NLP技术的工具,能够高效扫描图像、PDF和文件中的政府ID、地址和电邮等敏感信息。支持多种扫描方式,包括本地文件系统、S3 URLs及Apache公开目录,帮助用户检测和防止个人信息泄露,增强数据安全性。
GLiNER_PII_ITA - 意大利语文本中的个人信息识别与分类通用模型
Github开源项目模型HuggingfacePII模型应用隐私合规信息识别Gliner
GLiNER的模型专为识别和分类文本中的个人识别信息(PII)而设计,特别适用于法律、财务和行政文档中的隐私保护合规需求。该模型经过大规模多样化的标签数据训练,能够识别客户姓名、出生地、住址与财务信息等多种PII。此外,该模型在非结构化数据或稀有标签识别时,准确性可能会有所降低。