热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#代码数据集
starpii - 基于NER模型的代码数据集个人信息检测工具
PII检测
隐私保护
Github
开源项目
代码数据集
标记化分类
Huggingface
StarPII
模型
StarPII是一个基于NER模型的代码数据集个人信息检测工具。通过微调bigcode-encoder,该模型能准确识别代码中的姓名、邮箱、密钥等六类敏感信息。模型在包含20961个密钥和31种编程语言的数据集上训练,并利用伪标签数据预训练提升性能。StarPII为代码数据隐私保护、PII清理和隐私合规提供了可靠的技术支持。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号