#字符级编码
UDiffText - 基于字符级扩散模型的高质量图像文本合成框架
UDiffText文本合成扩散模型图像生成字符级编码Github开源项目
UDiffText是一个基于字符级扩散模型的文本合成框架,能在任意图像中生成高质量文本。该框架适用于合成和真实图像,可进行场景文本编辑、任意文本生成和精确的文本到图像生成。项目包含完整的训练和评估流程,支持LAION-OCR、ICDAR13等多个数据集。UDiffText为文本合成和图像处理领域提供了新的解决方案。
canine-c - 字符级多语言自然语言处理模型
模型CANINEGithub自然语言处理预训练模型字符级编码Huggingface开源项目多语言模型
CANINE-c是一款预训练于104种语言的多语言模型,直接在字符级别处理文本,无需专门的分词器。该模型通过掩码语言建模和下一句预测方法训练,可生成适用于序列分类、标记分类和问答等下游任务的特征表示。CANINE-c为自然语言处理领域提供了一种新颖的、高效的处理方法。