#RoBERTa-large
roberta-large-cola-krishna2020 - 机器生成英语句子的流畅性与语法性评估
Github开源项目模型HuggingfaceRoBERTa-large无监督风格转换机器生成文本评估CoLA语料库语法可接受性判断
该模型为基于CoLA语料库训练的RoBERTa-large分类器,用于评估机生成英语句子的语法接纳性和流畅性,常应用于文本风格的转换评估。模型由Krishna等人在2020年发表,并已从Fairseq格式转为Transformers格式,详情参见原作者的项目页。
twitter-roberta-large-2022-154m - 训练于154M推文的RoBERTa-large模型(2022年数据)及其应用
Github开源项目自然语言处理模型Huggingface推特特征提取掩码语言模型RoBERTa-large
本项目提供了一种经过2022年12月底前154M条推文训练的RoBERTa-large模型,主要用于推文数据的理解和解析。它通过Twitter Academic API获取并过滤推文,实现了高级文本预处理、掩码语言模型和特征提取的应用示例。用户可借助标准Transformers接口进行推文分析及嵌入提取,同时适用于对比在不同时间段训练的模型的预测结果和困惑度得分,为研究人员提供更深入分析推特时间序列数据的工具。