热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#抽象总结
pegasus-multi_news - 优化文本摘要生成:采用混合数据集和随机抽样
模型训练
开源项目
模型
抽象总结
Pegasus
混合和随机检查点
Huggingface
重要句
Github
该项目旨在提高文本摘要生成性能,通过混合C4和HugeNews数据集,以及随机抽样技术进行更有效的模型训练。训练过程中使用1.5M步数以增强预训练收敛性,均匀抽样15%到45%间的句间间隔,同时对重要句子施加20%随机扰动。更新后的sentencepiece tokenizer支持换行符编码,提升数据处理精度,展现了多领域数据集上的性能改进。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号