热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#中文图书语料
CBook-150K: 复旦大学NLP实验室推出的大规模中文图书语料库
2 个月前
CBook-150K是由复旦大学自然语言处理实验室推出的一个包含约15万本中文电子图书的大规模语料库,旨在为中文自然语言处理研究提供高质量的语料资源。该项目提供了图书的MD5链接,并介绍了下载和解析图书内容的方法。
中文图书语料
MD5链接
百度云盘
PDF解析
EPUB解析
Github
开源项目
2 个月前
CBook-150K:复旦大学自然语言处理实验室的中文图书语料库
2 个月前
CBook-150K是由复旦大学自然语言处理实验室开发的大规模中文图书语料库,包含约15万本中文图书的MD5链接,为自然语言处理研究提供了丰富的中文文本资源。
中文图书语料
MD5链接
百度云盘
PDF解析
EPUB解析
Github
开源项目
2 个月前
相关项目
CBook-150K
CBook-150K是一个包含约15万本中文图书的语料集合,基于开源MD5图书链接构建。项目支持PDF、EPUB和MOBI格式解析,提供MD5链接目录结构和快速转存方法。介绍了各种电子书格式的解析技术,为自然语言处理研究提供中文文本资源。该语料集合仅供科研用途。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号