写在前面:正在寻找维护者。如果您有兴趣,请联系 libthu (a) yandex.com!
清华教参服务平台辅助工具
从 http://reserves.lib.tsinghua.edu.cn/ 下载页面
下载书籍每一页的原图,生成PDF,无需登录。
下载
从发布页面的"Assets"中,下载对应系统的可执行文件。或运行Python脚本 downloader.py
。
使用方法
运行 downloader
,输入网站"阅读全文"下方的链接地址(如图中标黄的位置)。程序会自动爬取当前章节及以下的所有章节。
程序会将图片保存在 clawed
文件夹下,并自动生成PDF。
macOS
macOS用户可能无法直接运行下载的 downloader
,可能有两种原因:
-
因为它没有"执行权限"。
解决方法:在终端中进入
downloader
文件所在的文件夹,执行chmod +x downloader
命令。有关此命令的更多帮助请参阅 Apple支持。 -
因为它不是从App Store下载的。
解决方法:点击"安全性与隐私" -> "通用" -> "仍要打开"按钮来允许被阻止的App。此按钮在您尝试打开该App后一小时内可用。更多帮助请参阅 Apple支持。
常见问题
**问:**图片压缩的 quality
选项应该怎样设置?
答:范围 [1, 96]:其中96为不压缩(默认),[1, 95]从最差到最佳。更多信息请参见PIL文档。
**问:**运行时报错 'type' object is not subscriptable
,怎么办?
答:请升级Python版本至3.9+,或直接运行分发的可执行文件。
**问:**运行时报错 Cookie Required
,怎么办?
答:经测试,绝大部分教参无需cookie即可访问。少数教参需要cookie进行身份验证,请将网站cookie中 .ASPXAUTH
和 ASP.NET_SessionId
的值依次写入同目录下 cookie.txt
,每行一个。获取cookie的方法请见 #5
**问:**下载的章节不全?
答:这是因为此图书的章节编号不连续。请再次运行程序并输入下一位置的章节链接。通常不会出现此情况。
**问:**下载突然失败了?
答:目前学校对教参平台的访问添加了速率限制,短时间内多次爬取会暂时封禁IP,请过一段时间重试。设置相邻请求的间隔时间可以使用 -i seconds
来设置。
**问:**分享一些高级玩法?
- 使用学校提供的正版福昕编辑器可以对PDF进行OCR。
- Z-Library无法正常访问,使用谷歌搜索
zlib searcher
有惊喜。 - 从GitHub Actions中可以下载预览版的可执行文件。
高级设置
在终端中运行 downloader --help
。
用法: downloader.py [-h] [-v] [-u URL] [-c C] [-i I] [-q Q] [-r] [-e] [--no-pdf] [--no-img]
查看README.md获取帮助。仓库: https://github.com/libthu/reserves-lib-tsinghua-downloader
可选参数:
-h, --help 显示此帮助信息并退出
-v, --version 显示程序版本号并退出
-u URL, --url URL 输入URL
-c C, --concurrent C 并发下载数量(默认为4)
-i I, --interval I 批次之间的时间间隔,以秒为单位(默认为0.5)
-q Q, --quality Q 图像质量,从0(最差)到95(最佳)。96保持图像不变。
-r, --resume 跳过下载图像
-e, --exit 完成后自动退出
--no-pdf 不生成PDF
--no-img 不保存图像
待办事项
- 翻译
- 从网站获取纯文本
- PDF书签
贡献
请查看contribution.md
。
欢迎Star/Issue/PR~
使用风险自负。
友情链接:更多清华常用信息/服务汇总请看这里。