Wild链接器
Wild是一个旨在实现快速迭代开发的链接器。
目前它仍处于开发阶段,绝不应该用于链接任何生产环境的二进制文件。由于还有许多重要功能尚未实现,如调试信息等,它可能还不适合用于开发目的。
问答
为什么要开发另一个链接器?
Mold已经非常快了,但它不支持增量链接,而且作者表示没有这个打算。Wild目前还不支持增量链接,但这是最终目标。通过使用Rust编写Wild,希望能够实现增量链接的复杂性。
目前支持哪些功能?
当前支持以下平台/架构:
- Linux上的x86-64
以下功能已经可用,但可能存在bug:
- 输出静态链接的、不可重定位的二进制文件
- 输出静态链接的、位置无关的二进制文件(静态PIE)
- 输出动态链接的二进制文件
- 输出共享对象(.so文件)
- 使用Wild链接的Rust过程宏可以正常工作
- crates.io上大多数下载量最高的crate已经通过Wild测试并通过了它们的测试
目前还不支持哪些功能?
还有很多功能尚未实现。以下是一些较大的尚未完成的功能,大致按当前优先级排序:
- 调试信息
- 增量链接
- 支持x86-64以外的架构
- 支持更广泛的链接器标志
- 链接器脚本
- Mac支持
- Windows支持
- LTO
如何验证二进制文件是否使用Wild链接?
安装readelf
,然后运行:
readelf -p .comment my-executable
查找类似以下的行:
Linker: Wild version 0.1.0
如果你不想安装readelf,也可以尝试:
strings my-executable | grep Linker
名称的由来?
链接器以"ld"结尾是一种传统。例如"GNU ld"、"gold"、"lld"、"mold"。由于最终目标是实现增量链接,所以加上了"I"。我们可以说"W"代表"Wild",因为递归缩写在开源项目中很流行。
基准测试
Wild目前还有很多功能未实现,所以在这个阶段进行基准测试可能意义不大。尽管如此,我还是做了一些初步的比较。我尝试链接了我的warm build benchmark仓库中的二进制文件,它构建了一个约80MB的非PIE、静态链接的二进制文件,包含符号表和eh-frames,但不包含调试信息。在我的笔记本电脑上,得到以下结果:
链接器 | 时间(毫秒) | ±标准偏差(毫秒) | CPU时间(毫秒) | 文件大小(MiB) |
---|---|---|---|---|
GNU ld | 12300 | 150 | 12299 | 80.3 |
gold | 3365 | 30 | 3362 | 83.3 |
lld | 905 | 5.6 | 1222 | 84.8 |
mold | 457 | 7.2 | 2834 | 81.1 |
wild | 363 | 6.6 | 1585 | 80.9 |
关于这些结果的说明:
- CPU时间是hyperfine报告的用户+系统CPU时间。
- Mold默认情况下会fork,这样用户就不需要等待执行工作的mold进程关闭。这是一个巧妙的优化。在上面的基准测试中,时间列是启用此优化的结果。但CPU时间是禁用此优化的结果(--no-fork),因为启用fork时,我们无法轻易测量CPU时间。
我想强调的是,这只是一个基准测试。还有许多未知因素:
- 对于其他基准测试,结果会有显著不同吗?
- 当链接更大的二进制文件和/或在多CPU核心系统上时,Wild的性能如何?
- 实现缺失的功能是否需要对Wild的设计进行可能降低速度的更改?
从这个基准测试中,我们只能得出Wild目前在非增量链接方面效率较高,并且能合理利用几个线程的结论。我认为添加缺失的功能不应该显著改变这个基准测试的结果。例如,添加调试信息支持不应该改变在不链接调试信息时的速度。但在实现这些缺失的功能之前,我无法确定。
如果你决定对比Wild和其他链接器的性能,为了公平比较,你应该确保其他链接器不会执行Wild不支持的工作。特别是:
- 不应链接调试信息。例如,向所有链接器传递--strip-debug
可能还有其他标志可以通过让其他链接器避免某些当前正在执行的工作来加速。如果你知道这样的标志,请告诉我。
链接Rust代码
以下是可用于使用Wild构建和测试crate的cargo test
命令行。这已在一些流行的crate上成功运行(例如ripgrep、serde、tokio、rand、bitflags)。它假设"wild"二进制文件在你的路径中。它还依赖于安装了Clang编译器,因为GCC不允许使用任意链接器。
RUSTFLAGS="-Clinker=clang -Clink-args=--ld-path=wild" cargo test
贡献
如果你想提供帮助,我很乐意听到你的想法。最好先联系我,以避免重复工作。这样我也可以提供一些提示,可能会让你的工作更容易。沟通方式:
- 我喜欢尽可能通过视频聊天与人交谈。你可以在我的日历上预约时间。如果时区问题使这变得困难,请通过其他方式让我知道,我会看看是否能找到合适的时间(我在澳大利亚悉尼)。
- 在github上开一个issue或讨论。
- 在rust-lang Zulip上给我发消息。
- 给我发邮件:dvdlttmr@gmail.com
赞助
如果你想赞助这项工作,我将非常感激。获得的赞助越多,我就能继续全职从事这个项目的时间越长。
许可证
根据你的选择,可以使用Apache License, Version 2.0或MIT license。
除非你明确说明,否则你有意提交以包含在Wild中的任何贡献,如Apache-2.0许可证中定义的,都将按上述方式双重许可,不附加任何额外条款或条件。