BEES
最佳努力范围相同,一个 btrfs 重复数据删除代理。
关于 bees
bees 是一个为大型 btrfs 文件系统设计的面向块的用户空间重复数据删除代理。它是一种离线重复数据删除与增量数据扫描功能相结合的工具,可以最大限度地减少数据从写入到重复数据删除的时间。
优势
- 空间高效的哈希表和匹配算法 - 每 10 TB 唯一数据仅需 1 GB 哈希表(0.1GB/TB)
- 守护进程使用 btrfs 树搜索增量删除重复数据
- 适用于 btrfs 压缩 - 可删除任意组合的压缩和未压缩文件的重复数据
- 绕过 btrfs 文件系统结构以释放更多磁盘空间
- 持久化哈希表,可在关机后快速重启
- 全文件系统重复数据删除 - 包括快照
- 恒定大小的哈希表 - 数据集变大时不会增加内存使用
- 可处理活动数据 - 无需计划停机时间
- 根据系统负载自动自我调节
劣势
- 全文件系统重复数据删除 - 没有包含/排除过滤器,不接受文件列表
- 需要 root 权限(或
CAP_SYS_ADMIN
) - 首次运行可能需要临时磁盘空间进行范围重组
- 如果存在许多快照,首次运行可能会增加元数据空间使用
- 恒定大小的哈希表 - 数据集变小时不会减少内存使用
- 仅适用于 btrfs
安装和使用
推荐阅读
- bees 注意事项
- btrfs 内核 bug - 特别是数据损坏警告
- bees 与其他 btrfs 功能的对比
- 当出现问题时该怎么办
更多信息
错误报告和贡献
请将错误报告和补丁通过电子邮件发送给 Zygo Blaxell bees@furryterror.org。
您也可以使用 Github:
https://github.com/Zygo/bees
版权和许可
版权所有 2015-2023 Zygo Blaxell bees@furryterror.org。
GPL(第 3 版或更高版本)。