Project Icon

dill

Python对象序列化扩展库

dill是Python pickle模块的扩展库,支持序列化和反序列化大多数内置Python类型,包括复杂类型如带yield的函数、嵌套函数和lambda表达式。它提供与pickle相同的接口,并增加了保存解释器会话状态、提取源代码和诊断pickle错误等功能。作为pathos框架的一部分,dill适用于异构计算环境,为Python对象序列化提供了更强大和灵活的解决方案。

dill

序列化所有的Python对象

关于Dill

dill扩展了Python的pickle模块,用于序列化和反序列化大多数内置Python类型的Python对象。序列化是将对象转换为字节流的过程,而反序列化则是将字节流转换回Python对象层次结构的逆过程。

dill为用户提供了与pickle模块相同的接口,还包含一些额外的功能。除了pickle Python对象外,dill还提供了通过单个命令保存解释器会话状态的能力。因此,可以保存一个解释器会话,关闭解释器,将pickle文件发送到另一台计算机,打开新的解释器,解pickle会话,从而继续原始解释器会话的"保存"状态。

dill可用于将Python对象存储到文件中,但主要用途是将Python对象作为字节流通过网络发送。dill非常灵活,允许序列化任意用户定义的类和函数。因此,dill并非旨在针对错误或恶意构造的数据提供安全保护。由用户决定他们解pickle的数据是否来自可信来源。

dillpathos的一部分,pathos是一个用于异构计算的Python框架。dill正在积极开发中,因此非常欢迎任何用户反馈、错误报告、评论或建议。问题列表位于https://github.com/uqfoundation/dill/issues,旧版列表维护在https://uqfoundation.github.io/project/pathos/query。

主要特性

dill可以pickle以下标准类型:

  • none, type, bool, int, float, complex, bytes, str,
  • tuple, list, dict, file, buffer, builtin,
  • Python类, namedtuples, dataclasses, metaclasses,
  • 类的实例,
  • set, frozenset, array, functions, exceptions

dill还可以pickle更多"特殊"的标准类型:

  • 带yield的函数, 嵌套函数, lambdas,
  • cell, method, unboundmethod, module, code, methodwrapper,
  • methoddescriptor, getsetdescriptor, memberdescriptor, wrapperdescriptor,
  • dictproxy, slice, notimplemented, ellipsis, quit

dill目前还不能pickle这些标准类型:

  • frame, generator, traceback

dill还提供以下功能:

  • 保存和加载Python解释器会话
  • 保存和提取函数和类的源代码
  • 交互式诊断pickling错误

当前版本

dill的最新发布版本可从以下地址获得: https://pypi.org/project/dill

dill以3条款BSD许可证分发。

开发版本

您可以从以下地址获得具有所有新功能的最新开发版本: https://github.com/uqfoundation

如果您有新的贡献,请提交拉取请求。

安装

可以使用pip安装dill:

$ pip install dill

要在安装中可选包含objgraph诊断工具:

$ pip install dill[graph]

要在安装中可选包含gprof2dot诊断工具:

$ pip install dill[profile]

对于Windows用户,可选安装会话历史工具:

$ pip install dill[readline]

要求

dill需要:

  • python (或 pypy), >=3.8
  • setuptools, >=42

可选要求:

  • objgraph, >=1.7.2
  • gprof2dot, >=2022.7.29
  • pyreadline, >=1.7.1 (在Windows上)

基本用法

dillpickle的直接替代品。可以使用以下方式更新现有代码以允许完全pickling:

>>> import dill as pickle

或:

>>> from dill import dumps, loads

dumps将对象转换为唯一的字节字符串,loads执行逆操作:

>>> squared = lambda x: x**2
>>> loads(dumps(squared))(3)
9

有一些选项可以控制序列化,这些选项作为关键字参数提供给几个dill函数:

  • 使用 protocol 可以设置 pickle 协议级别。这使用与 pickle 模块相同的值 DEFAULT_PROTOCOL
  • 使用 byref=True 时,dill 在处理某些对象(如模块)时会更像 pickle,通过引用进行序列化而不是尝试序列化对象本身。
  • 使用 recurse=True 时,全局字典中引用的对象会被递归追踪和序列化,而不是默认行为中尝试存储整个全局字典。
  • 使用 fmode 时,文件内容可以与文件句柄一起序列化,这在对象被发送到没有原始文件的远程系统时很有用。选项包括仅句柄的 HANDLE_FMODE、文件内容的 CONTENTS_FMODE 和内容加句柄的 FILE_FMODE
  • 使用 ignore=False 时,使用顶级脚本环境中定义的类型重建的对象会使用环境中现有的类型,而不是可能不同的重建类型。

默认序列化也可以在 dill.settings 中全局设置。因此,我们可以在本地或全局修改 dill 处理全局字典引用的方式::

>>> import dill.settings
>>> dumps(absolute) == dumps(absolute, recurse=True)
False
>>> dill.settings['recurse'] = True
>>> dumps(absolute) == dumps(absolute, recurse=True)
True

dill 还包括源代码检查,作为序列化的替代方法::

>>> import dill.source
>>> print(dill.source.getsource(squared))
squared = lambda x:x**2

为了帮助调试序列化问题,使用 dill.detect 提供的工具,如序列化跟踪::

>>> import dill.detect
>>> with dill.detect.trace():
>>>     dumps(squared)
┬ F1: <function <lambda> at 0x7fe074f8c280>
├┬ F2: <function _create_function at 0x7fe074c49c10>
│└ # F2 [34 B]
├┬ Co: <code object <lambda> at 0x7fe07501eb30, file "<stdin>", line 1>
│├┬ F2: <function _create_code at 0x7fe074c49ca0>
││└ # F2 [19 B]
│└ # Co [87 B]
├┬ D1: <dict object at 0x7fe0750d4680>
│└ # D1 [22 B]
├┬ D2: <dict object at 0x7fe074c5a1c0>
│└ # D2 [2 B]
├┬ D2: <dict object at 0x7fe074f903c0>
│├┬ D2: <dict object at 0x7fe074f8ebc0>
││└ # D2 [2 B]
│└ # D2 [23 B]
└ # F1 [180 B]

通过跟踪,我们可以看到 dill 如何存储 lambda (F1):首先存储 _create_function、底层代码对象 (Co) 和 _create_code (用于处理代码对象),然后处理全局字典的引用 (D2) 以及其他保存 lambda 对象状态的字典 (D1D2)。# 标记表示对象实际被存储的时刻。

更多信息

开始使用的最佳方式可能是查看 http://dill.rtfd.io 上的文档。也可以查看 dill.tests 中的一系列脚本,它们演示了 dill 如何序列化不同的 Python 对象。你可以通过 python -m dill.tests 运行测试套件。任何 pickle 文件的内容都可以用 undill 检查。由于 dill 符合 pickle 接口,http://docs.python.org/library/pickle.html 上的示例和文档也适用于 dill,只需 import dill as pickle。源代码通常也有很好的文档,所以进一步的问题可以通过检查代码本身来解决。请随时在 github 上提交问题,或在 stackoverflow 上提问 (@Mike McKerns)。 如果你想分享你如何在工作中使用 dill,请发送电子邮件至 mmckerns at uqfoundation dot org

引用

如果你使用 dill 进行研究并发表论文,我们请求你通过在出版物中引用以下内容来确认使用 dill::

M.M. McKerns, L. Strand, T. Sullivan, A. Fang, M.A.G. Aivazis,
"Building a framework for predictive science", Proceedings of
the 10th Python in Science Conference, 2011;
http://arxiv.org/pdf/1202.1056

Michael McKerns and Michael Aivazis,
"pathos: a framework for heterogeneous computing", 2010- ;
https://uqfoundation.github.io/project/pathos

更多信息请参见 https://uqfoundation.github.io/project/pathoshttp://arxiv.org/pdf/1202.1056。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号