Project Icon

datamol

基于RDKit的高效分子处理Python库

datamol是一个基于RDKit的Python库,专为简化分子处理而设计。它提供简洁的API、高效的并行处理和现代IO支持,同时保持与RDKit的兼容性。通过良好的默认设置,datamol简化了分子标准化、构象生成和特征计算等任务,使分子操作更加便捷高效。该库支持远程路径读写多种格式文件,适用于大规模数据处理。datamol的设计理念是在RDKit基础上提供更简单的接口,同时保持性能和灵活性,使其成为分子信息学研究和开发的有力工具。

datamol - 简化分子处理

文档 | 主页


DOI Binder PyPI Conda PyPI - 下载量 Conda PyPI - Python版本 许可证 GitHub 仓库星标 GitHub 仓库分支 Codecov

Datamol 是一个用于处理分子的 Python 库。它是构建在 RDKit 之上的一层,旨在尽可能轻量化。

  • 🐍 简单的 Python 风格 API
  • ⚗️ 以 RDKit 为先:所有操作都基于 rdkit.Chem.Mol 对象
  • ✅ 分子操作通常依赖多个选项;Datamol 在设计上提供了良好的默认值
  • 🧠 性能至关重要:内置高效并行化处理,可选进度条显示
  • 🕹️ 现代 IO:使用 fsspec 开箱即用支持远程路径,可读写多种格式(sdf、xlsx、csv 等)

在线试用

访问 Binder 在线试用 Datamol。

文档

访问 https://docs.datamol.io

安装

使用 conda:

mamba install -c conda-forge datamol

API 快速浏览

import datamol as dm

# 常用函数
mol = dm.to_mol("O=C(C)Oc1ccccc1C(=O)O", sanitize=True)
fp = dm.to_fp(mol)
selfies = dm.to_selfies(mol)
inchi = dm.to_inchi(mol)

# 标准化和净化
mol = dm.to_mol("O=C(C)Oc1ccccc1C(=O)O")
mol = dm.fix_mol(mol)
mol = dm.sanitize_mol(mol)
mol = dm.standardize_mol(mol)

# 数据框操作
df = dm.data.freesolv()
mols = dm.from_df(df)

# 2D 可视化
legends = [dm.to_smiles(mol) for mol in mols[:10]]
dm.viz.to_image(mols[:10], legends=legends)

# 生成构象
smiles = "O=C(C)Oc1ccccc1C(=O)O"
mol = dm.to_mol(smiles)
mol_with_conformers = dm.conformers.generate(mol)

# 3D 可视化(使用 nglview)
dm.viz.conformers(mol, n_confs=10)

# 从构象计算 SASA
sasa = dm.conformers.sasa(mol_with_conformers)

# 简便的 IO
mols = dm.read_sdf("s3://my-awesome-data-lake/smiles.sdf", as_df=False)
dm.to_sdf(mols, "gs://data-bucket/smiles.sdf")

如何引用

如果您在研究中使用 Datamol,请引用:DOI

兼容性

版本兼容性对于生产软件栈至关重要。我们谨慎地记录了 datamolpythonrdkit 之间的兼容性。

以下是 Datamol 次要版本在其整个生命周期中已测试的 Python 和 RDKit 相关版本。这并不意味着其他组合不可用,只是这些组合未经测试。

datamolpythonrdkit
0.12.x[3.10, 3.11][2023.03, 2023.09]
0.11.x[3.9, 3.10, 3.11][2022.09, 2023.03]
0.10.x[3.9, 3.10, 3.11][2022.03, 2022.09]
0.9.x[3.9, 3.10, 3.11][2022.03, 2022.09]
0.8.x[3.8, 3.9, 3.10][2021.09, 2022.03, 2022.09]
0.7.x[3.8, 3.9][2021.09, 2022.03]
0.6.x[3.8, 3.9][2021.09]
0.5.x[3.8, 3.9][2021.03, 2021.09]
0.4.x[3.8, 3.9][2020.09, 2021.03]
0.3.x[3.8, 3.9][2020.09, 2021.03]

CI 状态

CI 运行测试并对以下组合进行代码质量检查:

  • 三个主要平台:Windows、OSX 和 Linux
  • 最新的两个 Python 版本
  • 最新的两个 RDKit 版本
main
库构建和测试test
代码健全性检查code-check
文档构建doc

许可证

基于 Apache-2.0 许可证。查看 LICENSE

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号