maml(材料机器学习)是一个Python包,旨在提供有用的高级接口,使材料科学的机器学习变得尽可能简单。
maml的目标不是重复其他包中已有的功能。maml依赖于如scikit-learn和tensorflow等成熟的包来实现机器学习算法,以及其他材料科学包如pymatgen和matminer来进行晶体/分子操作和特征生成。
官方文档:https://materialsvirtuallab.github.io/maml/
特点
- 将材料(晶体和分子)转换为特征。除了常见的成分、位点和结构特征外,我们还提供以下细粒度局部环境特征。
a) 双谱系数 b) Behler-Parrinello对称函数 c) 原子位置平滑重叠(SOAP) d) 图网络特征(成分、位点和结构)
-
使用机器学习来学习特征和目标之间的关系。目前,
maml
支持sklearn
和keras
模型。 -
应用:
a) pes
用于建模势能面,构建用于性质预测的代理模型。
i) 神经网络势(NNP) ii) 使用SOAP特征的高斯近似势(GAP) iii) 光谱邻域分析势(SNAP) iv) 矩张量势(MTP)
b) rfxas
用于使用随机森林模型从X射线吸收光谱预测原子局部环境。
c) bowsr
用于利用贝叶斯优化和代理能量模型进行快速结构弛豫。
安装
通过PyPI进行pip安装:
pip install maml
要运行势能面(pes),需要安装lammps,你可以从源代码安装或从conda
安装:
conda install -c conda-forge/label/cf202003 lammps
SNAP势包含在这个lammps安装中。运行相应的势需要GAP包(用于GAP)和MLIP包(用于MTP)。对于拟合NNP势,需要n2p2
包。
从requirement.txt文件安装所有库:
pip install -r requirements.txt
对于上述所有要求:
pip install -r requirements-ci.txt
pip install -r requirements-optional.txt
pip install -r requirements-dl.txt
pip install -r requirements.txt
使用
有许多关于使用的Jupyter笔记本。请参见notebooks。我们还在nanoHUB上提供了工具和教程讲座。
API文档
请参见API文档。
引用
@misc{
maml,
author = {Chen, Chi and Zuo, Yunxing, Ye, Weike, Ji, Qi and Ong, Shyue Ping},
title = {{Maml - materials machine learning package}},
year = {2020},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/materialsvirtuallab/maml}},
}
对于ML-IAP包(maml.pes
),请引用:
Zuo, Y.; Chen, C.; Li, X.; Deng, Z.; Chen, Y.; Behler, J.; Csányi, G.; Shapeev, A. V.; Thompson, A. P.;
Wood, M. A.; Ong, S. P. Performance and Cost Assessment of Machine Learning Interatomic Potentials.
J. Phys. Chem. A 2020, 124 (4), 731–745. https://doi.org/10.1021/acs.jpca.9b08723.
对于BOWSR包(maml.bowsr
),请引用:
Zuo, Y.; Qin, M.; Chen, C.; Ye, W.; Li, X.; Luo, J.; Ong, S. P. Accelerating Materials Discovery with Bayesian
Optimization and Graph Deep Learning. Materials Today 2021, 51, 126–135.
https://doi.org/10.1016/j.mattod.2021.08.012.
对于AtomSets模型(maml.models.AtomSets
),请引用:
Chen, C.; Ong, S. P. AtomSets as a hierarchical transfer learning framework for small and large materials
datasets. Npj Comput. Mater. 2021, 7, 173. https://doi.org/10.1038/s41524-021-00639-w