awesome-materials-informatics

awesome-materials-informatics

材料信息学全面资源集锦 助力数据驱动材料研究

本资源列表汇集了材料信息学领域的软件工具、云平台、数据集和标准化倡议。内容涵盖开源与商业解决方案,聚焦材料模拟、数据挖掘和机器学习等关键技术。研究人员可借此快速了解行业动态,为数据驱动的材料科学研究提供参考。

材料信息学数据科学开源软件机器学习计算材料学Github开源项目

超棒的材料信息学 Awesome

DOI

新兴的材料信息学学科是材料、计算机和数据科学的交叉领域。它旨在将当今相互竞争的物理密集型和数据密集型努力统一起来,服务于20世纪已经改变我们社会的最具影响力的应用科学。

欢迎贡献 - 请遵循指南

目录

软件和产品

  • AFLOW - 高通量从头计算(C++)。
  • AiiDA - 从头设计的自动化基础设施和数据库(Python)。
  • ASE - 原子模拟环境(Python)。
  • ASR - 基于ASE的原子模拟配方(Python)。
  • atomate - 基于FireWorks的材料科学工作流,由LBNL开发(Python)。
  • aviary - 使用成分和Wyckoff表示预测材料性质(Python)。
  • BIOVIA Materials Studio - 专有模拟基础设施。
  • CAMD - 用于材料发现的基于代理的序列学习软件(Python)。
  • cclib - 解析和解释计算化学软件包的结果(Python)。
  • cctbx - 计算晶体学工具箱(C++)。
  • CDVAE - 晶体扩散变分自编码器(CDVAE)通过逆向设计生成新的稳定材料(Python)。
  • CrabNet - 仅使用成分信息预测材料性质(Python)。
  • Crystal Toolkit - 用于构建材料科学网络应用的框架,为新的Materials Project网站提供支持。
  • Custodian - 简单、强大和灵活的即时(JIT)作业管理框架(Python)。
  • datamol - 简化分子操作。基于RDKit构建的轻量级封装(Python)。
  • ElMD - 使用元素移动距离量化两种成分之间的化学相似性。
  • FireWorks - 由LBNL开发的工作流引擎(Python)。
  • Granta MI - 专有的材料数据企业基础设施。
  • httk - 高通量工具包(Python)。
  • ICMD - QuesTek Innovations LLC提供的云端数字材料设计平台(专有)。
  • ioChem-BD - 管理计算化学大数据的解决方案(Java)。
  • MAST-ML - 旨在扩大和加速机器学习在材料科学研究中应用的开源Python包(Python)。
  • matador - 用于高通量DFT聚合和分析的库(Python)。
  • matbench - Matbench:材料科学性质预测基准(Python)。
  • matbench-genmetrics - 生成材料基准指标,灵感来自guacamolCDVAEPython)。
  • matminer - 材料科学数据挖掘库(Python)。
  • MatSciBERT - 用于文本挖掘和信息提取的材料领域语言模型(Python)。
  • mat_discover - 在化学空间中找到高性能候选物,仅基于成分(Python)。
  • MDCS - 材料数据管理系统(Python)。
  • MedeA - Materials Design, Inc.的专有计算Tcl环境。
  • MODNet - 选择最佳描述符并构建模型以预测材料性质(Python)。
  • mp-time-split - 使用Materials Project的基于时间的交叉验证分割进行生成模型基准测试(Python)。
  • NOMAD Oasis - 用于管理和共享材料数据的基于网络的软件(Python/JavaScript)。
  • OACIS - 使用Ruby on Rails网络服务器的模拟研究作业管理软件。
  • optimade-python-tools - OPTIMADE APIsPython工具。
  • piro - 评估帕累托最优合成路径的软件(Python)。
  • pyiron - 计算材料科学的集成开发环境(IDE)(Python)。
  • pymatflow - 材料(高通量)DFT建模工具箱(Python)。
  • Pymatgen - 用于材料分析的强大开源Python库。
  • Pymatviz - 材料信息学可视化工具包。
  • pymks - 材料知识系统(Python)。Github Stars
  • QMForge - 用于分析量子化学代码结果的Python框架和图形用户界面。
  • QMflows - 用于计算化学中输入生成和任务处理的Python库。Github Stars
  • qmpy - 创建和运行开放量子材料数据库的Python后端。Github Stars
  • quacc - 用于高通量、数据库驱动的计算材料科学和量子化学的Python平台。Github Stars
  • RDKit - 用C++Python编写的化学信息学和机器学习软件集合。Github Stars
  • SEAMM - 原子和分子建模仿真环境(Python)。Github Stars
  • SLAMD - 一个开源网络应用程序,通过数字实验室孪生和人工智能优化,加速水泥和混凝土开发(Python/JavaScript)。Github Stars
  • tilde - 用于从头计算数据存储库的Python框架。Github Stars
  • xtal2png - 用于将晶体结构可逆地表示为PNG图像的Python包,用于筛选最先进的图像处理生成模型。Github Stars

云仿真平台和人工智能初创公司

  • Absolidix - MPDS (PAULING FILE)与AiiDA框架的按需云材料仿真早期预览版。
  • AiiDAlab - 云端AiiDA的Web平台和图形界面(参见AiiDA框架)。
  • Ångström AI - 使用生成式人工智能加速分子模拟(美国加利福尼亚州)。
  • Atomic Tessellator - 来自新西兰的计算化学云和人工智能实验室。
  • Azure Quantum Elements - 微软的量子计算,包括生成化学和加速密度泛函理论。
  • Compular - 来自瑞典的新材料开发云平台。
  • CuspAI - 利用人工智能设计的材料应对气候变化(英国剑桥)。
  • Entalpic - 利用人工智能发现新化学过程和材料的公司(法国)。
  • LMDS - 利物浦材料发现服务器,为实验化学家提供寻找新材料的计算工具。
  • Mat3ra - 材料建模2.0(来自硅谷的云引擎)。
  • MatCloud - 中国材料基因工程项目的基于云的计算基础设施(中国)。
  • Materials Square - 第一性原理和CALPHAD模拟云(韩国)。
  • Matlantis - 加速材料发现平台(日本)。
  • Orbital Materials - 利用人工智能制造先进材料(英国)。
  • Radical AI - 加速材料研发(美国纽约)。
  • Quantistry Lab - 基于云的合成模拟、新材料设计、计算化学(德国)。
  • SIT Rolos - 沙夫豪森理工学院的材料研究平台(瑞士)。

机器可读材料数据集

  • AFLOW - 材料发现流程存储库(参见AFLOW框架)。
  • ATB - 自动拓扑构建器和存储库。
  • AtomWorkAtomWork-Adv - 日本物质·材料研究机构的数据平台(基于PAULING FILE实验数据库)。
  • 巴伊科夫冶金与材料科学研究所 - 俄罗斯科学院数据库。
  • 卡罗来纳材料数据库 - 南卡罗来纳大学的机器学习密度泛函理论数据库。
  • CascadesDB - 国际原子能机构的碰撞级联分子动力学模拟。
  • Catalysis Hub - 用于共享计算催化研究数据和软件的Web平台。
  • cccbdb - 计算化学比较和基准数据库。
  • CCDC - 剑桥晶体学数据中心(部分专有)。
  • Citrination - 人工智能驱动的材料数据平台(部分专有)。
  • CMR - 计算材料存储库(参见ASE框架)。
  • COD - 晶体学开放数据库(包括理论数据库)。
  • ESP - 电子结构项目。
  • HybriD3材料数据库 - 晶体有机-无机化合物的综合实验和计算材料数据集合。
  • ICSD - 无机晶体结构数据库(部分专有)。
  • JARVIS - 各种集成模拟的联合自动化存储库(美国国家标准与技术研究院)。
  • Khazana - 原子模拟创建数据的存储库,还包括聚合物基因组。
  • Materials Cloud - 开放材料科学平台(参见AiiDA框架)。
  • 中国材料基因工程数据库 - 国家集成平台(参见MatCloud)。
  • MaterialsMine - 纳米复合材料数据(NanoMine)和机械超材料数据(MetaMine)的开源存储库。
  • Materials Project - 已知和预测材料的计算信息(参见Pymatgen框架)。
  • MDF - 材料数据设施,专门为支持材料科学研究人员而构建的一系列数据服务。
  • MolSSI - MolSSI量子化学档案。
  • MPDS - 材料数据科学平台(基于PAULING FILE实验数据库,部分专有)。
  • MPOD - 材料性质开放数据库。
  • MSE - 材料科学与工程测试集。
  • nanoHUB - 计算纳米技术研究、教育和协作的场所。
  • NOMAD - 新材料发现、存储库和实验室(参见NOMAD Oasis)。
  • NREL MatDB - 可再生能源应用材料热化学和电子性质的计算数据库。
  • 有机材料数据库 - 三维有机晶体的电子结构数据库(Nordita)。
  • 开放材料数据库 - 基于第一性原理计算的材料基因组类型存储库(参见httk框架)。
  • OpenKIM - 原子间势实现和测试计算协议的存储库。
  • OQMD - 开放量子材料数据库(参见qmpy框架)。
  • 京都大学声子数据库 - 计算声子能带结构、态密度和热性质。
  • 匹兹堡量子存储库 - 基于量子力学预测的分子性质。
  • ROD - 拉曼开放数据库。
  • 拓扑材料数据库 - 高质量拓扑材料的完整目录。

标准化倡议

  • 蓝方尖碑 - 化学和材料科学中开放数据、开源和开放标准的运动(由Murray-Rust发起)。
  • CIF - 晶体学信息文件,晶体学信息的标准(由国际晶体学联合会IUCr制定)。
  • CML - 化学标记语言:分子、化合物、反应、光谱、晶体等(由Murray-Rust发起)。
  • ColabFit - 用于开发和分发最先进的数据驱动原子间势(DDIPs)的协作基础设施。
  • EMMO - 欧洲材料建模本体。
  • ESCDF - 电子结构通用数据格式。
  • ESSE - 为数字材料科学设计的Exabyte模式和示例来源。
  • GEMD - 材料数据的图形表达(由Citrine开发),取代PIF。
  • JCAMP-DX - 化学和光谱信息的电子数据标准(由国际纯粹与应用化学联合会IUPAC制定)。
  • KIM API - 连接分子模拟代码与原子间模型的API标准。
  • NOMAD元信息 - 用于存储第一性原理和力场原子模拟结果的模式(由NOMAD实验室开发)。
  • OPTIMADE - 材料设计开放数据库集成,用于交换材料信息的REST API标准。
  • PIF - 物理信息文件模式(由Citrine开发),被GEMD取代。
  • 材料科学语义资产 - 研究数据联盟词汇服务兴趣小组内的任务组。
  • 开放力场工具包 - 编码分子力学力场的规范(由开放力场倡议开发)。

类似汇编

许可证

CC0

编辑推荐精选

Manus

Manus

全面超越基准的 AI Agent助手

Manus 是一款通用人工智能代理平台,能够将您的创意和想法迅速转化为实际成果。无论是定制旅行规划、深入的数据分析,还是教育支持与商业决策,Manus 都能高效整合信息,提供精准解决方案。它以直观的交互体验和领先的技术,为用户开启了一个智慧驱动、轻松高效的新时代,让每个灵感都能得到完美落地。

飞书知识问答

飞书知识问答

飞书官方推出的AI知识库 上传word pdf即可部署AI私有知识库

基于DeepSeek R1大模型构建的知识管理系统,支持PDF、Word、PPT等常见文档格式解析,实现云端与本地数据的双向同步。系统具备实时网络检索能力,可自动关联外部信息源,通过语义理解技术处理结构化与非结构化数据。免费版本提供基础知识库搭建功能,适用于企业文档管理和个人学习资料整理场景。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

TraeAI IDE协作生产力转型热门AI工具
酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

使用教程AI工具酷表ChatExcelAI智能客服AI营销产品
DeepEP

DeepEP

DeepSeek开源的专家并行通信优化框架

DeepEP是一个专为大规模分布式计算设计的通信库,重点解决专家并行模式中的通信瓶颈问题。其核心架构采用分层拓扑感知技术,能够自动识别节点间物理连接关系,优化数据传输路径。通过实现动态路由选择与负载均衡机制,系统在千卡级计算集群中维持稳定的低延迟特性,同时兼容主流深度学习框架的通信接口。

DeepSeek

DeepSeek

全球领先开源大模型,高效智能助手

DeepSeek是一家幻方量化创办的专注于通用人工智能的中国科技公司,主攻大模型研发与应用。DeepSeek-R1是开源的推理模型,擅长处理复杂任务且可免费商用。

KnowS

KnowS

AI医学搜索引擎 整合4000万+实时更新的全球医学文献

医学领域专用搜索引擎整合4000万+实时更新的全球医学文献,通过自主研发AI模型实现精准知识检索。系统每日更新指南、中英文文献及会议资料,搜索准确率较传统工具提升80%,同时将大模型幻觉率控制在8%以下。支持临床建议生成、文献深度解析、学术报告制作等全流程科研辅助,典型用户反馈显示每周可节省医疗工作者70%时间。

Windsurf Wave 3

Windsurf Wave 3

Windsurf Editor推出第三次重大更新Wave 3

新增模型上下文协议支持与智能编辑功能。本次更新包含五项核心改进:支持接入MCP协议扩展工具生态,Tab键智能跳转提升编码效率,Turbo模式实现自动化终端操作,图片拖拽功能优化多模态交互,以及面向付费用户的个性化图标定制。系统同步集成DeepSeek、Gemini等新模型,并通过信用点数机制实现差异化的资源调配。

AI IDE
腾讯元宝

腾讯元宝

腾讯自研的混元大模型AI助手

腾讯元宝是腾讯基于自研的混元大模型推出的一款多功能AI应用,旨在通过人工智能技术提升用户在写作、绘画、翻译、编程、搜索、阅读总结等多个领域的工作与生活效率。

AI 办公助手AI对话AI助手AI工具腾讯元宝智能体热门
Grok3

Grok3

埃隆·马斯克旗下的人工智能公司 xAI 推出的第三代大规模语言模型

Grok3 是由埃隆·马斯克旗下的人工智能公司 xAI 推出的第三代大规模语言模型,常被马斯克称为“地球上最聪明的 AI”。它不仅是在前代产品 Grok 1 和 Grok 2 基础上的一次飞跃,还在多个关键技术上实现了创新突破。

下拉加载更多