awesome-materials-informatics

awesome-materials-informatics

材料信息学全面资源集锦 助力数据驱动材料研究

本资源列表汇集了材料信息学领域的软件工具、云平台、数据集和标准化倡议。内容涵盖开源与商业解决方案,聚焦材料模拟、数据挖掘和机器学习等关键技术。研究人员可借此快速了解行业动态,为数据驱动的材料科学研究提供参考。

材料信息学数据科学开源软件机器学习计算材料学Github开源项目

超棒的材料信息学 Awesome

DOI

新兴的材料信息学学科是材料、计算机和数据科学的交叉领域。它旨在将当今相互竞争的物理密集型和数据密集型努力统一起来,服务于20世纪已经改变我们社会的最具影响力的应用科学。

欢迎贡献 - 请遵循指南

目录

软件和产品

  • AFLOW - 高通量从头计算(C++)。
  • AiiDA - 从头设计的自动化基础设施和数据库(Python)。
  • ASE - 原子模拟环境(Python)。
  • ASR - 基于ASE的原子模拟配方(Python)。
  • atomate - 基于FireWorks的材料科学工作流,由LBNL开发(Python)。
  • aviary - 使用成分和Wyckoff表示预测材料性质(Python)。
  • BIOVIA Materials Studio - 专有模拟基础设施。
  • CAMD - 用于材料发现的基于代理的序列学习软件(Python)。
  • cclib - 解析和解释计算化学软件包的结果(Python)。
  • cctbx - 计算晶体学工具箱(C++)。
  • CDVAE - 晶体扩散变分自编码器(CDVAE)通过逆向设计生成新的稳定材料(Python)。
  • CrabNet - 仅使用成分信息预测材料性质(Python)。
  • Crystal Toolkit - 用于构建材料科学网络应用的框架,为新的Materials Project网站提供支持。
  • Custodian - 简单、强大和灵活的即时(JIT)作业管理框架(Python)。
  • datamol - 简化分子操作。基于RDKit构建的轻量级封装(Python)。
  • ElMD - 使用元素移动距离量化两种成分之间的化学相似性。
  • FireWorks - 由LBNL开发的工作流引擎(Python)。
  • Granta MI - 专有的材料数据企业基础设施。
  • httk - 高通量工具包(Python)。
  • ICMD - QuesTek Innovations LLC提供的云端数字材料设计平台(专有)。
  • ioChem-BD - 管理计算化学大数据的解决方案(Java)。
  • MAST-ML - 旨在扩大和加速机器学习在材料科学研究中应用的开源Python包(Python)。
  • matador - 用于高通量DFT聚合和分析的库(Python)。
  • matbench - Matbench:材料科学性质预测基准(Python)。
  • matbench-genmetrics - 生成材料基准指标,灵感来自guacamolCDVAEPython)。
  • matminer - 材料科学数据挖掘库(Python)。
  • MatSciBERT - 用于文本挖掘和信息提取的材料领域语言模型(Python)。
  • mat_discover - 在化学空间中找到高性能候选物,仅基于成分(Python)。
  • MDCS - 材料数据管理系统(Python)。
  • MedeA - Materials Design, Inc.的专有计算Tcl环境。
  • MODNet - 选择最佳描述符并构建模型以预测材料性质(Python)。
  • mp-time-split - 使用Materials Project的基于时间的交叉验证分割进行生成模型基准测试(Python)。
  • NOMAD Oasis - 用于管理和共享材料数据的基于网络的软件(Python/JavaScript)。
  • OACIS - 使用Ruby on Rails网络服务器的模拟研究作业管理软件。
  • optimade-python-tools - OPTIMADE APIsPython工具。
  • piro - 评估帕累托最优合成路径的软件(Python)。
  • pyiron - 计算材料科学的集成开发环境(IDE)(Python)。
  • pymatflow - 材料(高通量)DFT建模工具箱(Python)。
  • Pymatgen - 用于材料分析的强大开源Python库。
  • Pymatviz - 材料信息学可视化工具包。
  • pymks - 材料知识系统(Python)。Github Stars
  • QMForge - 用于分析量子化学代码结果的Python框架和图形用户界面。
  • QMflows - 用于计算化学中输入生成和任务处理的Python库。Github Stars
  • qmpy - 创建和运行开放量子材料数据库的Python后端。Github Stars
  • quacc - 用于高通量、数据库驱动的计算材料科学和量子化学的Python平台。Github Stars
  • RDKit - 用C++Python编写的化学信息学和机器学习软件集合。Github Stars
  • SEAMM - 原子和分子建模仿真环境(Python)。Github Stars
  • SLAMD - 一个开源网络应用程序,通过数字实验室孪生和人工智能优化,加速水泥和混凝土开发(Python/JavaScript)。Github Stars
  • tilde - 用于从头计算数据存储库的Python框架。Github Stars
  • xtal2png - 用于将晶体结构可逆地表示为PNG图像的Python包,用于筛选最先进的图像处理生成模型。Github Stars

云仿真平台和人工智能初创公司

  • Absolidix - MPDS (PAULING FILE)与AiiDA框架的按需云材料仿真早期预览版。
  • AiiDAlab - 云端AiiDA的Web平台和图形界面(参见AiiDA框架)。
  • Ångström AI - 使用生成式人工智能加速分子模拟(美国加利福尼亚州)。
  • Atomic Tessellator - 来自新西兰的计算化学云和人工智能实验室。
  • Azure Quantum Elements - 微软的量子计算,包括生成化学和加速密度泛函理论。
  • Compular - 来自瑞典的新材料开发云平台。
  • CuspAI - 利用人工智能设计的材料应对气候变化(英国剑桥)。
  • Entalpic - 利用人工智能发现新化学过程和材料的公司(法国)。
  • LMDS - 利物浦材料发现服务器,为实验化学家提供寻找新材料的计算工具。
  • Mat3ra - 材料建模2.0(来自硅谷的云引擎)。
  • MatCloud - 中国材料基因工程项目的基于云的计算基础设施(中国)。
  • Materials Square - 第一性原理和CALPHAD模拟云(韩国)。
  • Matlantis - 加速材料发现平台(日本)。
  • Orbital Materials - 利用人工智能制造先进材料(英国)。
  • Radical AI - 加速材料研发(美国纽约)。
  • Quantistry Lab - 基于云的合成模拟、新材料设计、计算化学(德国)。
  • SIT Rolos - 沙夫豪森理工学院的材料研究平台(瑞士)。

机器可读材料数据集

  • AFLOW - 材料发现流程存储库(参见AFLOW框架)。
  • ATB - 自动拓扑构建器和存储库。
  • AtomWorkAtomWork-Adv - 日本物质·材料研究机构的数据平台(基于PAULING FILE实验数据库)。
  • 巴伊科夫冶金与材料科学研究所 - 俄罗斯科学院数据库。
  • 卡罗来纳材料数据库 - 南卡罗来纳大学的机器学习密度泛函理论数据库。
  • CascadesDB - 国际原子能机构的碰撞级联分子动力学模拟。
  • Catalysis Hub - 用于共享计算催化研究数据和软件的Web平台。
  • cccbdb - 计算化学比较和基准数据库。
  • CCDC - 剑桥晶体学数据中心(部分专有)。
  • Citrination - 人工智能驱动的材料数据平台(部分专有)。
  • CMR - 计算材料存储库(参见ASE框架)。
  • COD - 晶体学开放数据库(包括理论数据库)。
  • ESP - 电子结构项目。
  • HybriD3材料数据库 - 晶体有机-无机化合物的综合实验和计算材料数据集合。
  • ICSD - 无机晶体结构数据库(部分专有)。
  • JARVIS - 各种集成模拟的联合自动化存储库(美国国家标准与技术研究院)。
  • Khazana - 原子模拟创建数据的存储库,还包括聚合物基因组。
  • Materials Cloud - 开放材料科学平台(参见AiiDA框架)。
  • 中国材料基因工程数据库 - 国家集成平台(参见MatCloud)。
  • MaterialsMine - 纳米复合材料数据(NanoMine)和机械超材料数据(MetaMine)的开源存储库。
  • Materials Project - 已知和预测材料的计算信息(参见Pymatgen框架)。
  • MDF - 材料数据设施,专门为支持材料科学研究人员而构建的一系列数据服务。
  • MolSSI - MolSSI量子化学档案。
  • MPDS - 材料数据科学平台(基于PAULING FILE实验数据库,部分专有)。
  • MPOD - 材料性质开放数据库。
  • MSE - 材料科学与工程测试集。
  • nanoHUB - 计算纳米技术研究、教育和协作的场所。
  • NOMAD - 新材料发现、存储库和实验室(参见NOMAD Oasis)。
  • NREL MatDB - 可再生能源应用材料热化学和电子性质的计算数据库。
  • 有机材料数据库 - 三维有机晶体的电子结构数据库(Nordita)。
  • 开放材料数据库 - 基于第一性原理计算的材料基因组类型存储库(参见httk框架)。
  • OpenKIM - 原子间势实现和测试计算协议的存储库。
  • OQMD - 开放量子材料数据库(参见qmpy框架)。
  • 京都大学声子数据库 - 计算声子能带结构、态密度和热性质。
  • 匹兹堡量子存储库 - 基于量子力学预测的分子性质。
  • ROD - 拉曼开放数据库。
  • 拓扑材料数据库 - 高质量拓扑材料的完整目录。

标准化倡议

  • 蓝方尖碑 - 化学和材料科学中开放数据、开源和开放标准的运动(由Murray-Rust发起)。
  • CIF - 晶体学信息文件,晶体学信息的标准(由国际晶体学联合会IUCr制定)。
  • CML - 化学标记语言:分子、化合物、反应、光谱、晶体等(由Murray-Rust发起)。
  • ColabFit - 用于开发和分发最先进的数据驱动原子间势(DDIPs)的协作基础设施。
  • EMMO - 欧洲材料建模本体。
  • ESCDF - 电子结构通用数据格式。
  • ESSE - 为数字材料科学设计的Exabyte模式和示例来源。
  • GEMD - 材料数据的图形表达(由Citrine开发),取代PIF。
  • JCAMP-DX - 化学和光谱信息的电子数据标准(由国际纯粹与应用化学联合会IUPAC制定)。
  • KIM API - 连接分子模拟代码与原子间模型的API标准。
  • NOMAD元信息 - 用于存储第一性原理和力场原子模拟结果的模式(由NOMAD实验室开发)。
  • OPTIMADE - 材料设计开放数据库集成,用于交换材料信息的REST API标准。
  • PIF - 物理信息文件模式(由Citrine开发),被GEMD取代。
  • 材料科学语义资产 - 研究数据联盟词汇服务兴趣小组内的任务组。
  • 开放力场工具包 - 编码分子力学力场的规范(由开放力场倡议开发)。

类似汇编

许可证

CC0

编辑推荐精选

AEE

AEE

AI Excel全自动制表工具

AEE 在线 AI 全自动 Excel 编辑器,提供智能录入、自动公式、数据整理、图表生成等功能,高效处理 Excel 任务,提升办公效率。支持自动高亮数据、批量计算、不规则数据录入,适用于企业、教育、金融等多场景。

UI-TARS-desktop

UI-TARS-desktop

基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。

UI-TARS-desktop 是一款功能强大的桌面应用,基于 UI-TARS(视觉语言模型)构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。

Wan2.1

Wan2.1

开源且先进的大规模视频生成模型项目

Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。

爱图表

爱图表

全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表

爱图表(aitubiao.com)就是AI图表,是由镝数科技推出的一款创新型智能数据可视化平台,专注于为用户提供便捷的图表生成、数据分析和报告撰写服务。爱图表是中国首个在图表场景接入DeepSeek的产品。通过接入前沿的DeepSeek系列AI模型,爱图表结合强大的数据处理能力与智能化功能,致力于帮助职场人士高效处理和表达数据,提升工作效率和报告质量。

Qwen2.5-VL

Qwen2.5-VL

一款强大的视觉语言模型,支持图像和视频输入

Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。

HunyuanVideo

HunyuanVideo

HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。

HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。

WebUI for Browser Use

WebUI for Browser Use

一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。

WebUI for Browser Use 是一个强大的项目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。

xiaozhi-esp32

xiaozhi-esp32

基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。

xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。

olmocr

olmocr

一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。

olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。

飞书多维表格

飞书多维表格

飞书多维表格 ×DeepSeek R1 满血版

飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。

下拉加载更多