纯计算JACS:基于神经网络和迁移学习的氧化物能带对齐预测新方法

研究背景:
半导体、绝缘体和介电材料的能带对齐是影响其表面性质和器件结构的关键因素。其中,电离势和电子亲和力是描述材料表面能带位置相对真空能级的基础物理量。准确而系统地确定这些关键参数,需要进行大量精细的实验测量或理论模拟。
随着机器学习在材料科学领域的广泛应用,基于高通量第一性原理计算的虚拟筛选已成为一种高效的材料探索方法。本文作者利用约3000个氧化物表面的第一性原理计算数据,构建了一个准确预测非金属氧化物能带对齐的神经网络模型。该模型仅需输入材料的体相结构和表面取向信息,就可直接给出relaxed表面的电离势和电子亲和力,大大减少了实验测量和理论计算的工作量。
此外,作者还进一步拓展了这一方法,使其可以适用于多阳离子氧化物体系,并通过迁移学习的方式将模型成功应用于三元氧化物,大幅提高了预测精度。这种结合理论计算和机器学习的方法,为系统理解和探索各种氧化物表面性质开辟了全新的道路。
主要创新点:基于高通量第一性原理计算数据,构建了一个准确预测非金属氧化物电离势和电子亲和力的神经网络模型。该模型只需输入材料的体相结构和表面取向信息,就可直接给出relaxed表面的这两个关键参数,大幅提高了计算效率。
为了应对多阳离子氧化物体系,作者开发了一种"可学习"的原子环境描述符(SOAP),在降低描述符维度的同时保留了对原子物种的区分能力。这种SOAP不仅可以更好地描述复杂的氧化物结构,还使得模型可以直接应用于三元氧化物体系。
通过迁移学习的方式,将在二元氧化物上训练的模型成功应用于三元氧化物,大幅提高了预测精度,特别是对于电子亲和力的预测。这种迁移学习策略为机器学习模型在不同材料体系间的转移应用提供了有效范例。






研究结论:
基于SOAP描述符的神经网络模型可以准确预测二元氧化物relaxed表面的电离势和电子亲和力,其R^2值分别达到0.90和0.93,均方根误差也仅为0.29eV和0.27eV。这种性能远优于单纯使用结构信息的简单神经网络模型。
引入可学习加权的SOAP(L-SOAP),不仅大幅降低了描述符维度,还赋予了对不同元素的区分能力。结合注意力机制,L-SOAP模型在预测三元氧化物性质时也表现出色,在10%训练数据条件下,电子亲和力的预测精度就能达到70%训练数据条件下常规注意力机制模型的水平。

通过在二元氧化物数据上预训练,再在三元氧化物数据上fine-tune,实现了从二元到三元的迁移学习。这不仅大幅提高了模型在三元体系的预测精度,也为机器学习模型在不同材料体系间的转移应用提供了有效范例。
该模型不仅可以准确预测氧化物表面的电离势和电子亲和力,还可以自动识别对这些性质贡献最大的表面原子位点。这为深入理解氧化物表面化学物理性质提供了新的分析工具。
总的来说,本文提出的基于神经网络和迁移学习的能带预测新方法,不仅大幅提高了计算效率,而且可以广泛应用于多种oxide体系,为材料表界面性质的高通量筛选和系统理解开辟了新的道路。这种结合理论计算和机器学习的创新模式,必将在未来材料科学研究中发挥重要作用。