材料科学是能源、电子等领域的核心驱动力,但传统研究方法(如量子计算模拟)成本高、耗时长,AI模型虽能加速预测,却难以结合科学语境与人类交互。最近,伯克利实验室团队 提出全新多模态大模型 MatterChat,一举突破两大瓶颈——精准预测材料属性 + 自然语言交互,性能甚至超越GPT-4!

MatterChat是什么?

MatterChat是首个融合原子结构数据与自然语言的AI模型,堪称材料科学家的“全能助手”:

  • 输入:用户用文字提问(如“这种材料的带隙是多少?”),同时输入材料原子结构图。

  • 输出:直接生成答案(如带隙数值、稳定性分析),甚至能设计合成步骤!


三大核心技术

  1. 多模态架构

    •     1、材料结构分支:用预训练模型CHGNet解析原子结构图,提取高精度嵌入特征。


    •     2、语言分支:基于Mistral 7B大模型理解文本问题。

    •     3、桥接模型:通过多模态对齐技术,将结构特征“翻译”成语言模型能理解的信号。


  2. 海量数据集
    基于Materials Project数据库,涵盖14万+材料结构,覆盖元素周期表至钚元素,支持12种任务(如带隙预测、磁性分类)。

  3. 检索增强生成(RAG)
    通过相似材料检索聚合结果,预测误差降低20%!

  4. 这种检索是基于样本材料的嵌入和池中的嵌入之间的L2相似性。之后,通过对分类任务应用多数投票策略并对定量任务进行平均,将所有三个结果聚合以获得最终输出。这种方法可以进一步增强MatterChat跨不同任务的整体鲁棒性。可视化方法的细节在方法部分提供。



下图展示了与MatterChat交互的例子

MatterChat有能力解决从预训练的LLM继承的更复杂的任务。



性能吊打现有模型

  • 分类任务(如金属性判断):准确率超物理模型SchNet、CHGNet,碾压Vicuna等通用LLM。

  • 数值预测(如形成能):误差比传统模型低30%,远超GPT-4、Gemini等商业模型。

  • 科学推理:能解释“为何某硅结构不稳定”,还能生成GaN(氮化镓)的合成步骤,堪比专业文献!




应用场景

  • 新材料发现:快速筛选稳定材料,缩短研发周期。

  • 教育科普:学生输入结构图,AI即时解答属性问题。

  • 工业设计:为企业定制合成方案,降低试错成本。


未来展望

团队计划扩展数据多样性、优化模型对齐,并探索材料生成功能。未来,MatterChat或成材料领域“ChatGPT”,推动AI驱动的新材料革命!



总结:MatterChat不仅“懂结构”还“会说话”,让材料研究告别繁琐计算,拥抱智能交互!


MatterChat: A Multi-Modal LLM for Material Science. 

Lawrence Berkeley National Laboratory和清华大学联合发表的论文。


点击扫码分享至微信