マイクロソフトのMatterGen - 生成型AIに基づく材料発見ツール

マイクロソフトは最近、「MatterGen: A new paradigm of materials design with generative AI」という研究ブログを公開しました。今日は、時間をとって読んでみました。

MatterGenは『ネイチャー』に最近発表され、マイクロソフトのチームが共有した生成AIに基づく材料発見ツールです。従来の候補材料のスクリーニングとは異なり、MatterGenはアプリケーションの設計要件に基づいて新しい材料を直接生成します。

MatterGenは、特定の化学的、機械的、電気的または磁気的な特性を持つ材料を入力された設計要件に基づいて生成できますし、複数の異なる制約条件を同時に満たすことも可能です。

MatterGen:新しい安定な材料を生成する拡散モデル

MatterGenは拡散モデルに基づいたツールで、主に材料の三次元幾何構造を処理するために設計されています。画像拡散モデルがノイズのある画像のピクセル色を変更して画像を生成するのと同様に、MatterGenはランダム構造内の位置、要素、周期的格子を調整することで必要な材料構造を生成します。

この拡散アーキテクチャは材料の特徴に最適化されており、材料の周期性や三次元幾何特性を効果的に処理できます。MatterGenは異なる設計要件に応じて微調整され、特定の化学組成、結晶対称性、または材料性能を満たす材料を生成することができます。この革新により、MatterGenは設計要件に適合する材料構造をより正確に生成することが可能です。

MatterGenのパフォーマンス展示と最適化

MatterGenのベースモデルは、新しい、安定した、多様な材料を生成する能力において業界をリードしています。パフォーマンスの向上は、アーキテクチャの革新だけでなく、訓練データの質と規模にも起因しています。

MatterGenは他の方法と比較して、安定でユニークかつ新しい材料構造を生成する能力を持っています。各手法の訓練データセットは括弧内に記載されています。紫色の棒グラフはMatterGenアーキテクチャ自体によるパフォーマンス向上を示しており、青緑色の棒グラフは大規模な訓練データセットによってもたらされるパフォーマンス向上を示しています。

MatterGenの伝統的なスクリーニング手法に対する主要な利点は、未知の材料空間全体を探索できることです。下図のように、MatterGenは高体積弾性率(400 GPa以上)を満たす革新的な候補材料を継続的に生成できます。このような材料は通常圧縮が困難です。一方で、既知の候補材料に依存するため、従来のスクリーニング手法は性能が飽和しやすく、新しい材料の発見が困難です。

MatterGen(青緑色)と従来のスクリーニング手法(黄色)の比較では、体積弾性率が400 GPaを超える安定で新規かつユニークな材料構造を生成する能力が示されています。

成分無秩序問題への対処

成分無秩序は合成材料における一般的な現象であり、異なる原子がその結晶学的位置をランダムに交換できる状態を指します。近年、計算材料設計の文脈で「新規性」とみなされるべき材料とは何かについて議論が始まっています。伝統的なアルゴリズムは、単に類似元素が格子位置での配置順序が異なるだけで区別できない構造対を識別できません。

この問題を解決するために、MatterGenは成分無秩序を考慮した新しい構造マッチングアルゴリズムを提案しました。このアルゴリズムは、一対の構造が同一の成分無秩序構造の有序近似形式として認識されるかどうかを判断します。これにより、新規性と独自性の新しい定義が提供され、それが私たちの計算評価基準に組み込まれています。

上図は成分無秩序の概念図です。左:成分無秩序のない完全な結晶で、繰り返し単位胞があります(黒い破線)。右:成分無秩序を持つ結晶で、各位置には黄色または青緑色の原子が50%の確率で存在します。

実験室での検証

広範な計算評価に加え、チームは実験合成を通じてMatterGenの能力を検証しました。

実験検証で提案された化合物TaCr₂O₆。図中では、科学者が実験台で操作を行い、つweedで小さなサンプルを持っています。

その構造は、MatterGenが体積弾性率値200 GPaの条件下で生成したものです。合成材料の構造はMatterGenが提案した構造と一致しており、唯一の違いはTaとCr間の成分無秩序です。さらに、チームの実験測定値は体積弾性率169 GPaで、設計仕様の200 GPaに対して相対誤差は20%未満であり、実験的には非常に近い結果です。この結果が他の分野にも適用可能であれば、バッテリーや燃料電池などの材料設計に大きな影響を与えるでしょう。

AIシミュレーターとジェネレーターのフィードバックループ

MatterSimは、幅広い元素、温度、圧力範囲内で正確かつ効率的に材料シミュレーションと性能予測を行う深層学習モデルです。MatterSimは科学発見の第五のパラダイムに従っており、材料特性のシミュレーション速度を大幅に加速します。一方、MatterGenはプロパティガイド生成を通じて新材料候補の探索速度を加速します。MatterGenとMatterSimは協調して働き、新材料のシミュレーションと探索を同時に加速するフィードバックループ効果を形成します。

科学発見の五つのパラダイム

  • 第一パラダイム:経験的観察(Empirical Observation)
  • 第二パラダイム:理論モデル(Theoretical Models)
  • 第三パラダイム:数値計算(Numerical Computation)
  • 第四パラダイム:データ駆動型科学発見(Data-Intensive Scientific Discovery)
  • 第五パラダイム:機械学習と人工知能(AI-Driven Scientific Discovery)

未来への展望

MatterGenは、生成AI技術によって推進される材料設計の新しいパラダイムを代表しています。これは、スクリーニングベースの手法を超えて広範な材料空間を探索します。さらに、材料探索を導くことで、MatterGenは効率面でも優れています。生成AIが薬物発見分野に与えた影響と同様に、MatterGenはバッテリー、磁石、燃料電池など広範な分野における材料設計に深い影響を与えます。