Metaは、AIによる分子・材料科学研究を加速するため、過去最大規模の公開データセット「OMol25」と、汎用AIモデル「UMA(Universal Model for Atoms)」を発表した。
OMol25は、1億件以上の高精度な分子計算データから構成されており、生成には60億時間以上のスーパーコンピュータ稼働時間が費やされた。データには有機化合物やタンパク質断片、DNA、金属錯体、電解質など多様な分子が含まれ、電荷状態やスピン状態、立体配座、化学反応の情報も網羅している。OMol25は、創薬、電池材料、触媒研究など幅広い用途でのAI学習に活用可能で、Hugging Face上で公開されている。
同時に発表されたUMAは、OMol25を活用して訓練された新たなAIモデルで、従来の専用モデルより高速かつ高精度で分子・材料の特性を予測する。分子シミュレーションから材料設計、触媒反応解析まで幅広い応用に対応でき、UMAを使えば従来数日かかっていた解析が数秒で可能になるという。
また、Metaは「Adjoint Sampling」という新しい分子構造生成手法も導入。現実世界に例のない分子構造を少ない計算で予測できるこの技術により、柔軟性の高い分子でも高精度な構造探索が可能になるとされる。
UMAのモデルやコードもHugging FaceとGitHub上で公開されている。
※本記事は、以下の記事をもとに翻訳・要約しています。
THE DECODER「Meta introduces OMol25 and UMA, new open AI tools for molecular research」
コメント
Metaが発表したOMol25とUMAは、AIと化学の融合を大きく前進させる革新的な取り組みです。特に、創薬や次世代電池、材料設計の分野では、これまで時間とコストがかかっていた分子解析を大幅に効率化できる可能性があります。分子の挙動を高速かつ正確に予測できるAIが、未来の科学研究のスタンダードになる日は近いかもしれません。