Naukowcy z dziedziny chemii informatycznej opracowali ReactionAtlas - system który automatycznie odkrywa sieci reakcji chemicznych, mapując grafy ze stanami pośrednimi, przejściami a połączeniami między nimi. Dotychczasowe podejścia były niepraktyczne, wymagały ręcznego wskazania substratów i produktów, a tradycyjne obliczenia w oparciu o teorię funkcjonału gęstości (DFT) były zbyt wolne nawet dla małych molekuł.

ReactionAtlas rozwiązuje ten problem kombinacją uczenia maszynowego i chemii obliczeniowej. System pracuje iteracyjnie: model generatywny trenowany maszynowo proponuje potencjalne reakcje ze zboru kandydatów, pole siłowe uczony maszynowo (MLFF) trenowane na danych DFT weryfikuje, które stanów przejściowe są chemicznie prawidłowe, a powstałe produkty stają się nowymi punktami wyjścia dla kolejnych odkryć. Zaczynając od zaledwie ośmiu prebiotycznych cząsteczek (woda, dwutlenek węgla, hydroksyd, jony hydronium i formian), system ujawnił około 47 tys. reakcji między 12 tys. różnymi związkami chemicznymi.

Ważne jest że algorytm działa bez ręcznych reguł syntezowych czy predefiniowanych schematów transformacji chemicznych. Dokładność obliczeniowa jest zadowalająca - w 85 proc. przypadków struktury stanów przejściowych zgadzają się z referencyjnymi obliczeniami PBE0 z tolerancją 0,5 angstroma. Odkrycia obejmują całą chemiję cukrów prostych aż do cząsteczek C4H8O4, przechowując informacje o ładunkach i stereochemii. To potencjalnie przyspieszałoby badania nad pochodzeniem życia, katalizą i spalaniem, gdzie mapowanie tak obszernych sieci chemicznych jest kluczowe dla zrozumienia złożonych procesów.