I catalizzatori al rodio convertono enantioselettivamente gli alcheni in idrogeno (idrogenazione) da mezzo secolo. Sono stati pubblicati molti articoli su questi tipi di catalizzatori e sul meccanismo di reazione sottostante, quindi ci si aspetterebbe che ci fosse una comprensione sofisticata di queste reazioni catalitiche. Ma non esiste ancora un modo semplice per selezionare rapidamente i ligandi appropriati per il proprio catalizzatore omogeneo quando si cambiano i substrati. Adarsh Kalikadien, Evgeny Pidko e colleghi della TU Delft e Janssen Pharmaceutica volevano vedere se potevano sviluppare un modello predittivo per questo utilizzando l’apprendimento automatico, ma il progetto si è rivelato diverso dal previsto.
“L’idea non era complicata”, afferma Kalikadian, uno studente di dottorato del gruppo Bidco. “Abbiamo creato un modello semplice della reazione utilizzando un catalizzatore al rodio molto noto. L’obiettivo era quello di creare modelli statistici per prevedere quali catalizzatori e ligandi avresti potuto utilizzare, in modo da aver bisogno di meno tentativi ed errori. Hanno utilizzato diversi modelli di apprendimento automatico su una serie di dati computazionali ed esperimenti ad alto rendimento hanno condotto Janssen.
casuale
Il team ha confrontato, tra le altre cose, le prestazioni di questi modelli. Kalikadin: “Abbiamo calcolato tutti i tipi di proprietà sulla base della chimica quantistica – i calcoli più densi e costosi – e dell’informatica chimica 2D e anche delle rappresentazioni 2D”. Queste proprietà sono rappresentazioni diverse dello stimolo visto dal modello. Come test, hanno anche aggiunto un set casuale, contenente 34 numeri casuali compresi tra -100 e 100. “La cosa strana è che tutti i modelli più semplici, compreso il modello random, hanno mostrato le stesse prestazioni della versione costosa e si sono rivelati completamente inutili;
“Abbiamo reso tutto open source.”
Qualcosa che non si rifletteva nel documento, ma che influenzava il progetto, era semplice Supervisione All’interno della squadra. “Sul computer, puoi disegnare la struttura 3D del catalizzatore che hai testato in determinate condizioni, quindi puoi eseguire calcoli DFT su di esso ed estrarne le proprietà”, afferma Kalikadin. “Ora abbiamo utilizzato i numeri CAS dei ligandi scopo. Ma quello di cui non ci rendevamo conto era che i numeri CAS e i disegni sulle fiale in laboratorio non corrispondevano alle nostre strutture 3D.
“Abbiamo passato mesi a discutere le funzionalità con il team e ad apportare miglioramenti, e alla fine abbiamo ottenuto calcoli davvero buoni ad un livello computazionale elevato”, continua il dottorando. Ma durante un certo incontro si scoprì che le strutture matematiche non indicavano le strutture corrette identificatori Per i dati sperimentali! Quindi abbiamo dovuto esaminare tutte queste strutture una per una per vedere dove c’erano cose sbagliate. Quando abbiamo elaborato le molecole corrette e creato un nuovo modello statistico, siamo rimasti sorpresi di ottenere quasi gli stessi risultati. Quindi una delle conclusioni è stata: per questo Fuori portata Approccio da modellista, non importa cosa ci metti dentro. Ciò indicava che il modello non aveva imparato molto dalla rappresentazione data. “Ripensandoci, possiamo riderci su, ma durante il progetto ci ho messo un po’ della mia sanità mentale”, dice ridendo.
Valutare
Doveva essere un progetto semplice, ma non è andato come previsto. “Ho trovato molti risultati un po’ deludenti”, ammette Kalikadin. Tuttavia, la ricerca – e soprattutto i dati che ha generato – si è rivelata estremamente preziosa, soprattutto alla luce della diffusione dell’apprendimento automatico. “Ecco perché abbiamo reso tutto open source. Non solo tutti i dati possono essere visualizzati, ma forniamo anche il codice, inclusi pacchetti e manuali, in modo che chiunque lo desideri possa fare lo stesso tipo di ricerca.”
Quindi hanno pubblicato uno dei set di dati più grandi per un tipo specifico di reazione di idrogenazione. “La pubblicazione era ancora una sfida. Si trattava di una ricerca molto approfondita su come funziona l’apprendimento automatico in chimica e non tutte le conclusioni erano positive. Ciò ha portato una rivista di alto profilo a rifiutare l’articolo perché riteneva che “non rientrasse in questo contesto”. .’ Per fortuna si è alzato.” Scienze chimiche Siamo più aperti ad esso, così possiamo mettere a disposizione i nostri dati, il codice e persino i numeri interattivi.
Significativo
E adesso? “La nostra rappresentazione non era così significativa come speravamo, quindi ora stiamo cercando una rappresentazione dello stimolo che sia forse meno semplicistica, ma comunque il più semplice possibile”, afferma Kalikadian. “Si vuole anche evitare che i costi diventino troppo elevati, quindi cerchiamo di incorporare più informazioni sul meccanismo di reazione nel modello senza renderlo troppo ampio, quindi una versione dinamica della rappresentazione.”
Nel frattempo, A. V. et al. (2024) Chimica e scienza,DOI: 10.1039/D4SK03647F
“Esploratore. Imprenditore impenitente. Fanatico dell’alcol. Scrittore certificato. Aspirante evangelista televisivo. Fanatico di Twitter. Studente. Studioso del web. Appassionato di viaggi.”