come la struttura diventa proprietà: il mondo dei descrittori molecolari

Print Friendly, PDF & Email

Uno dei concetti fondanti della chimica è quello che riguarda le relazioni fra la struttura (in pratica la costituzione e la forma esatte) di una molecola e le sue proprietà o caratteristiche.

Alla domanda che talvolta mi viene posta “quali proprietà?”, rispondo con un minimo di provocazione costruttiva: tutte!. …da quelle fisiche (come il punto di ebollizione, la solubilità in acqua, la polarità, ecc) a quelle reattive (es. capacità di reagire in un certo modo con certe altre sostanze), fino a quelle biologiche (es. tossicità, proprietà farmacologiche, assimilabilità, ecc) o sensoriali (colore, odore, sapore, ecc).

Tali relazioni struttura-proprietà sono infatti:
1) univoche
2) calcolabili

descrizione_molecolare Univoche in quanto ad una data struttura molecolare corrispondono alcune proprietà ben specifiche, ovvero un ben preciso valore numerico assunto dalla variabili fisiche implicate (es. un certo punto di fusione) ma anche una ben preciso set di proprietà qualitative ed osservabili (es. un certo colore del prodotto sciolto in acqua, un ben preciso profumo della sostanza pura).
Mentre ovviamente non si può dire il contrario: le molecole aventi un certo punto di fusione, una certa solubilità, un certo colore, ecc possono essere ben più di una!

Calcolabili in quanto, misure sperimentali o meno, è possibile “stimare”e la proprietà avendo come unico punto di partenza la struttura della molecola, utilizzando un procedimento di calcolo.

Qualcuno potrebbe a questo punto domandarsi se per proprietà chimiche e fisiche più concrete, si pensi per esempio ai già citati punti di fusione e di ebollizione, solubilità, magari anche caratteristiche connesse con l’acidità, la lipofilia, ecc non sia meglio in termini di affidabilità procedere alla misura sperimentale effettiva piuttosto che affidarsi ad un procedimento di calcolo, quasi sempre basato sull’impiego di elaborato software che girano su computer.
La risposta è “sicuramente sì”, se si dispone di una quantità sufficiente di campione per poter effettuare le misure in laboratorio, servono responsi quantitativi perfettamente affidabili ed infine se per il tipo di valutazioni che vogliamo effettuare esiste o è comunque concepibile un test di laboratorio.

Potrebbe invece valere la pena di procedere con un calcolo se la molecola fosse rarissima o costosissima, ottenuta in mesi di lavoro in quantità microscopiche, oppure se dovesse bastare una valutazione orientativa, come si dice in gergo “spannometrica” della proprietà chimico-fisica, o addirittura se la molecola non dovesse proprio esistere perché nessuno l’ha ancora mai sintetizzata, come accade nel campo della ricerca di nuovi farmaci, il “drug design”, dove torna di primaria utilità poter stimare le più disparate proprietà di una nuova molecola prima ancora di investire magari settimane o mesi di lavoro, nonché ingenti capitali, per arrivare alla sua preparazione, anche solo di un minuscolo campioncino, tramite sintesi chimica.
Quindi in prima battuta possiamo dire che questi strumenti di calcolo ci possono servire a prevedere alcune delle più importanti proprietà chimiche e fisiche di molecole semplicemente partendo dallo loro struttura, magari disegnata a video tramite un apposito software di disegno molecolare.

In realtà questa possibilità di calcolo apre la strada a qualcosa di portata ben più ampia.
Bisogna a questo punto però introdurre in concetto di “descrittore molecolare”, e scelgo di farlo con le parole di uno dei principali esperti del settore a livello internazionale: in Italia infatti la teoria e l’utilizzo dei procedimenti basati sui descrittori molecolari annovera figure pionieristiche attualmente annoverate fra le principali autorità in materia, il prof. Roberto Todeschini (università di Milano Bicocca, dipartimento di Scienze dell’Ambiente e del Territorio, gruppo di ricerca “Milano Chemometrics and QSAR Research).
libro_descrittori_molecolari_todeschini_consonni Secondo la definizione di Todeschini e Consonni “il descrittore molecolare è il risultato finale di un procedimento logico e matematico che trasforma l’informazione chimica codificata all’interno di una rappresentazione simbolica di una molecola, in un numero utile o nel risultato di qualche esperimento standardizzato”.

Questa definizione introduce un concetto nuovo, a mio parere non poi così intuitivo: quello che il descrittore molecolare non sia necessariamente un parametro che trovi un riscontro immediato in una proprietà chimica, fisica o comunque tangibile e tradizionalmente misurabile della molecola; in altre parole dobbiamo estendere la nostra idea di descrittore molecolare un po’ a tutto cosa di una molecola è univocamente calcolabile, tramite un algoritmo matematico, e riducibile ad un valore numerico. Dietro ad ogni algoritmo di calcolo, quindi ad ogni descrittore, vi è sicuramente una “proprietà” o una caratteristica della molecola, ma spessissimo queste proprietà non hanno un riscontro sperimentale concreto, non riassumono qualche tipo di valutazione già misurabile sperimentalmente, come ad esempio una solubilità o un punto di ebollizione o una proprietà spettrale. Alcuni descrittori sono, scusate il gioco di parole, appunto “descrittivi”, riassumono cioè numero e tipo di atomi contenuti nella molecola, modalità di legame reciproco, presenza ed abbondanza di determinati gruppi funzionali, distanze reciproche fra di essi ed infine posizione spaziale di atomi e gruppi in un sistema 3D ottimizzato, ovvero sulla molecola proiettata nello spazio tridimensionale, previo individuazione delle condizioni di conformazione corrispondenti al minimo energetico.
Altri invece derivano da complesse e tutt’altro che intuitive speculazioni di tipo teorico, che tuttavia partono sempre in modo specifico ed univoco dalla struttura della molecola, tanto che all’utilizzatore finale spesso importa ben poco di comprendere in profondità il significato concreto, fisico o teorico, della specifica variabile che il suo PC sta calcolando insieme magari ad altre migliaia, essendo nella maggior parte dei casi più che sufficiente avere consapevolezza delle classi di descrittori da utilizzare, divise appunto per tipologia.

Potremmo a questo punto domandarci che senso abbia calcolare proprietà di questo tipo, visto che di per sé stesse risultano ben poco “spendibili” in un contesto pratico…
Ecco, possiamo dire che possono tornare utili non singolarmente ma nel loro insieme (a gruppi o nella loro totalità) per spiegare proprietà più complesse di una molecola, proprietà che non possono essere riassunte in un solo valore numerico calcolabile proprio in funzione della sua presumibile multifattorialità (es. un’azione farmacologica, una proprietà organolettica, una caratteristica tecnologica).
Questo genere di approccio massivo ai descrittori molecolari non sperimentali passa attraverso la costruzione di database, realizzati sottoponendo un set di strutture molecolari fra loro diverse, tutte con la proprietà da calcolare nota (es. azione antipiretica), al calcolo dei medesimi descrittori molecolari. Per ogni molecola si procederà pertanto al calcolo via software di qualche centinaio o migliaio di descrittori, tutti rappresentabili con un numero: quella che si otterrà sarà pertanto una grande matrice bidimensionale di dati, dove una dimensione sarà rappresentata dalle diverse molecole, mentre l’altra dalle diverse proprietà calcolate, più la proprietà misurata nota (nell’esempio l’azione antipiretica, valutata volendo anche su una scala numerica convenzionale da 0=inefficace ad 1=estremamente efficace).

studio_variazioni_tema_progesterone Tutta questa mole di dati, che i nostri attuali elaboratori PC trattano senza difficoltà in pochi minuti, costituirà la base per la predizione del valore che potrà assumere la proprietà complessa sotto indagine, nel caso di nuove strutture molecolari delle quali non si sa nulla e che magari non sono neppure disponibili fisicamente. Il farmacologo per esempio potrebbe avere a disposizione “sulla carta” un gran numero di possibili molecole candidate ad essere dei buoni antipiretici, ma per sintetizzarle e provarle tutte potrebbero essere richiesti anni di lavoro ed investimenti economici intrattabili: disponendo unicamente delle formule di struttura complete di ciascuna molecola sarà invece possibile con questo sistema “stimare” la proprietà ricercata per ciascuna molecola candidata, in modo tale da scremare in modo decisivo i possibili candidati, ad esempio scartandone il 90% già inefficaci in sede di calcolo su PC (o come amano dire i chemio informatici “in silico”, evoluzione contemporanea del concetto di “in vitro” sviluppato di nostri padri).
Il 10% ipotetico di molecole buone candidate ad avere azione antipiretica potrà quindi essere sintetizzato e testato concretamente in laboratorio per verificarne l’efficacia e gli eventuali effetti collaterali.
Si pensi anche al risvolto etico di tecniche di calcolo di questo tipo, che si riflettono per esempio sulla nettissima riduzione della necessità di ricorrere per esempio a sperimentazioni estensive su animali! I database di proprietà farmacologiche includono ormai migliaia di molecole note nelle loro proprietà più complesse come quelle biologiche e fisiologiche, da quelle tossicologiche a quelle di assorbimento, da quelle di distribuzione nell’organismo a quelle di escrezione, che costituiscono in molti casi un’ottima base di conoscenza sulla quale partire per impostare uno studio di relazioni struttura-proprietà in silico.

Il passaggio concettuale che ancora ci manca per giustificare questo tipo di impiego è lo strumento statistico dell’analisi multivariata, che con il suddetto database di strutture a proprietà nota + relativi descrittori da un lato, e qualche nuova struttura a proprietà incognita + relativi descrittori calcolati (gli stessi del database!), sarà in grado di individuare la migliore combinazione algebrica di descrittori molecolari noti, per poter ottimizzare le capacità estimative del sistema sulla caratteristica incognita.

L’acronimo inglese che viene utilizzato per definire tutto questo complesso approccio è di sole 4 lettere: QSAR (Quantification of Structure Activity Relationship), o QSPR (se al posto di un’Attività vogliamo stimare una qualsiasi altra Proprietà complessa misurabile).

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Sostieni la divulgazione della Chimica
Il tuo libero contributo sarà interamente devoluto alle attività di divulgazione della Chimica.
CONDIVIDI QUESTO ARTICOLO
RICHIEDI LA NEWSLETTER
Una mail settimanale con gli aggiornamenti delle pubblicazioni, le attività dell'Associazione e le novità del mondo della divulgazione chimica
SEGUI CHIMICARE ANCHE SU FACEBOOK
segui chimicare anche su facebook
ARTICOLI RECENTI
ARCHIVIO ARTICOLI PER MESE
SEGUI CHIMICARE ANCHE SU TWITTER
Non solo gli aggiornamenti degli articoli pubblicati sui nostri blog e le novità del Carnevale della Chimica, ma anche le segnalazioni dei migliori interventi di divulgazione chimica in lingua italiana nel web.