La genetica dell’artrite reumatoide contribuisce alla sua biologia ed alla scoperta dei farmaci

Una delle sfide principali della genetica nell’uomo è di concepire una strategia sistematica per integrare le varianti associate alla malattia con i diversi gruppi di dati genomici e biologici per fornire approfondimenti della patogenesi della malattia e guidare la scoperta di farmaci per tratti complessi come l’artrite reumatoide (RA).  Qui abbiamo attuato uno studio di meta-analisi di un’ampia associazione genomica su un totale di >100000 soggetti con antenati Europei ed Asiatici (29880 casi di RA e 73758 controlli), valutando circa 10 milioni di polimorfismi su singoli nucleotidi.  Abbiamo scoperto 42 nuovi loci di rischio per RA con un livello di significatività nel genoma ampio, portando il totale a 101.  Abbiamo ideato una linea in silico usando metodi di bioinformatica conosciuti basati su annotazioni funzionali, tratti di loci con espressioni quantitative cis-acting ed analisi delle vie di trasduzione – così come nuovi metodi basati sulla sovrapposizione genetica con l’immunodeficienza primitiva umana, con mutazioni somatiche dei tumori ematologici e fenotipi di topi knock-out – per identificare 98 geni candidati in questi 101 loci di rischio.  Abbiamo dimostrato che questi geni sono bersagli di terapie approvate per la RA, e suggeriamo inoltre che farmaci approvati per altre indicazioni possono essere riproposti per il trattamento della RA.  In toto, lo studio genetico completo getta nuova luce su geni fondamentali, tipi cellulari e vie di trasduzione che contribuiscono alla patogenesi della RA, e fornisce evidenze empiriche che la genetica dell’RA può fornire importanti informazioni per la scoperta di nuovi farmaci.

Abbiamo condotto una meta-analisi trans-etnica in tre stadi.  Sulla base dell’architettura poligenica della RA e del rischio genetico comune ai diversi antenati, abbiamo proposto che combinando uno studio di associazione a genoma ampio (genome-wide association study – GWAS-) di antenati Europei ed Asiatici dovrebbe aumentare il potere di evidenziare nuovi loci di rischio.  Nello stadio 1, abbiamo combinato 22 GWAS per 19234 casi e 61565 controlli di antenati Europei ed Asiatici.  Abbiamo condotto meta-analisi trans-etniche, specifiche Europee e specifiche Asiatiche valutando circa 10 milioni di polimorfismi a singolo nucleotide (SNPs).  Sono state descritte le caratteristiche delle coorti, delle piattaforme di genotipizzazione ed i criteri del controllo di qualità sono state descritte.

                La meta-analisi dello stadio 1 ha identificato 57 loci che hanno soddisfatto la soglia di significatività genome-wide di P<5.0 x 10-8, inclusi 17 nuovi loci.  Abbiamo poi condotto uno studio di replicazione a due step (stadio 2 per in silico e stadio 3 per de novo) in 10646 casi e 12193 controlli per i loci con P<5.0 x 10-6 dello stadio 1.  In una analisi combinata degli stadi 1-3, abbiamo identificato 42 nuovi loci con P<5.0 x 10-8 in qualsiasi delle meta-analisi trans-etniche, Europee o Asiatiche.  Questo ha aumentato il numero totale dei loci di rischio RA a 101.

                Il paragone di 101 loci di rischio ha rivelato correlazioni significative delle frequenze alleliche di rischio (RAFs) e dell’Odds Ratio (ORs) tra gli Europei e gli Asiatici, anche se 5 loci hanno dimostrato un’associazione specifica di popolazione.  Nel modello di rischio genetico specifico per popolazione, i 100 loci di rischio RA al di fuori della regione del complesso maggiore d’istocompatibilità (MHC) dispiegano un 5,5% ed un 4,7% di ereditarietà per Europei ed Asiatici, rispettivamente, con un 1,6% di ereditarietà dei nuovi loci.  Il modello di rischio genetico trans-etnico, basato sulla RAF di una popolazione ma sul OR dell’altra popolazione, potrebbe spiegare la maggioranza (>80%) dell’ereditarietà conosciuta in ciascuna popolazione (4,7% per gli Europei e 3,8% per gli AsiaticI).  Queste osservazioni supportano la nostra ipotesi che il rischio genetico dell’RA è condiviso, in generale tra Europei ed Asiatici.

                Abbiamo valutato l’arricchimento di 100 loci di rischio non-MHC in marchi epigenetici di cromatina.  Dei 34 tipi cellulari investigati, abbiamo osservato un significativo arricchimento degli alleli di rischio RA con picchi di trimetilazione dell’istone H3 nella lisina 4 (H3K4me3) in cellule T regolatorie CD4+ (cellule Treg; P<1.0 x 10-5).  Per i loci di rischio RA arricchiti per picchi H3K4me3 nelle Treg, abbiamo incorporato le notazioni epigenetiche insieme alle differenze trans-etniche in quadri di linkage disequilibrium per mappare finemente eventuali alleli di rischio casuali.

                Abbiamo scoperto che circa due-terzi dei loci di rischio RA dimostravano pleiotropia con altri fenotipi umani, incluse malattie correlate all’immunità (per esempio, vitiligine, cirrosi biliare primitiva), correlate all’infiammazione o biomarcatori ematologici (per esempio, fibrinogeno, conte neutrofile) e altri tratti complessi (per esempio, malattie cardiovascolari).

                Ciascuno dei 100 loci di rischio non-MHC contenevano una media di circa 4 geni nella regione del linkage disequilibrium (in totale 377 geni).  Per dare priorità in maniera sistematica al gene più probabile come candidato biologico, abbiamo messo a punto una linea bioinformatica in silico.  Oltre ai metodi pubblicati che integrano i dati attraverso loci associati, noi abbiamo valutato molti gruppi di dati biologici per testare l’arricchimento di geni di rischio RA, il chè aiuta a puntare un gene specifico in ciascun locus.

                Abbiamo per prima cosa condotto una annotazione funzionale degli SNP dei loci di rischio. Il sedici per cento degli SNP erano in linkage disequilibrium con SNP missense.  La proporzione di SNP di rischio RA missense era più alta se paragonata con un gruppo di SNP comuni genome-wide (8.0%), e relativamente molto più alta nell’eredità spiegata (circa 26,8%).  Usando dati cis-acting expression quantitative trait loci (cis-eQTL) ottenuti da cellule mononucleate del sangue periferico (5311 individui) e da cellule T CD4+ e monociti CD14+CD16 (212 individui), abbiamo scoperto che gli SNP di rischio RA in 44 loci mostravano effetti cis-eQTL.

                Secondo, abbiamo valutato se geni dai loci di rischio RA si sovrappongono con geni dell’immunodeficienza primitiva (PID) dell’uomo, ed abbiamo osservato una sovrapposizione significativa (14/94 = 7,2%).  Le categorie di classificazione dei geni PID mostrano quadri differenti di sovrapposizione:  la proporzione più alta di sovrapposizione era in “disregolazione immune” (4/21 = 19,0%) ma non c’era nessuna sovrapposizione in “immunità innata”.

                Terzo, abbiamo valutato la sovrapposizione con geni somatici del cancro mutati, nell’ipotesi che geni che conferiscono vantaggi per la crescita cellulare possano contribuire allo sviluppo RA.  Tra 444 geni con mutazioni somatiche del cancro registrate, abbiamo osservato una sovrapposizione significativa con geni implicati in tumori ematologici (17/251 = 6,8%), ma non con geni implicati in tumori non ematologici (6/221 = 2.7%).

                Quarto, abbiamo valutato la sovrapposizione con geni implicati in fenotipi di topi knockout.  Tra le 30 categorie di fenotipi, abbiamo osservato 3 categorie significativamente arricchite con geni di rischio RA: “fenotipo del sistema ematopoietico”, “fenotipo del sistema immune”, e “fenotipo cellulare”.

                Infine, abbiamo condotto un’analisi di arricchimento di vie molecolari.  Abbiamo osservato arricchimento per vie correlate alle cellule T, consistente con segnature epigenetiche cellulo-specifiche, così come arricchimento per vie di segnale di cellule B e citochine (per esempio, interleuchina (IL)-10, interferone, granulocyte-macrophage colony-stimulating factor (GM-CSF)).  Per paragone, la nostra precedente meta-analisi RA GWAS non ha identificato le vie di segnale di cellule B e citochine, e ciò indica che se più loci vengono scoperti, sono identificate ulteriori vie biologiche.

In base a questi nuovi risultati, abbiamo adottato i seguenti 8 criteri come priorità per ciascuno dei 377 geni dai 100 loci di rischio RA non-MHC: (1) geni con varianti missenso di rischio RA (n = 19); (2) geni cis-eQTL (n = 51); (3) geni resi prioritari per estrazione dai testi pube (n = 90); (4) geni resi prioritari dalle interazioni proteina-proteina (PPI)(n = 63); (5) geni PID (n = 15); (6) geni con mutazioni somatiche di tumori ematologici (n = 17); (7) geni resi prioritari dall’associazione con fenotipi knockout (n = 86); e (8) geni resi prioritari dall’analisi delle vie molecolari (n = 35).

                Novantotto geni (26%) hanno ricevuto un punteggio di > 2, che abbiamo definito come “geni di rischio RA candidati biologici”.  Diciannove loci includevano molteplici geni di rischio biologico RA (per esempio, IL13 e CSF2 nel cromosoma 5q31), mentre non sono stati selezionati geni biologici da 40 loci.

                Per fornire evidenze empiriche della linea, abbiamo valutato le relazioni dei punteggi dei geni con informazioni genomiche o epigenetiche indipendenti.  C’erano maggiori probabilità che i geni con punteggi biologici più alti fossero geni più vicini al rischio SNP (18.6% per punteggio dei geni <2 e 49% per punteggi dei geni >2), ed anche fossero inclusi nella regione in cui il rischio RA SNP era sovrapposto con i picchi H3K4me3 Treg (41.9% per punteggio dei geni <2 e 57.1% per punteggio dei geni >2).  Inoltre, le cellule Treg dimostravano il maggior incremento nelle proporzioni di sovrapposizione con i picchi H3K4me3 per l’aumento dei punteggi biologici dei geni in paragone con altri tipi cellulari.

                Infine, abbiamo valutato il ruolo potenziale della genetica RA nella scoperta dei farmaci.  Abbiamo proposto che se la genetica umana è utile per validare i bersagli farmacologici, dovrebbe anche identificare farmaci per l’RA approvati già esistenti.  Per provare questa “ipotesi terapeutica”, abbiamo ottenuto 871 geni di bersagli farmacologici corrispondenti a farmaci per malattie umane approvate, in studio clinico o sperimentali.  Abbiamo valutato se qualsiasi prodotto proteico da geni di rischio biologico RA identificati, o qualsiasi gene da un PPI diretto che fa rete con questi prodotti proteici, sono i bersagli farmacologicamente attivi di farmaci RA approvati.

                Ventisette geni di bersagli farmacologici di farmaci approvati per RA hanno dimostrato una sovrapposizione significativa con 98 geni di rischio biologico e 2332 geni dalla rete PPI espansa (18 geni sovrapposti).  Per paragone, tutti i geni di bersagli farmacologici (indipendentemente dalla indicazione di malattia) si sono sovrapposti con 247 geni, che rappresenta un aumento di 1.7 volte di arricchimento rispetto a ciò che ci si aspettava casualmente, ma meno di un arricchimento di 2,2 volte in paragone con la sovrapposizione dei geni bersaglio dei farmaci RA.  Esempi di terapie RA approvate identificate con questa analisi includono tocilizumab (anti-IL6R), tofactinib (inibitore JAK3) e abatacept (immunoglobulina-CTLA4).

                Abbiamo anche valutato come i farmaci approvati per altre malattie possano essere connessi a geni di rischio biologico RA.  Abbiamo messo in luce CDK6 e CDK4, bersagli di tre farmaci approvati per diversi tipi di cancro.  A favore del riposizionamento, è stato visto che un inibitore CDK6/CDK4, il flavopiridolo, migliora l’attività di malattia in modelli animali di RA.  Inoltre, la biologia è plausibile, dal momento che molti farmaci RA approvati sono stati sviluppati inizialmente per il trattamento del cancro e poi riposizionati per l’RA (per esempio, il rituximab).  Nonostante siano necessarie ulteriori investigazioni, proponiamo che geni bersaglio/farmaci selezionati attraverso questo approccio potrebbero rappresentare candidati promettenti per la scoperta di nuovi farmaci per il trattamento RA.

                Notiamo che una distribuzione non casuale di indicazioni da farmaco-a-malattia nei database potrebbero potenzialmente alterare i nostri risultati.  Cioè, poiché i geni di rischio RA sono arricchiti per geni della funzione immune, potrebbe esserci un arricchimento spurio con bersagli farmacologici se la maggioranza delle indicazioni nei database erano di malattie immuno-mediate o di geni bersaglio correlati all’immunità.  Tuttavia, questo arricchimento non era evidente nella nostra analisi (circa 11% per indicazioni farmacologiche e circa il 9% per geni bersaglio).

                Attraverso uno studio genetico completo con >100.000 soggetti, abbiamo identificato 42 nuovi loci di rischio RA e abbiamo fornito nuove conoscenze nella patogenesi dell’RA.  Abbiamo particolarmente evidenziato il ruolo della genetica per la scoperta di farmaci.  Nonostante ci siano stati esempi aneddotici di ciò, il nostro studio fornisce un approccio sistematico attraverso cui i dati di genetica umana possono essere efficientemente integrati con altre informazioni biologiche per derivare conoscenze biologiche e guidare verso la scoperta di farmaci.

(Tratto da “Genetics of rheumatoid arthritis contributes to biology and drug discovery”, Nature, 2014; 506:376-381)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: