Cosa stai cercando?

La genetica della Malattia di Alzheimer esplorata con il Machine Learning.

L’utilizzo dell’intelligenza artificiale per la ricerca genetica dell’AD è in continuo aumento.[1]

Abstract

L'architettura genetica della malattia di Alzheimer (AD) è caratterizzata da un'elevata complessità e non può essere descritta in modo completo dai modelli statistici tradizionali. Questa minireview analizza brevemente l’utilità del machine learning (ML) nel superare i limiti dei modelli lineari additivi, focalizzandosi sull'identificazione di nuovi loci di rischio, sullo studio delle interazioni epistatiche e sull'integrazione di biomarcatori immunitari. L'integrazione di dati omici e clinici tramite il ML rappresenta una strategia promettente per migliorare la diagnosi precoce e la stratificazione del rischio, aprendo la strada a una medicina di precisione per l'AD.

La malattia di Alzheimer (AD, Alzheimer Disease) è una patologia neurodegenerativa in cui i fattori genetici contribuiscono per circa il 70% all'effetto eziologico complessivo.[1] Nonostante il successo degli studi di associazione genome-wide (GWAS), gli approcci statistici tradizionali si basano prevalentemente su modelli lineari additivi che spesso ignorano le interazioni biologiche complesse.[2] Questi modelli assumono che le varianti genetiche agiscano come predittori indipendenti, una semplificazione che contrasta con l'evidenza biologica secondo cui l'eterogeneità della malattia e la risposta cellulare dipendono in modo cruciale dallo stato di APOE (gene dell’apolipoproteina E).[2,3] In questo scenario, l'intelligenza artificiale (AI, Artificial Intelligence) offre vantaggi evidenti nell'analisi di strutture ultra-complesse che superano le capacità di elaborazione umana.[1] Il machine learning, un sottoinsieme dell'AI, consente infatti di identificare pattern nascosti all’interno di dataset di grandi dimensioni, migliorando la nostra comprensione della patogenesi dell'AD.[1]

L'applicazione del ML alla genetica dell'AD si avvale di diversi algoritmi, tra cui le Gradient Boosting Machines (GBMs), le reti neurali informate da percorsi biologici e la riduzione della dimensionalità multifattoriale basata su modelli (MB-MDR).[2]

Identificazione di nuovi loci e varianti di rischio

Studi condotti su vasta scala utilizzando il ML hanno permesso di replicare i principali risultati dei Gradient Boosting Machines (GWAS), identificando con precisione loci noti come BIN1, PICALM, CLU e ABCA7.[2] In particolare, i modelli ML sono stati in grado di cogliere l'impatto specifico degli aplotipi APOE, identificando rs429358 e rs7412 come i predittori più importanti.[2] Al contrario, i modelli lineari tradizionali spesso possono risultare meno efficaci nel distinguere efficacemente il peso relativo di queste varianti critiche.[2] Oltre alla validazione di segnali noti, il ML ha evidenziato nuovi loci di suscettibilità che replicano in dataset esterni, tra cui ARHGAP25, COG7, LY6H e SOD1. Ad esempio, il gene LY6H codifica per proteine che regolano i recettori nicotinici dell'acetilcolina, coinvolti nella trasmissione colinergica sinaptica nel cervello.[2] Questo delicato equilibrio funzionale è alterato nell’ AD, e un aumento di Ly6h nel liquido cerebrospinale umano è stato associato a una maggiore gravità della patologia.[2] Il coinvolgimento di SOD1, tradizionalmente associato alla sclerosi laterale amiotrofica, suggerisce inoltre un possibile ruolo dei meccanismi di difesa antiossidante anche nella patogenesi dell'Alzheimer.[2] In generale, con l’eccezione di APOE, gran parte delle varianti genetiche identificate esercita un effetto individuale modesto sul rischio di malattia.[1] Per comprendere l’eziologia dell’AD, è quindi necessario considerare l’effetto di varianti genetiche multiple (effetti additivi), delle interazioni tra geni (epistasi, o effetti moltiplicativi) e dell’interazione di geni con l’ambiente.[1]

Interazioni gene-gene ed epistasi

Un vantaggio fondamentale del machine learning è la capacità di rilevare interazioni tra SNP (single nucleotide polymorphism) non lineari, unita all’analisi di reti di interazione trascrittomiche e percorsi metabolici.Questi approcci contribuiscono a spiegare una quota del rischio genetico attribuibile a interazioni non lineari tra varianti, identificando relazioni che rimarrebbero invisibili nelle analisi univariabili.[1,2]

Ad esempio, analisi condotte con GBM e reti neurali hanno rivelato interazioni significative tra varianti nelle regioni APOE e MS4A, suggerendo che il rischio genetico dell’AD sia modulato dall’interazione complessa tra diversi loci.[2]

Integrazione di biomarcatori immunitari e omica

Purtroppo, la malattia di Alzheimer viene solitamente diagnosticata in fase tardiva, mentre le opzioni terapeutiche attualmente disponibili risultano efficaci solo nei pazienti in fase precoce.[3] I biomarcatori ematici rappresentano una strategia promettente, poiché consentono una valutazione accessibile, ripetibile e a basso costo, facilitando la diagnosi precoce della malattia.[3] In particolare, i biomarcatori ematici di tipo immunitario stanno suscitando crescente interesse, alla luce della recente scoperta del cross-talk tra le cellule immunitarie del sistema nervoso centrale e quelle del sistema periferico.[3] Ad esempio, uno studio di sequenziamento dell’RNA a singola cellula (scRNA-seq) su pazienti con Alzheimer ha identificato le cellule B come determinanti della gravità della malattia ed è stato riscontrato un numero inferiore di linfociti B nel sangue dei pazienti con AD rispetto al gruppo controllo.[3]

Per supportare le decisioni mediche, inclusa la diagnosi precoce, è necessario integrare le caratteristiche cliniche, genetiche e biologiche del singolo paziente in un unico punteggio diagnostico.[3] Poiché è improbabile che un singolo biomarcatore sia sufficiente per identificare con elevata accuratezza i pazienti in fase preclinica o prodromica, diventa essenziale analizzare simultaneamente un elevato numero di variabili ad alta dimensionalità.[3] In questo contesto, il machine learning riveste un ruolo cruciale, poiché consente di individuare pattern complessi difficilmente rilevabili con metodi convenzionali.[3]

Capacità predittiva e neuroimaging genetico

Varatharajah et al. hanno sviluppato un modello multivariato basato su algoritmi di apprendimento automatico (SVM, apprendimento multiplo del kernel), che integra: dati demografici, biomarcatori del liquido cerebrospinale, la risonanza magnetica, la tomografia a emissione di positroni, i punteggi dei test psicologici per la cognizione e la resilienza cognitiva e i principali geni correlati all'AD che sono stati convalidati (per un totale di 94 potenziali fattori predittivi).[1] Analizzando 135 partecipanti dell'ADNI (Alzheimer’s Disease Neuroimaging Initiative), gli autori hanno ottenuto un tasso di accuratezza predittiva del 93% nell’identificare i soggetti con disturbo cognitivo lieve destinati a progredire verso l’AD entro tre anni.[1] Questi risultati dimostrano che l’integrazione di dati genetici e di imaging, analizzati mediante metodi di apprendimento, può fornire strumenti prognostici di elevata precisione, con potenziali ricadute cliniche rilevanti.[1]

In conclusione, sebbene l’applicazione del machine learning alla genetica dell’Alzheimer sia ancora in una fase relativamente precoce, i progressi nella condivisione di dati di alta qualità, nell’analisi biologica multilivello e nella potenza di calcolo rendono plausibile lo sviluppo di sistemi integrati di analisi.[1] Il ML può contribuire in modo significativo a chiarire l’eterogeneità biologica dell’AD, identificando sottotipi di malattia e pannelli di biomarcatori specifici.[3]
Nel medio termine, queste strategie potrebbero tradursi in strumenti clinici utili per una diagnosi più precoce, una migliore stratificazione del rischio e lo sviluppo di una medicina personalizzata per l’Alzheimer.[3]

Referenze:

Mishra R, Li B. The Application of Artificial Intelligence in the Genetic Study of Alzheimer's Disease. Aging Dis. 2020 Dec 1;11(6):1567-1584. doi: 10.14336/AD.2020.0312. PMID: 33269107; PMCID: PMC7673858.
Bracher-Smith M, Melograna F, Ulm B, et al. Machine learning in Alzheimer's disease genetics. Nat Commun. 2025 Jul 22;16(1):6726. doi: 10.1038/s41467-025-61650-z. PMID: 40691194; PMCID: PMC12280214.
Krix S, Wilczynski E, Falgàs N, et al. Towards early diagnosis of Alzheimer's disease: advances in immune-related blood biomarkers and computational approaches. Front Immunol. 2024 Apr 23;15:1343900. doi: 10.3389/fimmu.2024.1343900. PMID: 38720902; PMCID: PMC11078023.