La valutazione delle insufficienze valvolari rappresenta uno dei quesiti diagnostici più difficili in ecocardiografia, in quanto richiede l’integrazione di molteplici parametri qualitativi e quantitativi derivanti sia dall’imaging bidimensionale che Doppler. Nonostante i notevoli progressi tecnologici degli ultimi anni, la soggettività dell’interpretazione e la variabilità inter-osservatore continuano a rappresentare il limite principale di qualsiasi valutazione ecocardiografica. Inoltre, la predizione della possibile progressione del rigurgito valvolare è assolutamente imprevedibile, rendendo la gestione del follow-up spesso arbitraria.
In questo contesto una novità è rappresentata dallo studio DELINEATE (Deep Learning for Echo Analysis, Tracking, and Evaluation), recentemente pubblicato sull’European Heart Journal da Long A e coll (1). Lo studio, condotto in due importanti centri accademici statunitensi (Columbia University e Weill Cornell Medicine), ha valutato, attraverso analisi retrospettive, l’utilità dell’intelligenza artificiale (IA) per migliorare l’accuratezza e l’uniformità della valutazione ecocardiografica dell’ insufficienza aortica (IAo), mitralica (IM) e tricuspidale (IT), nonché la possibilità di predire l’evoluzione dell’IM verso forme gravi.
Sono stati analizzati oltre 71.000 ecocardiogrammi transtoracici (ETT) e più di 1.2 milioni di clip color-Doppler registrate nei due centri per varie indicazioni. I ricercatori hanno sviluppato modelli di deep learning, in particolare basati su reti neurali convoluzionali (un metodo analitico particolarmente adatto a studiare forme che si modificano nel tempo) e architetture transformer (in grado di cogliere relazioni tra dati non ordinati e pesare di più gli elementi più rilevanti per la diagnosi), per analizzare automaticamente le clip ecocardiografiche e quantificare l’insufficienza valvolare attraverso il seguente grading: nessuna/trascurabile, lieve, moderata, grave. Sono state confrontate tre diverse strategie di analisi:
-single-view (basata su una singola clip per ciascuna valvola),
-multiview top-3 (media di tre clip con il rigurgito più evidente),
-multiview all (integrazione di tutte le clip disponibili).
Il grading effettuato dall’IA è stato confrontato con il grading effettuato dai cardiologici in maniera tradizionale. I risultati hanno mostrato una superiore accuratezza dei modelli multiview, in particolare del modello “multiview all”, che ha raggiunto nel grading delle insufficienze valvolari un kappa ponderato di 0.76 per IM, 0.73 per IT e 0.81 per IAo, dimostrando una sostanziale concordanza con la valutazione dei cardiologi esperti. Le performance dei modelli sono risultate ottime, con curve ROC >0.96 per tutte le valvole e i livelli di gravità, indicando una capacità discriminativa molto elevata.
Parallelamente, il sottostudio DELINEATE-MR-Progression ha utilizzato un altro modello di IA deep-set transformer, per individuare, tra i pazienti con IM lieve o moderata, quelli più a rischio di progressione durante un follow-up di 2 anni. Il modello è stato addestrato internamente su oltre 5.000 ETT e validato esternamente su più di 10.000 ETT.
Lo score di rischio generato dal modello di IA si è dimostrato indipendentemente associato alla progressione del rigurgito anche dopo aggiustamento per numerose variabili cliniche ed ecocardiografiche. Nei pazienti con IM lieve-moderata, il tasso di peggioramento a 2 anni era del 4.9% nel terzile a basso rischio e del 18.1% nel terzile ad alto rischio secondo il modello AI. Nei modelli di Cox multivariati, uno score di rischio AI elevato era associato a un hazard ratio di 4.1 (IC 95%: 2.5–6.6) nel set di ETT interno e di 2.1 (IC 95%:1.7–2.5) nel set di ETT esterno.
Considerazioni
Lo studio di Long e coll. si aggiunge ad una serie di recenti evidenze a sostegno delle potenzialità dell’ IA nella diagnostica cardiovascolare. In particolare, questi dati sembrerebbero semplificare uno degli aspetti più challenging dell’ecocardiografia, ossia la quantificazione delle insufficienze valvolari, attraverso l’automatizzazione e standardizzazione del processo diagnostico. Inoltre, la possibilità di individuare i pazienti a maggior rischio di progressione verso forme più gravi potrebbe consentire di personalizzare il follow-up, con tempistiche più strette limitate ai pazienti a maggior rischio. Ciò potrebbe consentire una migliore gestione delle risorse, una riduzione delle liste di attesa e, auspicabilmente, migliori esiti clinici.
Tuttavia, benché sicuramente affascinanti e intriganti, le evidenze sull’utilizzo dell’IA in ambito ecocardiografico (e non solo) appaiono ancora ( e forse fortunatamente) lontane dalla pratica clinica quotidiana per una serie di motivi. Innanzitutto, i processi di elaborazione dei dati da parte dell’IA rimangono ancora incomprensibili alla maggior parte dei clinici e possono generare diffidenza nei confronti delle diagnosi effettuate con l’IA. Inoltre, l’implementazione delle varie metodiche di AI da parte delle diverse aziende biomedicali potrebbe risultare molto eterogenea e pertanto paradossalmente creare una variabilità interpretativa IA-dipendente. Infine, i dati a oggi disponibili provengono prevalentemente da studi retrospettivi e quindi sono necessari studi prospettici e randomizzati per confermare l’accuratezza diagnostica di questi strumenti, nonché studi di outcome per dimostrare che l’utilizzo di tali metodiche migliori realmente la gestione e l’outcome dei pazienti. In particolare, studi di outcome positivi sono indispensabili prima che si possa pensare di poter sostituire il giudizio di un clinico con l’output di un computer.
Reference
- Long A, Finer J, Hartman H, Hartzel D, Jing L, Kelsey C, Rocha D, Ruhl J, vanMaanen D, Elnabawi Y, Metser G, Duffy E, Mawson T, Tat E, Haggerty CM, Maurer M, Einstein AJ, Beecy AN, Kumaraiah D, Devereux RB, Homma S, Leon M, Hahn RT, Elias P, Poterucha TJ. Deep learning for echocardiographic assessment and risk stratification of aortic, mitral, and tricuspid regurgitation: the DELINEATE-regurgitation study. Eur Heart J. 2025;46:2780-2791.