Articolo di Marco Tanini e Caterina Pistoia
Lo studio ha analizzato un dataset di 1.306 partecipanti, di cui 392 affetti da PD, provenienti da ambienti clinici e domiciliari, con una rappresentanza demografica bilanciata (53,2% donne). I soggetti sono stati invitati a pronunciare pangrammi in lingua inglese — frasi che includono tutte le lettere dell’alfabeto — registrando così campioni vocali rappresentativi.
L’analisi dei segnali vocali è stata effettuata mediante modelli di deep learning avanzati, tra cui Wav2Vec 2.0, WavLM e ImageBind. Questi strumenti hanno permesso l’estrazione di rappresentazioni vocali sensibili alle alterazioni motorie associate al PD. Successivamente, è stato sviluppato un innovativo modello di fusione capace di allineare gli *embedding* vocali in uno spazio coerente, migliorando l’accuratezza e l’efficacia dello screening rispetto ai modelli standard.
Risultati
Il modello ha ottenuto performance elevate: in una suddivisione casuale stratificata del campione, ha raggiunto un’area sotto la curva ROC (AUROC) dell’88,9% e un’accuratezza dell’85,7%. L’analisi statistica ha confermato l’equità delle prestazioni tra sottogruppi di sesso, etnia ed età, e ne ha dimostrato la robustezza in relazione a vari stadi e durate della malattia.
Un’analisi degli errori ha rivelato tassi di misclassificazione maggiori in specifiche fasce d’età per uomini e donne, in linea con quanto osservato in ambito clinico. Inoltre, il modello è stato validato su due dataset clinici indipendenti, ottenendo AUROC rispettivamente dell’82,1% e del 78,4%. Anche su un corpus spontaneo di discorsi in inglese, il sistema ha mantenuto buone prestazioni (AUROC 77,4%).
Conclusioni
L’impiego dell’IA per l’analisi vocale si dimostra un’opzione promettente per lo screening precoce del morbo di Parkinson. La possibilità di utilizzare pangrammi letti ad alta voce, anche in contesti domiciliari, rende questo approccio potenzialmente applicabile su larga scala, contribuendo alla riduzione delle disuguaglianze nell’accesso alla diagnosi.
La robustezza del modello su diversi dataset e sottogruppi demografici evidenzia il suo valore clinico. Tuttavia, sarà necessaria una validazione più estesa, anche in altre lingue e in contesti reali, per confermarne l’efficacia e implementarne l’uso nella pratica clinica quotidiana.
Bibliografia: Norel, R., Venkataraman, A., Yeo, C., & Smalt, C. (2025). Voice-based detection of Parkinson’s disease using AI and pangram reading. npj Parkinson’s Disease, 11, 176. [https://doi.org/10.1038/s41531-025-00956-7](https://doi.org/10.1038/s41531-025-00956-7)
Little, M. A., & McSharry, P. E. (2012). Digital signal processing of voice in Parkinson’s disease. IEEE Transactions on Biomedical Engineering, 59 (4), 1015–1022. [https://doi.org/10.1109/TBME.2011.2182528](https://doi.org/10.1109/TBME.2011.2182528)
Arora, S., Venkataraman, V., Zhan, A., Donohue, K. D., Biglan, K. M., Dorsey, E. R., & Little, M. A. (2015). Detecting and monitoring the symptoms of Parkinson’s disease using smartphones: A pilot study. Parkinsonism & Related Disorders, 21 (6), 650–653. [https://doi.org/10.1016/j.parkreldis.2015.02.026](https://doi.org/10.1016/j.parkreldis.2015.02.026)
Shahid, N., Rappon, T., & Berta, W. (2019). Applications of artificial intelligence in health care: Review and future directions. BMJ Health & Care Informatics, 26, e100066. [https://doi.org/10.1136/bmjhci-2019-100066](https://doi.org/10.1136/bmjhci-2019-100066)
Lascia un commento