Pisa – Informatica, ricerca economica e statistica collaborano per indagare la portata economica e la diffusione delle attività illegali, intrecciando i modelli e le tecniche tipiche della ricerca economica e della statistica economica con le informazioni che una disciplina relativamente giovane come la linguistica computazionale può offrire, riuscendo ad automatizzare il trattamento di big data testuali. A questo incontro tra discipline, è dedicato il progetto di ricerca tra Istat e Istituto di Management della Scuola Superiore Sant’Anna in cui si inserisce il workshop di martedì 17 maggio, dalle ore 11.30, in aula 6.
Turbativa d’asta negli appalti e corruzione nella Pubblica Amministrazione sono alcuni reati che interferiscono e distorcono il corretto funzionamento dei mercati. Per combattere questi reati un recente aiuto è fornito dal “text mining”, ovvero dalla possibilità di ricavare numeri ed estrarre informazioni significative da testi di vario genere (dagli articoli di giornale alle sentenze dei Tribunali) e permetterne un’analisi statistica.
Il workshop del 17 maggio è introdotto da Guido Rey dell’Istituto di Management della Sant’Anna di Pisa; Sergio Bolasco, docente di Statistica della Sapienza di Roma e ideatore del software TalTac2, illustra i “Modelli di estrazione di informazioni e categorizzazione automatica di documenti”; Alessandro Lenci, docente di linguistica dell’Università di Pisa chiarisce il ruolo della “Linguistica computazionale per l’analisi dei documenti della Pubblica Amministrazione”; Maria Francesca Romano dell’Istituto di Economia della Sant’Anna presenta i risultati preliminari dell’applicazione dei metodi dell’analisi testuale e statistica, effettuata con text mining, alle “Analisi delle sentenze su turbativa d’asta, concussione e corruzione”.