Information Extraction basata su Natural Language Processing della lingua italiana | Francesco Marinuzzi

Ho curato direttamente e organizzato per conto dell’Ordine degli Ingegneri della Provincia di Roma un seminario tecnico gratuito sul tema del Natural Language Processing (NLP) e Information Extraction (IE) per la lingua italiana.

Partendo dal web, da email, chat e documenti non strutturati, ossia sotto forma di testo libero, attraverso opportune tecniche e strumenti è possibile costruire dei “motori” in grado di individuare ed estrarre le informazioni in essi contenute, determinare le relazioni che intercorrono e la loro provenienza.

Certo la complessità dell’interpretazione del linguaggio naturale pone ancora diversi limiti, ma la capacità di individuare con buona precisione entità (es. persone fisiche, persone giuridiche, beni materiali, località, date, indirizzi, ecc.), le loro relazioni e le conseguenti proprietà (es. per una persona fisica la data il luogo di nascita, il suo indirizzo di residenza, il luogo di lavoro, ecc.), permette di arricchire archivi strutturati di informazioni, mantenendo al contempo una mappa aggiornata tra le informazioni stesse e la loro origine documentale.

Nel seminario, sulla base di recenti esperienze di progetto, si introducono le basi teoriche, il metodo progettuale, le criticità, gli elementi di multidisciplinarità culturale e professionale del team e alcuni degli strumenti software open source in questo settore.

In particolare esempi e approfondimenti verranno presentati attraverso la piattaforma open source GATE.

Inizio del corso: 06/06/2017 9:30 Durata del corso: 4 ore

Vai all’evento