Cosa significa davvero lavorare nella ricerca sull'AI oggi

Non è come la raccontano i giornali, e nemmeno come la racconta Hollywood. Ecco com'è davvero, vista dall'interno, nel 2026.

Quando dico a qualcuno che faccio ricerca in Intelligenza Artificiale, le reazioni si dividono in due grandi gruppi. Una metà immagina una stanza con luci blu, schermi che proiettano matrici verdi e un computer che parla. L'altra metà — più realista, ma non di molto — immagina qualcuno che "fa funzionare ChatGPT". La verità è meno scenografica di entrambe, e probabilmente più interessante.

Ho fatto un dottorato in Intelligenza Artificiale all'Università di Trento, in co-supervisione con l'Università di Aalborg in Danimarca. Negli ultimi anni ho presentato lavori a conferenze come NeurIPS, ICML, AISTATS, ho passato quattro mesi a Tokyo all'AIST come visiting researcher, partecipato a summer school e workshop in alcune città europee. Quando dico "fare ricerca in AI" mi riferisco a questo: una vita fatta in larga parte di esperimenti che non funzionano, paper che vengono respinti, e ogni tanto, raramente, momenti in cui senti di aver capito qualcosa che prima non capivi.

Vorrei provare a raccontare cosa significa davvero, perché penso che ci sia una sproporzione enorme tra come la ricerca AI viene rappresentata fuori e come si vive dentro. E perché credo che capire questa differenza sia utile a chi vuole capire davvero di cosa parliamo, quando parliamo di Intelligenza Artificiale.

Il 90% del lavoro è capire perché qualcosa non funziona

La prima cosa che mi sento di dire è che la ricerca, per la grandissima parte del tempo, è composta da tentativi che falliscono. Non in modo drammatico, non in modo eclatante. Falliscono in modo silenzioso, ostinato, ripetitivo. Una dimostrazione apparentemente solida si rivela basata su un'ipotesi troppo forte. Un algoritmo che dovrebbe funzionare meglio del baseline produce risultati peggiori. Una bound teorica che sembrava promettente si rivela inutile in pratica perché le costanti nascoste sono enormi. Questo è il pane quotidiano: teoria che non regge, esperimenti che non confermano, oppure, il caso più frequente, entrambe le cose insieme.

Per ogni paper accettato a una conferenza, ci sono mesi di lavoro che hanno prodotto solo silenzio: dimostrazioni che non si chiudono, controesempi inaspettati, esperimenti i cui risultati sono indistinguibili dal rumore. Non sono mesi sprecati, è la materia prima del mestiere, è dove si capisce davvero perché certe cose funzionano e altre no, ma da fuori non si vedono. Si vede solo il risultato finale: il teorema enunciato in modo pulito, il grafico con le barre verdi che batte lo stato dell'arte di qualche decimale. Sembra magia, ma è il prodotto di molta più stanchezza che genio.

Una collega mi disse una cosa che mi è rimasta impressa: "Se le tue dimostrazioni si chiudono al primo colpo e i tuoi esperimenti funzionano sempre, vuol dire che non stai facendo ricerca, stai facendo ingegneria." Aveva ragione. La ricerca è esattamente il punto in cui le cose smettono di funzionare in modo prevedibile.

Le conferenze sono il vero "campo di prova"

In altre discipline scientifiche, il punto d'arrivo è la rivista — Nature, Science, le grandi riviste di settore. In Machine Learning funziona diversamente. Il punto d'arrivo sono le conferenze: NeurIPS, ICML, ICLR, AISTATS, e poche altre. Sono i forum dove i lavori si presentano, si discutono, si pubblicano. Il processo di peer review è veloce (qualche mese, non anni) e selettivo: a NeurIPS, su circa 15.000 paper sottoposti, ne vengono accettati intorno al 25-30%. Tradotto: tre quarti delle ricerche, anche di qualità, vengono respinte.

Avere un paper accettato a queste conferenze non è solo un risultato di carriera. È il modo in cui la comunità ti dice: "questa cosa che hai fatto è abbastanza interessante da meritare di essere conosciuta". Ed è un giudizio dato da revisori che spesso non sai chi siano, che lavorano gratis, che hanno tre settimane per leggere il tuo lavoro e formarsi un'opinione. Il sistema è imperfetto, chi fa ricerca lo sa, e si lamenta apertamente, ma è quello che abbiamo, e funziona meglio di tante alternative.

Quando partecipi a una conferenza di persona, ti accorgi di una cosa: la maggior parte del valore non sono i talk principali. È quello che succede nei corridoi, davanti ai poster, durante le pause caffè. Trovi qualcuno che ha lavorato sullo stesso problema tuo da un'angolazione diversa, due frasi e capisci che vi siete persi mesi cercando di risolvere ognuno da soli quello che insieme avreste capito in una settimana. È lì che la ricerca diventa collettiva davvero, non sulla carta dei paper.

La differenza tra fare ricerca e "lavorare in AI"

C'è una differenza importante che vale la pena spiegare, perché spesso si confondono. Lavorare in un'azienda che usa l'AI — sviluppare un prodotto basato su modelli linguistici, applicare il Machine Learning a un dataset aziendale, costruire un sistema di raccomandazione — è una cosa diversa dal fare ricerca.

Chi applica l'AI prende modelli e tecniche esistenti, le adatta a un contesto specifico, le mette in produzione e fa in modo che funzionino su scala. È un lavoro tecnicamente difficile, importante, ben pagato. Ma usa strumenti consolidati.

Chi fa ricerca lavora sui problemi che ancora non hanno soluzione. Non sa, prima di iniziare, se quello che sta cercando di costruire si potrà costruire. Lavora su un'idea che potrebbe rivelarsi giusta o, molto più spesso, sbagliata. Quando funziona, produce un metodo nuovo, un'intuizione che prima non c'era, una piccola mossa in avanti del campo. Quando non funziona — che è la maggior parte delle volte — produce conoscenza negativa: sappiamo che quella strada è una via senza uscita, e questo è utile.

Non sto dicendo che una cosa sia "più importante" dell'altra. Lo sviluppo applicato e la ricerca si nutrono a vicenda: senza ricerca non ci sarebbero modelli da applicare, senza applicazioni la ricerca rimarrebbe esercizio teorico. Ma sono mestieri profondamente diversi nei tempi, nei criteri di successo, nella tolleranza al fallimento. Confonderli porta a fraintendimenti — sia dentro le aziende, sia quando si scelgono le persone con cui collaborare.

La cosa che la maggior parte non capisce: la ricerca è lenta

Viviamo in un'epoca in cui ogni settimana esce una "nuova frontiera" dell'AI. Un nuovo modello, una nuova capacità, una nuova preoccupazione. La velocità con cui le cose appaiono sui giornali fa pensare che la ricerca si muova alla stessa velocità.

Non è così.

Un paper serio impiega mesi a essere scritto. La fase di esperimenti dura settimane, a volte mesi. La fase di revisione tra i co-autori altre due o tre settimane. La revisione esterna, alla conferenza, prende altri mesi. Dal momento in cui hai l'idea al momento in cui il lavoro è pubblico, passa in media un anno. A volte due.

Quello che vediamo nei giornali — il nuovo modello presentato da una grande azienda, la nuova capacità sorprendente — è il prodotto finale di processi che spesso sono iniziati anni prima. Quando OpenAI rilascia un nuovo modello, le idee che lo sostengono sono in larga parte nate in paper accademici di tre o quattro anni prima, lentamente raffinati, combinati, scalati. La sensazione di velocità è in parte un effetto ottico: vediamo gli output, non i processi.

Questa lentezza ha un effetto laterale interessante. Quando insegno corsi sulle ultime tecnologie AI, posso parlarne con una certa pacatezza, perché so che dietro a ogni "novità" c'è una catena di idee più antiche che la spiegano. Una persona che ha fatto ricerca ha visto questi concetti nascere lentamente, e li riconosce sotto le nuove etichette. È una prospettiva che cambia il modo di insegnarli.

Cosa cambia nel modo in cui poi insegni

Una domanda che mi viene fatta spesso è: "Se uno vuole solo imparare a usare ChatGPT in azienda, a cosa gli serve che il docente abbia un PhD?"

È una domanda legittima, e per molto tempo non sapevo risponderla bene. Adesso credo di sì. La differenza non è cosa insegni, è il contesto dentro cui inserisci quello che insegni.

Quando uno spiega come funziona un Large Language Model senza aver mai letto un paper di base, finisce per ripetere metafore di seconda mano. "L'AI è come un pappagallo intelligente." "L'AI predice la parola successiva." Sono frasi corrette, ma vuote — non spiegano perché funzioni così, quali sono i limiti, quando ci si può fidare. Quando hai letto la letteratura, conosci i meccanismi, hai visto i modelli rompersi in mille modi diversi negli esperimenti, le stesse metafore acquistano una sostanza che prima non avevano. Diventano insegnabili.

Lo stesso vale per il prompting. Chi ha fatto ricerca su modelli linguistici sa che il prompting non è "scrivere bene le richieste" — è interagire con un sistema che ha proprietà statistiche specifiche, che reagisce a certi pattern e non ad altri. Sa perché il chain-of-thought funziona, sa quando il few-shot peggiora le risposte invece di migliorarle, sa quali fenomeni emergenti sono robusti e quali sono illusioni di benchmark. Questo non rende un corso più "tecnico" — rende un corso più onesto.

I momenti che valgono il resto

Tutto quello che ho scritto finora potrebbe far sembrare la ricerca un mestiere frustrante. In larga parte lo è. Ma ci sono momenti — pochi, ma reali — che giustificano il resto.

Sono i momenti in cui capisci una cosa che prima non capivi. Magari leggi un paper di un altro gruppo e all'improvviso il problema su cui sbatti la testa da settimane si scioglie. Magari guardi i risultati di un esperimento che hai lanciato la sera prima e vedi qualcosa che non ti aspettavi, e capisci che il tuo modello sta facendo qualcosa di interessante. Magari parli con un collega in una pausa di una conferenza e ti rendi conto che siete entrambi arrivati alla stessa intuizione da angolazioni opposte.

Questi momenti sono rari. Forse uno o due al mese, in periodi buoni. Ma sono il motivo per cui chi fa ricerca continua a farla, nonostante tutto il resto.

E penso siano anche il motivo per cui, quando insegni AI a persone che la vogliono capire e non solo usare, qualcosa si trasmette. Non sono solo nozioni. È un modo di guardare i problemi.

Perché questo dovrebbe interessare a chi non fa ricerca

Concludo con una riflessione su cui torno spesso quando parlo con aziende e professionisti che vogliono integrare l'AI nel loro lavoro.

Viviamo un momento in cui l'AI sta cambiando rapidamente molti settori. La tentazione, comprensibile, è di concentrarsi su cosa usare oggi: quale strumento è meglio, quale piano costa meno, quale prompt funziona. Sono tutte domande utili, ma sono domande sull'oggi.

Le persone che capiranno l'AI a un livello che durerà, secondo me, sono quelle che si fanno anche domande sul perché: perché un modello generativo è diverso da un motore di ricerca, perché certe richieste falliscono in modo prevedibile, perché alcuni problemi sono adatti all'AI e altri no. Queste sono domande di ricerca, anche quando non vengono poste da ricercatori.

Capire come funziona davvero un Large Language Model — non in modo profondo, ma in modo onesto — cambia il modo in cui lo usi. E in un'epoca in cui questi strumenti diventeranno sempre più parte del lavoro di tutti, è una competenza che non scade come scadono le funzionalità di un singolo prodotto.

È questo, in fondo, quello che porto in aula quando insegno. Non un elenco di trucchi che funzionano oggi e domani saranno superati. Il modo di pensare di chi ha passato anni cercando di capire perché queste cose funzionano, e quando smettono di farlo.


FAQ — Domande frequenti sulla ricerca in AI

Bisogna avere un dottorato per fare ricerca in AI?

Tecnicamente no, ma è la strada principale. Il dottorato è il periodo in cui si impara a fare ricerca in modo strutturato: leggere paper, fare esperimenti rigorosi, scrivere lavori che reggano la peer review. Si può anche entrare nella ricerca come ingegnere brillante con pubblicazioni proprie, ma è raro. La maggior parte dei ricercatori in laboratori industriali (Google DeepMind, Meta AI, OpenAI) ha un dottorato.

Qual è la differenza tra fare ricerca all'università e in azienda?

I laboratori industriali oggi pubblicano molto, partecipano alle stesse conferenze degli accademici, e spesso hanno più risorse computazionali. La differenza vera sta nei tempi e nei vincoli: in azienda c'è sempre una pressione, anche soft, verso applicazioni che possano produrre valore. In università si lavora più liberamente su problemi che potrebbero non avere applicazioni immediate, ma alla lunga si rivelano importanti.

Quante ore al giorno lavora un ricercatore in AI?

Dipende enormemente dalla fase. Vicino a una scadenza di conferenza, sono giornate da 10-12 ore per settimane di seguito. Nei periodi "normali", sono 8-9 ore con un certo livello di flessibilità. Quello che varia molto è la qualità delle ore: non si può fare ricerca creativa per 10 ore di fila, dopo le prime 4-5 il cervello si spegne. Molti ricercatori imparano presto a proteggere le ore migliori della giornata per il lavoro più difficile.

L'AI sostituirà i ricercatori che la sviluppano?

È una domanda che ci facciamo spesso, e onestamente non ho una risposta definitiva. Quello che vedo nella pratica è che gli strumenti AI hanno reso più veloce alcune parti del lavoro (scrivere codice, fare prime analisi di un dataset, riassumere paper), ma le parti più difficili — capire perché qualcosa non funziona, formulare un'ipotesi che valga la pena testare — restano profondamente umane. Per ora.

Si può fare ricerca in AI in Italia?

Sì, e la qualità di alcuni gruppi italiani è ottima — Trento, Pisa, Bologna, Roma La Sapienza, e diversi altri. Quello che manca rispetto agli Stati Uniti o ad alcuni centri europei sono le risorse computazionali su larga scala (training di modelli grandi richiede infrastrutture che pochissimi laboratori italiani hanno) e i salari competitivi per trattenere i talenti. Ma c'è ricerca seria che si fa, e si fa bene.