Qualche tempo fa ho scritto un post che associava la temperatura, un parmetro che può essere variato all'interno di un LLM e ne aumenta il grado di casualità nella scelta dei token più probabili, alla creatività, allargando il discorso ad altro, come i sistemi termodinamici e l'evoluzione biologica. Recentemente ho letto un articolo che riporta dei risultati di uno studio che mette a confronto l'intelligenza umana e quella artificiale dal punto di vista della cosiddetta "creatività divergente" ("A large-scale comparison of divergent creativity in humans and large language models").
NOTA 1: La creatività divergente è l'abilità di generare soluzioni originali per problemi aperti, espandendo il pensiero in direzioni diverse (il motore che permette di esplorare nuovi territori). Al contrario, la creatività convergente è l'abilità di formare associazioni e trovare collegamenti tra concetti o parole apparentemente distanti o contrapposti (la bussola che permette di unire i punti).
L'articolo, difficile da leggere quando racconta i metodi utilizzati per indagare l'argomento, è però abbastanza semplice (mi pare) nelle sue conclusioni, che mettono in risalto due cose, la prima è che gli esseri umani mantengono un vantaggio significativo nella varietà dell'uso del vocabolario, cioè dimostrano una capacità superiore di generare un repertorio più ampio di risposte uniche e variegate, al contrario delle IA che tendono a ripetere gli stessi termini. La seconda è che se si tenta di aumentare la "creatività" dell'intelligenza artificiale, aumentandone la "temperatura" (secondo l'idea riportata nel mio post precedente), si tende ad ottenere degli output privi di senso. Questo probabilmente perché l'IA si basa esclusivamente sulla manipolazione statistica, mentre la creatività umana emerge da un intreccio di esperienze vissute, contesti emotivi e comprensione semantica.
Riallacciandomi alle considerazioni del mio post precedente in cui parlavo del meccanismo con cui la natura indubbiamente risulta essere creativa, mi pare che nel caso dell'IA la cosiddetta "temperatura" risulta essere solo un meccanismo di generazione di casualità che non può essere sufficiente ad esprimere creatività. Evidentemente la creatività, come nel caso dell'evoluzione, ha bisogno sia di esplorare nuove possibilità sondandole casualmente sia di metterle alla prova in un'esperienza reale e non solamente testando la sua plausibilità statistica. All'IA, in particolare ad un LLM, manca la capacità di fare esperienza del mondo reale. Almeno per il momento.
L'articolo è stato anche commentato su Facebook da Walter Quattrociocchi: «Gli autori provano a “spingere” i modelli. Aumentano la temperatura, li istruiscono a essere creativi, li invitano a usare l’immaginazione, a massimizzare l’originalità. Il risultato è sempre lo stesso schema: inizialmente il punteggio sale, poi il sistema deraglia. Compaiono parole senza senso, combinazioni spurie, rumore linguistico. La diversità cresce, ma il significato si dissolve. È un aumento di entropia, non di creatività».
NOTA 2: nella nota precedente ho suggerito forse l'idea che in fondo lo studio fatto e riportato sull'articolo sia approdato a risultati che potevano essere intuiti molto facilmente e che, col senno di poi, potrebbero essere considerati scontati. Ecco, è importante sottolineare l'espressione "col senno di poi". Per costruire conoscenza è spesso necessario e sempre molto importante "verificare" le cose intuitive attraverso misure precise fatte sulla realtà, perché dovrebbe essere sempre molto ben presente il fatto che l'intuizione può portare a pensieri scollegati dalla realtà e può essere fonte di bias cognitivi. L'intuizione da sola non è mai da considerare sufficiente nel processo di costruzione della conoscenza. Quindi l'articolo in questione, sebbene possa far pensare di "scoprire l'acqua calda" è il risultato di un lavoro concettualmente molto importante.