Anthropic, azienda leader nel campo dell’intelligenza artificiale, ha recentemente pubblicato uno studio pionieristico che analizza come il suo modello linguistico, Claude, esprima giudizi di valore nelle interazioni quotidiane con gli utenti. Lo studio, intitolato Values in the Wild: Discovering and Analyzing Values in Real-World Language Model Interactions, si basa sull’analisi di 700.000 conversazioni anonime avvenute su claude.ai nel febbraio 2025.
Contrariamente alla percezione comune che l’AI fornisca solo risposte oggettive, lo studio rivela che Claude spesso affronta domande che richiedono giudizi morali o consigli personali. Ad esempio, quando un utente chiede consigli su relazioni personali o decisioni etiche, Claude non si limita a fornire informazioni, ma esprime valori come “rispetto reciproco” o “accuratezza storica”, adattandosi al contesto della conversazione.
I ricercatori di Anthropic hanno identificato 3.307 valori unici espressi da Claude, organizzati in cinque categorie principali: pratici, epistemici, sociali, protettivi e personali. Tra i valori più frequentemente riscontrati vi sono la “professionalità”, la “chiarezza” e la “trasparenza”, riflettendo l’obiettivo di Claude di essere un assistente utile e affidabile.
Lo studio evidenzia anche che Claude tende a rispecchiare i valori espressi dagli utenti. Nel 28,2% delle conversazioni analizzate, l’AI ha mostrato un forte sostegno ai valori dell’interlocutore. In alcuni casi (6,6%), ha riformulato i valori presentati, offrendo nuove prospettive, mentre nel 3% delle conversazioni ha opposto resistenza, specialmente quando venivano richiesti contenuti non etici o venivano espressi valori come il nichilismo morale.
I risultati dello studio offrono preziose indicazioni per migliorare l’addestramento dei modelli di AI. Comprendere come l’AI esprima e adatti i propri valori in contesti reali è fondamentale per garantire che tali sistemi siano allineati con i valori umani e agiscano in modo etico e responsabile.
Per approfondire lo studio completo, è possibile consultare il documento su arXiv: Values in the Wild.
Nicoletta Biglietti
(Accademia di Belle Arti di Brescia SantaGiulia)