Tra la fine del 2021 e il 2022 tre diversi gruppi hanno prodotto algoritmi di intelligenza artificiale per produrre illustrazioni a partire da un testo in lingua naturale. I risultati hanno scosso profondamente il mondo dell’arte e delle illustrazioni in brevissimo tempo, in particolare quando recentemente una immagine prodotta da uno di questi algoritmi ha vinto un concorso d’arte in Colorado.
La cosa che colpisce particolarmente è la possibilità di creare immagini non solo di soggetti diversi, ma anche in stili diversi, da foto (specificando l’obbiettivo e la macchina usata, o lo stile di un fotografo) a immagini 3D (anche nello stile di uno specifico motore 3D o videogioco), a disegni e quadri (specificando il media e lo stile di particolari disegnatori o pittori).
In generale questi algoritmi trasformano un prompt, cioè un testo in lingua inglese, in una immagine. Ad esempio nell’immagine sottostante vediamo come DALL-E2 ha interpretato il testo che ho usato come prompt “An orc. Painted by Michael Whelan” (Un orco. Dipinto da Michael Whelan).
Il seguito di questo articolo parlerà di due argomenti: una breve descrizione dei vari sistemi e quattro usi diversi di questi alogirtmi per i Giochi di Ruolo, sia per chi gioca sia per chi pubblica moduli.
Gli algoritmi disponibili
Vi sono tre algoritmi attualmente disponibili al pubblico, tutti usciti tra il 2021 e il 2022: Midjourney, DALL-E2 e Stable Diffusion.
Midjourney, che è il nome sia dell’algoritmo sia del laboratorio indipendente che lo sviluppa, è dei tre il più riconoscibile. Infatti, nonostante vi sia come per gli altri algoritmi la possibilità di definire uno stile, vi è una certa “mano” riconoscibile. David Holtz, il direttore del laboratorio di sviluppo, ha detto che spesso gli è stato fatto notare dagli artisti come chiedere all’algoritmo di copiare il proprio stile ricordi loro uno studente che provi ad ispirarsi a loro (“I feel like Midjourney is an art student, and it has its own style, and when you invoke my name to create an image, it’s like asking an art student to make something inspired by my art.”). Offre inoltre la possibilità di usare nel prompt dei metatag, non in linguaggio naturale, per chiedere ad esempio rapporti di forma diversi (le immagini di base sono quadrati) o specifiche risoluzioni o formati.
Una volta registratisi sul sito per la Open Beta, si usa tramite Discord. Si viene invitati sul server Discord, si propone un prompt negli appositi canali con il comando /imagine [prompt], e si ricevono quattro immagini possibili, a bassa risoluzione. Le singole immagini possono poi essere prodotte a risoluzione più alta, o si possono chiedere variazioni a partire da una di queste. Ogni azione che si fa ha un costo: si hanno a disposizione all’inizio crediti gratuiti sufficienti per fare un 30-50 azioni (questo numero cambia nel tempo ), ma dopo averli usati si deve fare un abbonamento mensile da $10/mese, o $30/mese per avere operazioni illimitate.
DALL-E2 è un algoritmo proprietario prodotto da OpenAI, una azienda fondata (tra gli altri) da Elon Musk. È una tra le più importanti aziende tecnologiche che si occupano di AI, con investimenti iniziali di più di 1 miliardo di dollari. Oltre ad essere probabilmente il più avanzato in termine di comprensione dei prompt, ha due features molto interessanti: inpainting e outpainting. Entrambe permettono di modificare immagini preesistenti, o cancellando e ricostruendo dettagli (inpainting) o estendendo una immagine preesistente oltre i suoi bordi (outpainting). Tra le altre cose questo permette una comprensione molto più avanzata dei prompt: se ad esempio è molto difficile far capire ad un programma simile che vuoi “un cavaliere in armatura con lo scudo, sullo scudo il simbolo della sua casata: un drago con un giglio in bocca”, è molto più facile generare “un cavaliere in armatura con lo scudo”, e poi chiedere con una seconda operazione di modificare lo scudo, disegnando “un drago con un giglio in bocca”. È anche interessante usarlo per scoprire come continua la Monna Lisa.
È possibile usare DALL-E2 registrandosi sul sito: tutte le operazioni avvengono sul sito in modo molto intuitivo. Il primo mese si hanno 45 generazioni gratuite, ogni mese successivo 15. Per avere più generazioni si possono comprare a $15 pacchetti da 115 generazioni.
Infine Stable Diffusion è un algoritmo open source, in rapida evoluzione. Permette ampia flessibilità, e ha recentemente aggiunto le funzioni di inpainting come DALL-E2. I risultati che ho ottenuto sono spesso leggermente meno collegati al prompt degli altri algoritmi, o forse richiede più abilità nello scrivere i prompt. Cresce molto rapidamente però, e grazie al suo essere open source potrebbe rapidamente diventare lo standard – e aumentare di conseguenza investimenti, potenza e capacità.
Essendo open source è infatti possibile installarlo sul proprio PC. Non è semplicissimo da usare (anche se pochi giorni fa è uscito un pacchetto molto semplice per MacOs, DiffusionBee, che permette di installarlo e usarlo con pochi click) e richiede processori e schede grafiche notevoli. Alternativamente, molti siti online permettono di usarlo più o meno gratuitamente sui loro server. Per esempio NightCafè permette, con la sola iscrizione gratuita, di generare 5 immagini al giorno gratuitamente.
Uso per i Giochi di Ruolo
Le illustrazioni sono sempre state un campo fortemente rilevante per il Gioco di Ruolo. Vi sono almeno quattro usi che vengono in mente facilmente per questi sistemi e che vale la pena menzionare.
Primo e più ovvio, il disegno del proprio personaggio. È possibile difatti ottenere immagini molto dettagliate e raffinate del proprio personaggio, magari nello stile di un artista che ci piace, senza grande fatica o costo semplicemente descrivendolo in inglese. Ad esempio qui vediamo Alkidámas, il mio Mago Elfo Alto dalla cresta rosso fuoco (che gioco in un PbF), che legge il suo nuovo Grimorio Arcano +1. Dipinto da Marc Simonetti.
Questo è un uso molto naturale e semplice di questi sistemi.
Una seconda opzione è usare questi sistemi per illustrare i propri moduli o le proprie produzioni con immagini generiche ma libere per usi commerciali. Difatti un punto fondamentale è che queste immagini sono utilizzabili liberamente, anche per scopi commerciali, da chi le ha generate. È possibile generare immagini con lo stile di particolari artisti, e metterle nei propri manuali.
Il terzo uso per arricchire la propria esperienza nei Giochi di Ruolo è creare con questi algoritmi immagini da offrire ai giocatori di specifici oggetti o aree. Questa ad esempio è una immagine che ho creato per una avventura che sto scrivendo. Le tre rune e la mano di pietra sono la chiave dell’indovinello, ma ovviamente non è facile trovare (gratuitamente o meno) un'immagine con queste caratteristiche, e che sia anche nel giusto ambiente (una antica fognatura ora abbandonata). Ho quindi fatto disegnare le tre rune da Stable Diffusion, le ho allineate in GIMP e poi ho chiesto a DALL-E2 in outpainting di fare prima la porta e poi la mano di pietra accanto. L'uso di questi algoritmi per generare rune, stemmi nobiliari, monete d’oro particolari e così via possono portare le immagini che si preparano per la sessione ad un livello completamente nuovo.
Infine, l’ultimo uso che ne faccio è come generatore di idee. Non viene in mente nulla di particolare per il villaggio in cui i personaggi sono appena arrivati? Potete chiedere a uno di questi sistemi di generare un villaggio fantasy nella foresta, e in pochi secondi avrete un’immagine che accenderà mille idee nella tua testa di DM – sia in partita sia davanti al foglio bianco! Una immagine dell'oste permette immediatamente di caratterizzarlo nella propria mente.
E questo è tutto! Cosa ne pensate? Siete artisti spaventati o arrabbiati, o giocatori entusiasti? Trovate sia corretto che sia permesso usare sistemi simili gratuitamente, anche se sono stati addestrati usando immagini – spesso protette da copyright - di artisti reali?
- 3
- 1
Commento consigliato
Crea un account o accedi per commentare
Devi essere un utente registrato per poter lasciare un commento
Crea un account
Crea un nuovo account e registrati nella nostra comunità. È facile!
Registra un nuovo accountAccedi
Hai già un account? Accedi qui.
Accedi ora