Vai al contenuto

Messaggio consigliato

Inviata

Anche il mondo dei GdR sta per subire l'influenza degli avanzamenti tecnologici nella creazione di illustrazioni da parte di intelligenze artificiali.

Tra la fine del 2021 e il 2022 tre diversi gruppi hanno prodotto algoritmi di intelligenza artificiale per produrre illustrazioni a partire da un testo in lingua naturale. I risultati hanno scosso profondamente il mondo dell’arte e delle illustrazioni in brevissimo tempo, in particolare quando recentemente una immagine prodotta da uno di questi algoritmi ha vinto un concorso d’arte in Colorado.

La cosa che colpisce particolarmente è la possibilità di creare immagini non solo di soggetti diversi, ma anche in stili diversi, da foto (specificando l’obbiettivo e la macchina usata, o lo stile di un fotografo) a immagini 3D (anche nello stile di uno specifico motore 3D o videogioco), a disegni e quadri (specificando il media e lo stile di particolari disegnatori o pittori).

In generale questi algoritmi trasformano un prompt, cioè un testo in lingua inglese, in una immagine. Ad esempio nell’immagine sottostante vediamo come DALL-E2 ha interpretato il testo che ho usato come prompt “An orc. Painted by Michael Whelan” (Un orco. Dipinto da Michael Whelan).

large.559390010_DALLE2022-10-0610_56.43-Anorc.paintedbyMichaelWhelan.thumb.jpg.70a0c76ea5df32991f9b0d21761e9998.jpg.f6581e2f3089b4b4915b5ab1d47acf3e.jpg

Il seguito di questo articolo parlerà di due argomenti: una breve descrizione dei vari sistemi e quattro usi diversi di questi alogirtmi per i Giochi di Ruolo, sia per chi gioca sia per chi pubblica moduli.

Gli algoritmi disponibili

Vi sono tre algoritmi attualmente disponibili al pubblico, tutti usciti tra il 2021 e il 2022: Midjourney, DALL-E2 e Stable Diffusion.

Midjourney, che è il nome sia dell’algoritmo sia del laboratorio indipendente che lo sviluppa, è dei tre il più riconoscibile. Infatti, nonostante vi sia come per gli altri algoritmi la possibilità di definire uno stile, vi è una certa “mano” riconoscibile. David Holtz, il direttore del laboratorio di sviluppo, ha detto che spesso gli è stato fatto notare dagli artisti come chiedere all’algoritmo di copiare il proprio stile ricordi loro uno studente che provi ad ispirarsi a loro (“I feel like Midjourney is an art student, and it has its own style, and when you invoke my name to create an image, it’s like asking an art student to make something inspired by my art.”). Offre inoltre la possibilità di usare nel prompt dei metatag, non in linguaggio naturale, per chiedere ad esempio rapporti di forma diversi (le immagini di base sono quadrati) o specifiche risoluzioni o formati.

Una volta registratisi sul sito per la Open Beta, si usa tramite Discord. Si viene invitati sul server Discord, si propone un prompt negli appositi canali con il comando /imagine [prompt], e si ricevono quattro immagini possibili, a bassa risoluzione. Le singole immagini possono poi essere prodotte a risoluzione più alta, o si possono chiedere variazioni a partire da una di queste. Ogni azione che si fa ha un costo: si hanno a disposizione all’inizio crediti gratuiti sufficienti per fare un 30-50 azioni (questo numero cambia nel tempo ), ma dopo averli usati si deve fare un abbonamento mensile da $10/mese, o $30/mese per avere operazioni illimitate.

DALL-E2 è un algoritmo proprietario prodotto da OpenAI, una azienda fondata (tra gli altri) da Elon Musk. È una tra le più importanti aziende tecnologiche che si occupano di AI, con investimenti iniziali di più di 1 miliardo di dollari. Oltre ad essere probabilmente il più avanzato in termine di comprensione dei prompt, ha due features molto interessanti: inpainting e outpainting. Entrambe permettono di modificare immagini preesistenti, o cancellando e ricostruendo dettagli (inpainting) o estendendo una immagine preesistente oltre i suoi bordi (outpainting). Tra le altre cose questo permette una comprensione molto più avanzata dei prompt: se ad esempio è molto difficile far capire ad un programma simile che vuoi “un cavaliere in armatura con lo scudo, sullo scudo il simbolo della sua casata: un drago con un giglio in bocca”, è molto più facile generare “un cavaliere in armatura con lo scudo”, e poi chiedere con una seconda operazione di modificare lo scudo, disegnando “un drago con un giglio in bocca”. È anche interessante usarlo per scoprire come continua la Monna Lisa.

large.1666378013_DALLE2022-10-0611_29.06-Tuscanhillswomansittingonachair.PaintedbyLeonardoDaVinci.thumb.jpg.4e0ea5b7d32d0c408380d0ae6afe7830.jpg.670672eebdfd3e57e3d134287fb3d0a9.jpg

È possibile usare DALL-E2 registrandosi sul sito: tutte le operazioni avvengono sul sito in modo molto intuitivo. Il primo mese si hanno 45 generazioni gratuite, ogni mese successivo 15. Per avere più generazioni si possono comprare a $15 pacchetti da 115 generazioni.

Infine Stable Diffusion è un algoritmo open source, in rapida evoluzione. Permette ampia flessibilità, e ha recentemente aggiunto le funzioni di inpainting come DALL-E2. I risultati che ho ottenuto sono spesso leggermente meno collegati al prompt degli altri algoritmi, o forse richiede più abilità nello scrivere i prompt. Cresce molto rapidamente però, e grazie al suo essere open source potrebbe rapidamente diventare lo standard – e aumentare di conseguenza investimenti, potenza e capacità.

Essendo open source è infatti possibile installarlo sul proprio PC. Non è semplicissimo da usare (anche se pochi giorni fa è uscito un pacchetto molto semplice per MacOs, DiffusionBee, che permette di installarlo e usarlo con pochi click) e richiede processori e schede grafiche notevoli. Alternativamente, molti siti online permettono di usarlo più o meno gratuitamente sui loro server. Per esempio NightCafè permette, con la sola iscrizione gratuita, di generare 5 immagini al giorno gratuitamente.

Uso per i Giochi di Ruolo

Le illustrazioni sono sempre state un campo fortemente rilevante per il Gioco di Ruolo. Vi sono almeno quattro usi che vengono in mente facilmente per questi sistemi e che vale la pena menzionare.

Primo e più ovvio, il disegno del proprio personaggio. È possibile difatti ottenere immagini molto dettagliate e raffinate del proprio personaggio, magari nello stile di un artista che ci piace, senza grande fatica o costo semplicemente descrivendolo in inglese. Ad esempio qui vediamo Alkidámas, il mio Mago Elfo Alto dalla cresta rosso fuoco (che gioco in un PbF), che legge il suo nuovo Grimorio Arcano +1. Dipinto da Marc Simonetti.

large.Alkidamas_v2.thumb.jpg.8dbcfb83e7002b522c3d1769efbbbe72.jpg.c9aad49d949822fdd8da23ebac085b19.jpg

Questo è un uso molto naturale e semplice di questi sistemi.

Una seconda opzione è usare questi sistemi per illustrare i propri moduli o le proprie produzioni con immagini generiche ma libere per usi commerciali. Difatti un punto fondamentale è che queste immagini sono utilizzabili liberamente, anche per scopi commerciali, da chi le ha generate. È possibile generare immagini con lo stile di particolari artisti, e metterle nei propri manuali.

Il terzo uso per arricchire la propria esperienza nei Giochi di Ruolo è creare con questi algoritmi immagini da offrire ai giocatori di specifici oggetti o aree. Questa ad esempio è una immagine che ho creato per una avventura che sto scrivendo. Le tre rune e la mano di pietra sono la chiave dell’indovinello, ma ovviamente non è facile trovare (gratuitamente o meno) un'immagine con queste caratteristiche, e che sia anche nel giusto ambiente (una antica fognatura ora abbandonata). Ho quindi fatto disegnare le tre rune da Stable Diffusion, le ho allineate in GIMP e poi ho chiesto a DALL-E2 in outpainting di fare prima la porta e poi la mano di pietra accanto. L'uso di questi algoritmi per generare rune, stemmi nobiliari, monete d’oro particolari e così via possono portare le immagini che si preparano per la sessione ad un livello completamente nuovo.

large.PortaDiPietra_43.thumb.jpg.9de49aeaa6b77d4a609645ceae097c7b.jpg.967bc6b187d0ff6448c15a63a02aa9c7.jpg

Infine, l’ultimo uso che ne faccio è come generatore di idee. Non viene in mente nulla di particolare per il villaggio in cui i personaggi sono appena arrivati? Potete chiedere a uno di questi sistemi di generare un villaggio fantasy nella foresta, e in pochi secondi avrete un’immagine che accenderà mille idee nella tua testa di DM – sia in partita sia davanti al foglio bianco! Una immagine dell'oste permette immediatamente di caratterizzarlo nella propria mente.


E questo è tutto! Cosa ne pensate? Siete artisti spaventati o arrabbiati, o giocatori entusiasti? Trovate sia corretto che sia permesso usare sistemi simili gratuitamente, anche se sono stati addestrati usando immagini – spesso protette da copyright - di artisti reali?


Visualizza tutto articolo

  • Mi piace 9
  • Grazie 2

Inviato

Vi ringrazio infinitamente ahah, è tre mesi che cerco di accedere gratuitamente a questi programmi per almeno provarli ( e poi magari utilizzarli per le mie sessioni ), finalmente con NightCafè posso! ^.^

  • Grazie 1
Inviato
1 ora fa, Lopolipo.96 ha scritto:

Vi ringrazio infinitamente ahah, è tre mesi che cerco di accedere gratuitamente a questi programmi per almeno provarli ( e poi magari utilizzarli per le mie sessioni ), finalmente con NightCafè posso! ^.^

Io con Nightcafè mi trovo bene per i ritratti, basta aprirlo in una finestra in incognito e i crediti si ricaricano automaticamente.

Inviato
4 minuti fa, Grimorio ha scritto:

Io con Nightcafè mi trovo bene per i ritratti, basta aprirlo in una finestra in incognito e i crediti si ricaricano automaticamente.

perfetto, userò questo trucchetto

Inviato
1 minuto fa, Ermenegildo2 ha scritto:

Se avete una buona scheda grafica stable diffusion può essere fatto girare in locale per avere il massimo controllo sui parametri e soprattutto non avere problemi in futuro qualora cambiasse qualcosa.

Esatto, ed è decisamente la cosa migliore (anche se DALL-E per ora lo trovo pazzesco!) se si è un minimo capaci.

Una caratteristica importante su cui non mi sono dilungato sull'articolo - che voleva essere introduttivo - è che tutti questi servizi hanno nelle versioni pubbliche meccanismi di censura sui prompt più o meno severi. Oltre ai casi ovvi, come la pornografia o le immagini violente, DALL-E in particolare impedisce di usare parole chiave come volti di persone viventi (su Stable Diffusion e Midjourney si può scrivere "Scarlet Johanson dipinta come una sirena", su DALL-E no) per evitare deepfake e problemi di protezione dell'immagine.

Le immagini violente in particolare è una limitazione per il gioco di ruolo, perché se si vogliono descrivere scene di combattimento è molto difficile con qualsiasi di questi sistemi. Anche alcune armi sono considerate parole tabù e vengono bloccate. Avendo Stable Diffusion sul proprio PC è possibile utilizzarlo (in modo consapevole) aggirando le limitazioni che ci limitano maggiormente.

  • Mi piace 1
Inviato (modificato)

Stable diffusion si può usare gratuitamente e senza limitazioni anche con il solo browser usando un servizio cloud hosting di google (google collab) a patto di avere spazio sul proprio drive (immagini generate e file necessari vengono scaricati li)e un account su huggingface
In rete esistono pagine già pronte allo scopo e guide per usarle.

Modificato da ilTipo
  • Mi piace 1
Inviato (modificato)

Altro utilizzo interessante può essere la creazione di stemmi e araldiche. Questi li ho fatti con DALL-E:

 

DALL·E 2022-10-10 15.51.48 - Medieval coat of arms depicting a black prancing horse on a yellow background.png

 

 

DALL·E 2022-10-10 15.56.39 - Medieval coat of arms depicting a green oak on a black background.png

 

 

DALL·E 2022-10-10 15.58.52 - Medieval coat of arms depicting a crown of blue laurels on a white background, with golden bees around it.png

Modificato da Assalon
  • Mi piace 6
Inviato
1 ora fa, Assalon ha scritto:

Altro utilizzo interessante può essere la creazione di stemmi e araldiche. Questi li ho fatti con DALL-E:

Molto belli! Rispetto a questo trovo particolarmente interessante la possibilità di fare cose non tradizionali. Ad esempio nel villaggio centrale in una mia avventura ci sono 6 case nobiliari, e essendo una ambientazione vagamente mesoamericana ho creato dei simboli da incidere sulla roccia delle case-piramidi invece di qualcosa che vada su uno scudo. Ma con soggetti più occidentali.

Per questi ho creato pietre intarsiate Maya in Stable Diffusion, e poi in Dall-E ho fatto l'inpaint del simbolo della casata che avevo in mente. Mi piace perché l'effetto non è né Mesoamericano né Europeo, sembra qualcosa di diverso. Ma soprattutto è un effetto veramente professionale per qualcosa fatto in meno di mezz'ora - e che sarebbe stato sicuramente impossibile da realizzare per un gioco casalingo.

casate.thumb.jpg.7fa4c45c3ca220ae61000e221ae2fbfa.jpg

 

  • Mi piace 8
Inviato

Sì è un argomento molto interessante e che potrebbe valere la pena di approfondire, in quanto permette a tutti di accedere ad una componente fondamentale dei giochi di ruolo.

  • 1 mese dopo...
Inviato

Il problema principale che ho incontrato quando ho provato a usare Night Café per D&D (oltre al fatto che sono un principiante, e probabilmente devo imparare a programmare meglio i prompt) è che appena il soggetto è una creatura umanoide non-umana la qualità cala drasticamente. È molto difficile, ad esempio, ottenere goblin o orchi di buona qualità. Qualcuno salta fuori, ma con un tasso di scarto delle immagini davvero alto.

Qui trovate i risultati dei miei esperimenti (prima quelli buoni, poi, in appendice, una "galleria degli orrori" di quelli cattivi).

Vacanze a Kichiputl – Dietro lo schermo (wordpress.com)

Il mio profilo, se vi interessa, è questo:

https://creator.nightcafe.studio/u/billeboo

Ho apprezzato comunque che di recente Night Café abbia permesso di creare 4 immagini con lo stesso prompt per 1 solo credito: aiuta a mitigare un po' il problema, per forza bruta, con la legge dei grandi numeri.

Inviato (modificato)
2 ore fa, Bille Boo ha scritto:

Il problema principale che ho incontrato quando ho provato a usare Night Café per D&D (oltre al fatto che sono un principiante, e probabilmente devo imparare a programmare meglio i prompt) è che appena il soggetto è una creatura umanoide non-umana la qualità cala drasticamente. È molto difficile, ad esempio, ottenere goblin o orchi di buona qualità. Qualcuno salta fuori, ma con un tasso di scarto delle immagini davvero alto.

Qui trovate i risultati dei miei esperimenti (prima quelli buoni, poi, in appendice, una "galleria degli orrori" di quelli cattivi).

Vacanze a Kichiputl – Dietro lo schermo (wordpress.com)

Il mio profilo, se vi interessa, è questo:

https://creator.nightcafe.studio/u/billeboo

Ho apprezzato comunque che di recente Night Café abbia permesso di creare 4 immagini con lo stesso prompt per 1 solo credito: aiuta a mitigare un po' il problema, per forza bruta, con la legge dei grandi numeri.

Well, oggi son sul Cb andante e ti/vi do un paio di dritte😄 

• Sì, alcune cose non escono al volo (presumo che le AI non abbiano il vocabolario dndiano incorporato o ci arrivino per giri strani)

• No no. Escono pure catfolk e altri...ma c'è da capire dove mettere le mani. 

• Yep of course. Da quel che vedo usi solo il random, non forzi le %, i seed vanno per conto loro e il default regna sovrano.

In ogni caso, a meno che non vuoi pubblicarlo là, puoi fare le prove col tricky che diceva @Grimorio  salvarti le immagini e/o annotare i parametri.

Spoiler

 

snapshot_images.nightcafe.studio_1668427723289.thumb.png.9cc1a79cd1a94804832ae9c05b8c9c50.png

🖕👇Screenshot in stile: "creazione fatta al volo col cell" 

Screenshot_20221114-123030_Opera.thumb.jpg.aada941cb5229d7c1a4a4f2c587ce959.jpg

 

snapshot_images.nightcafe.studio_1668428604636.thumb.png.9464bcf6ffa48d506e50dfeb402a9868.png

 ~~~~~~~

Qui in sostanza è "quando hai trovato la combinazione della serratura per la creazione di X soggetto e fai un po' il cavolo che vuoi". 

snapshot_images.nightcafe.studio_1668383866477.thumb.png.6478fdc9551ca1a1594ea7122ddb564f.png

 

 

 

 

Modificato da Nyxator
  • Mi piace 1
Inviato
11 minuti fa, Nyxator ha scritto:

Da quel che vedo usi solo il random, non forzi le %, i seed vanno per conto loro e il default regna sovrano.

ll fatto che io non abbia capito niente di questa frase mi fa capire che ho molto da studiare 🤣

Un giorno che ho tempo e voglia vedrò di mettermi d'impegno. Intanto grazie!

Inviato (modificato)
20 ore fa, Bille Boo ha scritto:

ll fatto che io non abbia capito niente di questa frase mi fa capire che ho molto da studiare 🤣

I parametri fan miracoli.

Questa npc del PbF dell'altrove postereccio mi uscì durante un test in anonimo. 

Normalmente i results dei test non li pubblicherei, ma onde evitare di far vaccate coi backup/upload ecc meglio aver in giro anche la copia originale con noticina di credits+un like dal profilo ufficiale 😄

https://creator.nightcafe.studio/creation/cfxy05MQ2ioqh0K8Bwav

 

E bon, per un po' qui mi sa che son a posto.😄

Modificato da Nyxator

Crea un account o accedi per commentare

Devi essere un utente registrato per poter lasciare un commento

Crea un account

Crea un nuovo account e registrati nella nostra comunità. È facile!

Registra un nuovo account

Accedi

Hai già un account? Accedi qui.
 

Accedi ora
×
×
  • Crea nuovo...