Vai al contenuto
  • Anche il mondo dei GdR sta per subire l'influenza degli avanzamenti tecnologici nella creazione di illustrazioni da parte di intelligenze artificiali.

Tra la fine del 2021 e il 2022 tre diversi gruppi hanno prodotto algoritmi di intelligenza artificiale per produrre illustrazioni a partire da un testo in lingua naturale. I risultati hanno scosso profondamente il mondo dell’arte e delle illustrazioni in brevissimo tempo, in particolare quando recentemente una immagine prodotta da uno di questi algoritmi ha vinto un concorso d’arte in Colorado.

La cosa che colpisce particolarmente è la possibilità di creare immagini non solo di soggetti diversi, ma anche in stili diversi, da foto (specificando l’obbiettivo e la macchina usata, o lo stile di un fotografo) a immagini 3D (anche nello stile di uno specifico motore 3D o videogioco), a disegni e quadri (specificando il media e lo stile di particolari disegnatori o pittori).

In generale questi algoritmi trasformano un prompt, cioè un testo in lingua inglese, in una immagine. Ad esempio nell’immagine sottostante vediamo come DALL-E2 ha interpretato il testo che ho usato come prompt “An orc. Painted by Michael Whelan” (Un orco. Dipinto da Michael Whelan).

large.559390010_DALLE2022-10-0610_56.43-Anorc.paintedbyMichaelWhelan.thumb.jpg.70a0c76ea5df32991f9b0d21761e9998.jpg.f6581e2f3089b4b4915b5ab1d47acf3e.jpg

Il seguito di questo articolo parlerà di due argomenti: una breve descrizione dei vari sistemi e quattro usi diversi di questi alogirtmi per i Giochi di Ruolo, sia per chi gioca sia per chi pubblica moduli.

Gli algoritmi disponibili

Vi sono tre algoritmi attualmente disponibili al pubblico, tutti usciti tra il 2021 e il 2022: Midjourney, DALL-E2 e Stable Diffusion.

Midjourney, che è il nome sia dell’algoritmo sia del laboratorio indipendente che lo sviluppa, è dei tre il più riconoscibile. Infatti, nonostante vi sia come per gli altri algoritmi la possibilità di definire uno stile, vi è una certa “mano” riconoscibile. David Holtz, il direttore del laboratorio di sviluppo, ha detto che spesso gli è stato fatto notare dagli artisti come chiedere all’algoritmo di copiare il proprio stile ricordi loro uno studente che provi ad ispirarsi a loro (“I feel like Midjourney is an art student, and it has its own style, and when you invoke my name to create an image, it’s like asking an art student to make something inspired by my art.”). Offre inoltre la possibilità di usare nel prompt dei metatag, non in linguaggio naturale, per chiedere ad esempio rapporti di forma diversi (le immagini di base sono quadrati) o specifiche risoluzioni o formati.

Una volta registratisi sul sito per la Open Beta, si usa tramite Discord. Si viene invitati sul server Discord, si propone un prompt negli appositi canali con il comando /imagine [prompt], e si ricevono quattro immagini possibili, a bassa risoluzione. Le singole immagini possono poi essere prodotte a risoluzione più alta, o si possono chiedere variazioni a partire da una di queste. Ogni azione che si fa ha un costo: si hanno a disposizione all’inizio crediti gratuiti sufficienti per fare un 30-50 azioni (questo numero cambia nel tempo ), ma dopo averli usati si deve fare un abbonamento mensile da $10/mese, o $30/mese per avere operazioni illimitate.

DALL-E2 è un algoritmo proprietario prodotto da OpenAI, una azienda fondata (tra gli altri) da Elon Musk. È una tra le più importanti aziende tecnologiche che si occupano di AI, con investimenti iniziali di più di 1 miliardo di dollari. Oltre ad essere probabilmente il più avanzato in termine di comprensione dei prompt, ha due features molto interessanti: inpainting e outpainting. Entrambe permettono di modificare immagini preesistenti, o cancellando e ricostruendo dettagli (inpainting) o estendendo una immagine preesistente oltre i suoi bordi (outpainting). Tra le altre cose questo permette una comprensione molto più avanzata dei prompt: se ad esempio è molto difficile far capire ad un programma simile che vuoi “un cavaliere in armatura con lo scudo, sullo scudo il simbolo della sua casata: un drago con un giglio in bocca”, è molto più facile generare “un cavaliere in armatura con lo scudo”, e poi chiedere con una seconda operazione di modificare lo scudo, disegnando “un drago con un giglio in bocca”. È anche interessante usarlo per scoprire come continua la Monna Lisa.

large.1666378013_DALLE2022-10-0611_29.06-Tuscanhillswomansittingonachair.PaintedbyLeonardoDaVinci.thumb.jpg.4e0ea5b7d32d0c408380d0ae6afe7830.jpg.670672eebdfd3e57e3d134287fb3d0a9.jpg

È possibile usare DALL-E2 registrandosi sul sito: tutte le operazioni avvengono sul sito in modo molto intuitivo. Il primo mese si hanno 45 generazioni gratuite, ogni mese successivo 15. Per avere più generazioni si possono comprare a $15 pacchetti da 115 generazioni.

Infine Stable Diffusion è un algoritmo open source, in rapida evoluzione. Permette ampia flessibilità, e ha recentemente aggiunto le funzioni di inpainting come DALL-E2. I risultati che ho ottenuto sono spesso leggermente meno collegati al prompt degli altri algoritmi, o forse richiede più abilità nello scrivere i prompt. Cresce molto rapidamente però, e grazie al suo essere open source potrebbe rapidamente diventare lo standard – e aumentare di conseguenza investimenti, potenza e capacità.

Essendo open source è infatti possibile installarlo sul proprio PC. Non è semplicissimo da usare (anche se pochi giorni fa è uscito un pacchetto molto semplice per MacOs, DiffusionBee, che permette di installarlo e usarlo con pochi click) e richiede processori e schede grafiche notevoli. Alternativamente, molti siti online permettono di usarlo più o meno gratuitamente sui loro server. Per esempio NightCafè permette, con la sola iscrizione gratuita, di generare 5 immagini al giorno gratuitamente.

Uso per i Giochi di Ruolo

Le illustrazioni sono sempre state un campo fortemente rilevante per il Gioco di Ruolo. Vi sono almeno quattro usi che vengono in mente facilmente per questi sistemi e che vale la pena menzionare.

Primo e più ovvio, il disegno del proprio personaggio. È possibile difatti ottenere immagini molto dettagliate e raffinate del proprio personaggio, magari nello stile di un artista che ci piace, senza grande fatica o costo semplicemente descrivendolo in inglese. Ad esempio qui vediamo Alkidámas, il mio Mago Elfo Alto dalla cresta rosso fuoco (che gioco in un PbF), che legge il suo nuovo Grimorio Arcano +1. Dipinto da Marc Simonetti.

large.Alkidamas_v2.thumb.jpg.8dbcfb83e7002b522c3d1769efbbbe72.jpg.c9aad49d949822fdd8da23ebac085b19.jpg

Questo è un uso molto naturale e semplice di questi sistemi.

Una seconda opzione è usare questi sistemi per illustrare i propri moduli o le proprie produzioni con immagini generiche ma libere per usi commerciali. Difatti un punto fondamentale è che queste immagini sono utilizzabili liberamente, anche per scopi commerciali, da chi le ha generate. È possibile generare immagini con lo stile di particolari artisti, e metterle nei propri manuali.

Il terzo uso per arricchire la propria esperienza nei Giochi di Ruolo è creare con questi algoritmi immagini da offrire ai giocatori di specifici oggetti o aree. Questa ad esempio è una immagine che ho creato per una avventura che sto scrivendo. Le tre rune e la mano di pietra sono la chiave dell’indovinello, ma ovviamente non è facile trovare (gratuitamente o meno) un'immagine con queste caratteristiche, e che sia anche nel giusto ambiente (una antica fognatura ora abbandonata). Ho quindi fatto disegnare le tre rune da Stable Diffusion, le ho allineate in GIMP e poi ho chiesto a DALL-E2 in outpainting di fare prima la porta e poi la mano di pietra accanto. L'uso di questi algoritmi per generare rune, stemmi nobiliari, monete d’oro particolari e così via possono portare le immagini che si preparano per la sessione ad un livello completamente nuovo.

large.PortaDiPietra_43.thumb.jpg.9de49aeaa6b77d4a609645ceae097c7b.jpg.967bc6b187d0ff6448c15a63a02aa9c7.jpg

Infine, l’ultimo uso che ne faccio è come generatore di idee. Non viene in mente nulla di particolare per il villaggio in cui i personaggi sono appena arrivati? Potete chiedere a uno di questi sistemi di generare un villaggio fantasy nella foresta, e in pochi secondi avrete un’immagine che accenderà mille idee nella tua testa di DM – sia in partita sia davanti al foglio bianco! Una immagine dell'oste permette immediatamente di caratterizzarlo nella propria mente.


E questo è tutto! Cosa ne pensate? Siete artisti spaventati o arrabbiati, o giocatori entusiasti? Trovate sia corretto che sia permesso usare sistemi simili gratuitamente, anche se sono stati addestrati usando immagini – spesso protette da copyright - di artisti reali?


Approfondimenti

User Feedback

Recommended Comments

Hero81

Circolo degli Antichi
(modificato)
comment_1827496

Che bellissimo thread: da affiggere sulla sommità della sezione 'Discussioni Gdr Generiche'. (a mio avviso)

Aggiungo che in passato mi sono occupato per circa due anni di Data Science. Non di 'Generative adversarial network' tuttavia che, al tempo, erano un campo troppo recente.

Edited by Hero81

Nyxator

Circolo degli Antichi
(modificato)
comment_1828281
14 ore fa, MattoMatteo ha scritto:

Consiglio di dare un'occhiata qui... attenzione, che rischiano di cadere delle mascelle. 😉

Nah, son assai carini e belli tridimensionali, ma se bazzichi nei siti delle AI si vedono cose anche più slogamascella di quelle.😄

Pure io al primo tentativo al volo ti riesco a fare dei simil Alien decenti o ritratti di attrici/attori in quantità industriale.

(H.R Giger tra l'altro è tra gli artisti delle opzioni avanzate di Stable/Nightcafe)

 

K58ltiiXwePhzbIVYYet--1--06zhn_15.625x.j

https://creator.nightcafe.studio/creation/K58ltiiXwePhzbIVYYet

NeZXVimxYrDxHVOmBW1P--grid_2x.jpg?tr=w-1

 

 

Edited by Nyxator

Hero81

Circolo degli Antichi
(modificato)
comment_1828648

Sarebbe interessante addestrare GAN per produrre modelli 3d (dipinti) da stampare magari con stampante 3d o da importare in Tabletop Simulator o Menyr o software simili.

 

 

 

Altra potenziale killer application: produrre video animati a partire da descrizioni testuali.

Tutti registi di anime!

Comunque il mio primo esperimento: https://hotpot.ai/art-generator

description: "a medieval wizard in a tiny cottage"

style: Anime Berserk

8-cBi8J6z99cgTPNn.png

Edited by Hero81

2 ore fa, Hero81 ha scritto:

Altra potenziale killer application: produrre video animati a partire da descrizioni testuali.

Tutti registi di anime!

Sarebbe la svegliata che serve all'industria degli anime XD

Nyxator

Circolo degli Antichi
(modificato)
comment_1830276
3 ore fa, Hero81 ha scritto:

Altra potenziale killer application: produrre video animati a partire da descrizioni testuali.

Tutti registi di anime!

Comunque il mio primo esperimento: https://hotpot.ai/art-generator

description: "a medieval wizard in a tiny cottage"

style: Anime Berserk

8-cBi8J6z99cgTPNn.png

Boh, 🤔sarà che ho guardato/provato al volo, ma mi sembra un normale editor di immagini nemmeno troppo evoluto.In ogni caso ha un criterio di censura dei prompt che rasenta il ridicolo (un banale "a woman walk in the park" me lo cataloga instant come contenuto maturo/Nsfw  invitandomi a spendere $ per il pacchetto premium anche solo per disegnarla)

Cioè, notare che su Stable/Nightcafé non serve manco il Tag nsfw neanche se la lady indossa un vestito col décolleté. 

Spoiler

Pubblicata ieri su NC

we2tpNNZqavbPRN3oL2t--1--qmf3p.jpg?tr=w-

 

Comunque se è come Artistic i risultati sono abbastanza grezzi * (salvo gif e una discreta bravura coi prompt se miri a un minimo di realismo) e richiedono bazziliardi di credits. Ora come ora mi sa che sarebbe una killer application giusto se implementassero tutto a gratis l'editor video all'ultima versione di Midjourney.

* (un test che avevo fatto per gioco con Artistic)

https://creator.nightcafe.studio/creation/ThqXO5xCKvHnJZxIcWOA

 

 

 

 

Edited by Nyxator

Nyxator

Circolo degli Antichi
(modificato)
comment_1830299
4 ore fa, Hero81 ha scritto:

si non dubito non sia niente di che: non l'ho scelto....era solo il primo link che mi è capitato googlando 'ia generated art'....

sapresti consigliarmi @Nyxator qualcosa che possa andare veramente forte nel generare immagini stile vecchi manuali di giochi di ruolo in bianco e nero? (tipo queste: https://www.pinterest.it/fantasysoup/old-school-bw-drawings/)

Non so dirti come se la cavi Midjourney, ma è appurato che Stable/Nightcafe (prompt giusti permettendo) conosce/sa ricreare lo stile degli illustratori storici di D&D. È tra le prime cose che avevo provato a tirar fuori appena ho notato il nome di Gerald Brom nelle impostazioni avanzate. 😄

C'è da dire che non è la precisione in terra per quel che riguarda i ritratti di npc noti di questo o quel setting. 

Di location e interni ne ho un po' in bacheca

https://creator.nightcafe.studio/creation/TJ92vIRV29V87pBqIW8J

https://creator.nightcafe.studio/creation/K4BAbkhBJnkJjyNXiYer

https://creator.nightcafe.studio/creation/7T8m511Mzoji0yLvs9xQ

 

Un paio di test al volo.

 

 

 

 

 

 

 

 

 

Edited by Nyxator

1 ora fa, Hero81 ha scritto:

@Nyxator spesso mi taglia le figure. Nel senso che invece che disegnare tutto il soggetto disegna escludendo il viso o i piedi o zoomando sul torace: https://creator.nightcafe.studio/creation/wqe4r6UFY3pwn9T8DYfe

Sai come impostare i parametri per evitarlo?

In generale ci sono due consigli.

Il primo e più importante è come sempre il prompt. I migliori termini neutri legati alla composizione che ho trovato sono longshot, full shot, full body, close shot (per un torso senza gambe). Vi sono alcuni termini, come ¨sprite", che garantiscono di avere solo il soggetto ma non sono neutri, cambiano la composizione. Un secondo suggerimento è scegliere una proporzione dell'immagine simile a quella che vuoi ottenere: se è una figura in piedi, e non vuoi un wideshot con uno scenario, non usare un rapporto quadrato, ma almeno portrait. Immagina come faresti la foto e come metteresti il cellulare, portrait o landscape: difficilmente vuoi immagini quadrate.

Nyxator

Circolo degli Antichi
(modificato)
comment_1830455
19 ore fa, Hero81 ha scritto:

@Nyxator spesso mi taglia le figure. Nel senso che invece che disegnare tutto il soggetto disegna escludendo il viso o i piedi o zoomando sul torace: https://creator.nightcafe.studio/creation/wqe4r6UFY3pwn9T8DYfe

Sai come impostare i parametri per evitarlo?

Diciamo che in generale vale quanto detto sopra da @bobon123. Alcuni termini li trovi già nelle impostazioni avanzate. Altri li trovi spulciando siti di fotografia ecc 

Va detto che non tutto (termini, illustratori se ne metti più di uno) pesa sempre allo stesso modo nei prompt custom. A volte fa testo anche il punto in cui scrivi l'istruzione.

(poi vabbé, potrei anche dire l'opposto e mostrarvi quanto possono essere CN ste AI se gli si da in pasto titoli di canzoni😆)

Comunque tra i tricky di impostazione che preferisco per i prompt custom c'è quello del freno a mano sul nr° del random seed. L'ho scoperto quasi per caso mentre creavo le lady in red che ho in bacheca. Lo sto usando tutt'ora nelle challenge su NC.

In pratica:

• quando ottieni un result che ti convince nel riquadro in alto a sinistra, fermati e guarda le statistiche dell'immagine.

• il numero del seed corrisponde quasi sempre alla posa o alla composizione del riquadro in alto a sinistra.

• Copi-incolli il nr.

• a quel punto hai 1 posa fissa su 4 (o una posa fissa se crei una sola immagine) e puoi vedere cosa ti tira fuori la AI se cambi soggetto, sfondi, illustratori ecc. 

 

Liscio 

lr81foYWaLttszkHC6MS--2--9v738.jpg?tr=w-

Con sfondo, ma come vedi "snowy forest" influisce un po' sul soggetto.

ykE6QYgE9HXBFUq9n5Kz--3--enj0l.jpg?tr=w-

Guerriera vichinga 

JB7qFVtKtcC3ZOc4yxNJ--3--9fmyq.jpg?tr=w-

Altro es:

Lato ma con aggiunta di vista sul lago 

cTIgbOt5CpXlMyQ04xLu--1--ualfl_2x.jpg?tr

Sempre di lato ma con una simil valchiria e neve.

IeSfpPs4LabidpKcL4Sq--1--6lg42.jpg?tr=w-

 

 

Edited by Nyxator

Hero81

Circolo degli Antichi
comment_1830505

Con questi generatori di immagini vengono fuori delle figate veramente allucinanti: devo ammettere che questa roba mi sta rimettendo addosso la voglia di giocare/masterizzare .... solo per dar vita ai posti che mi aiuta a visualizzare!

4y9b9SvHMGA53pYo4SG9--1--w3fw1_8x.jpg?tr

Hero81

Circolo degli Antichi
(modificato)
comment_1830686

Un'altra domanda @Nyxator e @bobon123 ... ho trovato una tecnica per correggere quasi tutti i difetti: 

1. creo l'immagine e identifico i difetti in essa presenti.

2. uso l'opzione 'evolve' e con il prompt negativo (di cui aggiusto il peso a -1.0 o -2.0) elimino i difetti trovati: esempi di prompt negativi 'bad anatomy', 'cut off', 'deformed', 'poorly drawn hands' et cetera et cetera

C'è però un difetto che non riesco a correggere con questa tecnica.

Le maledette armi scrause: spesso le immagini di guerrieri o simili sono equipaggiati con strane 'cose'....bizzarri abbozzi di lame o di archi o di lance che non riesco a correggere con le tecnica delle evoluzioni successive.

Negli esempi che avete postato non c'è traccia di questo problema per me invece piuttosto endemico: c'è qualcosa di fondamentale che consente di risolverlo e che non conosco?

Edited by Hero81

Hero81

Circolo degli Antichi
comment_1830688

L'ho usata unicamente per correggere difetti: inoltre ci vuole un prompt negativo

* focalizzato su un singolo difetto o al massimo una coppia di difetti.

* con una alto (in modulo) peso: da -0.5 a -2.0

12 ore fa, Hero81 ha scritto:

Le maledette armi scrause: spesso le immagini di guerrieri o simili sono equipaggiati con strane 'cose'....bizzarri abbozzi di lame o di archi o di lance che non riesco a correggere con le tecnica delle evoluzioni successive.

È molto endemico, e in parte ancora irrisolto: forbici, biciclette, armi, tutte le cose in relazione specifica con un essere umano hanno problemi. Nelle nuove evoluzioni ci sono pacchetti come noclip che forniscono risultati accettabili, ma non sono ancora molto diffusi nei vari siti che offrono il servizio. Ottimi risultati si ottengono con img2img, ma non so se vi sono siti che lo offrono.

Lyt

Circolo degli Antichi
(modificato)
comment_1831135

 

Visto che avete postato alcuni vostri esperimenti con le immagini Generate con IA ho pensato di condividere anche io i miei (seppur modesti) esperimenti con le immagini generate da IA:

Spoiler

Questo è il risultato che mi è piaciuto di meno. Volevo una immagine di una capitale sul limite di un precipizio, ma non trovando niente di interessante su pinterest ho preso l'immagine di una città su una scogliera ed ho tagliato via il mare. Cosi facendo effettivamente sembra abbastanza una città sul limite di un isola volante come volevo.

image.jpeg.523c2dd882c984bfd48bd76ff4ff900a.jpeg

Ho poi caricato l'immagine su DALL-E per provare ad ottenere delle variazioni. Ma dopo diversi tentativi questo è il meglio che sono riuscito ad ottenere. Sono un pò troppo poco "definite" per quello che volevo, ma le idee dietro sono molto carine. Alla fine mi sa userò l'originale. image.thumb.png.f3044b2cae4daa0dbf8b4ae18f492719.png 

Spoiler

Qua per puro divertimento personale ho usato su discord il Midjourney Bot scrivendo: Fantasy image of a goblin in armor armed with a sword and bow 

e questi sono i risultati. Sarò onesto, ma li aspettavo più "cattivi" ma ammatto che sono fantastici

LytTheBit_Fantasy_image_of_a_goblin_in_armor_armed_with_a_sword_b6cb229a-596b-4bab-a105-980ce088bf09.png

Con quest'ultimo ho creato il token che userò per il momento per questo goblin.

image.jpeg.a6b3d35e14f339daae449c0d31bcad44.jpeg

Spoiler

Questa è l'immagine di un vigglaggio fantasy che ho trovato su pinterestimage.jpeg.29d66873cd910cf03faeafbd3b317881.jpeg

Dato che volevo allargare l'immagine per tenerla come sfondo su Roll20 ho chiesto a DALL-E di allargarla, scrivendo come descrizione "fantasy town". Il risultato è soddisfacente anche se non perfetto. La differenza tra l'originale e il resto si nota, le finestre sulla sinistra sembrano delle patate incastonate nei muri, e il fiume si perde chissà dove. Ma l'immagina nel complesso non è maleimage.thumb.png.f212fbd316aa6eb6f1ddf1a1d3456150.png

è sicuramente un campo da esplorare

Edited by Lyt

Nyxator

Circolo degli Antichi
comment_1831200
8 ore fa, Lyt ha scritto:

scrivendo: Fantasy image of a goblin in armor armed with a sword and bow 

e questi sono i risultati. Sarò onesto, ma li aspettavo più "cattivi" ma ammatto che sono fantastici

Se li vuoi più cattivi/altro scrivi che li vuoi cattivi/altro. Se non fornisci il parametro, l'AI te li fa come ha voglia o va di modello neutro.

Lord Danarc

Circolo degli Antichi
comment_1831221
13 ore fa, Lyt ha scritto:

 

  Mostra contenuto nascosto

Qua per puro divertimento personale ho usato su discord il Midjourney Bot scrivendo: Fantasy image of a goblin in armor armed with a sword and bow 

e questi sono i risultati. Sarò onesto, ma li aspettavo più "cattivi" ma ammatto che sono fantastici

LytTheBit_Fantasy_image_of_a_goblin_in_armor_armed_with_a_sword_b6cb229a-596b-4bab-a105-980ce088bf09.png

Con quest'ultimo ho creato il token che userò per il momento per questo goblin.

image.jpeg.a6b3d35e14f339daae449c0d31bcad44.jpeg

è sicuramente un campo da esplorare

Una domanda, ho visto che iscrivendoti senza supportare midjurney fa solo fare 25 immagini. Come funziona il supporto (se lo sai)

Lyt

Circolo degli Antichi
comment_1831246
16 ore fa, Nyxator ha scritto:

Se li vuoi più cattivi/altro scrivi che li vuoi cattivi/altro. Se non fornisci il parametro, l'AI te li fa come ha voglia o va di modello neutro.

Questo si, purtroppo sono partito da un preconcetto "razzista" e cioè che tutti i goblin sono cattivi. Quindi non l'ho scritto😂😅

E dato che midjurney ha utilizzi limitati non ho ancora riprovato (dato che non voglio sprecare subito tutti gli utilizzi)

11 ore fa, Lord Danarc ha scritto:

Una domanda, ho visto che iscrivendoti senza supportare midjurney fa solo fare 25 immagini. Come funziona il supporto (se lo sai)

Purtroppo non ho capito bene neanche io, e per il momento l'ho solo usato 2 volte (una volta per il Goblin e una volta per disegnare una casa)

Da quel che ho notato però ti fa fare diverse operazioni su un unica immagine. Cose come "migliorare" o "creare varianti" non sono considerate nuove immagini. Quindi io dovrei ancora avere 23 utilizzi.

Crea un account o accedi per commentare

Statistiche utente

  • 29.919 Totale utenti
  • 1.125 Max connessi
  • Reroger2000
    Reroger2000 Nuovo utente ·