Categorie
News

I.A. Innovazione grafica

La più grande innovazione del secolo, nel settore grafico, si chiama intelligenza artificiale.

Introduzione e requisiti

Oggi abbiamo a disposizione nuovi programmi chiamati “text to image“, che sono in grado di generare infiniti visual partendo da comandi testuali inseriti da un utente (umano).

Fra le più note, apprezzate e potenti AI, si posizionano sicuramente Stable DiffusionMidJourney ed Adobe Firefly.

Stable Diffusion, basato sull’algoritmo Stability, è diventato uno strumento particolarmente apprezzato dai professionisti, perché permette di essere calibrato a piacimento con modelli ed estensioni di vario tipo, disponibili online e completamente gratuiti (open source), ma può anche essere addestrato con un metodo inverso, ovvero inserendo il proprio volto, per esempio, istruendo l’algoritmo della macchina a replicarlo in diverse scenografie, pose o stili.

Tuttavia il programma richiede competenze informatiche specifiche e macchine molto potenti, perché funziona solo localmente.

MidJourney, al contrario, viene venduto in abbonamento mensile, ma sfrutta la potenza di server in remoto, quindi riesce a soddisfare una fetta più ampia di mercato, per così dire “entry level“, ovvero persone senza competenze specifiche.

Noi di ELAN42 stiamo studiando entrambe le intelligenze artificiali fin dalla loro prima fase di sviluppo ed abbiamo seguito con grande entusiasmo i miglioramenti ottenuti negli ultimi 2 anni.

MidJourney 5.2

La scorsa settimana MidJourney presentava la nuova versione 5.2.

Già con l’uscita della precedente versione 5 ci eravamo resi conto di una qualità eccellente dei risultati ottenuti: immagini sempre più realistiche ed anatomia umana perfezionata a livelli degni di uno scultore classico.

Ci siamo avvicinati ad un realismo degno della grande fotografia. Non è una caso, per la cronaca, che l’ultimo award fotografico della Sony sia stato vinto da un artista che aveva usato l’AI per generare lo scatto.

Successivamente lo stesso ha preferito non ritirare il premio, per questioni etiche e di correttezza nei confronti dei colleghi, ma nessuno (nemmeno i giudici stessi) era riuscito a percepire che l’elaborato fosse interamente digitale, generativo, fatto da una AI.

Questo aggiornamento (5.2) non presenta grandi novità, per lo meno non rivoluzionarie, ma introduce nuovi strumenti sempre più precisi.

Andiamo ad elencarli e a spiegare il loro funzionamento nel dettaglio.

Stylize

Il comando era già stato introdotto nella versione 4 ed andava scritto all’interno della prompt, con un parametro da zero a mille.

Quindi richiedeva un numero di prove elevato per ottenere il risultato desiderato.

Con la stilizzazione si chiede all’AI quanto essere coerente con il testo inserito, oppure astrarsi ed introdurre elementi fantasiosi.

Proprio per soddisfare il mercato “entry level”, da adesso abbiamo tre pulsanti semplificati per un livello di stilizzazione basso, medio, alto o altissimo, senza dover scrivere i numeri manualmente, anche se tuttora è possibile farlo, quindi possiamo sfruttare la UI o entrare nel dettaglio a piacimento.

Troviamo queste impostazioni all’interno del nostro account nel canale discord di MidJourney, digitando il comando “/settings”.

Prompt: “cinematic masterpiece, Venice Italy panorama, cat, photorealistic –s 50”

Chiediamo a MidJourney di generare un gatto a Venezia, con uno stile fotografico realistico ed un basso parametro di stilizzazione.

Utilizziamo la prompt precedente alzando il livello di stilizzazione (–s 750). Il risultato è nettamente più astratto.

Zoom Out e Make Square

Nuovo comando di post processing per aggiungere contenuto al di fuori di una tavola già creata, come se si stesse facendo un “zoom out”. MidJourney va a riempire la scena al di fuori della tavola, con un contenuto coerente. Potreste aver visto fare questo tipo di operazioni, recentemente, dal generative fill di Adobe, introdotto con l’uscita della sua neonata Firefly, ultima AI della nota software house.

Mentre lo zoom lavora a qualsiasi proporzione, make square genera il contenuto extra fino a riempire un quadrato, partendo da immagini con precedenti proporzioni diverse (2:3, 3:4, 16:9, eccetera).

Chiediamo a MidJourney un leggero Zoom out (Zoom x1,5), ottenendo il soggetto con uno spazio più ampio attorno ad esso.

Variation mode

Nuovi metodi di variazione dei risultati ottenuti, con parametro basso o alto.

Una volta generata l’immagine sarà possibile chiedere delle varianti coerenti, impostando al contempo questo parametro che ci aiuta ad ottenere risultati simili o più astratti.

Troviamo queste impostazioni da presettare in default nel nostro pannello delle impostazioni, sempre tramite il comando “/settings” oppure subito dopo aver generato le immagini desiderate, con parametri Vary Strong (varianti marcate) o Vary Subtle (varianti leggere).

Shorten command

Offre una serie di semplificazioni testuali per le prompts più complesse, che spesso generano risultati casuali o non voluti.

Accorcia fino a cinque livelli testuali riassuntivi e perfezionati, con risultati gradualmente diversi. Alleghiamo un esempio un esempio pratico.

Ritratti ed avatar creativi

Nei prossimi articoli parleremo anche di Stable Diffusion, che permette di caricare una serie di scatti di un qualsiasi soggetto, cosa o persona, che vanno poi descritti testualmente in maniera di allenare il modello ad essere replicato in altre scene, pose, stili, situazioni varie.

Un processo che ha bisogno di pazienza ed è in sostanza il cuore che ha fatto nascere le stesse AI. Quando la stessa Stable Diffusion era nella prima fase di sviluppo, collaborammo in moltissimi ricercatori per arricchire questi primi set di dati.
MidJourney al contrario ha provato a semplificare queste operazioni offrendo una sorta di riconoscimento facciale automatico, che si basa sull’analisi dei tratti somatici principali di un soggetto. Ovviamente il risultato non potrà mai essere al pari di un allenamento specifico, ma buona parte dei risultati ottenuti sono comunque pienamente degni di nota.

Prima di tutto, sempre all’interno del nostro canale discord di MidJourney, dovremo interagire con il MidJourney Bot, attivandolo come chat privata.

All’interno della chat abbiamo a disposizione un tasto “+”, che ci permette di caricare il nostro scatto. Migliore e più nitida è la foto, senza elementi di disturbo, migliore sarà il riconoscimento facciale.

Una volta caricata la foto otteniamo un url, link remoto della nostra foto caricata nel server di MJ, che potrà essere successivamente inserito all’interno delle nostre prompts, come dato su cui lavorare ed interagire a piacimento.

Vediamo con calma questo flusso di lavoro e quali sono i risultati ottenuti.

Ho iniziato caricando l’immagine del mio volto, scattata con telefonino, senza elementi esterni di disturbo (quindi con un muro bianco alle mie spalle).

La richiesta successiva è stata di stilizzarmi ad alto livello (–s 1000, massimo parametro di stilizzazione), come se fossi stato dipinto con colori bianco, rosso e nero dall’artista informale statunitense Franz Kline (1910-1962).
Un secondo comando, sempre all’interno della stessa riga di ordini, una negative prompt (–no) chiede to rimuovere i dettagli ombreggiati, quindi di appiattire il risultato in toni piatti, per essere più coerente ad un uno stile pittorico illustrato.

La prompt completa è questa:

https://s.mj.run/fwiA86TAvLM portrait of a crazy artist, painting by Franz Kline, red black and white colors –no shading details –s 1000″

Il primo risultato è stato decisamente appagante, selezionato fra quattro in base al mio gusto estetico. Successivamente ho chiesto alcune varianti “pesanti”, ottenendo risultati sempre più astratti, ma in linea con lo stile pittorico ricercato.

Possiamo aiutarti

Oltre a studiare attivamente il funzionamento di queste intelligenze artificiali, noi di ELAN42 le mettiamo a disposizione per i nostri clienti, trovando la giusta immagine che a volte non sarebbe disponibile nelle banche dati commerciali, o anche più semplicemente per generare dei concept grafici in maniera veloce ed efficace. Partendo da questi concetti è possibile andare successivamente a lavorare su realizzazioni uniche, accorciando i tempi di esecuzione.

L’importante oggi è avere bene in mente qual è l’obiettovo: noi riusciamo a dar vita alle vostre idee, con strumenti tecnici ogni giorno più potenti.

Le tre barrette del marchio ELAN42, rielaborate tramite I.A, chiedendo una fusione con alberi in una scena in stile fantasy.

Marco Natolli