Home BIM AI text-to-image: come i tool generativi stanno impattando la modellazione dei progetti

AI text-to-image: come i tool generativi stanno impattando la modellazione dei progetti

Il punto di vista di Assobim sull’impatto che la tecnologia di AI Text-to-image, sempre più diffusa, potrebbe avere sulla professione del progettista.

Per alcuni è un freno alla creatività o addirittura una minaccia, per altri una straordinaria opportunità. Quale che sia la posizione assunta, è in ogni caso indubbio che l’avvento delle tecnologie che sfruttano l’Intelligenza Artificiale per la generazione di immagini sta esercitando un rilevante impatto sulla progettazione, impatto del resto testimoniato dal moltiplicarsi degli strumenti software basati su questa tecnologia.

L’utilizzo delle AI text-to-image, ovvero di sistemi in grado di generare immagini a partire da un input testuale in linguaggio naturale, ha così conquistato una popolarità sempre maggiore, in particolare grazie a un livello di accessibilità estremamente semplice che le rende alla portata di tutti. Un fenomeno se non di massa comunque molto diffuso, quindi, da cui stanno scaturendo dibattiti di varia natura, molti dei quali incentrati sull’impatto che questa tecnologia potrebbe avere sulla professione del progettista e il rischio che essa possa sostituirsi al lavoro umano.

I più ottimisti preferiscono invece porre l’accento sulle possibilità che la AI text-to-image apre in termini di miglioramento dell’efficienza e della qualità del lavoro, con significativi vantaggi sulla vita delle persone, oltre che sul fatto che allo stato attuale le capacità della AI dipendono da meccanismi di apprendimento in qualche misura influenzati e controllati dall’uomo come machine learning e deep learning. Il primo in particolare utilizza algoritmi addestrati su grandi quantità di dati, elaborando informazioni dalla propria esperienza di funzionamento così come ricevendo istruzioni di programmazione.

Il machine learning utilizza diversi tipi di reti neurali artificiali, ognuna caratterizzata da una specifica architettura di funzionamento e più o meno adatte a specifici compiti e risultati. A sua volta il deep learning è un sottoinsieme del machine learning, prevede l’elaborazione di una più ampia base di dati e tende a produrre risultati più accurati con un minore intervento umano. Questa metodologia utilizza reti neurali interconnesse che permettono un’elaborazione più profonda dei dati da parte del sistema in quanto i dati inseriti vengono analizzati attraverso più iterazioni che permettono l’apprendimento di informazioni man mano sempre più complesse.

Attualmente il tool AI text-to-image più conosciuto è Midjourney, un generatore sviluppato dall’omonimo laboratorio di ricerca indipendente specificamente dedicato al design che grazie al suo algoritmo è in grado di generare con grande rapidità immagini di eccellente qualità. E non c’è dubbio che dal punto di vista visuale le sue prestazioni siano effettivamente impressionanti. Ma qual è concretamente la loro natura, e in che modo e con quali conseguenze entrano in contatto con il tradizionale lavoro del progettista?

Attualmente l’opinione largamente condivisa è che i rendering creati in Midjourney siano, in sostanza, solo belle immagini. L’applicazione non è in grado di produrre modelli dimensionalmente accurati, mappe di profondità 3D o documenti di progettazione e costruzione. Una volta creato un rendering in Midjourney, questo diventa essenzialmente un artefatto, e i programmi di modellazione non possono tradurre i rendering nell’ambiente 3D. Ciò che Midjourney può fare, tuttavia, è produrre immagini e concept con una velocità e un livello di differenziazione stilistica senza precedenti. Il che crea indubbiamente una sorta di “competizione” con i professionisti, che però hanno allo stesso tempo la possibilità di introdurre i generatori di immagini nei loro flussi di lavoro per ridurre i costi, accelerare la produzione e attrarre clienti proponendo scelte e varianti più ampie, sfruttando una continua evoluzione di tali strumenti che ha visto affiancarsi a Midjourney altri tool come ad esempio PromeAI, Look X, Finch 3D, ControlNet, Comfy AI e Stable Diffusion.

Sviluppati per architetti e progettisti computazionali, questi strumenti offrono modalità per rendere la generazione di immagini più specifica per il contesto desiderato incorporando dimensioni proporzionate da modelli 3D, interpretando le normative edilizie locali e utilizzando registrazioni dello schermo caricate da programmi di modellazione tridimensionale come base per la renderizzazione in tempo reale utilizzando comandi testuali.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome

Webinar: Digital Twin, BIM e sensoristica IoT per la rivoluzione del...

Il ciclo di webinar proposti da Assobim prosegue, con una puntata su Digital Twin: BIM e sensoristica IoT per la rivoluzione del Facility Management

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

css.php