Láthatóvá tenni a láthatatlant
Olykor gyengénlátóként is kihívásszámba megy számomra, mire elmagyarázom, mit és hogyan látok a köröttem zajló világból. De a Café Communications és a Kézzelfogható Alapítvány a Blind Journey („vak utazás”) projektjével ennél tovább ment: láthatóvá tette a láthatatlant hét, születésétől vak személy szubjektív Budapestjének ábrázolásával.
Ehhez a manapság egyre divatosabb mesterséges intelligenciát, tehát az emberi intelligenciát szimuláló programokat hívták segítségül a szervezők. Pontosabban Lőrincz Áron grafikus, aki így avat be eme alkotó folyamatba: „Első körben az érintettek elmondása alapján, elemenként állt össze bennem egy-egy vízió, kvázi kép mindegyik helyszínről, amiről a résztvevők beszéltek. Hogyan lett mégis mindezekből nekünk, látóknak létrehozott kompozíció? Úgy, hogy a beszámolókból olyan tömör megfogalmazást kellett adni az AI-nak (azaz Artificial Intelligence/mesterséges intelligencia), ami alapján az elhangzott információknak leginkább megfelelő képeket generálta a szoftver. Hiszen lényeges szempont volt, hogy minél inkább felismerhető legyen a kapott eredményben az eredeti gondolat. Eltérések esetén különböző paraméterekkel tovább instruálható az AI, amíg a véglegesnek tekintett alkotás el nem készül. Ez esetben is a nem megfelelőnek ítélt fázisképek által előidézett töprengésen át vezetett az út a sikerig.”
Nyilvánvaló módon ebben a szituációban a grafikus nem kizárólag parancsnok, hanem aktív közreműködője a folyamatnak, ami során kihívásokkal is szembesül. Mégpedig, hogy a szoftver önmagától nem képes egyetlen, hatásos, látványos képpé gyúrni a személyes meglátásokat. Emberi kontroll és vízió hiányában teljesen véletlenszerűen ragad ki az AI információkat az elmondottakból. Ha ez a cél, akkor ez nem hátrány, ám mivel jelen esetben a város esszenciáinak bemutatását tervezték, nem bízhatták teljes mértékben áramkörökre a megvalósítást. Következésképpen még döcögősen megy az AI-nak az információk súlypontozása. Emiatt egyszerűsítik le a hosszú és összetett szövegeket ezek a programok, majd algoritmusaik révén választanak ki belőlük pár fontosabb elemet, amiket aztán megjelenítenek. Fontos a nagyobb egységektől a kisebbek felé haladva kell felépíteni a gépnek szánt mondandókat.
„Több különböző AI szoftver (midjourney, stable diffusion, control-net, photoshop AI) vegyítésével, és a már említett pontosítással a legkülönbözőbb elképzeléseket is meg lehet oldani” – biztosít Áron, majd a megoldásban rejlő kimeríthetetlen lehetőségekre tér át. Gyakorlatilag amit az ember el tud képzelni, azt az AI képes realisztikus fotójellegű (vagy egyéb kép) formájában megjeleníteni. A klasszikusan nehéz részleteket, mint például kéz, ujjak, vagy több arc és személy ábrázolása egy képen, utólagos AI-generálásokkal már szintén létre lehet hozni illetve lehet korrigálni.
Minden gyerekbetegségével együtt Lőrincz Áron számára nagyon inspiráló az AI kreativitása, mikor egy-egy feladatnál – főleg kezdeti kísérletező stádiumban – kiemelkedő szabadságot kap az alkotó az asszociációkra. „Ez a fajta végtelenség és mégis egyediség számomra nagyon izgalmas lehetőségeket hordoz, illetve óriásira növeli az egyes képek kiválasztásának, szelekciójának a fontosságát is. így annak kitüntetett értéket, személyességet ad –, mely művelet viszont már kizárólag emberi szempontok és döntés alapján történik és a továbbiakban nincs is helye, értelme az AI-nak. Ez a lépés bár kicsinek tűnik, mégis nagyon fontossá válik, és rengeteg lehetőséget rejt” – hangsúlyozza Lőrincz Áron, grafikus.
S hogy sikerült-e a céljukat elérni, hidat építeni látók és nem látók között? Nincs is olyan nagy eltérés abban, ahogy a körülöttünk lévő világot észleljük? Adják meg a választ a képek!