Szövegből képet állít elő a mesterséges intelligencia

A fejlesztők szerint a művészi vénát nélkülözők számára önkifejezési lehetőséget nyújthat, de az alkotóművészeknek is segíthet a módszer.

A müncheni Ludwig-Maximillian Egyetem (LMU) Björn Ommer vezette kutatócsoportja fejlesztette ki azt, a Stable Diffusion nevű, mesterséges intelligencián alapuló módszert, amellyel szuperszámítógépek nélkül is képesek lehetünk szövegből képet előállítani.
„Még a művészi tehetséget nélkülöző laikusok számára is hatékony eszköz a modellünk, nincs hozzá szükség különleges ismeretekre vagy hardverre, mégis lehetővé teszi, hogy a számítógép utasítás alapján képeket generáljon. A modellünkkel elhárulnak az akadályok a hétköznapi emberek elől, így már kifejezhetik a kreativitásukat” – mondta el Ommer. A művészek számára is hasznos lehet, hogy az ötleteikből gyors grafikai vázlatot készítsenek.
A kutatók úgy vélik, az eszközük olyan forradalmi átalakulást eredményez majd a rajzolásban, mint amilyen a szövegszerkesztő megjelenése volt a kézzel vagy írógéppel íráshoz képest.
A betanított modell meglehetősen kompakt, ezért egy hagyományos grafikus kártyán képes futni, nem kell hozzá speciális eszköz, vagy szuperszámítógép, mint a korábbi képszintetizáló eszközök esetében. A betanítás során használt több milliárd kép esszenciáját sűríti a mesterséges intelligencia egy néhány gigabájtos modellbe. „Amint az MI igazán megértette, miből is áll össze egy autó, vagy mik is jellemzőek egy művészi stílusra, képes ezeket ideális esetben új példák alkotására felhasználni, pont úgy, ahogy egy festőművész műhelyének tanítványai mind ugyanabban a stílusban alkotnak” – magyarázta Ommer.
Az LMU kutatóinak célja az, hogy a számítógépeket megtanítsák „látni”, vagyis megérteni egy-egy kép tartalmát, s a mostani eredmény olyan előrelépés, ami továbbviszi az alapkutatást a számítógépes látás és gépi tanulás terén.
A betanított modell nemrég látott napvilágot, és a CreativeML Open RAIL-M licence alatt ingyenesen elérhető azzal a céllal, hogy a segítségével további kutatások szülessenek, és a technológia szélesebb körben elterjedhessen.