Key Takeaways
- DALL·E je nova neuronska mreža koja može crtati slike na osnovu teksta.
- Mreža je jedan od sve većeg broja AI projekata koji mogu oponašati kreativni učinak ljudskih bića.
- Stručnjaci kažu da slike koje je nacrtala AI nisu originalne kreacije.
Pomeri se, Picasso. Nova neuronska mreža može crtati slike na osnovu teksta.
DALL·E, portmanto imena umjetnika Salvadora Dalija i Pixarov WALL·E, može uzeti bilo koji tekst i stvoriti sliku od njega. Sistem koristi neuronsku mrežu koja je obučena na milijardama slika i tekstualnih primjera. To je jedan od sve većeg broja AI projekata koji mogu oponašati, ali ne i replicirati, kreativni učinak ljudskih bića.
"Budući da se prirodni jezik neprestano razvija i veoma zavisi od kontekstualnih nijansi, učenje mašine da razume jezik dovoljno dobro da nacrta sliku je veoma značajno dostignuće," Tamara Švarc, profesorka sajber bezbednosti na koledžu York u Pensilvaniji, rekao je u mejl intervjuu. "Zamislite policijskog crtača, to je rijedak talenat, koji ima sposobnost da kreira sliku na osnovu opisa svjedoka."
Korišćenje velikih podataka za proizvodnju slika
DALL-E kreirala je kompanija za istraživanje veštačke inteligencije OpenAI i radi tako što akumulira ogromne količine podataka sa interneta. Podaci se zatim obrađuju modelom prirodnog jezika i obučavaju se za proizvodnju slika iz teksta. DALL-E radi slično nedavno objavljenom GPT-3, jezičkom modelu koji je kreirao OpenAI koji se može podstaći da generiše originalne tekstualne pasuse. GPT-3 je obučen koristeći pola triliona riječi internetskog teksta i može proizvesti iznenađujuće realističan tekst.
Učenje mašine da razume jezik dovoljno dobro da nacrta sliku je veoma značajno dostignuće.
Michael Yurushkin, osnivač i CTO kompanije BroutonLab, kompanije za nauku podataka, rekao je u intervjuu e-poštom da je DALL-E "jedan od rijetkih uspješnih pokušaja čovječanstva u oponašanju naše kreativnosti i mašte." Dodao je: "Lakše je shvatiti kako AI predviđa nešto prolazeći kroz relevantne podatke, ali teže je razumjeti kako može generirati crteže od stvari za koje nikada ranije nije `čuo`."
Schwartz pazi da AI ne stvara informacije, već radije uzima jezičke podatke i pretvara ih u slike.
"Inicijalna kreativnost dolazi od čovjeka koji je konstruirao zadatak", rekao je Schwartz. "Postoji određena 'kreativnost' od strane AI, jer eksperimentiše s različitim kombinacijama podataka, a zatim bira između brojnih potencijalnih izlaza. Međutim, čovjek ispituje rezultate i podučava AI kako da izabere između mnogih kombinacija."
Robot Detective Work?
Mašina može eksperimentisati sa ovom kombinacijom podataka i objekata mnogo brže od ljudskog umetnika. Švarc je primetio da bi DALL-E jednog dana mogao da bude partner sa detektivom koji pokušava da rekonstruiše mesto zločina kroz skicu, na osnovu svedočenja očevidaca.
"Dok svjedoci daju svoje izjave, kompjuter bi mogao uzeti te govorne informacije na prirodnom jeziku i napraviti crtež scene, ili mnoge crteže scene", rekla je ona. "Ove vizualizacije bi se zatim mogle integrirati kako bi se stvorila preciznija slika izgubljenih dokaza. Ova vizualizacija bi se mogla obogatiti integracijom prethodnih slika lokacije prije zločina."
Nekoliko drugih programa vođenih umjetnom inteligencijom može proizvesti umjetnost. Na primjer, Ai-Da koristi sistem robotskih ruku i tehnologiju prepoznavanja lica uparene s umjetnom inteligencijom za stvaranje umjetnosti. Sistem može analizirati sliku stavljenu ispred mašine, koja se unosi u algoritam za proizvodnju pokreta ruke robota.
Međutim, ljudski umjetnici ne bi trebali brinuti da će ih robotski gospodari zamijeniti, tvrdi Ahmed Elgammal, direktor Laboratorije za umjetnost i umjetnu inteligenciju na Univerzitetu Rutgers, u New York Timesu prošle godine.
"Dok se definicija umjetnosti stalno razvija, u svojoj srži, ona je oblik komunikacije među ljudima", napisao je. "Bez ljudskog umjetnika iza mašine, umjetna inteligencija može učiniti nešto više od igranja formom, bilo da to znači manipuliranje pikselima na ekranu ili bilješkama na muzičkoj knjizi. Ove aktivnosti mogu biti zanimljive i perceptivno intrigantne, ali im nedostaje značenje bez interakcije između umjetnik i publika."
Nakon što sam pogledao DALL-E-jev rad, razumijem Elgammalovu poentu da slike stvorene umjetnom inteligencijom nisu umjetnost. S druge strane, oni su bolji od bilo koje umjetnosti koju bih mogao stvoriti. Pa, stvarno, u čemu je razlika?