Sadržaj kursa
Primeri upotrebe veštačke inteligencije
0/2
Uvod u veštačku inteligenciju (AI)
Sadržaj lekcije

Samonadgledani temeljni modeli, poput difuzionog, predstavljaju jedan od najuspešnijih sistema za generisanje novih slika. Ovi modeli zahtevaju mnogo podataka, ali zato imaju veliku fleksibilnost. Bez obzira na to, od sistema se najčešće očekuje da kreira sasvim normalnu sliku na kojoj će biti prikazan neki portret ili planinski vrh a ne miš sa šeširom ili astronaut koji stoji na zidu od cigle.

Ako ste spremni da se odreknete fleksibilnosti, onda postoje i drugi načini za generisanje foto realističnih slika. Jedan od najpopularnijih predstavlja stvaranje tzv. generativne suparničke mreže, skraćeno GAN. Ovi GAN-ovi ne koriste samonadgledano učenje ni temeljne modele i mogu se uporediti sa dobrim starim sistemima za nenadgledano i nadgledano učenje. Ključni element u skraćenici GAN predstavlja pojam suparnički (Adversarial). Zamislite bokserski ring u kome se bore dve veštačke neuronske mreže. Jedna od njih se naziva generator i ona predstavlja sistem koji za kreiranje novih slika koristi učenje bez nadzora. Njegovi početni pokušaji će vas sigurno podsećati na prskanje boje po zidu. Druga neuronska mreža se zove diskriminator. Ovaj sistem se koristi za klasifikovanje gotovih slika što znači da on utvrđuje da li je ona prava ili lažna.

Zamislite da ste kreirali mrežu sa ciljem da napravite portret profesionalnog kvaliteta. Generator može da za početak stvori sliku koja se sastoji od nekoliko tačaka i da je zatim prosledi diskriminatoru. On će vrlo brzo shvatiti da ovo nije dovoljno, odbaciti postignute rezultate i zahtevati od generatora da pokuša ponovo. Sledeći pokušaj bi trebalo da bude zasnovan na povratnim informacijama pa se može desiti da generator od ovih tačaka formira kružnicu i pokuša da imitira ljudsko lice. Naravno, diskriminator će ponovo odbiti ovakvu sliku ali će pružiti i dovoljno povratnih informacija koje bi mogle da pomognu generatoru.

Nakon milijardu neuspelih pokušaja, generator će konačno početi da kreira foto realistične slike. Diskriminator će imati težak zadatak da oceni da li je u pitanju prava fotografija a postoji velika verovatnoća da ni vi nećete moći da napravite tačnu procenu. Generativne suparničke mreže mogu proizvesti izuzetne foto realistične slike, ali imaju i nekoliko nedostataka u poređenju sa difuzionim modelima. Prvi je da diskriminator može klasifikovati samo fotografije za koje je obučen. Dakle, ako je diskriminator obučen samo za ljudske portrete, sistem će moći da generiše samo ovakve slike. Prednost ovih sistema se sastoji u tome što se oni ne oslanjaju na osnovni model, tako da im je potrebno mnogo manje podataka i lakše ih je postaviti. Zato su generativne suparničke mreže idealne za stvaranje sistema VI koji služi za kreiranje realnih fotografija. To ih naravno neće sprečiti da povremeno stvore portret nepostojeće osobe ili oslikaju zamišljeni pejzaž, mada bi za ovakve potrebe bilo bolje koristiti neki od difuzionih modela.

0% Završeno
Call Now Button