Godine 1798. Napoleon Bonaparta je izvršio invaziju na Egipat. U malom gradu Rozeti, francuska vojska je otkrila kamen sa tekstom koji je bio napisan na tri drevna jezika. Kada su Egipat osvoji Britanci, kamen iz Rozete je odnet u London a pošto je on sadržao grčke prevode staroegipatskih hijeroglifa, to je predstavljalo sjajnu osnovu za njihovo dešifrovanje. Pošto su mnogi istoričari znali grčki, mogli su da hijeroglife uporede sa poznatim jezikom. Oni su pročitali grčki tekst a zatim ga iskoristili kao ključ za odgonetanje simbola koje nisu razumeli. Ta nagađanja su postala osnova za razumevanje egipatskih hijeroglifa.
Možda zvuči čudno, ali savremeni generativni sistemi veštačke inteligencije koriste sličnu tehniku koja se zove samonadgledano učenje. Imajte u vidu da je većina podataka kojima raspolažemo nestruktuirana, što znači da ne postoji uputstvo za njihovo razumevanje. Dakle, generativni VI sistemi moraju da uporede ovakve neobeležene podatke sa onima koje već poznaju. U izvesnom smislu, to predstavlja nagađanje, ali se bez obzira na to u drugoj fazi se na osnovu tih nagađanja vrši označavanje podataka.
Generativna VI koristi učenje bez nadzora za analizu ovih podataka i generisanje tzv. pseudo oznaka. One se tako zovu jer predstavljaju samo nagađanja koje je napravila mašina. Ove pseudo oznake se dalje mogu koristiti za nadgledano učenje. Zamislite da vam je potreban sistem za označavanje svih dostupnih slika pasa. To podrazumeva analizu ogromnog boja fotografija, pri čemu većina njih neće biti označena, što znači da se na njima ne nalazi natpis koji potvrđuje da je u pitanju pas. Umesto toga, one mogu biti deo posta sa društvene mreže u kome se pominje nešto poput jutarnje šetnje. Prva stvar koju sistem za samonadgledano učenje mora da uradi je grupisanje sličnih slika. To znači da će prvo izdvojiti one koje sadrže krzno, rep ili konturu koja liči na pseće uvo. Zatim će iskoristiti neki drugi oblik nenadgledanog učenja i proveriti da li postoji mogućnost za pronalaženje još nekog karakterističnog podatka a sve to će dobro poslužiti kao vodič za nagađanje. To će biti svojevrsni kamen iz Rozete koji će sistemu omogućiti da na nekoj slici prepozna psa.
U tom cilju se mogu upotrebiti i natpisi u kojima se pominje nešto poput šetnje, izlaska u prirodu ili park, jer se pretpostavlja da postoji određena verovatnoća da u tom slučaju slika sadrži i nekog psa. Sve ovo će omogućiti sistemu da kreira pseudo oznake za milijarde slika koje bi inače bile izgubljene u svim tim nestruktuiranim podacima. Sa ovim pseudo oznakama, nadgledani sistem učenja će biti u prilici da izvrši osnovnu klasifikaciju a zatim može da nastavi dalje i prepozna određene rase ili izvrši razdvajanje po visini i težini.
Treba imati na umu da samonadgledano učenje obično služi za rešavanje konkretnih problema. Ono vam omogućava da iz ogromne količine nestruktuiranih podataka dobijete odgovarajuće rezultate, ali takođe i zahteva veoma veliku računarsku moć, pa na svetu nema mnogo kompanija koje raspolažu sa ovakvim mogućnostima.