Root NationVijestiIT vijestiKao u filmovima: Google-ova nova umjetna inteligencija za obradu fotografija čini njihovo skaliranje i poboljšanje stvarnosti

Kao u filmovima: Google-ova nova umjetna inteligencija za obradu fotografija čini njihovo skaliranje i poboljšanje stvarnosti

-

Vjerovatno ste gledali fantastične filmove ili TV emisije u kojima glavni lik traži da poveća sliku i poboljša rezultat – da pokaže lice, registarsku tablicu ili bilo koji drugi ključni detalj. Najnoviji Google-ovi sistemi umjetne inteligencije (AI), bazirani na tzv difuzioni modeli, mogu izvesti ovaj trik.

To je težak proces za savladavanje jer se u suštini dodaje detalji na sliku koju kamera prvobitno nije snimila, koristeći super-pametna nagađanja zasnovana na drugim, sličnim slikama.

Google

U Googleu se ova tehnika naziva prirodna sinteza slike, au ovom konkretnom scenariju ultra-visoka rezolucija slike. Počinjete s malom, pikseliziranom fotografijom i završavate s nečim oštrim, jasnim i prirodnim. Možda nije baš original, ali je dovoljno blizu da ljudskom oku izgleda stvarno.

Google je predstavio dva nova AI alata za ovaj posao. Prvi se zove SR3, ili Super-rezolucija putem ponovljenog prečišćavanja, i radi tako što dodaje šum na sliku, a zatim ga uklanja. Kroz niz probabilističkih proračuna zasnovanih na velikoj bazi podataka slika i neke magije mašinskog učenja, SR3 može zamisliti kako izgleda verzija slike u pikselu niske rezolucije u super-visokoj rezoluciji.

Drugi alat je CDM, ili kaskadni difuzioni modeli. Google ih opisuje kao "cevovode" duž kojih se difuzijski modeli – uključujući SR3 – mogu usmjeriti za visokokvalitetno povećanje slike. Uzima modele poboljšanja i pretvara ih u veće slike.

Google

Korištenjem različitih modela poboljšanja u različitim rezolucijama, CDM pristup je u stanju nadmašiti alternativne metode povećanja slike, prema Google-u. Novi AI motor je testiran na ImageNet-u, džinovskoj bazi podataka slika za obuku koja se obično koristi za istraživanje vizuelnog prepoznavanja objekata.

Krajnji rezultati SR3 i CDM su impresivni. U standardnom testu sa 50 ljudskih dobrovoljaca, slike ljudskih lica koje je generisao SR3 pogrešno su u 50% slučajeva – a imajući u vidu da bi idealni algoritam trebao postići 50%, to je impresivno. Vrijedi ponoviti da ove poboljšane slike nisu potpuno podudaranje s originalima, već su pažljivo izračunate simulacije zasnovane na matematici vjerovatnoće.

Google

Google obećava mnogo više od svojih novih AI motora i srodnih tehnologija – ne samo u smislu povećanja slika lica i drugih prirodnih objekata, već iu drugim oblastima vjerovatnostnog modeliranja.

Pročitajte također:

Prijaviti se
Obavijesti o
gost

0 Komentari
Embedded Reviews
Pogledaj sve komentare