ČUDESNI STROJ

NOVI GOOGLEOV AI NADMAŠIO LJUDE U NEOČEKIVANOJ VJEŠTINI Mogućnosti dubinskog učenja ponovno su postigle jezive rezultate

 Alexander Chernyakov/iStock
Pogađanje lokacije nasumce odabrane slike s Google Street Viewa je teško, čak i za one koji su jako puno putovali u životu. Googleov najnoviji stroj s umjetnom inteligencijom to uspjeva s lakoćom.

Probajte riješiti ovaj zadatak. Nasumce odaberite fotografiju s interneta. Sada pokušajte odrediti gdje je fotografija načinjena koristeći samo fotografiju.

Ako je na fotografiji neka poznata zgrada ili znamenitost kao što je Eiffelov toranj ili Kip slobode, zadatak je poprilično jednostavan. Međutim, zadatak postaje znatno teži kada na fotografiji nema nikakvih konkretnih odrednica ili ako je fotografija načinjena u zatvorenom prostoru ili prikazuje nečijeg kućnog ljubimca ili hrane.

Bez obzira na sve to, ljudi su začuđujuće dobri u rješavanju takvih zadataka. Kako bi si pomogli, ljudi upošljavaju znatne količine znanja o svijetu kako bi došli do odgovora. Ljudi cijeli život skupljaju geolokacijske natuknice.

Stoga je lako zamisliti da bi se strojevi mogli mučiti s takvim zadatak, i to je istina, mučili su se, međutim to se u srijedu promijenilo zahvaljujući radu Tobiasa Weyanda, specijaliste za kompjuterski vid u Googleu, prenosi MIT Technology Review.

Weyand i njegovi suradnici naučili su stroj s mogućnošću dubinskog učenja kako odrediti lokaciju gotovo svake fotografiju isključivo na temelju piksela te fotografije. Njihov stroj određuje lokaciju fotografije znatno bolje od ljudi, a koristi zanimljiv trik kako bi odredio lokaciju fotografija načinjenih u zatvorenom prostoru te onih koje uključuju hranu i kućne ljubimce odnosno one koje nemaju nikakvo značajno vizualno znakovlje.

Njihov je pristup začuđujuće jednostavan, barem kada se radi o učenju strojeva.

Weyand i njegovi suradnici su počeli s dijeljenjem svijeta na mrežu od preko 26 tisuća kvadrata raznih veličina, a veličina pojedinog kvadrata ovisi o tome koliko je fotografija učinjeno na toj lokaciji. Tako veliki gradovi, koji su subjekti mnogih fotografija imaju detaljniju mrežu od onih lokacija gdje je malo fotografija napravljeno.

Googleov tim je pritom ignorirao oceane i polarne regije gdje je malo fotografirano. Nakon toga tim je kreirao bazu podataka geo-lociranih fotografija s interneta te je iskoristila lokacijske podatke kako bi odredili u kojem je kvadratu svijeta fotografija načinjena. Ta grupa podataka je ogromna, a sastoji se od 126 milijuna fotografija uz lokacijske podatke za svaku fotografiju.

Weyand i njegov tim je iskoristio 91 milijun tih fotografija kako bi naučio moćnu neurološku mrežu da sama odredi lokaciju fotografije na mreži svijeta koristeći samo fotografiju. Njihova je ideja bila da ubacivanjem fotografije u neurološku mrežu dobiju konkretnu lokaciju ili grupu vjerojatnih kandidata. Nakon toga su mrežu ovjerili s ostalih 35 milijuna fotografija. Poslije toga su testirali mrežu - trenutnog imena PlaNet - na razne načine kako bi vidjeli koliko dobro funkcionira.

Rezultati testiranja su vrlo zanimljivo štivo.

Preciznost stroja Weyand i njegov tim testirali su putem 2,3 milijuna geotagiranih fotografija s Flickra kako bi vidjeli može li ih stroj pravilno smjestiti. 'PlaNet je uspio lokalizirati 3,6 posto fotografija do ulice, a 10,1 posto do grada u kojem su načinjene', kažu Weyand i njegovi suradnici. 'Stroj je uspio ispravno pogoditi državu fotografije u 28,4 posto slučajeva, a kontinent u 48 posto slučajeva.'

Prema Weyandu i njegovom timu to je poprilično dobro. Kako bi pokazali koliko dobro, PlaNet je protiv 10 ljudi koji su tijekom života puno putovali odigrao popularnu igru GeoGuessr i razbio ih je.

'Ukupno gledajuću, PlaNet je osvojio 28 od 50 rundi, a srednja lokalizacijska greška PlaNeta je 1,131.7 kilometara, dok je srednja lokalizacijska greška čovjek 2,320.75 kilometara', kažu Weyand i suradnici.

Weyand i njegov tim misli da zna zašto PlaNet uspijeva biti tako dobar u određivanju lokacije bez oslanjanja na ono što ljudi mogu, kao što je vegetacija, arhitektura i slično. 'PlaNet je u prednosti zato što je vidio više mjesta nego što je realno moguće za ijednog čovjeka te ja naučio suptilne znakove diferencijacije između dva mjesta koje bi bile teške čak i iskusnom svjetskom putniku za uočiti', kažu Weyand i suradnici.

Weyandov tim kaže da bi PlaNet mogao odrediti i lokacije fotografija bez prepoznatljivog znakovlja na temelju prepoznavanja sličnosti u većim grupama fotografija. To je impresivno s obzirom da je u ovoj inicijalnoj fazi projekta PlaNet koristio bazu podataka od svega 377 MB, što je dovoljno malo da stane na pametni telefon. Prijašnji pokušaji su koristili gigabajte podataka što čini ovaj pothvat još impresivnijim.

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?
Linker
24. travanj 2024 09:12