Veštačka inteligencija (AI) savladava kompleksne zadatke u nekoliko sati

Novi pristup veštačkoj inteligenciji u fizičkom svetu znatno ubrzava sposobnost robota da usvoje i usavrše nove veštine. Toyota, MIT i Columbia Engineering su pokazali neverovatne rezultate novog pristupa učenju veštačke inteligencije koji znatno ubrzava brzinu kojom roboti mogu usvojiti nove veštine. Izgleda kao trenutak ChatGPT-a za robotiku.

Mi živimo na samom početku ere opštih namena za robotiku. Kompanije su odlučile da je vreme da ulože veliki novac u humanoidne robote koji mogu autonomno da se kreću po postojećim radnim prostorima i polako preuzimaju zadatke od ljudskih radnika.

Većina ranijih scenarija upotrebe, međutim, spada u ono sto bih nazvao kategorijom Planet Fitness: roboti dižu stvari i spuštaju ih. To će biti sjajno za logistiku u stilu skladišta, utovar i istovar kamiona i paleta i slično, kao i za premestanje stvari u fabrikama. Ali to nije tako glamurozno, i svakako ne pruža korisnost kao radnik.

Da bi ove sposobnosti proširile na toliko nivoa da roboti mogu da se kreću bilo gde i počnu da preuzimaju različite zadatke, moraju naći način da brzo unaprede svoje veštine na osnovu ljudskih instrukcija ili demonstracija. I to je tačka gde Toyota tvrdi da je napravila veliki proboj, sa novim pristupom učenju zasnovanom na konceptu Diffusion Policy, koji, prema njihovim rečima, otvara vrata konceptu velikih modela ponašanja.

Diffusion Policy je koncept koji je Toyota razvila u saradnji sa Columbia Engineering i MIT-om. Dok veliki modeli jezika (LLM) poput ChatGPT mogu da upiju milijarde reči ljudskog pisanja i da nauče da pišu i kodiraju – i čak razmišljaju – na nivou koji je iznenađujuće blizak ljudima, Diffusion Policy omogućava robotima da posmatraju kako čovek izvodi određeni fizički zadatak u realnom svetu i da se programiraju da ga izvršavaju na fleksibilan način.

Dok su neke startap kompanije podučavale svoje robote putem VR telepresence-a – pružajući ljudskom operateru tačno ono što robot vidi i omogućavajući mu da upravlja rukama robota kako bi obavio zadatak – Toyota je pristupila više fokusirano na haptiku. Operateri ne nose VR naočare, već dobijaju haptičku povratnu informaciju od mekih, fleksibilnih hvataljki robota putem kontrole rukama, što im na neki način omogućava da osete ono što robot oseća kada njegovi manipulatori dolaze u dodir sa objektima.

Kada ljudski operater pokaže robotima kako da obave određeni zadatak nekoliko puta pod različitim uslovima, veštačka inteligencija robota gradi sopstveni interni model kako uspeh i neuspeh izgledaju, a zatim pokreće hiljade simulacija zasnovanih na fizici na osnovu svog internog modela zadatka, kako bi pronašao niz tehnika za obavljanje posla.

Postupak započinje sa demonstracijom malog skupa veština od strane nastavnika putem teleoperacije. AI zasnovana Politika difuzije tada uči u pozadini tokom nekoliko sati. Ako na primer naučimo robota popodne, dozvolimo mu da uči preko noći, i sledećeg jutra imamo novo funkcionalno ponašanje.

Tim je do sada koristio ovaj pristup kako bi brzo obučavao robote u više od 60 malih, uglavnom kuhinjskih zadataka – svaki relativno jednostavan za prosečnu odraslu osobu, ali svaki zahteva da roboti sami otkriju kako da uhvate, drže i manipulišu različitim vrstama predmeta, koristeći razne alate i pribor.

Govorimo o korišćenju noža da jednolično nanesemo namaz na krišku hleba, ili korišćenje spatule da okrene palačinku, ili korišćenje ljuštilice za krompire. Naučio je kako da razvuče testo u podlogu za pizzu, onda da kašikom nanese sos na podlogu i da ga razmaže kašikom.

Diffusion Policy

Toyota kaže da će kontrolisati stotine zadataka do kraja godine, a do kraja 2024. godine planira preko 1000 zadataka. Kao takva, razvija ono u šta veruje da će biti prvi veliki model ponašanja ili LBM – okvir koji će se vremenom proširiti da postane nešto poput robota u obliku telefonskog Chata. Drugim rečima, potpuno AI-generisani model kako robot može da interaguje s fizičkim svetom da bi postigao određene rezultate, koji se manifestuju kao ogromna količina podataka koja je potpuno nečitljiva ljudskom oku.

Tim efektivno implementira postupak kojim će budući vlasnici i operateri robota u svim vrstama situacija moći brzo da nauče svoje robote novim zadacima po potrebi – nadograđujući čitave flote robota novim veštinama kako napreduju.

Ono što je tako uzbudljivo kod ovog novog pristupa je brzina i pouzdanost s kojom možemo dodavati nove veštine. Zato što ove veštine direktno rade sa slikama sa kamere i taktilnim osetilima, koristeći samo naučene predstave, oni su sposobni da dobro izvršavaju čak i zadatke koji uključuju deformabilne objekte, tkanine i tečnosti – koje su tradicionalno bile izuzetno teške za robote.

Napišite komentar:

Unesite svoj komentar!
Unesite svoje ime ovde

Povezani naslovi

Možda Vas interesuje

Preplavljeni pozivima prevaranata? Imamo jednostavno rešenje...

Većina nas nosi mobilne telefone gde god da idemo. Koristimo telefone za gotovo sve osim za...

Kako funkcioniše veštačka inteligencija?

Alan Turing se pitao: mogu li mašine da misle? Šta čini da se „nešto“ smatra inteligentnim?...

Novi modeli kombajna CR11 i CR10

Novi vodeći model kombajna New Holland CR11, pridružio se modelu CR10, sa novim dizajnom sledeće generacije....

Helm.ai VidGen−1: Generativni AI video...

Helm.ai, vodeći dobavljač naprednog AI softvera za visokokvalitetne ADAS sisteme, autonomnu vožnju nivoa 4 i robotsku...

Potpuno nova LG toplotna pumpa koja...

Kompanija LG Electronics predstavila je najnoviju R290 monobloc Therma V toplotnu pumpu. Ovaj inovativni uređaj podjednako...

Da li su vibrirajuće seksi igračke...

Dugo su vibratori bili prvi izbor za žene ili osobe sa vulvom kada je u pitanju...

Ekspert upozorava ljude na korišćenje friteza...

Friteze na vruć vazduh su zamenile pse kao najbolji čovekov prijatelj u poslednjih nekoliko godina, ali...

Dva najvažnija načina na koja će...

Nema sumnje da je dolazak velikih jezičkih modela i AI chatbotova poput ChatGPT-a i Google Geminija...

Google proglašava kraj World Wide Weba

Nijedna kompanija nije toliko nerazdvojna od World Wide Weba kao Google, koji je pretragu interneta učinio...

TOP 5 aplikacija koje će vam...

Airalo Ako vaš plan mobilne mreže ne uključuje međunarodni roaming, možete se suočiti sa visokim troškovima za...
Novi pristup veštačkoj inteligenciji u fizičkom svetu znatno ubrzava sposobnost robota da usvoje i usavrše nove veštine. Toyota, MIT i Columbia Engineering su pokazali neverovatne rezultate novog pristupa učenju veštačke inteligencije koji znatno ubrzava brzinu kojom roboti mogu usvojiti nove veštine. Izgleda kao trenutak ChatGPT-a za robotiku. Mi živimo na samom početku ere opštih namena za robotiku. Kompanije su odlučile da je vreme da ulože veliki novac u humanoidne robote koji mogu autonomno da se kreću po postojećim radnim prostorima i polako preuzimaju zadatke od ljudskih radnika. Većina ranijih scenarija upotrebe, međutim, spada u ono sto bih nazvao kategorijom Planet Fitness: roboti dižu stvari i spuštaju ih. To će biti sjajno za logistiku u stilu skladišta, utovar i istovar kamiona i paleta i slično, kao i za premestanje stvari u fabrikama. Ali to nije tako glamurozno, i svakako ne pruža korisnost kao radnik. Da bi ove sposobnosti proširile na toliko nivoa da roboti mogu da se kreću bilo gde i počnu da preuzimaju različite zadatke, moraju naći način da brzo unaprede svoje veštine na osnovu ljudskih instrukcija ili demonstracija. I to je tačka gde Toyota tvrdi da je napravila veliki proboj, sa novim pristupom učenju zasnovanom na konceptu Diffusion Policy, koji, prema njihovim rečima, otvara vrata konceptu velikih modela ponašanja. Diffusion Policy je koncept koji je Toyota razvila u saradnji sa Columbia Engineering i MIT-om. Dok veliki modeli jezika (LLM) poput ChatGPT mogu da upiju milijarde reči ljudskog pisanja i da nauče da pišu i kodiraju - i čak razmišljaju - na nivou koji je iznenađujuće blizak ljudima, Diffusion Policy omogućava robotima da posmatraju kako čovek izvodi određeni fizički zadatak u realnom svetu i da se programiraju da ga izvršavaju na fleksibilan način. Dok su neke startap kompanije podučavale svoje robote putem VR telepresence-a - pružajući ljudskom operateru tačno ono što robot vidi i omogućavajući mu da upravlja rukama robota kako bi obavio zadatak - Toyota je pristupila više fokusirano na haptiku. Operateri ne nose VR naočare, već dobijaju haptičku povratnu informaciju od mekih, fleksibilnih hvataljki robota putem kontrole rukama, što im na neki način omogućava da osete ono što robot oseća kada njegovi manipulatori dolaze u dodir sa objektima. Kada ljudski operater pokaže robotima kako da obave određeni zadatak nekoliko puta pod različitim uslovima, veštačka inteligencija robota gradi sopstveni interni model kako uspeh i neuspeh izgledaju, a zatim pokreće hiljade simulacija zasnovanih na fizici na osnovu svog internog modela zadatka, kako bi pronašao niz tehnika za obavljanje posla. Postupak započinje sa demonstracijom malog skupa veština od strane nastavnika putem teleoperacije. AI zasnovana Politika difuzije tada uči u pozadini tokom nekoliko sati. Ako na primer naučimo robota popodne, dozvolimo mu da uči preko noći, i sledećeg jutra imamo novo funkcionalno ponašanje. Tim je do sada koristio ovaj pristup kako bi brzo obučavao robote u više od 60 malih, uglavnom kuhinjskih zadataka - svaki relativno jednostavan za prosečnu odraslu osobu, ali svaki zahteva da roboti sami otkriju kako da uhvate, drže i manipulišu različitim vrstama predmeta, koristeći razne alate i pribor. Govorimo o korišćenju noža da jednolično nanesemo namaz na krišku hleba, ili korišćenje spatule da okrene palačinku, ili korišćenje ljuštilice za krompire. Naučio je kako da razvuče testo u podlogu za pizzu, onda da kašikom nanese sos na podlogu i da ga razmaže kašikom.
Diffusion Policy
Toyota kaže da će kontrolisati stotine zadataka do kraja godine, a do kraja 2024. godine planira preko 1000 zadataka. Kao takva, razvija ono u šta veruje da će biti prvi veliki model ponašanja ili LBM - okvir koji će se vremenom proširiti da postane nešto poput robota u obliku telefonskog Chata. Drugim rečima, potpuno AI-generisani model kako robot može da interaguje s fizičkim svetom da bi postigao određene rezultate, koji se manifestuju kao ogromna količina podataka koja je potpuno nečitljiva ljudskom oku. Tim efektivno implementira postupak kojim će budući vlasnici i operateri robota u svim vrstama situacija moći brzo da nauče svoje robote novim zadacima po potrebi - nadograđujući čitave flote robota novim veštinama kako napreduju. Ono što je tako uzbudljivo kod ovog novog pristupa je brzina i pouzdanost s kojom možemo dodavati nove veštine. Zato što ove veštine direktno rade sa slikama sa kamere i taktilnim osetilima, koristeći samo naučene predstave, oni su sposobni da dobro izvršavaju čak i zadatke koji uključuju deformabilne objekte, tkanine i tečnosti - koje su tradicionalno bile izuzetno teške za robote.