Novi o1 model, sada dostupan u ChatGPT-u, sada ‘razmišlja’ pre nego što odgovori – i počinje da nadmašuje i prethodne modele i ljude sa doktoratima u rešavanju problema na nivou visoke stručnosti.
Predstavljajući o1: Mislilac
Novi model se zove o1. Već je dostupan u 100% korisničkih naloga ChatGPT kao opcija koju možete pozvati. I dok GPT-4o (omni) ostaje univerzalni model najrelevantniji za većinu zadataka, o1 je svojevrsni specijalista. Njegova specijalizacija je kompleksno rezonovanje. I supermoć koja ga odvaja od GPT modela je… to što stane i ‘razmišlja’ umesto da odmah počne da vam odgovara.
o1 postiže znatno bolje odgovore na teškim zadacima, naspram prethodnih modela, suštinski tako što skicira sve što ima na raspolaganju, razlaže veliki posao na manje zadatke, proverava svoj rad i izaziva svoje pretpostavke (sve to u pozadini) pre nego što počne da vam daje odgovor.
Dakle, dok GPT-4o obično odmah počinje sa pisanjem koda, generisanjem slika ili pisanjem odgovora, o1 može sedeti i razmišljati o pitanju neko vreme, planirajući svoj način napada. Nije to dugo vreme – možda 10-20 sekundi – ali izgleda da pravi razliku kada je reč o vrstama teških problema sa kojima su se ovi veliki jezički modeli obično mučili.
Što duže razmišlja, to su bolji odgovori, i dok će proizvodi koji su danas objavljeni razmišljati o stvarima nekoliko sekundi, OpenAI kaže da će verovatno imati smisla objaviti buduće verzije koje će provoditi sate, dane ili čak nedelje pažljivo prolazeći kroz ogromne, složene probleme, proizvodeći puno rešenja, testirajući ih jedne protiv drugih i konačno da odgovor.
Ne možete učitati fajlove u njih
Ne izgleda kao da imaju pristup memoriji GPT-4o ili vašim ličnim prilagođenim sistemskim promptovima, tako da ne znaju ništa o vama. Ne mogu pretraživati internet za nove informacije posle njihovog datuma obuke – oktobar 2023.
U opštim zadacima pisanja i bilo čemu što zahteva učitavanje fajlova ili pristup internetu, GPT-4o će i dalje biti mnogo korisniji – ali s druge strane, moguće je da se GPT-4o koristi za sastavljanje gomile korisnih resursa i za pripremnu analizu, zatim zapakuje problem u prompt za svog pametnijeg, ali izolovanijeg novog prijatelja.
Koliko je dobar model o1?
o1 je pomeo doktorske fizičare u njihovoj sopstvenoj oblasti, koji su imali dozvolu da uzmu ove testove sa otvorenim knjigama, i iako nije sasvim nadmašio biologe i hemičare, prati ih u stopu. Njegov ukupni rezultat bio je najbolji ikada viđen od AI modela. Model o1 je značajan korak napred u matematičkim sposobnostima. Dodatno, bolji je u prepoznavanju i odbijanju pokušaja probijanja zaštite, iako se to još uvek ponekad provuče. Samosvestan je u većoj meri, i tako više sposoban za planiranje i razmišljanje o svojim sopstvenim slabostima. Značajno je manipulativniji, barem kada je u pitanju manipulacija modelom GPT-4o. Znatno je bolji u prevođenju između jezika. S druge strane, i dalje nije pouzdan i često je veliki fabikator.
Šta sve ovo znači?
Jednostavno rečeno, ChatGPT je upravo postao mnogo sposobniji za duže, teže i složenije zadatke. Logičko razmišljanje i planiranje su ključni gradivni blokovi ka velikom cilju: AI model koji može uzeti ideju i jednostavno je sprovesti u delo, uzimajući koliko god vremena je potrebno, temeljno proveravajući svoj rad uz put, i prikupljajući i koristeći bilo koje resurse koje su mu potrebni duž puta.
Rani o1 model obećava da će naprednim korisnicima GPT-a pružiti znatno oštriji alat.