The Register pokazuje kako pokrenuti lokalne AI coding agente bez token limita
The Register objavljuje praktičan vodič za pokretanje lokalnih AI coding agenata, kao odgovor na rast cena, agresivnije rate limite i prelazak alata poput GitHub Copilot-a na usage-based model. Autori testiraju lokalne modele, posebno Qwen3.6-27B, kroz Llama.cpp i agent frameworke kao što su Claude Code, Pi Coding Agent i Cline. Vodič navodi da su lokalni modeli danas znatno korisniji nego ranije zahvaljujući boljim reasoning sposobnostima, tool calling-u, većim context window-ima i efikasnijim inference stackovima. Ipak, tekst jasno kaže da Qwen3.6-27B nije zamena za frontier modele poput Opus 4.7 ili GPT-5.5, ali može biti dovoljno dobar za manje projekte, skripte, fokusirane izmene i eksperimentisanje bez stalnog troška tokena.
Lokalni AI coding agenti menjaju računicu za hobi projekte, interne eksperimente i manje razvojne zadatke. Prednost nije samo cena, već i kontrola nad okruženjem, podacima i zavisnošću od cloud dobavljača. Ograničenje ostaje isto kao kod svake automatizacije koja dobija pristup fajlovima i shell komandama: model može pogrešiti, agent može napraviti štetu, a brzina bez sandboxa i ljudske kontrole lako postaje rizik.
- Za lokalne coding agente koristiti dovoljno jaku mašinu, idealno GPU sa najmanje 24 GB VRAM-a ili Mac sa najmanje 32 GB unified memory
- Podesiti veliki context window, prompt caching i odgovarajuće parametre modela pre ozbiljnijeg rada sa kodom
- Claude Code i Cline koristiti sa human-in-the-loop režimom za izmene fajlova i izvršavanje komandi
- Pi Coding Agent ne pokretati na glavnoj radnoj mašini bez sandboxa jer po defaultu radi u YOLO režimu
- Za testiranje lokalnih agenata koristiti VM, Docker kontejner ili odvojeno development okruženje i obavezno imati backup projekta