Praksa 7. maj 2026. The Register

The Register pokazuje kako pokrenuti lokalne AI coding agente bez token limita

The Register objavljuje praktičan vodič za pokretanje lokalnih AI coding agenata, kao odgovor na rast cena, agresivnije rate limite i prelazak alata poput GitHub Copilot-a na usage-based model. Autori testiraju lokalne modele, posebno Qwen3.6-27B, kroz Llama.cpp i agent frameworke kao što su Claude Code, Pi Coding Agent i Cline. Vodič navodi da su lokalni modeli danas znatno korisniji nego ranije zahvaljujući boljim reasoning sposobnostima, tool calling-u, većim context window-ima i efikasnijim inference stackovima. Ipak, tekst jasno kaže da Qwen3.6-27B nije zamena za frontier modele poput Opus 4.7 ili GPT-5.5, ali može biti dovoljno dobar za manje projekte, skripte, fokusirane izmene i eksperimentisanje bez stalnog troška tokena.

Pojašnjenje

Lokalni AI coding agenti menjaju računicu za hobi projekte, interne eksperimente i manje razvojne zadatke. Prednost nije samo cena, već i kontrola nad okruženjem, podacima i zavisnošću od cloud dobavljača. Ograničenje ostaje isto kao kod svake automatizacije koja dobija pristup fajlovima i shell komandama: model može pogrešiti, agent može napraviti štetu, a brzina bez sandboxa i ljudske kontrole lako postaje rizik.

Preporuke

Za lokalne coding agente koristiti dovoljno jaku mašinu, idealno GPU sa najmanje 24 GB VRAM-a ili Mac sa najmanje 32 GB unified memory
Podesiti veliki context window, prompt caching i odgovarajuće parametre modela pre ozbiljnijeg rada sa kodom
Claude Code i Cline koristiti sa human-in-the-loop režimom za izmene fajlova i izvršavanje komandi
Pi Coding Agent ne pokretati na glavnoj radnoj mašini bez sandboxa jer po defaultu radi u YOLO režimu
Za testiranje lokalnih agenata koristiti VM, Docker kontejner ili odvojeno development okruženje i obavezno imati backup projekta