#26 Re: Lokalni AI modeli
Posted: 25/09/2025 23:35
Prije svega hvala na temi, ukoliko se slazes ja bih je prosirio na AI i ML ucenje generalno, ali na tebi je @zilog . Pa da mozemo malo pricati i o cloud servisima, edukacijama, cerfitikacijama.
Kao sto je napisano, lokalni AI modeli su offline modeli gdje vi mozete da svoje treninge radite, budete fleksibilni. Mozete to raditi na telefonima, tabletima, racunarima ili serverima. Bitno je da imate dovoljno jak GPU i dovoljno RAM memorije.
Neki primjeri su LLaMA 2 ili 3, Mistral/Mixtral, GPT4All, za slike Stable Diffusion, za govor se obicno koristi Whisper od OpenAI.
Vezano za pitanje da li lokalni modeli koriste bazu sa interneta, odogovor je ne. Vi skinete model i dobijate tezinu (weight), sto je obican fajl sa brojevima koji predstavlja znanje koje je model naucio. To znanje je ugradjeno u model i ne mijenja se. Dakle, model ne koristi internet, vec koristi sazvakano znanje koje je vec naucio. Ako ste offline onda model nema pristupu najnovijim podacima (vrijeme, vijesti, itd), dakle ne moze biti apdejtovan sa zadnjim trendovima.
Vezano za lokalnu bazu znanja, tu dolazimo do vec spomenutog RAG-a (Retrieval-Augmented Generation). RAG podrazumjeva indeksirano znanje ili vektorske baze. Da objasnim to jednostavno: zamislite da je AI model neko ko je mnogo citao, ali pamti samo do odredjenog datuma. RAG dodaje dva koraka:
- Pretraga (Retrieval) - AI prvo pogleda tvoju bazu znanja (lokalno ili online)
- Generacija (Generation) - AI zatim koristi ono sto je nasao da ti da odgovor
Primjer:
- Upit - koja je nova sifra za Wi-Fi u kuci?
- RAG:
1. Potrazi u biljesakama
2. Nadje dokument sa Wi-Fi sifrom
3. Vrati odgovor sa sifrom
Volio bih zaista da pricamo o cloud servisima i njihovim primjenama kao i o korisnim certifikatima na ovoj temi.
Kao sto je napisano, lokalni AI modeli su offline modeli gdje vi mozete da svoje treninge radite, budete fleksibilni. Mozete to raditi na telefonima, tabletima, racunarima ili serverima. Bitno je da imate dovoljno jak GPU i dovoljno RAM memorije.
Neki primjeri su LLaMA 2 ili 3, Mistral/Mixtral, GPT4All, za slike Stable Diffusion, za govor se obicno koristi Whisper od OpenAI.
Vezano za pitanje da li lokalni modeli koriste bazu sa interneta, odogovor je ne. Vi skinete model i dobijate tezinu (weight), sto je obican fajl sa brojevima koji predstavlja znanje koje je model naucio. To znanje je ugradjeno u model i ne mijenja se. Dakle, model ne koristi internet, vec koristi sazvakano znanje koje je vec naucio. Ako ste offline onda model nema pristupu najnovijim podacima (vrijeme, vijesti, itd), dakle ne moze biti apdejtovan sa zadnjim trendovima.
Vezano za lokalnu bazu znanja, tu dolazimo do vec spomenutog RAG-a (Retrieval-Augmented Generation). RAG podrazumjeva indeksirano znanje ili vektorske baze. Da objasnim to jednostavno: zamislite da je AI model neko ko je mnogo citao, ali pamti samo do odredjenog datuma. RAG dodaje dva koraka:
- Pretraga (Retrieval) - AI prvo pogleda tvoju bazu znanja (lokalno ili online)
- Generacija (Generation) - AI zatim koristi ono sto je nasao da ti da odgovor
Primjer:
- Upit - koja je nova sifra za Wi-Fi u kuci?
- RAG:
1. Potrazi u biljesakama
2. Nadje dokument sa Wi-Fi sifrom
3. Vrati odgovor sa sifrom
Volio bih zaista da pricamo o cloud servisima i njihovim primjenama kao i o korisnim certifikatima na ovoj temi.