FAQ

Pogosta vprašanja in odgovori

Moj mali eksperiment. Z njim opazujem gibanje zanimanja v slovenskem (spletnem) medijskem prostoru. Ko dobim novo idejo, spremenim algoritme in prikaz. Včasih je sprememba dobra, včasih ne ... Je odprt za vse, ki vas zanima kaj je trenutno popularno pri nas oziroma kaj se Slovencem zdi pomembno nek dan.

Prikazujejo se objave, ki so mlajše od 2 dni, tako da je vsebina vedno sveža.

Gre za delovno ime. Ni nujno, da ostane. Enkrat mi je padlo na pamet in iz njega sem razvil ta servis. Zamislil sem si vrtni šlauf iz katerega tečejo novice. Včasih hitreje, učasih počasneje ... Ja, sanjaril sem o vročem poletju. Upam, da mi ne zamerite. :)

Update: Ostalo je 10+ let. 😅 Nič ni bolj večnega, kot začasne odločitve. Zato sem na vrh dodal naziv "Novice tu in zdaj", da se nekaj premakne. 😎

Bolj srečen emoji pomeni bolj pozitivno novico, žalosten/jezen pa negativno. Za analizo uporabljam najmanjši možni AI model, ki še razume slovenski jezik. Številke so torej relativne in ne absolutne (ker vsak model to po svoje vrne). Primarno me je zanimalo razmerje negativnih in pozitivnih novic. Pa filtre sem hotel imet.

Spisek
Pozitivni: 😍 😁 😊 🙂
Negativni: 😡 😠 😒 🙁

Številka pomeni hibridno popularnost. Ni več samo social API. Vzamem FB odzive, svežino objave in ali več medijev piše o isti temi, nato dodam še lokalne signale iz te strani: klike, prikaze, CTR in hitrost klikov v zadnjih urah.

Praktično: 1 lokalni klik šteje približno kot 10 FB všečkov, zato lahko tudi obiskovalci strani premikate vrstni red. 🔥

Pomeni "trenutno najbolj vroče" med novicami zadnjih 2 dni. Algoritem ne gleda samo skupnega seštevka, ampak tudi tempo (kaj je pravkar začelo močno rasti).

So po vrsti, samo po "obteženem" vrstnem redu. Objave so objavljene po algoritmu, ki upošteva število glasov in svežino objave.

Za oboje uporabljam AI modele. Tiste najbolj poceni, ki znajo to ugotoviti. Sentiment je relativno enostavna zadeva za LLM, zato uporabljam brezplačne klice na Google Gemma, novinarski pristop pa zahteva malo več znanja - zanj uporabljam gpt-5-nano. Testiral sem še druge, ki so dali tudi boljše rezultate, ampak ta kombinacija je najbolj poceni.

Javno dostopni kanali medijev. Trenutno berem okoli 300 različnih slovenskih medijev različnih velikosti. Če se ti zdi, da sem katerega pomembnega pozabil, mi pošlji povezavo. Maila tukaj ne bom objavil, ker spam, ampak dobiš me na vseh socialnih omrežjih kot McLion.

Trenutni spisek novic:

  1. 1001ideja.si
  2. 1ka.arnes.si
  3. 24kul.si
  4. 24ur.com
  5. 365.rtvslo.si
  6. abczdravja.si
  7. aeromanija.com
  8. airbeletrina.si
  9. akos-rs.si
  10. aktivni.metropolitan.si
  11. alpeadriagreen.org
  12. amzs.si
  13. anamonro.si
  14. andraz-tersek.si
  15. api.follow.it
  16. astronomska-revija-spika.si
  17. avp-rs.si
  18. avto-fokus.si
  19. avto-magazin.metropolitan.si
  20. avto-sport.net
  21. avto.info
  22. avtofotomarket.si
  23. avtomanija.com
  24. avtomobilizem.com
  25. ba.bloombergadria.com
  26. babybook.si
  27. bambino.si
  28. beautyfullblog.si
  29. bibaleze.si
  30. bicikel.com
  31. bilibili.com
  32. bivanje.si
  33. blagovest.si
  34. blog.uporabnastran.si
  35. blogs.windows.com
  36. bloomberg.com
  37. bodieko.si
  38. bogastvozdravja.si
  39. bojanambrozic.com
  40. booknjiga.com
  41. bsidesmaribor.si
  42. bunker.si
  43. caranduser.com
  44. casoris.si
  45. caszaizlet.si
  46. caszazemljo.si
  47. cekin.si
  48. celje.info
  49. celjskiglasnik.si
  50. cestni-dirkac.com
  51. citymagazine.si
  52. cnbc.com
  53. cosmopolitan.metropolitan.si
  54. cukrarna.art
  55. data.si
  56. delo.si
  57. demokracija.si
  58. demokrati.si
  59. destrnik.si
  60. diz.si
  61. dnevne-novice.com
  62. dnevnik.si
  63. dogodki.vlada.si
  64. dolenjskilist.svet24.si
  65. dominvrt.si
  66. domovina.je
  67. domzale.si
  68. domzalec.si
  69. domzalske-novice.si
  70. donosno.si
  71. dpor.si
  72. drama.si
  73. drjamtravels.blog
  74. drobnica.si
  75. drugisvet.com
  76. drustvo-dsp.si
  77. drustvo1oktober.si
  78. druzina.si
  79. dsr.si
  80. duhovnost.eu
  81. dz-rs.si
  82. e-koroska.si
  83. e-maribor.si
  84. e-vozila.si
  85. edavki.durs.si
  86. ekipa.svet24.si
  87. ekodezela.si
  88. ekopercapodistria.si
  89. ekosklad.si
  90. elle.metropolitan.si
  91. emorje.com
  92. enavtika.si
  93. eposavje.com
  94. erast.si
  95. etno-muzej.si
  96. evrovizija.com
  97. f1.avtomanija.com
  98. facebook.com
  99. falajfl.si
  100. fashion.si
  101. filantropija.org
  102. finance.si
  103. fokuspokus.si
  104. forbes.n1info.si
  105. fu.gov.si
  106. gasilec.net
  107. germsek.com
  108. gezagrabar.kmeckiglas.com
  109. gibanjesvoboda.si
  110. glitter.si
  111. gmj.si
  112. go-portal.si
  113. gore-ljudje.net
  114. gorenjski-utrip.si
  115. gov.si
  116. govorise.metropolitan.si
  117. gradbenik.net
  118. gradnjainobnova.si
  119. grazia.si
  120. grosuplje.si
  121. gsmarena.com
  122. h2oteam.com
  123. hac.si
  124. had.si
  125. hausbau.si
  126. hermioninblog.blogspot.com
  127. hokej.si
  128. hop.si
  129. hr.bloombergadria.com
  130. hribi.net
  131. hudo.com
  132. igorzabel.org
  133. info360.si
  134. informer.si
  135. instore.si
  136. inz.si
  137. irenajoveva.si
  138. iskraonline.eu
  139. iskreni.net
  140. istra-nasa.si
  141. izgubljenavvesolju.si
  142. izola.si
  143. izvozniki.finance.si
  144. izvoznookno.si
  145. jazmp.si
  146. jzs.si
  147. kamzmulcem.si
  148. kaplan-marko.blogspot.com
  149. katoliska-cerkev.si
  150. kavarnahayek.wordpress.com
  151. kgzs.si
  152. kinodvor.org
  153. kinoloska.si
  154. kinosiska.si
  155. kinoteka.si
  156. klikaj.si
  157. kmeckiglas.com
  158. konj-zveza.org
  159. korociv.si
  160. koroskenovice.si
  161. kosarka.info
  162. kozjansko.info
  163. kpk-rs.si
  164. kraljiulice.org
  165. kreativnirazred.blogspot.com
  166. kristijanhrastar.kmeckiglas.com
  167. kulinarika.net
  168. kulturnimarksizem.si
  169. kzs.si
  170. lahkihnog-naokrog.si
  171. las-ok.si
  172. levica.si
  173. libertarec.blogspot.com
  174. lider.si
  175. live.finance.si
  176. ljnovice.si
  177. ljse.si
  178. ljubljanainfo.com
  179. ljubljanskobarje.si
  180. lokalec.si
  181. lokalne-ajdovscina.si
  182. lokalno.svet24.si
  183. loski-muzej.si
  184. lovska-zveza.si
  185. lzs-zveza.si
  186. m.planet-lepote.com
  187. mail.abczdravja.si
  188. mao.si
  189. maribor24.si
  190. mariborinfo.com
  191. marketingmagazin.si
  192. matjazcorel.com
  193. mbreport.si
  194. med.over.net
  195. mediaspeed.net
  196. medover.zurnal24.si
  197. megafon.si
  198. megasvet.si
  199. meteoinfo.si
  200. metinalista.si
  201. metropolitan.si
  202. mgml.si
  203. mi-press.eu
  204. mikstone.com
  205. mk.bloombergadria.com
  206. mklj.si
  207. mlad.si
  208. mladina.si
  209. mladipodjetnik.si
  210. mmjevnikar.kmeckiglas.com
  211. mobile.si
  212. moderna-zenska.si
  213. moja-dolenjska.si
  214. mojaobcina.si
  215. mojepodravje.si
  216. mojeposavje.si
  217. mojezdravje.net
  218. mojpes.com
  219. mojpogled.com
  220. mojprihranek.si
  221. monitor.si
  222. morel.si
  223. moski.hudo.com
  224. moskisvet.com
  225. motogp.avtomanija.com
  226. motovila.si
  227. mucek.si
  228. music24.si
  229. muzej-kamnik-on.net
  230. muzikobala.com
  231. mzt.org
  232. n1info.si
  233. nadlani.si
  234. nadskofija-ljubljana.si
  235. naklo.si
  236. napoved-vremena.si
  237. nas-stik.si
  238. nasaprimorska.si
  239. nascas.svet24.si
  240. navdihni.me
  241. necenzurirano.si
  242. nepremagljiva.si
  243. nijz.si
  244. njena.svet24.si
  245. nkolimpija.si
  246. nms.si
  247. nogomania.com
  248. nosecka.net
  249. nostalgija.si
  250. notranjska.si
  251. nova24tv.si
  252. novamedicina.org
  253. novice.at
  254. novice.si
  255. novice.sio.si
  256. noviceznotranjske.net
  257. novinar.com
  258. novitednik.svet24.si
  259. obalaplus.si
  260. obcina-ankaran.si
  261. obcina-ig.si
  262. obramba.com
  263. obzornik.zbornica-zveza.si
  264. odprtakuhinja.delo.si
  265. odv-zb.si
  266. okusno.je
  267. onaplus.delo.si
  268. opazovalec.si
  269. outsider.si
  270. ovinu.si
  271. ozs.si
  272. paradaplesa.si
  273. parkvojaskezgodovine.si
  274. penzionist.info
  275. piran.si
  276. piratskastranka.si
  277. planet-lepote.com
  278. planet-tv.si
  279. planetnogomet.si
  280. plavalna-zveza.si
  281. plusportal.si
  282. podcrto.si
  283. podjetnaslovenija.si
  284. podjetniskisklad.si
  285. pokmuz-ce.si
  286. pokukaj.si
  287. politikis.si
  288. pomurske-novice.si
  289. portal-os.si
  290. posavskiobzornik.si
  291. posrcumlad.si
  292. potepanja.com
  293. potnik.si
  294. potniski.sz.si
  295. povsodjelepo.com
  296. pozareport.si
  297. preberite.si
  298. predsednica-slo.si
  299. prehrana.si
  300. preiskovalno.si
  301. prijavim.se
  302. primorski.eu
  303. probauhaus.com
  304. prva.si
  305. ptujinfo.com
  306. publishwall.si
  307. racunalniske-novice.com
  308. racunovodja.com
  309. radio.ognjisce.si
  310. radio1.svet24.si
  311. radiokaos.info
  312. radiomars.si
  313. radioptuj.svet24.si
  314. radiostudent.si
  315. radioterminal.live
  316. radiotomi.si
  317. rally.avtomanija.com
  318. regionalno.si
  319. regionalobala.si
  320. renton.si
  321. reporter.si
  322. revija-vino.si
  323. revija.ognjisce.si
  324. revijalz.si
  325. revijastop.si
  326. revijazamojezdravje.si
  327. ringaraja.net
  328. robin.si
  329. rocker.si
  330. rockline.si
  331. rokomet.net
  332. rs.bloombergadria.com
  333. rts24.si
  334. rtvslo.si
  335. sasa-novice.si
  336. sensa.metropolitan.si
  337. seonet.ljse.si
  338. si.bloombergadria.com
  339. si21-com.dev.heim-01.bananadmin.com
  340. si21.com
  341. sigic.si
  342. simic-partnerji.si
  343. sindikat-novinarjev.si
  344. siol.net
  345. skandal24.si
  346. skofjaloka.si
  347. skupnostobcin.si
  348. slo-tech.com
  349. slosolar.si
  350. slovenci-zagreb.hr
  351. slovenec.org
  352. sloveniatimes.com
  353. slovenskavojska.si
  354. slovenskenovice.delo.si
  355. slovenskenovice.si
  356. snportal.si
  357. sobotainfo.com
  358. socialnidemokrati.si
  359. spletnicasopis.eu
  360. spodnjepodravje.si
  361. spomeniki.blogspot.com
  362. sport-tv.si
  363. sportklub.n1info.si
  364. sportni-portal.si
  365. ssz.at
  366. sta.si
  367. stat.si
  368. strogo-zaupno.si
  369. student.si
  370. studentska-org.si
  371. svet-el.si
  372. svet24.si
  373. svetavladar.si
  374. tacka.zurnal24.si
  375. tednik.svet24.si
  376. tehnozvezdje.si
  377. telefoncek.si
  378. telegraf.si
  379. teniskisvet.si
  380. tevztavcar.kmeckiglas.com
  381. the-slovenia.com
  382. theguardian.com
  383. tms.si
  384. tocnoto.si
  385. top24novice.si
  386. trgovina.vecer.com
  387. triglavmedia.si
  388. trziski-muzej.si
  389. turisticna-zveza.si
  390. turisticni-novinarji.si
  391. tv-m.si
  392. umanotera.org
  393. upokojenci.com
  394. utrip-ljubljane.si
  395. vandraj.si
  396. varnastarost.si
  397. vaticannews.va
  398. vecer.com
  399. vestnik.svet24.si
  400. vezjak.com
  401. vibe247.net
  402. videosvet.si
  403. viralko.si
  404. visitkras.info
  405. visitpohorje.si
  406. vitafit.si
  407. viva.bhc.si
  408. vizita.si
  409. vlastakunej.kmeckiglas.com
  410. vmax.si
  411. volksgruppen.orf.at
  412. vsezamojdan.si
  413. vw-revija.si
  414. zadovoljna.si
  415. zanima.me
  416. zasrce.si
  417. zastarse.si
  418. zaupokojence.si
  419. zav-zdruzenje.si
  420. zbs-giz.si
  421. zdis.si
  422. zdravo.si
  423. zdruzenje-frank.si
  424. zdruzenje-manager.si
  425. zelenaslovenija.si
  426. zenska.hudo.com
  427. zgodovina.si
  428. zifs.si
  429. zivljenje55plus.si
  430. zofijini.net
  431. zon.si
  432. zps.si
  433. zsis.si
  434. zspm.si
  435. zsss.si
  436. zurnal24.si
  437. zvitorep.si
  438. zvkds.si

Ker je tam moj dom in so mi takšne informacije pomembne. :)

Algoritem, ki ugotavlja "lokalnost" je dokaj neumen. V besedilu išče besede povezane z Obalo in imeni, ki se pogosto pojavljajo pri nas. Pogosto to povzroči "false positives". Zadeva ne uporablja niti algoritma, ki ga koristim za ugotavljanje podobnosti objav, tako neumno je. Je pa dovolj za pokrivanje moje radovednosti, vsaj kar se domačih krajev tiče.

Gre za dokaj pameten algoritem, če jemljemo slovar kot nekaj zelo inteligentnega. Uporabil sem javno dostopen slovar osnovnih oblik besed (korpus, leme), ki ga dobite s kopanjem skozi povezave na slovenscina.eu in na Projektu JOS. Moj slovar je sicer malo predelan in vanj je dodanih nekaj besed oz. imen, ki se pogosto pojavljajo v slovenskih medijih.

S pomočjo slovarja dobim spisek besed v imenovalniku, ki se pojavijo v naslovu in uvodniku. Zatem z algoritmom za ugotavljanje "bližine besedil" dobim ven neko številko in če je nad nekim minimumom, ki je ročno postavljen, povežem dokumenta kot podobna.

Tako početje ima sicer en stranski učinek. Hitro izpostavi vsebino, ki jo mediji enostavno skopirajo iz STA in podobnih virov.

Ne, ta algoritem ni tako dober, kot tisti od Najdi.si ali Googla. Nimam iskalnika v ozadju in velike baze znanja, da bi se lahko sistem samostojno učil.

Nimam nekih posebnih planov. Gre za moj peskovnik, kjer implementiram ideje, ki mi pridejo na pamet ob tistih trenutkih, ko me internet ne moti ... v podrobnosti se tukaj ne bom spuščal, ker je verjetno že vsem jasno. :)

Če imate kakšno idejo kako bi te algoritme ali aplikacijo uporabili na zanimiv način, dobite moje kontakte na Linkedinu.

Enkrat dnevno vzamem vse novice, jih razdelim na pozitivne/negativne in pošljem skozi LLM. Model vrne strukturiran povzetek po temah (z naslovi in kratkim blokom "V 20 sekundah"), na koncu pa še seznam ID-jev najbolj relevantnih novic. Te podatke zapišem v bazo in povežem z originalnimi članki.

Povzetek je narejen za hitro branje: najprej kratek pregled, potem pa po želji odpreš več podrobnosti.

Vse teme pokaže vse sklope.

Samo lokalno pokaže samo sklope z lokalno tematiko.

Brez športa skrije športne sklope.

Več pozitivnih skrije celoten negativni stolpec, da ostane samo pozitivni povzetek.

Gumb uporabi brskalnikov speech synthesis in poskuša uporabiti slovenski glas (sl-*). Če slovenski glas ni nameščen, predvajanje ne steče.

Besedilo je pripravljeno po sklopih, zato so med temami pavze in je poslušanje bolj naravno.

Odločitev sem prepustil LLM. Pognal sem ga čez vse medije, ki jih spremljam. Naročil sem mu, da odpre vse razpoložljive novice (zadnjih 25 novic) in glede na vsebino se odloči za "political bias". Uporabil sem openai/gpt-5.2 z reasoning na "high".

Tole je bil prompt:

Based on these article samples, analyze the political bias of this news source.

Consider:
1. Language patterns (emotional vs. neutral, loaded terms, framing)
2. Topic selection and emphasis
3. Source attribution and fact-checking practices
4. Slovenian political context (parties, figures, local issues)
5. Overall tone and presentation style

Political Spectrum Labels (choose ONE):
- Left-biased: Strong progressive/left-wing perspective
- Lean left: Generally left-leaning with some balance
- Balanced / Neutral: Objective, fact-based reporting from multiple perspectives
- Lean right: Generally right-leaning with some balance
- Right-biased: Strong conservative/right-wing perspective
- Populist / Sensational: Emotionally charged, sensationalist (transcends left-right)
- State-influenced: Government-owned or heavily influenced by state actors
- Satire / Parody: Humor-based, not intended as serious news
- Unknown / Insufficient evidence: Cannot determine from available samples

Analizo nameravam občasno ponoviti, ker sklepam, da bodo nekateri mediji bolj "odločni" v časi volitev. 😎