FAQ

Pogosta vprašanja in odgovori

Moj mali eksperiment. Z njim opazujem gibanje zanimanja v slovenskem (spletnem) medijskem prostoru. Ko dobim novo idejo, spremenim algoritme in prikaz. Včasih je sprememba dobra, včasih ne ... Je odprt za vse, ki vas zanima kaj je trenutno popularno pri nas oziroma kaj se Slovencem zdi pomembno nek dan.

Prikazujejo se objave, ki so mlajše od 2 dni, tako da je vsebina vedno sveža.

Gre za delovno ime. Ni nujno, da ostane. Enkrat mi je padlo na pamet in iz njega sem razvil ta servis. Zamislil sem si vrtni šlauf iz katerega tečejo novice. Včasih hitreje, učasih počasneje ... Ja, sanjaril sem o vročem poletju. Upam, da mi ne zamerite. :)

Update: Ostalo je 10+ let. 😅 Nič ni bolj večnega, kot začasne odločitve. Zato sem na vrh dodal naziv "Novice tu in zdaj", da se nekaj premakne. 😎

Bolj srečen emoji pomeni bolj pozitivno novico, žalosten/jezen pa negativno. Za analizo uporabljam najmanjši možni AI model, ki še razume slovenski jezik. Številke so torej relativne in ne absolutne (ker vsak model to po svoje vrne). Primarno me je zanimalo razmerje negativnih in pozitivnih novic. Pa filtre sem hotel imet.

Spisek
Pozitivni: 😍 😁 😊 🙂
Negativni: 😡 😠 😒 🙁

Številka pomeni hibridno popularnost. Ni več samo social API. Vzamem FB odzive, svežino objave in ali več medijev piše o isti temi, nato dodam še lokalne signale iz te strani: klike, prikaze, CTR in hitrost klikov v zadnjih urah.

Praktično: 1 lokalni klik šteje približno kot 10 FB všečkov, zato lahko tudi obiskovalci strani premikate vrstni red. 🔥

Pomeni "trenutno najbolj vroče" med novicami zadnjih 2 dni. Algoritem ne gleda samo skupnega seštevka, ampak tudi tempo (kaj je pravkar začelo močno rasti).

So po vrsti, samo po "obteženem" vrstnem redu. Objave so objavljene po algoritmu, ki upošteva število glasov in svežino objave.

Za oboje uporabljam AI modele. Tiste najbolj poceni, ki znajo to ugotoviti. Sentiment je relativno enostavna zadeva za LLM, zato uporabljam brezplačne klice na Google Gemma, novinarski pristop pa zahteva malo več znanja - zanj uporabljam gpt-5-nano. Testiral sem še druge, ki so dali tudi boljše rezultate, ampak ta kombinacija je najbolj poceni.

Javno dostopni kanali medijev. Trenutno berem okoli 300 različnih slovenskih medijev različnih velikosti. Če se ti zdi, da sem katerega pomembnega pozabil, mi pošlji povezavo. Maila tukaj ne bom objavil, ker spam, ampak dobiš me na vseh socialnih omrežjih kot McLion.

Trenutni spisek novic:

  1. 1001ideja.si
  2. 1ka.arnes.si
  3. 24kul.si
  4. 24ur.com
  5. 365.rtvslo.si
  6. abczdravja.si
  7. aeromanija.com
  8. airbeletrina.si
  9. akos-rs.si
  10. aktivni.metropolitan.si
  11. amzs.si
  12. anamonro.si
  13. andraz-tersek.si
  14. api.follow.it
  15. astronomska-revija-spika.si
  16. avp-rs.si
  17. avto-fokus.si
  18. avto-magazin.metropolitan.si
  19. avto-sport.net
  20. avto.info
  21. avtofotomarket.si
  22. avtomanija.com
  23. avtomobilizem.com
  24. ba.bloombergadria.com
  25. babybook.si
  26. bambino.si
  27. beautyfullblog.si
  28. bibaleze.si
  29. bicikel.com
  30. bilibili.com
  31. bivanje.si
  32. blagovest.si
  33. blog.uporabnastran.si
  34. blogs.windows.com
  35. bloomberg.com
  36. bodieko.si
  37. bogastvozdravja.si
  38. bojanambrozic.com
  39. booknjiga.com
  40. bunker.si
  41. caranduser.com
  42. casoris.si
  43. caszaizlet.si
  44. caszazemljo.si
  45. cekin.si
  46. celje.info
  47. celjskiglasnik.si
  48. cestni-dirkac.com
  49. citymagazine.si
  50. cosmopolitan.metropolitan.si
  51. cukrarna.art
  52. data.si
  53. delo.si
  54. demokracija.si
  55. demokrati.si
  56. destrnik.si
  57. diz.si
  58. dnevne-novice.com
  59. dnevnik.si
  60. dogodki.vlada.si
  61. dolenjskilist.svet24.si
  62. dominvrt.si
  63. domovina.je
  64. domzale.si
  65. domzalec.si
  66. domzalske-novice.si
  67. donosno.si
  68. dpor.si
  69. drama.si
  70. drjamtravels.blog
  71. drobnica.si
  72. drugisvet.com
  73. drustvo-dsp.si
  74. drustvo1oktober.si
  75. druzina.si
  76. dsr.si
  77. duhovnost.eu
  78. dz-rs.si
  79. e-koroska.si
  80. e-maribor.si
  81. e-vozila.si
  82. edavki.durs.si
  83. ekipa.svet24.si
  84. ekodezela.si
  85. ekopercapodistria.si
  86. ekosklad.si
  87. elle.metropolitan.si
  88. emorje.com
  89. enavtika.si
  90. eposavje.com
  91. erast.si
  92. etno-muzej.si
  93. evrovizija.com
  94. f1.avtomanija.com
  95. facebook.com
  96. falajfl.si
  97. fashion.si
  98. finance.si
  99. fokuspokus.si
  100. forbes.n1info.si
  101. fu.gov.si
  102. gasilec.net
  103. germsek.com
  104. gezagrabar.kmeckiglas.com
  105. gibanjesvoboda.si
  106. glitter.si
  107. gmj.si
  108. go-portal.si
  109. gore-ljudje.net
  110. gorenjski-utrip.si
  111. gov.si
  112. govorise.metropolitan.si
  113. gradbenik.net
  114. gradnjainobnova.si
  115. grazia.si
  116. grosuplje.si
  117. gsmarena.com
  118. h2oteam.com
  119. hac.si
  120. had.si
  121. hausbau.si
  122. hermioninblog.blogspot.com
  123. hokej.si
  124. hop.si
  125. hr.bloombergadria.com
  126. hribi.net
  127. hudo.com
  128. igorzabel.org
  129. info360.si
  130. informer.si
  131. instore.si
  132. inz.si
  133. irenajoveva.si
  134. iskraonline.eu
  135. iskreni.net
  136. istra-nasa.si
  137. izgubljenavvesolju.si
  138. izola.si
  139. izvozniki.finance.si
  140. jzs.si
  141. kamzmulcem.si
  142. kaplan-marko.blogspot.com
  143. katoliska-cerkev.si
  144. kavarnahayek.wordpress.com
  145. kgzs.si
  146. kinodvor.org
  147. kinoloska.si
  148. kinosiska.si
  149. kinoteka.si
  150. klikaj.si
  151. kmeckiglas.com
  152. konj-zveza.org
  153. korociv.si
  154. koroskenovice.si
  155. kosarka.info
  156. kozjansko.info
  157. kpk-rs.si
  158. kraljiulice.org
  159. kreativnirazred.blogspot.com
  160. kulinarika.net
  161. kulturnimarksizem.si
  162. kzs.si
  163. lahkihnog-naokrog.si
  164. las-ok.si
  165. levica.si
  166. libertarec.blogspot.com
  167. live.finance.si
  168. ljse.si
  169. ljubljanainfo.com
  170. lokalec.si
  171. lokalne-ajdovscina.si
  172. lokalno.svet24.si
  173. loski-muzej.si
  174. lovska-zveza.si
  175. lzs-zveza.si
  176. m.planet-lepote.com
  177. mao.si
  178. maribor24.si
  179. mariborinfo.com
  180. marketingmagazin.si
  181. matjazcorel.com
  182. mbreport.si
  183. med.over.net
  184. mediaspeed.net
  185. medover.zurnal24.si
  186. megafon.si
  187. megasvet.si
  188. meteoinfo.si
  189. metinalista.si
  190. metropolitan.si
  191. mgml.si
  192. mi-press.eu
  193. mikstone.com
  194. mk.bloombergadria.com
  195. mklj.si
  196. mlad.si
  197. mladina.si
  198. mladipodjetnik.si
  199. mmjevnikar.kmeckiglas.com
  200. mobile.si
  201. moderna-zenska.si
  202. moja-dolenjska.si
  203. mojaobcina.si
  204. mojepodravje.si
  205. mojeposavje.si
  206. mojezdravje.net
  207. mojpes.com
  208. mojprihranek.si
  209. monitor.si
  210. morel.si
  211. moski.hudo.com
  212. moskisvet.com
  213. motogp.avtomanija.com
  214. motovila.si
  215. mucek.si
  216. music24.si
  217. muzej-kamnik-on.net
  218. muzikobala.com
  219. mzt.org
  220. n1info.si
  221. nadlani.si
  222. nadskofija-ljubljana.si
  223. naklo.si
  224. napoved-vremena.si
  225. nas-stik.si
  226. nasaprimorska.si
  227. nascas.svet24.si
  228. navdihni.me
  229. necenzurirano.si
  230. nepremagljiva.si
  231. nijz.si
  232. njena.svet24.si
  233. nkolimpija.si
  234. nms.si
  235. nogomania.com
  236. nosecka.net
  237. nostalgija.si
  238. notranjska.si
  239. nova24tv.si
  240. novamedicina.org
  241. novice.at
  242. novice.si
  243. novice.sio.si
  244. noviceznotranjske.net
  245. novinar.com
  246. novitednik.svet24.si
  247. obalaplus.si
  248. obcina-ankaran.si
  249. obcina-ig.si
  250. obramba.com
  251. obzornik.zbornica-zveza.si
  252. odprtakuhinja.delo.si
  253. odv-zb.si
  254. okusno.je
  255. onaplus.delo.si
  256. opazovalec.si
  257. outsider.si
  258. ovinu.si
  259. ozs.si
  260. paradaplesa.si
  261. parkvojaskezgodovine.si
  262. penzionist.info
  263. piran.si
  264. piratskastranka.si
  265. planet-lepote.com
  266. planet-tv.si
  267. planetnogomet.si
  268. plusportal.si
  269. podcrto.si
  270. podjetnaslovenija.si
  271. podjetniskisklad.si
  272. pokmuz-ce.si
  273. pokukaj.si
  274. politikis.si
  275. pomurske-novice.si
  276. portal-os.si
  277. posavskiobzornik.si
  278. potepanja.com
  279. potnik.si
  280. potniski.sz.si
  281. povsodjelepo.com
  282. pozareport.si
  283. preberite.si
  284. predsednica-slo.si
  285. prehrana.si
  286. preiskovalno.si
  287. prijavim.se
  288. primorski.eu
  289. probauhaus.com
  290. prva.si
  291. ptujinfo.com
  292. publishwall.si
  293. racunalniske-novice.com
  294. racunovodja.com
  295. radio.ognjisce.si
  296. radio1.svet24.si
  297. radiomars.si
  298. radioptuj.svet24.si
  299. radiostudent.si
  300. radioterminal.live
  301. radiotomi.si
  302. rally.avtomanija.com
  303. regionalno.si
  304. regionalobala.si
  305. renton.si
  306. reporter.si
  307. revija-vino.si
  308. revija.ognjisce.si
  309. revijalz.si
  310. revijastop.si
  311. revijazamojezdravje.si
  312. ringaraja.net
  313. robin.si
  314. rocker.si
  315. rockline.si
  316. rokomet.net
  317. rs.bloombergadria.com
  318. rts24.si
  319. rtvslo.si
  320. sasa-novice.si
  321. sensa.metropolitan.si
  322. seonet.ljse.si
  323. si.bloombergadria.com
  324. si21-com.dev.heim-01.bananadmin.com
  325. si21.com
  326. sigic.si
  327. simic-partnerji.si
  328. sindikat-novinarjev.si
  329. siol.net
  330. skandal24.si
  331. skofjaloka.si
  332. skupnostobcin.si
  333. slo-tech.com
  334. slosolar.si
  335. slovenci-zagreb.hr
  336. slovenec.org
  337. sloveniatimes.com
  338. slovenskavojska.si
  339. slovenskenovice.delo.si
  340. slovenskenovice.si
  341. snportal.si
  342. sobotainfo.com
  343. socialnidemokrati.si
  344. spletnicasopis.eu
  345. spodnjepodravje.si
  346. sport-tv.si
  347. sportklub.n1info.si
  348. sportni-portal.si
  349. sta.si
  350. stat.si
  351. strogo-zaupno.si
  352. student.si
  353. studentska-org.si
  354. svet-el.si
  355. svet24.si
  356. svetavladar.si
  357. tacka.zurnal24.si
  358. tednik.svet24.si
  359. tehnozvezdje.si
  360. telefoncek.si
  361. telegraf.si
  362. teniskisvet.si
  363. tevztavcar.kmeckiglas.com
  364. the-slovenia.com
  365. theguardian.com
  366. tms.si
  367. tocnoto.si
  368. top24novice.si
  369. trgovina.vecer.com
  370. triglavmedia.si
  371. trziski-muzej.si
  372. turisticna-zveza.si
  373. turisticni-novinarji.si
  374. tv-m.si
  375. umanotera.org
  376. upokojenci.com
  377. utrip-ljubljane.si
  378. vandraj.si
  379. vaticannews.va
  380. vecer.com
  381. vestnik.svet24.si
  382. vezjak.com
  383. vibe247.net
  384. videosvet.si
  385. viralko.si
  386. visitkras.info
  387. visitpohorje.si
  388. vitafit.si
  389. viva.bhc.si
  390. vizita.si
  391. vlastakunej.kmeckiglas.com
  392. vmax.si
  393. volksgruppen.orf.at
  394. vsezamojdan.si
  395. vw-revija.si
  396. zadovoljna.si
  397. zanima.me
  398. zasrce.si
  399. zastarse.si
  400. zaupokojence.si
  401. zav-zdruzenje.si
  402. zbs-giz.si
  403. zdis.si
  404. zdravo.si
  405. zdruzenje-frank.si
  406. zdruzenje-manager.si
  407. zelenaslovenija.si
  408. zgodovina.si
  409. zifs.si
  410. zivljenje55plus.si
  411. zon.si
  412. zps.si
  413. zsis.si
  414. zspm.si
  415. zsss.si
  416. zurnal24.si
  417. zvitorep.si
  418. zvkds.si

Ker je tam moj dom in so mi takšne informacije pomembne. :)

Algoritem, ki ugotavlja "lokalnost" je dokaj neumen. V besedilu išče besede povezane z Obalo in imeni, ki se pogosto pojavljajo pri nas. Pogosto to povzroči "false positives". Zadeva ne uporablja niti algoritma, ki ga koristim za ugotavljanje podobnosti objav, tako neumno je. Je pa dovolj za pokrivanje moje radovednosti, vsaj kar se domačih krajev tiče.

Gre za dokaj pameten algoritem, če jemljemo slovar kot nekaj zelo inteligentnega. Uporabil sem javno dostopen slovar osnovnih oblik besed (korpus, leme), ki ga dobite s kopanjem skozi povezave na slovenscina.eu in na Projektu JOS. Moj slovar je sicer malo predelan in vanj je dodanih nekaj besed oz. imen, ki se pogosto pojavljajo v slovenskih medijih.

S pomočjo slovarja dobim spisek besed v imenovalniku, ki se pojavijo v naslovu in uvodniku. Zatem z algoritmom za ugotavljanje "bližine besedil" dobim ven neko številko in če je nad nekim minimumom, ki je ročno postavljen, povežem dokumenta kot podobna.

Tako početje ima sicer en stranski učinek. Hitro izpostavi vsebino, ki jo mediji enostavno skopirajo iz STA in podobnih virov.

Ne, ta algoritem ni tako dober, kot tisti od Najdi.si ali Googla. Nimam iskalnika v ozadju in velike baze znanja, da bi se lahko sistem samostojno učil.

Nimam nekih posebnih planov. Gre za moj peskovnik, kjer implementiram ideje, ki mi pridejo na pamet ob tistih trenutkih, ko me internet ne moti ... v podrobnosti se tukaj ne bom spuščal, ker je verjetno že vsem jasno. :)

Če imate kakšno idejo kako bi te algoritme ali aplikacijo uporabili na zanimiv način, dobite moje kontakte na Linkedinu.

Enkrat dnevno vzamem vse novice, jih razdelim na pozitivne/negativne in pošljem skozi LLM. Model vrne strukturiran povzetek po temah (z naslovi in kratkim blokom "V 20 sekundah"), na koncu pa še seznam ID-jev najbolj relevantnih novic. Te podatke zapišem v bazo in povežem z originalnimi članki.

Povzetek je narejen za hitro branje: najprej kratek pregled, potem pa po želji odpreš več podrobnosti.

Vse teme pokaže vse sklope.

Samo lokalno pokaže samo sklope z lokalno tematiko.

Brez športa skrije športne sklope.

Več pozitivnih skrije celoten negativni stolpec, da ostane samo pozitivni povzetek.

Gumb uporabi brskalnikov speech synthesis in poskuša uporabiti slovenski glas (sl-*). Če slovenski glas ni nameščen, predvajanje ne steče.

Besedilo je pripravljeno po sklopih, zato so med temami pavze in je poslušanje bolj naravno.

Odločitev sem prepustil LLM. Pognal sem ga čez vse medije, ki jih spremljam. Naročil sem mu, da odpre vse razpoložljive novice (zadnjih 25 novic) in glede na vsebino se odloči za "political bias". Uporabil sem openai/gpt-5.2 z reasoning na "high".

Tole je bil prompt:

Based on these article samples, analyze the political bias of this news source.

Consider:
1. Language patterns (emotional vs. neutral, loaded terms, framing)
2. Topic selection and emphasis
3. Source attribution and fact-checking practices
4. Slovenian political context (parties, figures, local issues)
5. Overall tone and presentation style

Political Spectrum Labels (choose ONE):
- Left-biased: Strong progressive/left-wing perspective
- Lean left: Generally left-leaning with some balance
- Balanced / Neutral: Objective, fact-based reporting from multiple perspectives
- Lean right: Generally right-leaning with some balance
- Right-biased: Strong conservative/right-wing perspective
- Populist / Sensational: Emotionally charged, sensationalist (transcends left-right)
- State-influenced: Government-owned or heavily influenced by state actors
- Satire / Parody: Humor-based, not intended as serious news
- Unknown / Insufficient evidence: Cannot determine from available samples

Analizo nameravam občasno ponoviti, ker sklepam, da bodo nekateri mediji bolj "odločni" v časi volitev. 😎