FAQ
Pogosta vprašanja in odgovori
Moj mali eksperiment. Z njim opazujem gibanje zanimanja v slovenskem (spletnem) medijskem prostoru. Ko dobim novo idejo, spremenim algoritme in prikaz. Včasih je sprememba dobra, včasih ne ... Je odprt za vse, ki vas zanima kaj je trenutno popularno pri nas oziroma kaj se Slovencem zdi pomembno nek dan.
Prikazujejo se objave, ki so mlajše od 2 dni, tako da je vsebina vedno sveža.
Gre za delovno ime. Ni nujno, da ostane. Enkrat mi je padlo na pamet in iz njega sem razvil ta servis. Zamislil sem si vrtni šlauf iz katerega tečejo novice. Včasih hitreje, učasih počasneje ... Ja, sanjaril sem o vročem poletju. Upam, da mi ne zamerite. :)
Update: Ostalo je 10+ let. 😅 Nič ni bolj večnega, kot začasne odločitve. Zato sem na vrh dodal naziv "Novice tu in zdaj", da se nekaj premakne. 😎
Bolj srečen emoji pomeni bolj pozitivno novico, žalosten/jezen pa negativno. Za analizo uporabljam najmanjši možni AI model, ki še razume slovenski jezik. Številke so torej relativne in ne absolutne (ker vsak model to po svoje vrne). Primarno me je zanimalo razmerje negativnih in pozitivnih novic. Pa filtre sem hotel imet.
Spisek
Pozitivni: 😍 😁 😊 🙂
Negativni: 😡 😠 😒 🙁
Številka pomeni hibridno popularnost. Ni več samo social API. Vzamem FB odzive, svežino objave in ali več medijev piše o isti temi, nato dodam še lokalne signale iz te strani: klike, prikaze, CTR in hitrost klikov v zadnjih urah.
Praktično: 1 lokalni klik šteje približno kot 10 FB všečkov, zato lahko tudi obiskovalci strani premikate vrstni red. 🔥
Pomeni "trenutno najbolj vroče" med novicami zadnjih 2 dni. Algoritem ne gleda samo skupnega seštevka, ampak tudi tempo (kaj je pravkar začelo močno rasti).
So po vrsti, samo po "obteženem" vrstnem redu. Objave so objavljene po algoritmu, ki upošteva število glasov in svežino objave.
Za oboje uporabljam AI modele. Tiste najbolj poceni, ki znajo to ugotoviti. Sentiment je relativno enostavna zadeva za LLM, zato uporabljam brezplačne klice na Google Gemma, novinarski pristop pa zahteva malo več znanja - zanj uporabljam gpt-5-nano. Testiral sem še druge, ki so dali tudi boljše rezultate, ampak ta kombinacija je najbolj poceni.
Javno dostopni kanali medijev. Trenutno berem okoli 300 različnih slovenskih medijev različnih velikosti. Če se ti zdi, da sem katerega pomembnega pozabil, mi pošlji povezavo. Maila tukaj ne bom objavil, ker spam, ampak dobiš me na vseh socialnih omrežjih kot McLion.
Trenutni spisek novic:
- 1001ideja.si
- 1ka.arnes.si
- 24kul.si
- 24ur.com
- 365.rtvslo.si
- abczdravja.si
- aeromanija.com
- airbeletrina.si
- akos-rs.si
- aktivni.metropolitan.si
- amzs.si
- anamonro.si
- andraz-tersek.si
- api.follow.it
- astronomska-revija-spika.si
- avp-rs.si
- avto-fokus.si
- avto-magazin.metropolitan.si
- avto-sport.net
- avto.info
- avtofotomarket.si
- avtomanija.com
- avtomobilizem.com
- ba.bloombergadria.com
- babybook.si
- bambino.si
- beautyfullblog.si
- bibaleze.si
- bicikel.com
- bilibili.com
- bivanje.si
- blagovest.si
- blog.uporabnastran.si
- blogs.windows.com
- bloomberg.com
- bodieko.si
- bogastvozdravja.si
- bojanambrozic.com
- booknjiga.com
- bunker.si
- caranduser.com
- casoris.si
- caszaizlet.si
- caszazemljo.si
- cekin.si
- celje.info
- celjskiglasnik.si
- cestni-dirkac.com
- citymagazine.si
- cosmopolitan.metropolitan.si
- cukrarna.art
- data.si
- delo.si
- demokracija.si
- demokrati.si
- destrnik.si
- diz.si
- dnevne-novice.com
- dnevnik.si
- dogodki.vlada.si
- dolenjskilist.svet24.si
- dominvrt.si
- domovina.je
- domzale.si
- domzalec.si
- domzalske-novice.si
- donosno.si
- dpor.si
- drama.si
- drjamtravels.blog
- drobnica.si
- drugisvet.com
- drustvo-dsp.si
- drustvo1oktober.si
- druzina.si
- dsr.si
- duhovnost.eu
- dz-rs.si
- e-koroska.si
- e-maribor.si
- e-vozila.si
- edavki.durs.si
- ekipa.svet24.si
- ekodezela.si
- ekopercapodistria.si
- ekosklad.si
- elle.metropolitan.si
- emorje.com
- enavtika.si
- eposavje.com
- erast.si
- etno-muzej.si
- evrovizija.com
- f1.avtomanija.com
- facebook.com
- falajfl.si
- fashion.si
- finance.si
- fokuspokus.si
- forbes.n1info.si
- fu.gov.si
- gasilec.net
- germsek.com
- gezagrabar.kmeckiglas.com
- gibanjesvoboda.si
- glitter.si
- gmj.si
- go-portal.si
- gore-ljudje.net
- gorenjski-utrip.si
- gov.si
- govorise.metropolitan.si
- gradbenik.net
- gradnjainobnova.si
- grazia.si
- grosuplje.si
- gsmarena.com
- h2oteam.com
- hac.si
- had.si
- hausbau.si
- hermioninblog.blogspot.com
- hokej.si
- hop.si
- hr.bloombergadria.com
- hribi.net
- hudo.com
- igorzabel.org
- info360.si
- informer.si
- instore.si
- inz.si
- irenajoveva.si
- iskraonline.eu
- iskreni.net
- istra-nasa.si
- izgubljenavvesolju.si
- izola.si
- izvozniki.finance.si
- jzs.si
- kamzmulcem.si
- kaplan-marko.blogspot.com
- katoliska-cerkev.si
- kavarnahayek.wordpress.com
- kgzs.si
- kinodvor.org
- kinoloska.si
- kinosiska.si
- kinoteka.si
- klikaj.si
- kmeckiglas.com
- konj-zveza.org
- korociv.si
- koroskenovice.si
- kosarka.info
- kozjansko.info
- kpk-rs.si
- kraljiulice.org
- kreativnirazred.blogspot.com
- kulinarika.net
- kulturnimarksizem.si
- kzs.si
- lahkihnog-naokrog.si
- las-ok.si
- levica.si
- libertarec.blogspot.com
- live.finance.si
- ljse.si
- ljubljanainfo.com
- lokalec.si
- lokalne-ajdovscina.si
- lokalno.svet24.si
- loski-muzej.si
- lovska-zveza.si
- lzs-zveza.si
- m.planet-lepote.com
- mao.si
- maribor24.si
- mariborinfo.com
- marketingmagazin.si
- matjazcorel.com
- mbreport.si
- med.over.net
- mediaspeed.net
- medover.zurnal24.si
- megafon.si
- megasvet.si
- meteoinfo.si
- metinalista.si
- metropolitan.si
- mgml.si
- mi-press.eu
- mikstone.com
- mk.bloombergadria.com
- mklj.si
- mlad.si
- mladina.si
- mladipodjetnik.si
- mmjevnikar.kmeckiglas.com
- mobile.si
- moderna-zenska.si
- moja-dolenjska.si
- mojaobcina.si
- mojepodravje.si
- mojeposavje.si
- mojezdravje.net
- mojpes.com
- mojprihranek.si
- monitor.si
- morel.si
- moski.hudo.com
- moskisvet.com
- motogp.avtomanija.com
- motovila.si
- mucek.si
- music24.si
- muzej-kamnik-on.net
- muzikobala.com
- mzt.org
- n1info.si
- nadlani.si
- nadskofija-ljubljana.si
- naklo.si
- napoved-vremena.si
- nas-stik.si
- nasaprimorska.si
- nascas.svet24.si
- navdihni.me
- necenzurirano.si
- nepremagljiva.si
- nijz.si
- njena.svet24.si
- nkolimpija.si
- nms.si
- nogomania.com
- nosecka.net
- nostalgija.si
- notranjska.si
- nova24tv.si
- novamedicina.org
- novice.at
- novice.si
- novice.sio.si
- noviceznotranjske.net
- novinar.com
- novitednik.svet24.si
- obalaplus.si
- obcina-ankaran.si
- obcina-ig.si
- obramba.com
- obzornik.zbornica-zveza.si
- odprtakuhinja.delo.si
- odv-zb.si
- okusno.je
- onaplus.delo.si
- opazovalec.si
- outsider.si
- ovinu.si
- ozs.si
- paradaplesa.si
- parkvojaskezgodovine.si
- penzionist.info
- piran.si
- piratskastranka.si
- planet-lepote.com
- planet-tv.si
- planetnogomet.si
- plusportal.si
- podcrto.si
- podjetnaslovenija.si
- podjetniskisklad.si
- pokmuz-ce.si
- pokukaj.si
- politikis.si
- pomurske-novice.si
- portal-os.si
- posavskiobzornik.si
- potepanja.com
- potnik.si
- potniski.sz.si
- povsodjelepo.com
- pozareport.si
- preberite.si
- predsednica-slo.si
- prehrana.si
- preiskovalno.si
- prijavim.se
- primorski.eu
- probauhaus.com
- prva.si
- ptujinfo.com
- publishwall.si
- racunalniske-novice.com
- racunovodja.com
- radio.ognjisce.si
- radio1.svet24.si
- radiomars.si
- radioptuj.svet24.si
- radiostudent.si
- radioterminal.live
- radiotomi.si
- rally.avtomanija.com
- regionalno.si
- regionalobala.si
- renton.si
- reporter.si
- revija-vino.si
- revija.ognjisce.si
- revijalz.si
- revijastop.si
- revijazamojezdravje.si
- ringaraja.net
- robin.si
- rocker.si
- rockline.si
- rokomet.net
- rs.bloombergadria.com
- rts24.si
- rtvslo.si
- sasa-novice.si
- sensa.metropolitan.si
- seonet.ljse.si
- si.bloombergadria.com
- si21-com.dev.heim-01.bananadmin.com
- si21.com
- sigic.si
- simic-partnerji.si
- sindikat-novinarjev.si
- siol.net
- skandal24.si
- skofjaloka.si
- skupnostobcin.si
- slo-tech.com
- slosolar.si
- slovenci-zagreb.hr
- slovenec.org
- sloveniatimes.com
- slovenskavojska.si
- slovenskenovice.delo.si
- slovenskenovice.si
- snportal.si
- sobotainfo.com
- socialnidemokrati.si
- spletnicasopis.eu
- spodnjepodravje.si
- sport-tv.si
- sportklub.n1info.si
- sportni-portal.si
- sta.si
- stat.si
- strogo-zaupno.si
- student.si
- studentska-org.si
- svet-el.si
- svet24.si
- svetavladar.si
- tacka.zurnal24.si
- tednik.svet24.si
- tehnozvezdje.si
- telefoncek.si
- telegraf.si
- teniskisvet.si
- tevztavcar.kmeckiglas.com
- the-slovenia.com
- theguardian.com
- tms.si
- tocnoto.si
- top24novice.si
- trgovina.vecer.com
- triglavmedia.si
- trziski-muzej.si
- turisticna-zveza.si
- turisticni-novinarji.si
- tv-m.si
- umanotera.org
- upokojenci.com
- utrip-ljubljane.si
- vandraj.si
- vaticannews.va
- vecer.com
- vestnik.svet24.si
- vezjak.com
- vibe247.net
- videosvet.si
- viralko.si
- visitkras.info
- visitpohorje.si
- vitafit.si
- viva.bhc.si
- vizita.si
- vlastakunej.kmeckiglas.com
- vmax.si
- volksgruppen.orf.at
- vsezamojdan.si
- vw-revija.si
- zadovoljna.si
- zanima.me
- zasrce.si
- zastarse.si
- zaupokojence.si
- zav-zdruzenje.si
- zbs-giz.si
- zdis.si
- zdravo.si
- zdruzenje-frank.si
- zdruzenje-manager.si
- zelenaslovenija.si
- zgodovina.si
- zifs.si
- zivljenje55plus.si
- zon.si
- zps.si
- zsis.si
- zspm.si
- zsss.si
- zurnal24.si
- zvitorep.si
- zvkds.si
Ker je tam moj dom in so mi takšne informacije pomembne. :)
Algoritem, ki ugotavlja "lokalnost" je dokaj neumen. V besedilu išče besede povezane z Obalo in imeni, ki se pogosto pojavljajo pri nas. Pogosto to povzroči "false positives". Zadeva ne uporablja niti algoritma, ki ga koristim za ugotavljanje podobnosti objav, tako neumno je. Je pa dovolj za pokrivanje moje radovednosti, vsaj kar se domačih krajev tiče.
Gre za dokaj pameten algoritem, če jemljemo slovar kot nekaj zelo inteligentnega. Uporabil sem javno dostopen slovar osnovnih oblik besed (korpus, leme), ki ga dobite s kopanjem skozi povezave na slovenscina.eu in na Projektu JOS. Moj slovar je sicer malo predelan in vanj je dodanih nekaj besed oz. imen, ki se pogosto pojavljajo v slovenskih medijih.
S pomočjo slovarja dobim spisek besed v imenovalniku, ki se pojavijo v naslovu in uvodniku. Zatem z algoritmom za ugotavljanje "bližine besedil" dobim ven neko številko in če je nad nekim minimumom, ki je ročno postavljen, povežem dokumenta kot podobna.
Tako početje ima sicer en stranski učinek. Hitro izpostavi vsebino, ki jo mediji enostavno skopirajo iz STA in podobnih virov.
Ne, ta algoritem ni tako dober, kot tisti od Najdi.si ali Googla. Nimam iskalnika v ozadju in velike baze znanja, da bi se lahko sistem samostojno učil.
Nimam nekih posebnih planov. Gre za moj peskovnik, kjer implementiram ideje, ki mi pridejo na pamet ob tistih trenutkih, ko me internet ne moti ... v podrobnosti se tukaj ne bom spuščal, ker je verjetno že vsem jasno. :)
Če imate kakšno idejo kako bi te algoritme ali aplikacijo uporabili na zanimiv način, dobite moje kontakte na Linkedinu.
Enkrat dnevno vzamem vse novice, jih razdelim na pozitivne/negativne in pošljem skozi LLM. Model vrne strukturiran povzetek po temah (z naslovi in kratkim blokom "V 20 sekundah"), na koncu pa še seznam ID-jev najbolj relevantnih novic. Te podatke zapišem v bazo in povežem z originalnimi članki.
Povzetek je narejen za hitro branje: najprej kratek pregled, potem pa po želji odpreš več podrobnosti.
Vse teme pokaže vse sklope.
Samo lokalno pokaže samo sklope z lokalno tematiko.
Brez športa skrije športne sklope.
Več pozitivnih skrije celoten negativni stolpec, da ostane samo pozitivni povzetek.
Gumb uporabi brskalnikov speech synthesis in poskuša uporabiti slovenski glas (sl-*). Če slovenski glas ni nameščen, predvajanje ne steče.
Besedilo je pripravljeno po sklopih, zato so med temami pavze in je poslušanje bolj naravno.
Odločitev sem prepustil LLM. Pognal sem ga čez vse medije, ki jih spremljam. Naročil sem mu, da odpre vse razpoložljive novice (zadnjih 25 novic) in glede na vsebino se odloči za "political bias". Uporabil sem openai/gpt-5.2 z reasoning na "high".
Tole je bil prompt:
Based on these article samples, analyze the political bias of this news source. Consider: 1. Language patterns (emotional vs. neutral, loaded terms, framing) 2. Topic selection and emphasis 3. Source attribution and fact-checking practices 4. Slovenian political context (parties, figures, local issues) 5. Overall tone and presentation style Political Spectrum Labels (choose ONE): - Left-biased: Strong progressive/left-wing perspective - Lean left: Generally left-leaning with some balance - Balanced / Neutral: Objective, fact-based reporting from multiple perspectives - Lean right: Generally right-leaning with some balance - Right-biased: Strong conservative/right-wing perspective - Populist / Sensational: Emotionally charged, sensationalist (transcends left-right) - State-influenced: Government-owned or heavily influenced by state actors - Satire / Parody: Humor-based, not intended as serious news - Unknown / Insufficient evidence: Cannot determine from available samples
Analizo nameravam občasno ponoviti, ker sklepam, da bodo nekateri mediji bolj "odločni" v časi volitev. 😎