lørdag 22. oktober 2005

Klassifisering av webaviser

Burde det ikke være mulig å klassifisere artiklene i alle avisene med f eks All Purpose Machine Learning Toolkit slik at vi på forhånd fikk vite hva slags artikkel dette er.
Webavisen har allerede en klassifisering, men det burde komme bedre frem om dette er en god eller dårlig artikkel, og hvor godt overskriften stemmer med innholdet.

Jeg vil rett og slett ha en klassifisering av hver artikkel. Jeg bruker Popfile til å luke ut spam fra epost-kontoene mine, jeg var litt uforsiktig med adressene mine til å begynne med og var mye plaget av spam til jeg installerte og trente opp Popfile.

Dersom vi nå kombinerer en RSS-leser med et "Naive Bayes" filter eller et annet lignende filter, kunne vi fått artiklene klassifisert f eks slik:

  • Tendensiøs
  • Useriøs
  • osv

Det hadde vært greit i dagens informasjonsstorm.

Hvis ingen andre tar fatt i dette skal jeg nok få hacket noe sammen selv.

En annen ting, vi kunne få en totalkarakter på vg.no akkurat nå, deretter laget statistikk, se hvem som stiger, hvem som synker. Kort sagt, bli en innholdskritiker som er oppdatert i sanntid.

Ingen kommentarer:

Legg inn en kommentar