Ny statistikkside for Norsk Orientering gir mye spennende data!
Postet av Norges Orienteringsforbund den 16. Des 2024
13 år med Eventor gir mye å «grave i» for den interesserte!
Over og under: Skjermdump fra den nye statistikksiden.
På arrangementsdelen av kompetansehelgen ble det presentert mye spennende statistikk. Nå er grunnlaget tilgjengelig for alle på https://statistikk.orientering.no.
- Vi ønsket å få mer konkrete data på temaer hvor vi hadde litt tynt grunnlag basert bare på løpsrapportene. Derfor begynte vi å se på muligheten for å hente data rett ut fra Eventor.
Slik innleder Mathias Benjaminsen som har utviklet den nye statistikksiden.
- Etter en prat med Leif Størmer på Oslo City Cup i vår kom det frem en del hypoteser som vi ønsket å se nærmere på.
Etter en konseptutprøving for å se på hvilke data som fantes på Eventor med bruk av deres API fant Benjaminsen fort ut at det var mye nyttig informasjon som kunne hentes ut. I første omgang ble dataen lastet rett inn i et Excel-ark, men det viste seg fort at dette ikke var nok.
I sommerferien ble det bestemt å gå for en mer robust løsning og nå blir dataprosessering gjort i node.js før dataen blir lastet inn i en PostgreSQL database. I tillegg ble det laget visualisering for diverse uttrekk fra dataene.
- Leif har jo gått glipp av hele TV-høsten etter at de første grafene kom opp. Han har virkelig fordypet seg i tallene, humrer Benjaminsen.
- Det er mye spennende data å trekke ut fra 13 år med løp i Eventor. Blant annet årskull- og aldersklasse-statistikken synes jeg er veldig interessant.
Med 9 ulike grafer, 3 topplister, 4 nøkkeltall og kart med løpsoversikt er det mye å grave i for de som ønsker det. I skrivende stund passerte vi også antall starter fra i fjor.
- Vi har slitt litt med datakvaliteten. Skrivefeil i resultatlistene og løp uten resultatlister har gjort at vi ikke kan gå 100% god for statistikken. Spesielt unike løpere er preget av en del duplikater fra resultater med skrivefeil.
På tross av utfordringer med dataene påpeker Benjaminsen at tallene relativt sett er representative år for år og dermed kan gi gode data på større trender. Avslutningsvis har han en oppfordring til alle kodekyndige i o-norge.
- Kildekoden er åpen, så jeg vil oppfordre alle som har lyst til å bidra til å forbedre siden å ta en titt. Spesielt lastetidene på databasespørringene trenger en overhaling.
Kildekode på GitHub: https://github.com/mathiasbno/eventor-scraper
Kontakt Mathias Benjaminsen ved spørsmål: mabenjam@gmail.com
Lenke til statistikksiden: https://statistikk.orientering.no
Flere skjremdumper nedenfor:
--
Kommentarer
Logg inn for å skrive en kommentar.