Gå til innhold

Solvik-Olsen vil ha økt datafrislipp: – Offentlige data tilhører alle (Ekstra)


Gjest Marius B. Jørgenrud

Anbefalte innlegg

Videoannonse
Annonse

Så utrolig bra!

-Har fått BaneNor til å utlevere alle avganger/ankomster siste 5år med forsinkelser.
-Også nylig fått Ruter til å utlevere anonymiserte data over alle kundehenvendelser siste 5år (kategori, når, hvilken rute, svar tider, antall refusjoner grunnet forsinkelse..)

Er i prosessen med å få BaneNor til å levere ut:
-Data fra de manuelle tellingene. Som eksempel teller kondoktøren antall passasjerer to ganger hver vei for toget mellom Drammen og Lillehammer, for så å legge det inn i systemet. Kondoktører jeg har snakket med har sagt at de gjerne kan ta en eksport for meg, men ønsker at det skal komme fra BaneNor selv for alle strekninger de har slike data.
-Forsinkelseskoder ved forsinkelser. Ved alle forsinkelser på 3min eller mer oppgir kondoktøren en årsakskode for forsinkelsen, dette ønsker ikke dataeier i BaneNor å dele. Selv om kondoktørene jeg har snakket med sier at dette fritt kan deles, og det er tross alt de som har generert dataene.

Ruter:
-Fått utlevert anonymiserte data fra ticketsystemet. Holder på med QA. Virker som det er hull i deler av datasettet, om de ikke bruker samme kodene internt på tross av hva kunden har tagget meldingen med. Noe som virker merkelig, så taler mer for at de ikke har utlevert alt.
-I prosessen med å prøve å få ut samme reiseinformasjon som for BaneNor. De argumenterer med at det er så store datamengder (opp til 2TB). Etter mine utregninger er det nærmere 2GB hvis det er ukomprimert. I en "dom" fra Fylkesmannen er det også lagt til grunn at det kun er tiden brukt til å utarbeide spørringer og manuelt arbeid som iberegnes, ikke hvor lenge en eksport står og jobber. Jeg kan godt skrive SQLen selv så lenge jeg får databaseskjema, noe som også er offentlig informasjon. Så da er det ikke noen argumentasjon som holder.
-Prøver også for ruter å få ut telledata, men der har jeg ikke fått noen god begrunnelse på hvorfor jeg ikke får det. De gjør både manuelle tellinger, sjåførene teller og de har automatiske tellere over dørene på alle busser+trikker (ikke beste nøyaktigheten).

Det fine er at EØS-avtalen er veldig tydelig på at det offentlige ikke har lov til å konkurrere mot det private. Så det er en sak for ESA-domstolen om BaneNor og Ruter ikke ønsker å utlevere reiseinformasjon, ettersom det eneste de ev. kunne lent seg på er at det er konkurransesensitivt.

Uansett bra jobbet Solvik-Olsen. Jeg tror og håper det kan komme mye bra ut av dette for norsk industri.
(Jeg vil slippe dataene jeg har fått tak i på GitHub så fort jeg har fått gjort datavask, sammenstilt alt og skrevet noen enkle guider som forklarer innholdet i filene).

 

Glemte hvor klønete GitHub er for store filer. Ser ingen grunn til å vente med å slippe dataene, så her er de som link til Dropbox:

https://www.dropbox.com/sh/703zazuion5s2xm/AACV9818Pw563RGUjHpaiEMxa?dl=0

Endret av morten7
  • Liker 4
Lenke til kommentar

Dette er jo ting som Hans Rosling var en forkjemper for i den tiden han levde, da i forhold til data fra FN, WHO og masse andre kilder. De startet jo opp Gapminder.com for å samle slik data og visualisere det i form av grafer og animasjoner.

 

Altfor mye data ligger gjemt i individuelle databaser, utilgjengelige for offentligheten eller låst bak betalingsløsninger og passordbeskyttet.

  • Liker 1
Lenke til kommentar

Hva med kartverket? De er jo finansiert over statsbudsjettet, men han slåss med nebb og klør i all år mot å slippe dataene sine

Det meste av rasterdata kan lastes ned via GeoNorge.no

For det som er gjort av LIDAR kan lastes ned fra hoydedata.no ved å trykke på fliken til venstre i bildet hvor det står Nedlasting. Synes nå Kartverket har vært ganske flinke til å dele, selv om man må vite litt hvor man skal lete.

Endret av morten7
Lenke til kommentar

Så utrolig bra!

 

-Har fått BaneNor til å utlevere alle avganger/ankomster siste 5år med forsinkelser.

-Også nylig fått Ruter til å utlevere anonymiserte data over alle kundehenvendelser siste 5år (kategori, når, hvilken rute, svar tider, antall refusjoner grunnet forsinkelse..)

 

Er i prosessen med å få BaneNor til å levere ut:

-Data fra de manuelle tellingene. Som eksempel teller kondoktøren antall passasjerer to ganger hver vei for toget mellom Drammen og Lillehammer, for så å legge det inn i systemet. Kondoktører jeg har snakket med har sagt at de gjerne kan ta en eksport for meg, men ønsker at det skal komme fra BaneNor selv for alle strekninger de har slike data.

-Forsinkelseskoder ved forsinkelser. Ved alle forsinkelser på 3min eller mer oppgir kondoktøren en årsakskode for forsinkelsen, dette ønsker ikke dataeier i BaneNor å dele. Selv om kondoktørene jeg har snakket med sier at dette fritt kan deles, og det er tross alt de som har generert dataene.

 

Ruter:

-Fått utlevert anonymiserte data fra ticketsystemet. Holder på med QA. Virker som det er hull i deler av datasettet, om de ikke bruker samme kodene internt på tross av hva kunden har tagget meldingen med. Noe som virker merkelig, så taler mer for at de ikke har utlevert alt.

-I prosessen med å prøve å få ut samme reiseinformasjon som for BaneNor. De argumenterer med at det er så store datamengder (opp til 2TB). Etter mine utregninger er det nærmere 2GB hvis det er ukomprimert. I en "dom" fra Fylkesmannen er det også lagt til grunn at det kun er tiden brukt til å utarbeide spørringer og manuelt arbeid som iberegnes, ikke hvor lenge en eksport står og jobber. Jeg kan godt skrive SQLen selv så lenge jeg får databaseskjema, noe som også er offentlig informasjon. Så da er det ikke noen argumentasjon som holder.

-Prøver også for ruter å få ut telledata, men der har jeg ikke fått noen god begrunnelse på hvorfor jeg ikke får det. De gjør både manuelle tellinger, sjåførene teller og de har automatiske tellere over dørene på alle busser+trikker (ikke beste nøyaktigheten).

 

Det fine er at EØS-avtalen er veldig tydelig på at det offentlige ikke har lov til å konkurrere mot det private. Så det er en sak for ESA-domstolen om BaneNor og Ruter ikke ønsker å utlevere reiseinformasjon, ettersom det eneste de ev. kunne lent seg på er at det er konkurransesensitivt.

 

Uansett bra jobbet Solvik-Olsen. Jeg tror og håper det kan komme mye bra ut av dette for norsk industri.

(Jeg vil slippe dataene jeg har fått tak i på GitHub så fort jeg har fått gjort datavask, sammenstilt alt og skrevet noen enkle guider som forklarer innholdet i filene).

 

Glemte hvor klønete GitHub er for store filer. Ser ingen grunn til å vente med å slippe dataene, så her er de som link til Dropbox:

https://www.dropbox.com/sh/703zazuion5s2xm/AACV9818Pw563RGUjHpaiEMxa?dl=0

 

For min del kunne jeg godt tenke meg at bussbillettene gikk drift av nettopp kollektivsystemet der en bor og ikke diverse innsynsbegjæringer. Men forstår jo at man i et demokrati må en leve med at mennesker tenker forskjellig.

Lenke til kommentar

For min del kunne jeg godt tenke meg at bussbillettene gikk drift av nettopp kollektivsystemet der en bor og ikke diverse innsynsbegjæringer. Men forstår jo at man i et demokrati må en leve med at mennesker tenker forskjellig.

Data som kan brukes til å optimalisere kjøp/salg i butikker, fordeling av passasjerer på en bedre måte, hvor man skal plassere butikker, bedre tilbakemeldinger til selskapene som selger tjenestene til Ruter (reiser de før tiden, venter de på forsinket tog etter avtale)..

Dette er snakk om SQLer det tar 30min til 2timer å skrive en gang. Skal godt gjøres at man bruker mer enn 10timer totalt på 5år med et par slike eksporter.

 

Vil si at verdien er mange mange ganger hva som legges ned i innsynsbegjæringene.

Håper og tror at pengene tilbake til kommunene/fylkene (Ruter eies av Akershus og Oslo) langt overstiger hva det koster å generere.

 

Så vil tørre å påstå at det er et positivt regnskap for spesielt innsyn i data av denne typen.

Som sagt kan jeg godt bistå med å lage SQLene om de mener det tar for mye tid, så har du/de ingen god forklaring på hvorfor det ikke skal gjøres.

 

--

For den som virkelig bryr seg om hva som skjer i samfunnet, ta en titt (fort mange timer) på Veilederen til Samfunnsøkonomisk analyse, eller les deg opp på MSG6 som SSB benytter (med tillegg) for å beregne samfunnsøkonomisk nytte. Spesielt MSG6 inneholder mange formler som heller mot spennende lesing for den tekniske. Eksempel på bruk av MSG6.

Er dette som i stor grad driver hva som får tommel opp/ned av tiltak i samfunnet. Skulle ønske at flere (sivil)ingeniører leste seg opp på området.

Endret av morten7
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...