Tabeller till Norge
Hej
Jag sitter på Norsk Reiseinformasjon i Oslo, vi gör exakt samma saker som ni, fast för Norge. Jag försöker använda mig av sweden.zip för att importera de tidtabeller som passerar gränsen mellan Norge och Sverige. Har dock inte lyckats lista ut vilket route_id jag ska importera.
Främst behöver jag ID för tågen Oslo-Stockholm, Narvikståget och Trondheim-Sundsvall. Värmlandstrafikens tåg får jag via NSB men kan gärna få ett ID där också så jag kan jämföra data.
På bussfronten är det Swebus Oslo-Stockholm och Oslo-Göteborg-Köpenhamn, GoByBus Oslo-Göteborg-Köpenhamn och Västtrafiks linje 111 Halden-Strömstad.
Vi hade tidigare ett par bussar till Bodø, men dom verkar ha lagts ner. Lite osäker på om det är nåt annat som passerar gränsen än dom jag redan nämnt.
Flygtrafiken får vi från flygbolagen så den är inte aktuell här.
Hade varit behjälpligt om ni kunde ge mig en lista på vilka route_id jag behöver se på, eller peka mig till en översikt på vad som är vad.
Ser dessutom att ni har ganska kort giltighet på era data. Laddade hem förra veckan och det va bara giltigt till 14/6 (20140414,20140614) om jag har förstått calendar.txt riktigt. Är det alltid så kort giltighet?
mvh Johan
Hej Johan!
Ett sätt att få ut denna data är att köra lite grep-kommando.
Det är dock en ganska stor inlärningströskel om man inte är bekant med kommandorader, men kopiera och klistra in borde fungera.
Här är kommando som kan köras på linux, eller i Cygwin som går att installera på Windows-datorer. (Troligen går det även att få kommandona att lira på Mac) Kommandot är testat Cygwin.
Följande kommando ger dig listan med alla route_id som trafikerar norska hållplatser:
egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt | awk -F, '{print ""$1""}' | sort | uniq
Kör jag kommandot i en mapp med sweden.zip från 2014-04-22 uppackad får jag följande route_id:
269_91_BLT_273
279_4111_BLT_262
315_70_J_314
315_J_314
327_BXBN
328_BXBN
690_820_BXBN
690_888_BXBN
694_JRE_74
74_BIC
74_J
74_JIC
74_JICN
74_JNT
74_JRE
76_J_74
Lite förklaringar till kommandot (Dessa kommando kan köras separat):
Plocka ut en lista med alla rader på norska hållplatser i stops.txt. (Regexpen ^76[^,]+ matchar norska som börjar på 76)
egrep "^76[^,]+" -o stops.txt
Resultat:
7601214
7601215
7601213
7601210
...osv
Skapa en lista med regexp för att använda i stop_times.txt utifrån urvalet av hållplatser.
egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}'
Resultat:
^[^,]+,[^,]+,[^,]+,7601214,
^[^,]+,[^,]+,[^,]+,7601215,
^[^,]+,[^,]+,[^,]+,7601213,
^[^,]+,[^,]+,[^,]+,7601210,
...osv
Ger oss listan med alla stop_times på norska hållplatser.
egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt
Resultat:
53223931,12:40:00,12:40:00,7602402,1,,,,
53223931,13:08:00,13:08:00,7602405,2,,,1,
53223931,13:22:00,13:22:00,7602406,3,,,1,
53223932,37:39:00,37:40:00,7602405,25,,,,
...osv
Ger oss regexp av förra resultat som kan användas på trips.txt
egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}'
Resultat:
^[^,]+,[^,]+,53223931,
^[^,]+,[^,]+,53223931,
^[^,]+,[^,]+,53223931,
^[^,]+,[^,]+,53223932,
Plocka ut de unika resultaten.
egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq
Resultat:
^[^,]+,[^,]+,53223931,
^[^,]+,[^,]+,53223932,
^[^,]+,[^,]+,53628031,
^[^,]+,[^,]+,53628034,
^[^,]+,[^,]+,53628480,
^[^,]+,[^,]+,53628481,
^[^,]+,[^,]+,53632487,
^[^,]+,[^,]+,53632497,
^[^,]+,[^,]+,53632516,
^[^,]+,[^,]+,53633234,
Ger oss alla rader i trips.txt som har stop_times på norska hållplatser.
egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt
Resultat:
74_J,4,53223931,Luleå Centralstation,93,,,
74_JICN,5,53223932,Narvik stn,94,,,
74_J,5,62483281,Narvik stn,94,,,
74_JICN,4,53628031,Stockholm Centralstation,93,,,
...osv
Plocka bara ut route_id.
egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt | awk -F, '{print ""$1""}'
Resultat:
74_J
74_JICN
74_J
74_JICN
...osv
Slutligen ge oss bara unika sorterade resultat med "sort | uniq":
egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt | awk -F, '{print ""$1""}' | sort | uniq
Resultat:
269_91_BLT_273
279_4111_BLT_262
315_70_J_314
315_J_314
327_BXBN
328_BXBN
690_820_BXBN
690_888_BXBN
694_JRE_74
74_BIC
74_J
74_JIC
74_JICN
74_JNT
74_JRE
76_J_74
/ Lars Löfquist
Angående giltighetstiden så kommer det ut en ny version i slutet av denna vecka, eller början på nästa som gäller över sommaren.
/ Lars Löfquist
Och på filen som släpptes idag (2014-05-02) finns det en buss-linje till. Här är hela listan:
269_91_BLT_273
279_4111_BLT_262
315_70_J_314
315_J_314
327_BXBN
328_BXBN
690_820_BXBN
690_822_BXBN
690_888_BXBN
694_JRE_74
74_BIC
74_J
74_JIC
74_JICN
74_JNT
74_JRE
76_J_74
/Lars Löfquist
Vi håller på och testar import av tabellerna. Än så länge ligger problemen i vår ände, men vi återkommer om vi har några frågor på ert innehåll. Tack för uppdateringen om nya tabellen.
Hej igen.
Varför använder ni inte direction_id?
Hej!
Det används inte för att vi inte har den informationen på det sättet i vårt data.
/Martin