Format GTFS Regional SL

https://opendata.samtrafiken.se/gtfs/sl/sl.zip?key=KEY

Hej, detta API är kommaseparerad för inläsning, 2 st stationer innehåller kommatecken inne i namnet, vilket gör att dessa rader inte kan läsas in korrekt och kan inte få ut koordinater med ett kommascript, finns kommatecken inne i namnet detta måste fixas.
"Folkets Hus, Ölstra" och "Huddinga Station, bussar"
Josefine Jonsson

Kommentarer

  • Hej Josefine,

    I dessa fall placeras citattecken omkring värdet i kolumnen för att kunna urskilja en kolumn som innehåller kommatecken från kommatecknen som används mellan kolumnerna:

    9021001015865000,"Folkets hus, Ölsta",59.403318,17.656728,1,,

    De flesta verktyg har redan stöd för detta då det är del av CSV-formatet, men skriver man ett eget script är det viktigt att man tar hänsyn till citattecken med. Citattecknen är inte del av värdet för kolumnen.

    Hälsningar,
    Bert
    Bert på Trafiklab
  • Jo, men då borde t.ex ";" används istället, är dålig praxis att ha kommatecken i komma separerad text.
    Josefine Jonsson
  • Hej Josefine,

    Detta är inte dåligt praxis utan en standard för CSV filformatet och även för GTFS-formatet, som denna filen är del av.

    Skulle man använda ; istället for man exakt samma problem fast med ett annat tecken. Därför behövs en lösning som klarar av att tecknet som används till separering av kolumner även får förekomma i innehållet.

    CSV formatet: https://en.wikipedia.org/wiki/Comma-separated_values#RFC_4180_and_MIME_standards , den fullständiga CSV standarden finns här: https://datatracker.ietf.org/doc/html/rfc4180 . Detta säkerställer att alla program kan tolka dessa filer på samma sätt. Det är på detta sätt filer har skapats sen 2005.



    Excel kan läsa in filen utan problem, eftersom både Excel och filen följer samma regler för filformat.

    Även GTFS specen följer samma praxis:

    Original field value: Contains "quotes", commas and text
    Field value in CSV file: "Contains ""quotes"", commas and text"
    https://gtfs.org/documentation/schedule/reference/#file-requirements
    Att det blir fel när ni läser in datat handlar alltså om ett fel i programmet ni använder, inte om ett fel i dataformatet eller datasettet.

    Hälsningar,
    Bert

    Bert på Trafiklab

Kommentera eller skriv ett nytt inlägg

Ditt namn och inlägg kan ses av alla. Din e-post visas aldrig publikt.