Driftstörning SL API
Hej,
Från runt 18 idag har responstiden ökat hos SLs API för Platssök, Realtidsinformation, Trafikläge, Störningsinformation och Reseplaneraren.
Stundvis går dessa tjänster inte heller att nå och ger meddelandet "The service is unavailable.".
Detta kan även ses på Trafiklabs status sida här, http://status.trafiklab.se/
Följ inlägget
0
följare
Hej Johan,
Vi har som mål att om möjlig informera om Driftsstörningar i förväg. SL har inte rapporterat in att deras system har haft planerat underhåll.
I kväll mellan 18-24:00 kan det förekomma temporära problem med Resrobots gamla APIer som följd av Serverflytt hos Samtrafiken.
Med vänlig hälsning, Åke
Hej Johan,
Det pågår undersökning om varför det var problem i SL:s API-portal i fredags kväll. Återkommer när jag vet mer.
/Sabina
Hej, det har varit / är en del störningar ikväll igen (2016-01-11), från 21.00 har det varit svårt att nå tjänsterna.
Tjänsterna kom tillbaka runt 02.30 igen.
Jag är nyfiken på hur hanteringen av störningar som den här hanteras och vilken prio de har. När detta händer är det ofta flera användare som hör av sig och man har lite eller ingen information att kunna återkoppla med.
Tack!
Hej Johan,
När det gäller själva störningen så SL förklara orsaken.
Tyvärr, finns det inga möjligheter att hantera störningar som sker utanför kontorstid.
Samtrafiken och SL får Pingdom meddelanden om APIerna går ner och igår såg jag att SL's APIer gick upp och ner under två-tre timmar. Man kan se detta på APIernas Driftstatussida.
Först, nästa morgon (idag) med hög prioritet hanteras problemen om dom inte löst under natten. Problem, som sträcker sig under en längre tid brukar oftast ligga ute hos våra respektive leverantörer, så dom kan vara extra svåra att lösa.
Vi skulle vilja erbjuda 24/7 support av APIerna men det är tyvärr inte möjligt.
Med vänlig hälsning, Åke
Hej Johan,
SL:s övervakning av systemen hos driftleverantören har tyvärr inte fångat upp driftstörningarna för API:erna. Efter förfrågan har jag fått reda på att det förekommit anmärkningsvärt långa svarstider under kvällen, men mer än så vet jag inte ännu.
Eftersom det inte är några pågående störningar hanteras ärendet inte akut, men orsaken kommer självklart att utredas och hanteras så snart som möjligt under veckan.
/Sabina
Tjänsterna var nere större delen av tiden, mina larm mot API:et för reseplaneraren har en loggad nertid på runt tre timmar. Det är så klart en tolkningsfråga om när det räknas som en driftstörning/nere eller ej, själv klipper jag anrop mot tredje-part som tar längre än 15s, tar de längre tid så tolkar jag tjänsten som "nere" för det anropet.
Testade ett par olika appar till och från under denna period och ingen fungerade. Däremot fungerade er (SLs) webbsida felfritt samtidigt.
Bifogat finns en graf från min övervakning för API:et mot reseplaneraren.
Bifogad fil:
Använder sl:s webbplats ett annat API än apparna? I så fall kan man inte göra en fall back i appen för att lösa detta?
Skulle vara intressant att ta del av detta.
Hej igen,
det förekom nya störningar igår igen. Responstiderna ökade på liknande sätt som kvällen innan runt 19-20 tiden och resulterade i viss nertid. Vilket kan ses i både min och Trafiklabs egna statussida.
Hej Johan,
Vi kommer att prioritera en lösning på detta problem.
Vi återkommer med ytterligare information.
Mvh
Erik
Vi noterade detta problem för en stund sedan och det är temporärt åtgärdat.
Mvh
Erik
Jag följde det igår och min känsla då var att det började med att det tog längre tid att hämta de mellanliggande hållplatserna `api2/TravelplannerV2/journeydetail`. Men det kanske bara var en tillfällighet.
Vad är skillnaden mellan de API jag använder och de som t.ex SLs webbsida använder. I presentationer på Trafiklabs träffar har det sagts att även SL använder samma API. Hur kan det då vara att SL själva inte drabbas av dessa störningar?
Hej igen, tänkte kolla om det finns någon uppdaterad status inför helgen.
Störningarna igår kväll var inte lika omfattande som de tidigare kvällarna, men de följer samma mönster med responstider som ökar vid ungefär samma tidpunkt.
Hej Johan,
Vi kommer att hålla koll på detta under helgen.
Vi är färdiga med vår felsökning och vi har en plan för åtgärd,
men datumet för åtgärden är inte fastställt ännu.
Återkommer med mer information.
Mvh
Erik
Toppen, tack!
När man hittat problemet så löser man väl det på en gång istället för att skjuta upp det så som ni beskriver i texten ovanför? Väldigt oseriöst att endast söka problemet och sedan ha det i något mellanting innan man gör något åt det. Som erfarenhet är det väldigt lätt att tappa det man hittat om man sätter en tid då problemet ska påbörjas för lösning.
Hej Mattias,
När vi har analyserat problemet så tar vi fram en lösning. När ändringen, eller ”patchen” är färdig så ska den testas. Efter att ändringen är färdigtestad så kommer vi att schemalägga en produktionssättning så snart som möjligt. Ibland går denna process snabbt, när det är enkla problem och ibland drar det ut på tiden. I det senare fallet brukar vi försöka ta fram en temporär lösning för att underlätta för er under tiden.
Mvh
Erik
Finns det en plan för när detta kan tänkas vara åtgärdat? Den temporära lösning verkar fungera till viss del men det förekommer fortfarande störningar.
Skulle vara toppen att få lite återkoppling så att vi kan planera därefter med.
Tack!
Status på detta?
Hej,
Vi har genomfört lite aktiviteter idag och kommer att undersöka om de har inverkat positivt på detta problem. Vi fortsätter samtidigt med de andra förbättringsförslagen för åtgärd av detta problem.
Mvh
Erik
Hur fungerar det på er sida? Problemet artar sig inte i samma utsträckning som tidigare, men jag ser fortfarande en ökning av responstiderna kvällstid som ibland ger timeouts mot era tjänster. Ökningen av responstiderna verkar följa ett mönster varje kväll.
Hej Johan,
Problemet kvarstår vad vi kan se trots den ändringen som vi genomförde förra veckan även om det kanske kan vara i något mindre omfattning.
Vi har tagit fram ny lösning som kommer att testas denna vecka. Denna ändring behöver bl a lasttestas för att säkerställa prestandan innan det kan releasas.'
Mvh
Erik
Tack för uppdatering. Säg till om ni behöver något mer bara.
Upplever att det har blivit betydligt värre de senaste dagarna. Är det något ni ser på er sida med? Bifogat är en dump från övervakning för Reseplaneraren.
Bifogad fil:
Detta är periodvis sämre, och vi får meddelanden från vår övervakning när det uppstår.
Vi håller på att testa en uppdatering som ska lösa detta problem.
Mvh
Erik
Har igår och idag också upplevt ovan beskrivna problem, främst i SL Reseplanerare 2, men även i platsuppslag. Stundals långa responstider, ibland 503 Service Unavailable. Mellan problemen går allt snabbt som vanligt.
Jag ser samma sak här med, det känns som att det har gått åt rätt håll. Men mönstret är liknande som innan att responstiderna ökar kraftigt mot eftermiddag / kväll.