Matti Grönroos

Mikä on käyttökatko?

Palvelun käyttäjän ja palvelun tuottajan näkemys käyttökatkosta ja sen kestosta poikkeavat yleensä merkittävästi toisistaan.

Käyttökatkosta toipuminen on paljon muutakin kuin esimerkiksi palvelimen uudelleen käynnistäminen. Sehän tapahtuu sekunneissa tai minuuteissa, mutta käyttäjäkunta saattaa istua tumput suorina pitkäänkin, joskus jopa tunteja.

Käyttökatko ei myöskään ole aina yksikäsitteinen on-off-kysymys. Jos järjestelmän suorituskyky romahtaa, käyttäjät tosiasiallisesti jäävät ilman palveluita, vaikka arvoketjun jokainen komponentti olisi toiminnassa.

Melkoisen moni palvelusopimus historian saatossa on kiireessä tai asiaa enempiä ymmärtämättä rakennettu siten, että jollain matematiikalla lasketaan palvelinten yhteinen käytettävyys ja tätä lukua sitten seurataan kuin jumalansanaa. Ja sitten ihmetellään, kun käyttäjäkunnan näkemys laadusta on aivan toinen kuin korkeiden sopijaosapuolten.

Jos käyttökatkoja sanktioidaan (tai muuten vain mitataan millimetrimitalla ja täikammalla), kumpaakin osapuolta suojaa käyttökatkon edes alkeellisesti täsmällisen määritelmän kirjaaminen sopimuksiin.

Käyttökatkosta toipuminenkin on arvoketju:

Ellei kyseessä ole perin harvinainen fyysinen vika, varsinaisen infrastruktuurin toipuminen on nopea tapahtuma ja siihen perustuvat useamman yhdeksikön käytettävyyslukemat. Mutta tämä aika on yleensä varsin epäoleellisen pieni koko toipumisajasta.

Vasta kun infrastruktuuri on palautunut, alkaa tiedonhallintajärjestelmien, tiedon ja sovelluksen toipuminen. Suuri tietokanta, jota ei ole suunniteltu nopeasti toipuvaksi, saattaa tähtien ollessa sopivassa asennossa joutua toipuessaan tekemään huomattavan määrän työtä ja siihen voi kulua aikaa moni- tai monikymmenkertaisesti varsinaiseen palvelimen uudelleenkäynnistykseen verrattuna. Tämä on arvoketjun lenkki, johon infrastruktuurin toimittajalla ei useinkaan ole juuri vaikutusmahdollisuutta, vaan toipumisaika on sidoksissa tietokantaratkaisuun.

Ennen käyttäjien päästämistä sisään saattaa olla tarpeen tarkastaa toipumisen onnistuminen ja kriittisten tietojen eheys. Tämä on vaihe, joka sekin on osa käyttäjien kokemaa katkoa, vaikka se saattaa olla asiakasorganisaation itsensä vastuulla.

Käyttäjien palautumisaikaa ei sitäkään kannata aliarvioida. Katkon alkaessa on saatettu siirtyä kahville tai ryhtyä tekemään muita töitä. Myös osa tehdystä työstä saatetaan joutua tekemään uudelleen. Siksi sorvin ääreen palautumiseen ja häiriön kohteena olleen järjestelmän palautuminen täyteen käyttövolyymiinsä voi kestää kauan.

Palvelusopimuksiin saattaa piiloutua toinenkin epäoleellisuuksiin liittyvä sudenkuoppa: pelkkien katkominuuttien laskeminen.

Vertaillaanpa kahta tapausta. Ylemmässä tarkastelujakson aikana tapahtuu yksi pitkä infrapohjainen käyttökatko ja alemmassa kolme lyhyttä.

Paradoksi asiassa on, että ylempi tapaus saattaa laukaista sopimuksen sanktiopykälän, mutta alempi ei. Infran toipumisen jälkeinen toipumisaika toistuessaan aiheuttaa kuitenkin sen, että alempi tapaus on käyttäjän näkökulmasta selvästi huonompi. Tarjolla siis jälleen kerran on vesimeloni!

Suorituskykyä ja käytettävyyttä varsin harvassa palvelusopimuksessa rinnastetaan, vaikka saattaisi olla aihetta. Syytä on niin sysissä kuin sepissäkin. Suorituskyvyn puute näkyy käyttäjälle vastausaikana, joka on jossain määrin subjektiivinen suure. Palvelunsaajalle se näkyy rajallisena läpäisykykynä (tapahtumaa aikayksikössä), joka se on objektiivisempi. Lisäksi vastuu suorituskyvystä hajautuu usealle toimijalle, minkä takia se on helpointa lakaista maton alle.

Syistä ja syyllisistä kuitenkin riippumatta kipuraja kohdattaessa on varsin makuasia, onko järjestelmä käynnissä vai ei, jos sitä todellisuudessa ei kykene käyttämään järjellisesti. Ei siis ole väärin ajatella, että kelvoton vastausaika ja käyttökatko ovat käyttäjän kannalta sama asia. Mutta koska vastausaika on asia, jonka objektiivinen mittaaminen on hankalaa, se on kiusallisena seikkana helppo unohtaa.