Vai Amazon problēmas patiešām nesa tikai sliktu?

Nesen Amazon Web Services piedzīvoja pārtraukumu darbībā – izdzisa ekrāni, informācijas paneļi pārtrauca mirguļot un internets jau kārtējo reizi konstatēja, ka “mākonis” ik pa laikam apliecina savu atbilstību nosaukumam.

Kad darboties pārstāja tik daudz sistēmu, tas, nenoliedzami, bija nepatīkami, pat sāpīgi. Cilvēki zaudēs darbu – arī atzīti profesionāļi. Pagājušajā nedēļā tika zaudēts ļoti daudz naudas. Un jautājums pat nav par to, vai ir iespējams izvairīties no šāda veida katastrofām. Īstais jautājums ir par to, vai šādas katastrofas patiesi ir tik sliktas. Ņemot vērā, cik daudz kopš Amazon Web Services (AWS) pirmsākumiem ir ietaupīts, balanss joprojām ir pozitīvs.

Asa reakcija uz uzņēmuma problēmām bija momentāna. Taču aiz saceltā trokšņa fonā varēja saklausīt ko pazīstamu un cerību viesošu: sistēma veica milzīga mēroga pašpārbaudi.  Ikviena lieliska tehnoloģija agri vai vēlu sasniedz savus limitus. Un tad atliek vērot, cik eleganti tā mācās no šādiem gadījumiem.

“Mākonis” vienmēr bijis vilinošs un neatvairāms. Tas solīja nebeidzamu izaugsmi, universālu piekļuvi un rēķinu, kam vajadzētu būt vēl tīkamākam par serveru telpu, kas pilna ar mirgojošām gaismiņām. Lielākajai daļai uzņēmumu tā bija racionāla izvēle – lētāka par iznomātām līnijām, vieglāk uzturama nekā sarežģītā žonglēšana ar ofisiem un attālinātajām darba vietām un noteikti daudz valdzinošāka nekā ķimerēšanās vasaras speltē ap saplīsušo datu centra kondicionēšanas sistēmu.

Šķipsniņa ironijas ir nozīmīga progresa komponente. Katrs vērā ņemams jaunatklājums radīs pats savas lietas, no kurām būt atkarīgam. Jo vairāk mēs optimizējam, lai pielāgotos “mākonim”, jo vairāk atbildības par neveiksmēm tiek nodota citiem. Kad nobrūk AWS, zūd arī ilūzija par vispārēju pieejamību un klātbūtni. Un – ņemiet vērā – tā vienmēr bijusi tikai ilūzija.

Inovāciju vecie solījumi

Lai radikāli jauna tehnoloģija būtu veiksmīga, tai jāspēj ātri iekļauties ekonomikā. Tā ir tik ļoti pievilcīga, tik ļoti eleganta un nepārprotami pārāka, lai to ignorētu. Tādēļ inženieri tās veiktspēju pacels līdz tehnoloģijas maksimumam, bet bizness maksimizēs tās ieguldījumu atdevi līdz pēdējam. Līdz nonāksim situācijā, kad vairāk no šīs tehnoloģijas izspiest vairs nebūs iespējams.

Taču ne visi uzņēmumi mācās vienādi. Uzņēmumi organiski sadalījušies trīs ciltīs.

Apzinīgie kapeiku skaitītāji. Viņi efektivitāti pērk pilnībā apzinoties riskus. Viņi zina, ka ietaupa naudu un vienlaikus pieņem, ka vairāk vai mazāk regulāri sistēmas darbības pārtraukumi ir neizbēgami. Viņiem “mākonis” ir apzināts risks, ne reliģija. AWS darbības pirmos piecus līdz desmit gadus uzņēmuma klienti bija tieši šādi ļaudis.  

Skeptiskie inženieri. Pirmkārt, viņi nekad nav uzticējušies kāda mārketingam. Viņi zina – ja kaut ko ir iespējams izveidot, to noteikti var arī salauzt. Viņi arī zina, ka ik pa laikam sistēmas nobrūk bez redzama vai kāda dīvaina iemesla dēļ. Crowdstrike gadījums bija tieši šāda tipa kļūda. Viņiem piemīt veselīga neuzticēšanās jebkurai sistēmai – cilvēka vai Dieva radītai – un tā noved līdz vēl veselīgākai domāšanai par to, kas vēl varētu salūzt. Viens no AWS lielākajiem klientiem – Netflix, piemēram, nemaz tik ļoti no AWS problēmām necieta. Viņi radīja par Chaos Monkey dēvētu instrumentu, kas infrastruktūrā un programmu komponentēs rada haosu.

Mūžīgi aizņemtie. Viņi bija pārāk aizņemti, lai spētu būt arī uzmanīgi. Viņu bizness auga ātrāk, nekā jaunajai situācijai tika pielāgots plāns neparedzētiem gadījumiem. Parasti šī ir tā grupa, kas, apstājoties sistēmai, cietīs vislielākos zaudējumus.

Katrs sistēmas darbības pārtraukums no jauna pārdala riskus starp šīm grupām. Un kas ir vēl svarīgāk, tas pārdala arī riskus starp inovācijām un status quo.

Kad ekonomika satiekas ar inženieriju

Pagājušā gada CrowdStrike fiasko – kad kļūdains programmatūras atjauninājums paralizēja aviosatiksmi un slimnīcu darbību – netika radīts kosmisku apmēru neveiksmes dēļ. Tas aizsākās ar politiskām izvēlēm. Eiropas Savienība uzstāja, lai Microsoft saviem konkurentiem sniedz pieeju uzņēmuma operacionālās sistēmas kodolam. Šādi bija iecerēts veicināt konkurenci. Sākotnēji Microsoft iebilda, bet tad pakļāvās ES prasībām. Rezultātā radās daudz atvērtāka ekosistēma un galu galā arī šīs pašas atvērtības radītais sistēmas sabrukums.

Vai tā bija kļūda? Lēmumi, kas pieņemti juristiem sniedzot padomus inženierim un otrādāk, reti nerada problēmas.

Tāda pat loģika vada “mākoņa” arhitektūru. Centralizācija sniedz ātrumu un spēju attīstīties, bet tā vienlaikus sistēmu padara arī trauslāku. Kad sistēma nobrūk Sietlā, to ir manāms arī Singapūrā.  Tādēļ vismaz pēdējos piecus gadus klusītēm notiek decentralizācija.

Mainīgais “mākonis”

Kādreiz neapšaubāmā teju zibenīgas attīstības nodrošinātāju dominance lēnām izzūd, un šos procesus virza divi spēki.

Pirmkārt, kad Amazon, Microsoft un Google pārtrauca pirkt datorus no tādiem tradicionālajiem pārdevējiem kā Dell un HPE, pretoties sāka datorsistēmu aparatūras tirgus. HPE, piemēram, bija spiesti radīt pavisam jaunu darbības modeli. Un viņiem tas izdevās. HPE uz izmaiņām tirgū reaģēja, radot labāku cenu politiku un finansēšanas iespējas, kā arī ierīces mašīnu klasteru vadīšanai un uzturēšanai.

Otrkārt, izaicinājumu pieņēma arī programmatūras ražotāji. Tādas tehnoloģijas kā Kubernetes un jaunās vadības sistēmas privāto klasteru pārvaldīšanu padarījušas daudz vieglāku. Tagad starpība izmaksām par dzīvošanu “mākonī” un savas sistēmas uzturēšanu ir krietni samazinājusies.

Abas šīs tendences nozīmē – gan lokālie, gan mākoņrisinājumi atkal ir ekonomiski dzīvotspējīgi un to popularitāte palielinās. Bet fakts, ka idejas par visu savu datu glabāšanu mākonī pievilcība ir mazinājusies, vairs nav nekāds lielais noslēpums, kaut arī to cenšas ļoti cieši sargāt.

Tomēr publiskajā telpā joprojām ir daudz atsauču. Īlons Masks publiski paudis, ka X/Twitter, pārvietojoties uz privātu datu centru, gadā ietaupīs 100 miljonus. Noteiktos gadījumos datorapstrādes pārvietošana tuvāk īpašniekiem atkal kļuvusi lētāka. Protams, ir jāņem vērā Īlona komandas spējas inženierijā.

Neo-clouds, ir jauns pakalpojuma sniedzēja tips, kas daudzos gadījumos radies no bitkoinu “racējiem”. Tas ir augstas veiktspējas datu centrs ar privātu infrastruktūru, kas savā darbībā izmanto arī publiskus “mākoņa” pakalpojumus. Bijuši Yandex komanda šo stratēģiju izmanto ļoti veiksmīgi. Svārsts, kas savulaik bija nosvēries totālas centralizācijas virzienā, tagad meklē savu balansu.

Visi tirgi mācās no kļūdām

Visu jūsu datu glabāšana vienā “mākonī” nekad nav bijusi 100 % droša. Bet – liels BET – tas bija drošāk, nekā par datu drošību rūpēties pašam. Pēdējo desmit gadu laikā “multimākonis” no teorijas ir attīstījies līdz atsevišķu inženiertehnisko disciplīnu.

Ja Amazon nobrukšanai ir kāda morāle, tad tā ir šāda – sistēmas kļūst daudz uzticamākas pēc tam, kad tās ir nobrukušas. Šāds tests atklāj vājās vietas, un tirgus šo mācību ņem vērā. Katrs šāds sistēmas darba pārrāvums veicina nākamo atjauninājumu un uzlabojumu rašanos.

Esiet gatavi vēl lielākai daudzveidībai infrastruktūrā. Tādi uzņēmumi kā Meta un Google vai Amazon nostiprinās savu ietekmi MI jomā un globālajā tīklā. Uzņēmumi attīstīs hibrīdus risinājumus un privātos mezglus. Inženieru komandas, reizēm pieļaujot sāpīgas kļūdas, mācīsies, ka rezerves risinājumi nav tik daudz par dublējumu, cik par gatavošanos negadījumiem.

Progress jau atkal atkārto savu mīļāko triku – vakardienas skandālu tas pārvērtīs par rītdienas labo praksi.

Posted in

Leave a comment