Projekt tardigrade chráni vaše VMS pred chybami hostiteľa

Obsah:

Video: L'indestructible tardigrade 2024

Video: L'indestructible tardigrade 2024
Anonim

Po niekoľkých zmenách v Azure a vylepšeniach zabezpečenia v posledných niekoľkých mesiacoch spoločnosť Microsoft predstavuje Project Tardigrade ako najnovší pokus o zvýšenie spoľahlivosti Azure.

Projekt Tardigrade zabraňuje zlyhaniam platformy

Projekt Tardigrade je nová služba, ktorej cieľom je zvýšiť odolnosť Azure. Zahŕňa stratégie zmierňovania, ktoré chránia VM Azure pred zlyhaním platformy.

Takto opisuje Mark Russinovich, technický riaditeľ spoločnosti Microsoft Azure, súčasnú prácu na Azure:

Naším cieľom je splnomocniť organizácie, aby spoľahlivo riadili svoju pracovnú záťaž na Azure. S týmto ako našim vedúcim princípom neustále investujeme do vývoja platformy Azure, aby sme sa stali odolnými voči chybám, a to nielen na zvýšenie produktivity podnikania, ale aj na zabezpečenie plynulého prostredia pre zákazníkov.

Aby sa predišlo dopadu na vaše pracovné zaťaženie, služba umožňuje komponentom samoliečiť sa a rýchlo sa zotaviť z potenciálnych porúch, dokonca aj v kritických chybách hostiteľa.

Ako funguje Project Tardigrade?

Tu je príklad, ako funguje pracovný tok obnovy Tardigrade:

  • Fáza 1: Tento krok nemá vplyv na chod virtuálnych počítačov zákazníkov. Jednoducho recykluje všetky služby bežiace na hostiteľovi. V zriedkavých prípadoch, keď sa chybná služba úspešne nereštartuje, prejdeme do fázy 2.
  • Fáza 2: Naša diagnostická služba beží na hostiteľovi, aby sa systematicky zhromažďovali všetky relevantné protokoly / výpisy, aby sme zaistili, že dokážeme dôkladne diagnostikovať príčinu zlyhania vo fáze 1. Táto komplexná analýza nám umožňuje „príčinu problému“ vyriešiť a zabrániť tak opakovaniu výskytu. v budúcnosti.
  • Fáza 3: Na vysokej úrovni obnovujeme OS do zdravého stavu s minimálnym dopadom na zákazníka, aby sme zmiernili problém hostiteľa. Počas tejto fázy zachovávame stavy každého VM do pamäte RAM, po ktorej začíname obnovovať OS do zdravého stavu. Zatiaľ čo operačný systém OS sa rýchlo resetuje, spúšťanie aplikácií vo všetkých virtuálnych počítačoch hostovaných na serveri sa dočasne „zmrazí“, pretože procesor je dočasne pozastavený. Táto skúsenosť je podobná sieťovému pripojeniu dočasne stratenému, ale rýchlo obnovenému kvôli logike opakovania. Po úspešnom resete OS spotrebujú VM uložený stav a obnovia normálnu činnosť, čím zabránia akémukoľvek možnému reštartu VM.

S ohľadom na to projekt Project Tardigrade zabezpečí, aby zlyhanie ktoréhokoľvek komponentu hostiteľa neovplyvnilo celý systém. Zákaznícke virtuálne počítače preto nebudú ovplyvnené chybami hostiteľa.

Spoločnosť Microsoft usilovne pracuje na zlepšení a rozšírení rôznych scenárov zlyhania hostiteľa, aby sa ubezpečila, že ich platforma cloud computing je spoľahlivejšia ako kedykoľvek predtým.

Očakávajte nový vývoj a ďalšie implementácie spoľahlivosti v blízkej budúcnosti.

Projekt tardigrade chráni vaše VMS pred chybami hostiteľa