Összefoglaló a karbantartásról

2012.02.23

Sikeresen zárult tegnap este a soron kívüli karbantartás tárhely szerverünkön.
Pár gondolatban összefoglalnánk, hogy mi történt (figyelem, kulisszatitkok következnek):

A weboldalak és a szolgáltatásokkal kapcsolatos adatok 6 db merevlemezen vannak tárolva, ezek össze vannak kapcsolva és úgynevezett RAID 5 tömbben vannak. Ez biztosítja a megfelelő biztonságot és a redundanciát is ami a tárhely szolgáltatás nélkülözhetetlen része.

A rendszerünk úgy van felépítve, hogy a 6-ból 2 merevlemez meghibásodása esetén is még gond nélkül mennek a szolgáltatások, és nem vesznek el adatok.

A tegnapi nap során észleltük, hogy az egyik merevlemez leállt, ami bár nem okozott gondot, mindenképpen utána akartunk járni, hogy mi a gond, és szükség esetén cserélni a meghibásodott merevlemezt. Sajnos a szerverünk távoli hardver menedzsment programja (ami minden lényeges alkatrészről állapotjelentést ad) sem működött, ezt sem értettük, hogy miért.

Tegnap este 20:00-ra érkeztünk a Dataland szervertermébe, rövid szemrevételezés után megállapítottuk, hogy elkerülhetetlen a merevlemez csere. Így rögtön kivettük a hibás merevlemezt és a tartalék merevlemezzel kicseréltük. Ez még nem igényel leállítást, mivel a szerver merevlemezek menet közben cserélhetőek.

Rövid szinkronizálást követően nekiláttunk kideríteni, hogy a hadver menedzsment miért nem fut.

Rendszergazdánk, Tibor hamar kiderítette az okokat, szerencsére szoftveres megoldás már létezik a problémára, így egy frissítést követően sikerült elhárítani a problémákat.

A szolgáltatások ezen frissítés időtartama alatt álltak le, mivel többször is újra kellett indítanunk a szervert.

Ha már ott voltunk, akkor elvégeztünk pár általános karbantartást is, eltávolítottunk pár szükségtelen fájlt, és finomhangoltunk néhány szolgáltatást is, hogy jobban követni tudjuk a tárhely kapacitást és forgalmat.

Összességében 3 órát vett igénybe a munka, 23:00 magasságában távoztunk a Dataland terméből.

Ügyfeleinknek köszönjük a türelmet! Igyekszünk tárhely szolgáltatásainkat magas szinten tartani, ebben pedig elengedhetetlen, hogy a felmerülő problémákat azonnal orvosoljuk.

Végül néhány kép mutatnánk, amit eddig nem láthattak. Hasonló statisztika készül a futó szolgáltatásainkról, úgy mint a levelezés, a hálózati forgalom, merevlemez kapacitás és egyéb paraméterekről.

Szerverünk közel egy éve nem lett újraindítva:

Tárhely szolgáltatás rendelkezésre állás

Ez idő alatt a processzorok terhelése így alakult (2x2 mag, ezért a 400% az Y tengelyen):

Tárhely terhelés