Problem z replikacją macierzową i przełączeniem SRM – studium przypadku.

  • By :
  • Category : VMware
VMware

Problem z replikacją macierzową – błąd failed to recover datastore … vmfs volume residing on recovered devices “109” cannot be found, some virtual machines in protection group “PROTECTION_GROUP” could not be recovered. — studium przypadku.
SRM ma jeden super fajny feature – przełączenie testowe. Przełączenie testowe regularnie warto robić! Dlaczego? Postaram się poniżej streścić.
Sytuacja, wszystko działa jak należy. Monitoring nie wychwycił żadnych błędów zarówno w konfiguracji serwerów/vmware/srm jak i konfiguracji czy pracy macierzy. Podczas testowego przełączenia SRM dla jednej z grup replikacji proces przebiega dłużej niż zwykle i w końcu pojawia się błąd: failed to recover datastore … vmfs volume residing on recovered devices “109” cannot be found.
Żmudna analiza wykazała, że po przełączeniu ESXi nie może zamontować wystawionego datastore z uwagi na problemy z systemem plików. System plików w tym samym czasie działa prawidłowo dla systemu w ośrodku podstawowym.
Ponieważ filesytem (vmfs) działa prawidłowo w ośrodku podstawowym i nie zgłasza żadnych błędów a nie chce się podmontować w ośrodku zapasowym ślady prowadzą do macierzy i do prawidłowej replikacji.
Analiza blokowa wykazuje, że filesystemy się różnią już na początku dysku.

Dodam tylko, że macierz wyższej znanego producenta z top 5.
Kolejna moja twierdza czyli przeświadczenie o niezawodności replikacji storage updała.

Przydatne polecenia:

hexdump -C naa. … |less

Producent macierzy zauważa problem, ale ponieważ nie może tego odtworzyć w labie to … sprawa do tej pory nie jest rozwiązana 🙁

No Comments

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

VMware
VCF, backup configuration

Backup implementation for VMware component is fairly easy. Just the requirements is to configure SFTP server in proper way and make it network available to the VMware components. SDDC Manager and NSX Manager backup In VCF Operations it is possible to configure backup for SDDC Manager and NSX Manager. Go …

VMware
VCF Automation, fresh environment configuration with identity providers and access control.

Introduction Login Login as user admin to the Organization name: system or if selected manual: Check the connections (in Administration section), where you should see connection to the vCenter and NSX-t manager as those are provided automatically via VCF Operations: the same for VCF Instances: Also check your networking: Identity …

VMware
VCF SoS

SoS (Supportability and Serviceability) command can be used for troubleshooting purpose to generate VCF (per component) log bundle, massively enable/disable ssh service on ESXi, vCenter, password and certificates expiry status, verify cluster health and many other. while troubleshooting, the following commands can be helpful: