Skip to content

Troubleshoot vSphere Clusters

Tüm hata giderme işlemlerinde olduğu gibi burada da hata giderme aslında edinilen tecrübeler doğrultusunda gerçekleşiyor. Bu yüzden tüm hataları tek tek yazıp çözümlerini anlatmak oldukça zor. Belli başlı bazı konulara göz atıp neler yapabileceğimize bakacağız.

DRS / HA Hatalarının Analizi

HA clusterın genel sağlık durumunu görüntülemek için;

Web Client -> HA Cluster -> Monitor -> vSphere HA

Configuration Issues sekmesinden yapılandırma ile ilgili problemler görüntülenebilir.

vSphere DRS’in genel sağılığına göz atmak için de yine Monitor sekmesine gideriz.

DRS / HA Yapılandırma Sorunlarının Giderilmesi

HA deploy edilirken sık karşılaşılan bir sorun olan başlangıçtaki HA yapılandırmasındaki hataların başlıca sebepleri şunlar olabilir:

Host Communication Errors: Hostlarla olan iletişim sorunlarını çözün ve yapılandırma işlemini yeniden deneyin. (Hostlar arasındaki ağ sorunlarını giderin.)

Timeout Errors: Olası nedenler arasında, hostun yapılandırma görevi sırasında çökmesi, agentın yüklendikten sonra başlayamaması ya da agentın başlatıldıktan sonra kendisini başlatamaması yer almaktadır. Bu durumda vCenter Server’ın hostlarla iletişim kurabildiğinden emin olun.

Lack of Resources: Yaklaşık 75 MB kadar disk alanını boşaltın. Başarısızlık bellek yetersizliğinden kaynaklanıyorsa, sanal makineleri başka bir hosta yeniden yerleştirerek ya da rezervasyonlarını azaltarak hosttaki belleği boşaltın. Her iki durumda da sorunu çözdükten sonra vSphere HA yapılandırma görevini yeniden deneyin.

Reboot pending: 5.0 veya sonraki bir host için kurulum “reboot pending” yüzünden başarısız olursa, hostu yeniden başlatın ve vSphere HA yapılandırma görevini yeniden deneyin.

Bir diğer sorun ise HA agent network partition veya HA agent network isolation olabilir. Aşağıdaki koşulların her ikisi de karşılanırsa bir network partition rapor edilir:

  • vCenter Server’ın bağlı olduğu vSphere HA master host, yönetim (veya Virtual SAN) ağını kullanarak hostla iletişim kuramıyor fakat bu host için seçilen heartbeat datastoreları kullanarak iletişim kurabiliyor ise,
  • Host izole değilse.

Hangi datastoreların heratbeat datastore olarak yapılandırıldığını görmek için;

Web Client -> HA Cluster -> Monitor -> vSphere HA -> Heartbeat 

Hostların yönetim ağı (veya Sanal SAN ağı) üzerinden iletişim kurabildiğinden emin olunmalıdır. VMKernel interface’i bulmak için;

Web Client -> Host -> Configure -> Networking -> VMKernel Adapters -> İlgili VMKernel Adapter

HA ile ilgili loglara bakmak isterseniz;

  • /var/log/fdm.log
  • /var/log/vmkernel.log

Virtual SAN/HA Sorunlarının Giderilmesi

Virtual SAN kendi ağına sahiptir. Virtual SAN ve vSphere HA aynı cluster için etkinleştirildiğinde, HA trafiği, yönetim ağı yerine bu depolama ağı üzerinden akar. Yönetim ağı, vSphere HA tarafından yalnızca Virtual SAN devre dışı bırakıldığında kullanılır.

Bir clusterda hem VSAN hem HA etkinleştirilmek isteniyorsa önce VSAN etkinleştirilmelidir. Daha sonra HA etkinleştirilebilir.

Hem VSAN’ın hem de HA’in etkin olduğu bir clusterda VSAN’ı devre dışı bırakmak istiyorsak, öncelikle HA’i devre dışı bırakmalıyız.

VMware Fault Tolerance Sorunlarının Giderilmesi

Hardware Virtualization Not Enabled

Fault Tolerance etkinleştirilmiş bir sanal makineyi açmaya çalıştığınızda HV’yi etkinleştirmediyseniz bir hata mesajı görüntülenebilir.

Çözüm: ESXi server donanımı HV’yi destekliyor ancak HV şu anda etkin değil ise, bu serverdaki BIOS’ta HV’yi etkinleştirin. Eğer ESXi server donanımı HV’yi desteklemiyorsa, Fault Tolerance’ı destekleyen işlemcileri kullanan donanıma geçilmesi gerekir.

Compatible Hosts Not Available for Secondary VM

Fault Tolerance etkinleştirilmiş bir sanal makineyi açarsanız ve secondary sanal makine için uyumlu bir host yoksa şöyle bir hata mesajı ile karşılaşabilirsiniz:

“Secondary VM could not be powered on as there are no compatible hosts that can accommodate it.”

Çözüm: Clusterdaki hostlar yetersizse clustera daha fazla host eklenebilir. Ayrıca clusterdaki hostların HV’yi desteklediklerinden ve HV’nin etkin olduğundan emin olunmalıdır. Hostlar yeterli kapasiteye sahip olmalı ve maintenance modda olmamalıdır.

Increased Network Latency Observed in FT Virtual Machines

FT ağı uygun şekilde yapılandırılmadıysa, FT VM’lerde gecikme problemleriyle karşılaşılabilir. Bu da uygulamaların performanslarında düşüşe sebep olabilir.

Çözüm: FT ağının yeterli bant genişliğine (10 Gbps veya daha fazla) sahip olduğu ve Primary VM ile Secondary VM arasında düşük gecikmeye sahip bir bağlantı kullanıldığından emin olunmalıdır. Bu önlemler ağ gecikmesini ortadan kaldırmaz ancak potansiyel etkisini en aza indirir.

vSphere Clusterlarda hataları tespit etme ve sık karşılaşılan problemlere genel bir bakış sağladık. Sınav için daha detaylı bilgi sahibi olmak isterseniz buraya bakabilirsiniz. İyi çalışmalar dilerim.

Published inVCAP-DCV

Be First to Comment

Leave a Reply

Your email address will not be published. Required fields are marked *