четверг, 8 января 2026 г.

ESXI CHECK DISK HEALTH

 

1️⃣ esxcli nvme device list

🔍 Ne işe yarar?

ESXi host’a bağlı tüm NVMe cihazları listeler.

📌 Örnek çıktı alanları (yorumlu):

Device: t10.NVMe____SAMSUNG_MZVL2512HCJQ2D00B00... Adapter: vmhba1 Controller: vmhba1 Queue Depth: 1024 Firmware Version: EDA7901Q Model: SAMSUNG MZVL2512HCJQ2D00 Namespace Count: 1

🧠 Nasıl yorumlanır?

  • Queue Depth (1024+) → NVMe için normal ✅

  • Firmware → Vendor önerisiyle aynı olmalı

  • Namespace Count → Genelde 1 (normal)

🚨 Alarm:

  • Queue Depth çok düşükse (128 altı)

  • Firmware eskiyse


2️⃣ NVMe disk SMART bilgisi

esxcli storage core device smart get -d t10.NVMe____SAMSUNG_...

🔍 Ne işe yarar?

NVMe diskin sağlık durumunu gösterir.


📌 Kritik alanlar (tek tek açıklama)

AlanAnlamNormal
Health StatusDisk sağlığıOK
Media Wearout IndicatorÖmür yüzdesi> 80
Power On HoursÇalışma süresiBilgi
Unsafe ShutdownsAni kapama0–az
TemperatureDisk sıcaklığı< 70°C

📌 Media Wearout %70 altı → planla
📌 Unsafe Shutdown artıyorsa → power / UPS sorunu


3️⃣ NVMe SMART log (adapter bazlı)

esxcli nvme device log smart get -A vmhba1 esxcli nvme device log smart get -A vmhba2

🔍 Ne işe yarar?

NVMe controller (path) bazında hata ve sağlık kontrolü.


📌 Önemli alanlar

AlanAçıklamaAlarm
Critical WarningGenel sağlık0 olmalı
Media ErrorsOkuma/yazma hata>0 ❌
Error Log EntriesToplam hataArtıyorsa ❌
TemperatureController sıcaklığı>80 ❌

📌 vmhba1 ile vmhba2 benzer değerlerde olmalı
Biri yüksekse → path / PCI / slot sorunu


4️⃣ esxcli storage core device list

🔍 Ne işe yarar?

Diskin ESXi tarafından nasıl görüldüğünü gösterir.


📌 Kritik alanlar:

Display Name: Local ATA Disk Vendor: NVMe Model: SAMSUNG... Multipath Plugin: NMP Devfs Path: /vmfs/devices/disks/... Queue Full Sample Size Device Max Queue Depth

🧠 Yorum:

  • Multipath Plugin:

    • NVMe-oF → NMP / HPP

    • Local NVMe → multipath yok

  • Queue Depth → Storage performans limiti

🚨 Alarm:

  • Queue Depth çok düşük

  • Path sayısı beklenenden az


5️⃣ ATA disk (TOSHIBA) SMART analizi

esxcli storage core device smart get \ -d t10.ATA_____TOSHIBA_MG04ACA200EY...

🔍 Ne işe yarar?

Klasik SATA / SAS disk sağlık kontrolü.


📌 Kritik SMART alanları

AlanNormalAlarm
Reallocated Sector Count0>0
Current Pending Sector0>0
Uncorrectable Errors0>0
Temperature< 50°C> 60°C

📌 HDD ise:

  • Latency doğal olarak yüksek

  • Queue çok çabuk dolar


🔥 NVMe vs ATA – canlı fark

ÖzellikNVMeATA HDD
Queue Depth1024+32
Latency<1 ms5–15 ms
SMART detayÇok zenginSınırlı

🚨 Sahada sık görülen red flag’ler

❌ NVMe var ama latency yüksek
➡️ PCI slot paylaşımı / NUMA

❌ vmhba1 OK, vmhba2 hata dolu
➡️ Path / firmware / kablo

❌ SMART OK ama performans kötü
➡️ Queue & multipath ayarı


🧠 Kısa checklist (ezber)

  • esxcli nvme device list

  • SMART = OK

  • vmhba path’ler dengeli

  • Queue Depth mantıklı

  • esxtop DAVG < 1 ms

Комментариев нет:

Отправить комментарий