1️⃣ esxcli nvme device list
🔍 Ne işe yarar?
ESXi host’a bağlı tüm NVMe cihazları listeler.
📌 Örnek çıktı alanları (yorumlu):
🧠 Nasıl yorumlanır?
-
Queue Depth (1024+) → NVMe için normal ✅
-
Firmware → Vendor önerisiyle aynı olmalı
-
Namespace Count → Genelde 1 (normal)
🚨 Alarm:
-
Queue Depth çok düşükse (128 altı)
-
Firmware eskiyse
2️⃣ NVMe disk SMART bilgisi
🔍 Ne işe yarar?
NVMe diskin sağlık durumunu gösterir.
📌 Kritik alanlar (tek tek açıklama)
| Alan | Anlam | Normal |
|---|---|---|
| Health Status | Disk sağlığı | OK |
| Media Wearout Indicator | Ömür yüzdesi | > 80 |
| Power On Hours | Çalışma süresi | Bilgi |
| Unsafe Shutdowns | Ani kapama | 0–az |
| Temperature | Disk sıcaklığı | < 70°C |
📌 Media Wearout %70 altı → planla
📌 Unsafe Shutdown artıyorsa → power / UPS sorunu
3️⃣ NVMe SMART log (adapter bazlı)
🔍 Ne işe yarar?
NVMe controller (path) bazında hata ve sağlık kontrolü.
📌 Önemli alanlar
| Alan | Açıklama | Alarm |
|---|---|---|
| Critical Warning | Genel sağlık | 0 olmalı |
| Media Errors | Okuma/yazma hata | >0 ❌ |
| Error Log Entries | Toplam hata | Artıyorsa ❌ |
| Temperature | Controller sıcaklığı | >80 ❌ |
📌 vmhba1 ile vmhba2 benzer değerlerde olmalı
Biri yüksekse → path / PCI / slot sorunu
4️⃣ esxcli storage core device list
🔍 Ne işe yarar?
Diskin ESXi tarafından nasıl görüldüğünü gösterir.
📌 Kritik alanlar:
🧠 Yorum:
-
Multipath Plugin:
-
NVMe-oF → NMP / HPP
-
Local NVMe → multipath yok
-
-
Queue Depth → Storage performans limiti
🚨 Alarm:
-
Queue Depth çok düşük
-
Path sayısı beklenenden az
5️⃣ ATA disk (TOSHIBA) SMART analizi
🔍 Ne işe yarar?
Klasik SATA / SAS disk sağlık kontrolü.
📌 Kritik SMART alanları
| Alan | Normal | Alarm |
|---|---|---|
| Reallocated Sector Count | 0 | >0 |
| Current Pending Sector | 0 | >0 |
| Uncorrectable Errors | 0 | >0 |
| Temperature | < 50°C | > 60°C |
📌 HDD ise:
-
Latency doğal olarak yüksek
-
Queue çok çabuk dolar
🔥 NVMe vs ATA – canlı fark
| Özellik | NVMe | ATA HDD |
|---|---|---|
| Queue Depth | 1024+ | 32 |
| Latency | <1 ms | 5–15 ms |
| SMART detay | Çok zengin | Sınırlı |
🚨 Sahada sık görülen red flag’ler
❌ NVMe var ama latency yüksek
➡️ PCI slot paylaşımı / NUMA
❌ vmhba1 OK, vmhba2 hata dolu
➡️ Path / firmware / kablo
❌ SMART OK ama performans kötü
➡️ Queue & multipath ayarı
🧠 Kısa checklist (ezber)
-
esxcli nvme device list -
SMART = OK
-
vmhba path’ler dengeli
-
Queue Depth mantıklı
-
esxtop DAVG < 1 ms
Комментариев нет:
Отправить комментарий