Für VSAN nicht berechtigte Festplatten ESXi-Tipp: VSAN-Disk-Claiming

VMFS-Partitionen, die das Disk-Claiming für VSAN verhindern, lassen sich mit partedUtil entfernen.

Beim Versuch, VMware Virtual SAN auf einen kleinen 3-Node-Cluster zu aktiveren, tauchten einige der in den ESXi-Hosts verbauten SATA-Platten einfach nicht im VSAN-Assistenten für das Disk-Claiming auf. Sie waren also für VSAN nicht berechtigt (ineligible). Warum ?

Ist eine HDD für VSAN nicht „berechtigt“ kann sie nicht als Datenplatte zum Kapazitäts-Tier beitragen. In diesem Fall lag das offenkundig daran, dass trotz zuvor per GUI entfernter Datastores offenbar noch VMFS-Partitionen vorhanden waren, die die Verwendung für VSAN verhinderten. Dies wiederrum kann dann der Fall sein, wenn einer VMFS-Partition (beim ESXi-Setup automatisch so konfiguriert) zur Aufnahme von Coredumps im Dateisystem dient oder als Scratch-Location. Die betreffenden Partitionen müssen also manuell entfernt werden.

Trotzdem soll an dieser Stelle noch auf die vSAN-Fehlersuchbefehle der RVC (Ruby vSphere Console) hingewiesen werden Diese startet man auf der Windows-vCenter-Version mit …

~%PROGRAMFILES%\VMware\Infrastructure\VirtualCenter Server\support\rvc\rvc.bat

… und an der  vCenter Server Appliance

rvc root@localhost

So findet man z.B. mit

vsan.disks_info <Host>

schnell heraus, welche Disks für vSAN „ineligible“ sind. Auch hier ist ersichtlich: der Grund dass die betreffenden Disks nicht für VSAN „claim-bar“ sind besteht darin, dass VMFS-Volumes auf den Disks existieren.

Korrespondieren diese nicht mittelbar mit einem Datastore, den man meist über die GUi erfolgreich entfernen kann, kann man diese mit dem Tool „partedUtil“ per SSH oder ESX-Shell löschen, wobei man sich aber anhand der Geräte und Partitionsnamen ganz sicher sein muss, auch die richtigen Partitionen zu löschen, wie z. B.

partedUtil delete „/dev/disks/t10.ATA_____WD5003ABYX2D88_______________________LEN______WD2DWMAYP6589359“ 1

Sollte das nicht funktionieren, hilft zum Löschen der Partition nur noch die „harte Tour“ mittels

dd if=/dev/zero of=“/dev/disks/<DISK>“ bs=512 count=34 conv=notrunc

Wurden alle “störrischen” Partitionen entfernt, muss man 1 Mal den Adapter neu scannen mit

esxcli storage core adapter rescan –all

.. und die Disks sollten anschließend für VSAN nutzbar.

Ergänzend sei noch erwähnt, dass seit der vSphere/vCenter-Version 6.0 U2 auch im Web-Client eine Option zum Löschen von Partitionen zur Verfügung steht. Hierzu navigiert man bei markiertem Host zu „Configure / Storage Adapters“, markiert den gewünschten Adapter, wechselt dann unten bei „Adapter Details“ zum gewünschten Device und klickt auf das letzte Icon vor den Menü „All Actions“. In folgender Abbildung findet sich eine VMware Diagnostic Partition (CoreDump).

Entfernen einer ESXi-Partition im Web Client.

Nach dem Löschen der CoreDump-Partition auf der lokalen SATA-Disk, kann man den Host auf der Kommandozeile jederzeit mit

esxcli system coredump partition set –enable true –smart

veranlassen, selbst eine passende Diagnostic-Partition auf dem USB-Device anzulegen. Der korrespondierende erweitere Konfigurations-Parameter lautet: „VMkernel.Boot.autoPartitionCreateUSBCoreDumpPartition„. Mit dem erweiterten Parameter „VMkernel.Boot.autoCreateDumpFile“ kann man zudem erzwingen, dass der ESXi-Host bei nicht vorhandener Diagnostic-Partition Coredumps in eine Datei schreibt, die irgendwo auf einem zugänglichen VMFS-Datastore liegt.

 

 

 

 

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.