Bu Blogda Ara

27 Kasım 2012 Salı

FCP Partner Path Misconfigured sorunu ve sorunun giderilmesi


Netapp autosupport mesajı olarak aşağıdaki gibi bir mesaj gönderir ;

SYSLOG AND EMS MESSAGES
[hostname: scsitarget.partnerPath.misconfigured:error]: FCP Partner Path Misconfigured.
[hostname: scsitarget.partnerPath.misconfigured:error]: FCP Partner Path Misconfigured - Host I/O access through a non-primary and non-optimal path was detected.

TERİMLER :

Partner Path:  LUN’ a giden herhangi bir path ki partner node’ un LUN’ u host eden controller’ a erişimi.

Non-primary path:  partner path ile aynı anlamda,

FCP target port:  Hostlar için sunulan Fibre channel interface (FCP) servisi.

Virtual Target Interconnect (VTIC): initiator group list’ de görülen sanal target’ lardır. Secondary path’ i belirtmek için kullanılır.

ALUA :Asymmetric Logical Unit Access

Igroup: initiators grubu


SORUN AÇIKLAMASI :

Active-active cluster yapılmış netapp storage controller’ larında FCP portları kullanılarak cluster’ daki her iki node da LUN lara erişebilir. Bir Lun’ a sadece primary node uygun durumda değilse partner node’ un path’ lerinden erişilir. Host ve controller arasında primary path fail
olursa yada MPIO düzgün yapılandırmamışsa, bazen host/vm reboot olduğunda I/O access secondary path üzerinden yapılır. Böyle durumlarda performans sorunu ortaya çıkacaktır. Primary path’ te yaşanan sorun giderilmeli ve manuel olarak primary path tekrar aktif hale getirilmelidir.

Aşağıdaki diagram host’ un primary-path ve secondary-path’ den yaptığı IO erişimine bir örnek.



BU DURUMDAN ETKİLENEN HOST VE LUN’ LARIN TESPİT EDİLMESİ:

1.       Partner node’ un FCP target portlarını kullanan LUN ların tespit edilmesi.

Lun stats –oi 1
Bu komutun çıktısında partner OPS ve KB değerleri “O” değilse yanlış path’ den erişim oluyor demektir.

2.       Yanlış path kullanan Host initiatorlarının tespit edilmesi.
lun config_check –A
lun show –v
igroup show –v

3.       Fcp target portlarının görüntülenmesi.
fcp show adapter
4.       Her iki cluster node’ unda ki fcp kullanım dağılımını görmek için;
sysstat –b 1

 
SORUNUN GİDERİLMESİ :

1.       Netapp VSC (virtual storage consol)
2.       Manuel path belirleme
3.       Alua (Asymmetric Logical Unit Access)


1.       Netapp VSC (virtual storage consol) vcenter plug-in’ i ile bu sorunlar algılanbilir ve giderilebilir. Şuan için ESX5’e uygun Netapp VSC versiyonu olmadığından bizim sistemlerde yüklü değil. İleri tarihlerde  kontrol edilerek yüklenebilir.

2.       Path’ ler manuel olarak elle belirlenebilir.  Bunun için yapılması gerekenler şunlardır ;


Hangi LUN’ un partner nodu kullandığını bize gelen autosupport yada yukarıda belirtilen komutlarla görebiliyorduk.

Netapp tarafında aşağıdaki komutla LUN ID’ leri görüntülenir.
MEDNOD01# lun show –m
LUN path                            Mapped to          LUN ID  Protocol
/vol/vm1/lun0                  esx_hosts               7       FCP
/vol/vm2/lun0                  esx_hosts               3       FCP
/vol/vm3/lun0                  esx_hosts               4       FCP
/vol/vm4/lun0                  LAB_ESX               2       FCP

Örneğin 7 nolu LUN’ u örnek olarak inceleyelim ;
ESX tarafında eşağıdaki menüye erişin,
Vcenter -> ESX Host->Configuration->Storage Adapters-> vmhba (HBA)



“Details” kısmında bu HBA üzerinden sisteme gelen tüm LUN’ lar ve bu LUN’ ların detaylarını görebiliyoruz. LUN  ID numarası bilgisini burada netapp’ dan gelen LUN’ ları ayırt etmek için kullanabiliriz.



Lun 7 ye sağ tıklayarak “Manage Paths”’ e tıklayın.


Şuanki aktif path (preferred) “ * ”  olarak işaretlenmiş :
Bu noktada target kontrol edilmelidir ; Active Path bu LUN’ un bulunduğu controllerın target’ ını göstermelidir.  Aktive target’ ın hangi kontroller’ a ait olduğunu tespit etmek için storage tarafında yukarıda gösterilen “fcp config” komutu çalıştırılabilir.

MEDNOD01> fcp config
1a:   ONLINE   PTP  Fabric 
        host address 010000
        portname 50:0a:09:81:9d:31:31:32  nodename 50:0a:09:80:8d:31:31:32
        mediatype auto speed auto

1b:   ONLINE   PTP  Fabric 
        host address 010000
        portname 50:0a:09:82:9d:31:31:32  nodename 50:0a:09:80:8d:31:31:32
        mediatype auto speed auto

Bu işlemlerin sonucunda doğru path belirlemek için path üzerine sağ tıklayarak “preferred” seçilir.


3.       ALUA (Asymmetric Logical Unit Access)

Alua netapp’ da igroup’ lar üzerinde etkinleştirilirse, ESX tarafından “round robin” kuralı ile bir Datastore’ a erişilebilir.

MEDNOD01# igroup show  -v
LAB_ESX (FCP) (ostype: vmware):
        10:00:00:05:1e:fb:48:67 (logged in on: vtic, 1b)
        10:00:00:05:1e:fb:48:8d (logged in on: vtic, 1b)

esx_hosts (FCP) (ostype: vmware):
        10:00:00:05:1e:fb:2e:85 (logged in on: vtic, 1b)
        10:00:00:05:1e:fb:2e:3a (logged in on: vtic, 1b)
  

Alua’ yı aktif hale getirmek için :

MEDNOD01# igroup set LAB_ESX alua yes
MEDNOD01# igroup set esx_host alua yes

MEDNOD01# igroup show  -v     
    LAB_ESX (FCP):
        OS Type: vmware
        Host Multipathing Software: Required
        Member: 10:00:00:05:1e:fb:48:67 (logged in on: vtic, 1b)
        Member: 10:00:00:05:1e:fb:48:8d (logged in on: vtic, 1b)
        UUID: 6933e458-99aa-11e0-8853-00a09816b9f2
        ALUA: Yes
        Report SCSI Name in Inquiry Descriptor: No
    esx_hosts (FCP):
        OS Type: vmware
        Host Multipathing Software: Required
        Member: 10:00:00:05:1e:fb:2e:85 (logged in on: vtic, 1b)
        Member: 10:00:00:05:1e:fb:2e:3a (logged in on: vtic, 1b)
        UUID: 9a0e7e00-943f-11e0-8852-00a09816b9f2
        ALUA: Yes
        Report SCSI Name in Inquiry Descriptor: No


 Esx tarafında yapılması gerekenler ;

Path Selection menüsünden “Round Robin (vmware)” seçilir.
Aşağıda görüldüğü gibi artık her iki primary path de yedekli olacak şekilde kullanıcak.




Hiç yorum yok: