Catalyst 4500/6500 Switchlerde Supervisor Engine Yedekliliği

Herhese merhaba, şu sıralar ağcıyız ekibi olarak yoğun bir dönemden geçiyoruz ancak yazılarımız hız kesmeden devam ediyor :), Bu yazımda kampüs backbone’nunda yada genel olarak söylememiz gerekirse distribution katmanında kullanılan Catalyst 4500/6500 serisi modüler switchlerin supervisor yedekliliğinden bahsedeceğim,

Supervisor kartlar bahsettiğimiz modüler switchlerin en önemli elemanıdır, bu kartlarda bir fail yaşanması durumunda switch trafiği iletemez hale gelir, bu nedenle backbone seviyesindeki switchlerde yüksek oranda erişilebilirlik (high availability) çok kritiktir, bunu sağlamak içinse yeni bir 6500 almak yerine(ki bu maliyet açısından pek mantıklı olmaz 🙂 ) yedek supervisor kart takmak hem daha maliyetli olur hem de bize daha esnek yedeklilik imkanları sunmaktadır. Catalyst 6500 tüm şaselerde, 4500 ise 4057R-E ve 4510R-E şaselerde supervisor yedekliliğini desteklemektedir.

3 farklı yedeklilik tipi vardır, bunlar:

• RPR (Route Processor Redundancy) ve RPR+ (sadece Catalyst 6500)

• SSO (Stateful SwitchOver)

• NSF (Non-Stop Forwarding) with SSO (en üst seviye yedeklilik sağlar)

 

Route Processor Redundancy

Cisco IOS 12.1(13)E sürümüyle başlayan ilk high availability formu RPR’dır, ancak günümüzde artık tercih edilmez, NSF with SSO, RPR ve RPR+ ‘tan daha kısa convergence süresi sağlar. Çalışma mantığı kısaca, trafiği ileten bir active supervisor ve aktif supervisor’ı periyodik olarak monitör eden standby supervisor olarak söylenebilir, eğer birincil (active) supervisor L2 ve L3 foksiyonları kaybederse yedekteki supervisor aktif olur. Bu işlem süresince geçen zaman (Failover süreleri) aşağıdaki gibidir;

Catalyst 6500 Failover Süresi Catalyst 4500 Failover Süresi

RPR 2 – 4 dakika 60 sn.’den daha az

RPR+ 30 – 60 sn. —–

Aşağıdaki durumların herhangi birinin meydana gelmesi halinde bahsettiğimiz bu görev değişimi (switchover) tetiklenmiş olur;

  • Aktif supervisor kartta Route Processor(RP) yada Switch Processor(SP)’ün crash etmesi
  • CLI üstünden manuel yapacağımız switchover
  • Aktif supervisor’ın çıkarılması
  • Supervisorlar arasında Clock synchronization hatası

Failover başladığında;

  • Tüm switch modülleri baştan başlar(power-cycle)
  • MSFC’nin kullandığı L2 ve L3 çalışan tüm protokoller yeni aktif kartta işleme başlar
  • Access-list’ler yeniden programlanarak yeni aktif supervisor kartın donanımına yazılır.

İşlem sonunda yeni aktif supervisor tüm operasyonu üstüne almış hale gelir.

 

Route Processor Redundancy Plus

Aynı işlemi daha kısa sürede yapabilen moddur. Ancak burda dikkat edilmesi gereken nokta switchover işleminden önce active supervisor, standby’dakinin imaj versiyonunu kontrol eder, eğer ikisi uyuşuyorsa bu mod kullanılır, uyuşmuyorsa RPR modu kullanılır.

PRP+ ‘ın getirdiği yenilikler,

– Konfigursayona bağlı olarak, switchover 30 – 60 sn. arasında tamamlanmış olur.

– Switchover esnasında startup ve running conf. aktif ve standby arasında senkronize bir şekilde işlenir, buda modüllerin reload etmesini gerektirmez.

– Switchover’dan önce up ve down olan modüller, switchoverdan sonrada aynı şekilde kalırlar

Switch’i RPR+ modunda çalıştırmak için basit birkaç komut girmek yeterli;

Switch# configure terminal

Switch(config)# redundancy

Switch(config-red)# mode rpr-plus

Switch(config-red)# end

Yedeklilik moduna bakmak için aşağıdaki komutu işletebilirsiniz, burada yedek bir supervisor bulunmadığı için peer state DISABLED olarak görünüyor.

 

Stateful Switchover (SSO)

Şu ana kadar gördüğümüz RPR ve RPR+ modları kullanıcı tarafında trasparan değildi, yani eğer bir VoIP görüşmesi yapıyorduysanız ve bu esnada failover gerçekleşseydi konuşma droplanacaktı. Ayrıca yaklaşık 1 dakikalık failover süresi standart internet kullanıcı için çok bir kayıp olmasada VoIP veya database uygulamaları için önemli bir kayıp olabilir. SSO, switchover esnasında L2 kesintisini minimuma indirerek bu durumu gidermeye çalışmıştır.

SSO modunda, standby supervisor çalışmaya başlamasıyla aktifteki startup ve running konfu kendine işler(senkronize olur), ayrıca aktifte meydana gelen tüm donanımsal ve yazılımsal değişiklikleride senkronizasyona dahil eder. SSO’nun desteklediği herhangi bir özellikte fail yaşanması durumunda kullanıcı tarafında farkına varılmadan standby supervisor operasyonu üstlenir.

Aşağıda L2 yedekliliği için SSO’nun desteklediği protokoller ve özellikler mevcut, güncel liste için cisco.com’a bakabilirsiniz.

• 802.3x (Flow Control)

• 802.3ad (LACP) ve PAgP

• 802.1X (Authentication) and Port security

• 802.3af (Inline power)

• VTP

• Dynamic ARP Inspection/DHCP snooping/IP source guard

• IGMP snooping (versiyon 1 ve 2)

• DTP (802.1Q ve ISL)

• MST/PVST+/Rapid-PVST

• PortFast/UplinkFast/BackboneFast /BPDU Guard ve filtering

• Voice VLAN

• Unicast MAC filtering

• ACL (VLAN ACLs, Port ACLs, Router ACLs)

• QOS (DBL)

• Multicast storm control/broadcast storm control

Standby supervisor her portun fiziksel link durumunu bildiği için switchover sonrası tüm portlar oldukları state’de kalırlar, switchover esnasında komşu cihazlar herhangi bir link-down durumu görmezler, link değişikliği olmadığı için spanning-tree topolojisinde de bir değişiklik olmaz. Catalyst 6500 switchlerde, standby supervisorın tüm L2 operasyonunu üstlenmesi için geçen süre 0 – 3 sn. arasındadır, 4500’te bu süre saniyenin altına iner. Ancak L3 bilgisinin (ARP tablosu, Layer3 CEF, adjacency tablosu) yeni supervisor için tekrardan öğrenilmesi gerekir, bu esnada L2 trafiği akmaya devam eder ancak L3 paketler droplanır.

RPR+ da olduğu gibi SSO modunun aktifleştirilmesi oldukça basittir;

Switch# configure terminal

Switch(config)# redundancy

Switch(config-red)# mode sso

Switch(config-red)# end

NSF with SSO

SSO moduna ek olarak L2 yedekliliğinde sağlanan performansı L3’te de sağlamak amaçlanmıştır. Switchover esnasında eski aktif supervisordan öğrenilen CEF entryleri ile IP paketlerinin iletiminin devamlılığı sağlanarak L3’teki kayıp sürenin sıfırlanması yada sıfıra yakın olması sağlanır.Paket iletimi devam ederken L3 routing protokolleri(BGP, EIGRP, OSPF vs.) için reconvergence işlemi arka planda gerçekleşir. Standby supervisor, devamlı olarak aktifteki CEF entrylerini kendine kopyalar, switchover esnasında yeni aktif supervisor arka planda routing protokolleri converge olurken, bu CEF entrylerini kullanarak kullanıcı trafiğinde kesinti yaşatmaz. Router Processor’dewki routing convergence ve Routing Information Base (RIB) tamamlandıktan sonra ise eski CEF entryleri silinir ve paket iletimi yeni haliyle devam eder.

Komşu NSF-enabled Routerlar, switchover sırasında durumun farkına vararak özel paketler yollar ve routing updateler tetiklenerek komşuluğun kopmamasını, link flapping yaşanmaması sağlanır.

EIGRP, OSPF, IS-IS için NSF konfigürasyonu yapmak için “nsf router-level” komutu kullanılır. BGP için farklı olarak “bgp graceful-restart router-level” komutu kullanılır.

Switch# configure terminal

Switch(config)# router bgp 100

Switch(config-router)# bgp graceful-restart

Switch(config-router)# exit

Switch(config)#router ospf 200

Switch(config-router)# nsf

Switch(config-router)# end

 

Switch# show ip bgp neighbors 192.168.200.1

Başta söylediğim gibi backbone seviyesinde switchler için yedeklilik kritik bir konu, bu bilgiler bende sadece bilgi olarak varlar, pratikte deneme şansım olmadı, olmasını da pek istemem açıkçası 🙂 konu üstüne çalışmaya devam ediyorum, yeni bilgiler öğrendikçe paylaşmaya devam edeceğim, sağlıcakla kalın.

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir