Man lernt halt nicht aus. Folgende kleine Sache ist mir gestern vor die Hufe gekommen, erlebt hatte ich das so noch nie. En Reboot war nicht vorgesehen.
Ein Solaris 10 Host hat einen seiner SAN Pfade verloren. Per cfgadm -alo show_FCP_dev sah man einen Pfad als unusable. Soweit so schlecht. Die Ursache war ein Portproblem an einem Switch, also nichts was einem Bauchschmerzen machen sollte wenn alles wieder OK ist. Dennoch wollte der Hosts seinen SAN Pfad nicht wieder erkennen. fcinfo hba-port zeigte den Port als offline an. Dem gegenüber stand der Switch der den Port nicht nur erkannte und online zeigte, sondern zudem auch noch die WWN des HBA erkannte 😯 (ausgelesen per DCFM). Also, Porttausch am Switch. Nichts, der Hosts zuckt nichtmal. Keine Messages, keine Hinweise auf einen gezogenen oder gesteckten Port. fcinfo hba-port erzählte weiterhin das alles offline wäre, der Switch sagte das alles Online ist. Na Super. Next Step, ab zum Hosts und mal nachsehen. Single-Port Qlogic, alles fein – grün und gut. Da der Pfad eh tot war einmal abgezogen und auf einen anderen HBA gesteckt. Auch hier: Null Reaktion des Hostes. Der Switch erkannte die WWNs des HBAs, der Hosts zuckte nicht und de HBA hatte die grüne LED an. Alle Versuche per luxadm (forcelip) und Co schlugen fehl, fcinfo und dump_map und Co blieben still. Aufgrund dieses Verhaltens hab ich nicht erwartet das ein Reboot das Problem löst, tja…so kann man sich verschätzen.