FastNetMon

Tuesday, 5 October 2010

Контроллер Adaptec 5405: основы эксплуатации

С недавнего времени начинаем использовать Raid контроллеры Adaptec 5405, поэтому решил написать несколько статеек про них.

Итак, для управления данными контроллерами в Linux (CentOS/Debian) используется удобная утилита arcconf (о ее установке и настройке я напишу позже).

Получение информации о разных подсистемах контроллера

Для получения информации о версиях прошивок контроллера используем следующую команду:
arcconf getversion

В ответ будет выдано примерно что-то вот такое:
Controllers found: 1
Controller #1
==============
Firmware : 5.2-0 (17899)
Staged Firmware : 5.2-0 (17899)
BIOS : 5.2-0 (17899)
Driver : 1.1-5 (2461)
Boot Flash : 5.2-0 (17899)


Command completed successfully.

Для получения более интересной информации о непосредственно контроллере, созданных разделах используется команда:
arcconf getconfig 1 [AD|LD|LD #|PD|AL]

Здесь AD означает получение информации только об адаптере, LD - информации о логических устройствах (созданных на контроллеер массивах), LD # - выдает информацию о конкретном логическом устройстве (LD 0, например), PD - выдает информацию о физических устройствах, подключенных к контроллеру и, наконец, AL - выдает вообще всю имеющуюся информацию.

Итак, запросим информацию о самом контроллере:
arcconf getconfig 1 AD
Controllers found: 1
----------------------------------------------------------------------
Controller information
----------------------------------------------------------------------
Controller Status : Optimal
Channel description : SAS/SATA
Controller Model : Adaptec 5405
Controller Serial Number : 0D221163AF8
Physical Slot : 49
Temperature : 80 C/ 176 F (Normal)
Installed memory : 256 MB
Copyback : Disabled
Background consistency check : Disabled
Automatic Failover : Enabled
Global task priority : High
Performance Mode : Default/Dynamic
Stayawake period : Disabled
Spinup limit internal drives : 0
Spinup limit external drives : 0
Defunct disk drive count : 0
Logical devices/Failed/Degraded : 1/0/0
SSDs assigned to MaxIQ Cache pool : 0
Maximum SSDs allowed in MaxIQ Cache pool : 8
NCQ status : Enabled
--------------------------------------------------------
Controller Version Information
--------------------------------------------------------
BIOS : 5.2-0 (17899)
Firmware : 5.2-0 (17899)
Driver : 1.1-5 (2461)
Boot Flash : 5.2-0 (17899)
--------------------------------------------------------
Controller Battery Information
--------------------------------------------------------
Status : Not Installed


Command completed successfully.

Теперь запросим информацию о логических устройствах, созданных на контроллере. Как можно видеть, у нас существует один RAID5 раздел из 4х дисков:
arcconf getconfig 1 LD
Controllers found: 1
----------------------------------------------------------------------
Logical device information
----------------------------------------------------------------------
Logical device number 0
Logical device name : Device 0
RAID level : 5
Status of logical device : Optimal
Size : 857075 MB
Stripe-unit size : 256 KB
Read-cache mode : Enabled
MaxIQ preferred cache setting : Disabled
MaxIQ cache setting : Disabled
Write-cache mode : Disabled (write-through)
Write-cache setting : Enabled (write-back) when protected by battery/ZMM
Partitioned : No
Protected by Hot-Spare : No
Bootable : Yes
Failed stripes : No
Power settings : Disabled
--------------------------------------------------------
Logical device segment information
--------------------------------------------------------
Segment 0 : Present (0,0) 3SJ20ZJK00009105PBVK
Segment 1 : Present (0,1) 3SJ1YWHL00009106RHAT
Segment 2 : Present (0,2) 3SJ202FY00009104X2T0
Segment 3 : Present (0,3) 3SJ1ZTRG00009106SSLC



Command completed successfully.

Если логических массивов несколько, то можно явно указать показ определенного (в случае одного логического устройства это будет нуль):
arcconf getconfig 1 LD 0
Controllers found: 1
----------------------------------------------------------------------
Logical device information
----------------------------------------------------------------------
Logical device number 0
Logical device name : Device 0
RAID level : 5
Status of logical device : Optimal
Size : 857075 MB
Stripe-unit size : 256 KB
Read-cache mode : Enabled
MaxIQ preferred cache setting : Disabled
MaxIQ cache setting : Disabled
Write-cache mode : Disabled (write-through)
Write-cache setting : Enabled (write-back) when protected by battery/ZMM
Partitioned : No
Protected by Hot-Spare : No
Bootable : Yes
Failed stripes : No
Power settings : Disabled
--------------------------------------------------------
Logical device segment information
--------------------------------------------------------
Segment 0 : Present (0,0) 3SJ20ZJK00009105PBVK
Segment 1 : Present (0,1) 3SJ1YWHL00009106RHAT
Segment 2 : Present (0,2) 3SJ202FY00009104X2T0
Segment 3 : Present (0,3) 3SJ1ZTRG00009106SSLC



Command completed successfully.

Теперь запросим информацию о физических устройствах, подключенных к контроллеру:
arcconf getconfig 1 PD
Controllers found: 1
----------------------------------------------------------------------
Physical Device information
----------------------------------------------------------------------
Device #0
Device is a Hard drive
State : Online
Supported : Yes
Transfer Speed : SAS 3.0 Gb/s
Reported Channel,Device(T:L) : 0,0(0:0)
Reported Location : Connector 0, Device 0
Vendor : SEAGATE
Model : ST3300657SS
Firmware : 0008
Serial number : 3SJ20ZJK00009105PBVK
World-wide name : 5000C500240E43CC
Size : 286102 MB
Write Cache : Enabled (write-back)
FRU : None
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Power State : Full rpm
Supported Power States : Full rpm,Powered off
SSD : No
MaxIQ Cache Capable : No
MaxIQ Cache Assigned : No
Device #1
Device is a Hard drive
State : Online
Supported : Yes
Transfer Speed : SAS 3.0 Gb/s
Reported Channel,Device(T:L) : 0,1(1:0)
Reported Location : Connector 0, Device 1
Vendor : SEAGATE
Model : ST3300657SS
Firmware : 0008
Serial number : 3SJ1YWHL00009106RHAT
World-wide name : 5000C500240E72BC
Size : 286102 MB
Write Cache : Enabled (write-back)
FRU : None
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Power State : Full rpm
Supported Power States : Full rpm,Powered off
SSD : No
MaxIQ Cache Capable : No
MaxIQ Cache Assigned : No
Device #2
Device is a Hard drive
State : Online
Supported : Yes
Transfer Speed : SAS 3.0 Gb/s
Reported Channel,Device(T:L) : 0,2(2:0)
Reported Location : Connector 0, Device 2
Vendor : SEAGATE
Model : ST3300657SS
Firmware : 0008
Serial number : 3SJ202FY00009104X2T0
World-wide name : 5000C500240E70A8
Size : 286102 MB
Write Cache : Enabled (write-back)
FRU : None
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Power State : Full rpm
Supported Power States : Full rpm,Powered off
SSD : No
MaxIQ Cache Capable : No
MaxIQ Cache Assigned : No
Device #3
Device is a Hard drive
State : Online
Supported : Yes
Transfer Speed : SAS 3.0 Gb/s
Reported Channel,Device(T:L) : 0,3(3:0)
Reported Location : Connector 0, Device 3
Vendor : SEAGATE
Model : ST3300657SS
Firmware : 0008
Serial number : 3SJ1ZTRG00009106SSLC
World-wide name : 5000C500240E1874
Size : 286102 MB
Write Cache : Enabled (write-back)
FRU : None
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Power State : Full rpm
Supported Power States : Full rpm,Powered off
SSD : No
MaxIQ Cache Capable : No
MaxIQ Cache Assigned : No


Command completed successfully.

Контроль состояния логических устройств и жестких дисков

Во-первых, первоочередная вещь, которую нужно контролировать - это состояние жестких дисков. Как это делать? Во-первых, это статус (отключен / отказал и проч.), во-вторых, это данные системы само-диагностики жестких дисков S.M.A.R.T.

Итак, для контроля выше описанных параметров я набросал несложный скрипт (первоисточник скрипта):
arcconf getconfig 1 PD | egrep 'Device #|^ +State|^ +Reported|Serial|S.M.A.R.T'

В итоге будет выдана примерно вот такая таблица, по которой можно оценить общее состояние жестких дисков:
Device #0
State : Online
Reported Channel,Device(T:L) : 0,0(0:0)
Reported Location : Connector 0, Device 0
Serial number : 3SJ20ZJK00009105PBVK
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Device #1
State : Online
Reported Channel,Device(T:L) : 0,1(1:0)
Reported Location : Connector 0, Device 1
Serial number : 3SJ1YWHL00009106RHAT
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Device #2
State : Online
Reported Channel,Device(T:L) : 0,2(2:0)
Reported Location : Connector 0, Device 2
Serial number : 3SJ202FY00009104X2T0
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Device #3
State : Online
Reported Channel,Device(T:L) : 0,3(3:0)
Reported Location : Connector 0, Device 3
Serial number : 3SJ1ZTRG00009106SSLC
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0


Кроме физического состояния дисков необходимо контролировать и состояние логического устройства (непосредственно нашего массива), мой пример справедлив лишь для RAID-5, возможно, имена параметров в других типах RAID будут называться иначе:
arcconf getconfig 1 LD 0 | egrep 'Status|Failed|Segment'

В итоге будет выдано примерно следующее (данное состояние сообщает нам о том, что все хорошо):
Status of logical device : Optimal
Failed stripes : No
Segment 0 : Present (0,0) 3SJ20ZJK00009105PBVK
Segment 1 : Present (0,1) 3SJ1YWHL00009106RHAT
Segment 2 : Present (0,2) 3SJ202FY00009104X2T0
Segment 3 : Present (0,3) 3SJ1ZTRG00009106SSLC

Официальная документация по эксплуатации

Кайне рекомендую с ней ознакомится: ссылка на PDF

Ну вот пока что все об эксплуатации даанного контроллера.

No comments :

Post a Comment

Note: only a member of this blog may post a comment.